Prosiding Uns 2013 PDF
Prosiding Uns 2013 PDF
Novatiara Fury Pritasari 1), Hanna Arini Parhusip 2), Bambang Susanto 3)
1)
Mahasiswa Program Studi Matematika FSM UKSW
2), 3)
Dosen Program Studi Matematika FSM UKSW
Fakultas Sains dan Matematika, Universitas Kristen Satya Wacana
Jl. Diponegoro 52-60 Salatiga 50711
1)
novatiarafury@gmail.com, 2)hannaariniparhusip@yahoo.co.id, 3)bsusanto5@gmail.com
Abstract
Data pengukuran berulang (repeated measures) memiliki struktur data longitudinal. Dalam
makalah ini, data longitudinal yang dianalisa adalah data hasil penyebaran kuesioner
mahasiswa FBS UKSW pada 2 kelas Listening FBS UKSW yang berbeda selama 3 kali
pertemuan (3 minggu). Adapun tujuan dari makalah ini adalah untuk mengetahui apakah ada
perbedaan yang signifikan antara respon mahasiswa kelas Listening terhadap pertanyaan yang
diteliti pada setiap kelas menggunakan one-wayrepeated measures dan dua kelas yang bebeda
menggunakan two-way repeated measures. Analisis data menggunakan program SPSS 16.0
sebagai alat bantu. Berdasarkan pengujian one-way repeated measures, pada Kelas A ada
perbedaan yang signifikan yaitu ada perbedaan respon minggu kedua dengan minggu ketiga.
Sedangkan respon mahasiswa pada Kelas B tidak berbeda secara signifikan. Pada pengujian
two-way repeated measuresada perbedaan respon Kelas A dan Kelas B, tetapi tidak ada
perbedaan respon mahasiswa dari minggu pertama sampai minggu ketiga. Untuk interaksi
Kelas dan Rata-rata respon mahasiswa menunjukkan bahwa respon mahasiswa tergantung pada
dua kelas yang berbeda.
PENDAHULUAN
Pritasari dkk (2013) telah membahas perbedaan respon mahasiswa kelas Listening antar dua
minggu yang berbeda dalam tiga minggu yang bertujuan untuk mengetahui perbedaan respon
mahasiswa menggunakan paired comparisons. Pada pengujian tersebut disimpulkan bahwa pada
kelas A minggu ke-1 dengan minggu ke-3 tidak ada perbedaan respon mahasiswa. Tetapi pada
minggu ke-1 dengan minggu ke-2 dan minggu ke-2 dengan minggu ke-3 ada perbedaan respon.
Sedangkan pada kelas B tidak ada perbedaan respon mahasiswa pada minggu ke-2 dengan minggu
ke-3, tetapi pada minggu ke-1 dengan minggu ke-2 dan minggu ke-1 dengan minggu ke-3 ada
perbedaan respon. Hal ini juga diperkuat dengan hasil analisa penghitungan daerah konfidensi
95%.
Dalam makalah ini ANOVA digunakan untuk menganalisis data yang sama.ANOVA adalah
suatu metode untuk menguji hipotesis kesamaan rata-rata dari tiga atau lebih populasi. Analisis
terhadap data pengukuran berulang tersebut dilakukan untuk menyelidiki apakah ada perbedaan
yang signifikan antara respon mahasiswa kelas Listening pada setiap kelas dan dua kelas yang
berbedamenggunakan one-wayrepeated measures dan two-way repeated measures. Program SPSS
16.0 digunakan sebagai alat bantu untuk melakukan analisis data.
METODE PENELITIAN
Jenis Penelitian
Penelitian ini menggunakan pendekatan kuantitatif.
Waktu dan Tempat Penelitian
Penyebaran kuesioner dilakukan pada kelas Listening Fakultas Bahasa dan Sastra (FBS)
UKSW selama tiga kali pertemuan pada setiap hari Senin tanggal 11, 18, dan 25 Februari 2013
untuk kelas A. Sedangkan untuk kelas B setiap hari Kamis tanggal 14, 21, dan 28 Februari 2013.
Target atau Subjek Penelitian
Subjek dari penelitian ini adalah mahasiswa baru kelas Listening FBS UKSW pada dua
kelas yang berbeda.
Data dan Teknik Pengumpulan Data
Data yang digunakan adalah data sekunder dari penelitian Rahandika(2013). Data tersebut
diperoleh melalui penyebaran kuesioner yang berisi 13 pertanyaan yang sama di setiap minggu
untuk 29 mahasiswa pada 2 kelas Listening FBS-UKSW selama tiga kali pertemuan. Isi
kuesioner mengenai persepsi mahasiswa tentang variasi latihan pada kelas Listening. Jenis data
adalah data skala 1-5 (skala likert) sebagai skala untuk menyatakan berturut-turut sangat tidak
setuju hingga sangat setuju.
Teknik Analisis Data
ANOVA adalah suatu modelyangcukup komprehensif untukmendeteksi perbedaan
kelompok pada variabel terikat tunggal. Teknik yang lebih umum biasa dikenal sebagai multivariat
analisis varians (MANOVA). MANOVA dapat dianggap sebagai ANOVA untuk situasi dimana
ada beberapa variabel terikat. Pada Tabel 1 dijelaskan perbedaan dari ANOVA dan MANOVA.
Informasi lebih lengkap dapat dilihat di Field(2009) dan Stevens (2009).
Tabel 1. Perbedaan ANOVA dan MANOVA
ANOVA MANOVA
Hanya satu variabel terikat Beberapa variabel terikat
Menguji perbedaan mean pada Menguji perbedaan vektor mean
variabel terikat untuk beberapa beberapa variabel terikat
variabel bebas
Sedangkan perbedaan one-way repeated measures dan two-way repeated measures hanya
pada variabel bebas. One-way repeated measures menggunakan satu variabel bebas dan two-way
repeated measures menggunakan dua variabel bebas.
a. Repeated Measures (Pengukuran Berulang) ANOVA
Repeated measures adalah pengukuran berulang terhadap sekumpulan obyek atau partisipan
yang sama. Pada prinsipnya Repeated Measures ANOVA sama dengan paired t-test untuk
membandingkan rata-rata dua sampel yang saling berhubungan. Perbedaannya dengan ANOVA
adalah sampel uji ini adalah sampel pengukuran berulang, sementara ANOVA mensyaratkan
sampel bebas.
One-way repeated measures ANOVA biasanya digunakan untuk membandingkan nilai
disain sebelum dan sesudah partisipan yang sama pada satu grup. Sedangkan two-way repeated
measures ANOVA membandingkan pada dua grup. (Web 4)
Dalam disain general linear model repeated measures, level dari within subject factor
mewakili beberapa pengamatan dari skala waktu ke waktu dalam kondisi yang berbeda. Ada 3 jenis
tes yang dilakukan jika within subject factormemiliki lebih dari dua level, yaitustandar univariat uji
F, uji univariat alternatif, dantes multivariat. Tiga jenistes ini mengevaluasi hipotesis yang sama,
rata-rata populasisama untuk semua level pada faktor (Web 1).
Standarunivariatuji F ANOVAtidak dianjurkanketikawithin subject factormemiliki lebih
daridua levelkarenapadaasumsitersebut, asumsi Sphericity umumnyadilanggardanuji F
ANOVAmenghasilkan p-value yangakuratsejauhasumsiini dilanggar.
Tes univariat alternatif memperhitungkan pelanggaran asumsi Sphericity. Tes ini menggunakan
penghitungan statistik F yang sama dengan standar univariat tes. Namun p-value berpotensi
berbeda. Dalam menentukan p-value, sebuah epsilon statistikdihitung berdasarkan data sampel
untuk mengetahui derajat yang melanggar asumsi Sphericity. Pembilang dan penyebut derajat
kebebasan uji standar dikalikan dengan epsilon untuk mendapatkan serangkaian derajat
kebebasanyang sudah dikoreksi untuk membuat nilai F yang baru dan menentukan p-value.
Uji multivariat tidak memerlukan asumsi Sphericity. Perbedaan nilai
dihitung dengan membandingkan nilai-nilai dari berbagai levelwithin subject factor.Misalnya
untuk within subject factor dengan tiga level, nilai perbedaan mungkin
dihitung antara level pertama dengan kedua dan antara level kedua dengan ketiga. Uji
multivariat kemudian akan mengevaluasi apakah rata-rata populasi untuk nilai perbedaan kedua
pasangan secara simultan sama dengan nol. Tes ini tidak hanyamengevaluasi rata-rata terkait
dengan dua pasangan nilai perbedaan, tetapi juga mengevaluasi apakah rata-rata dari nilai
selisih antara level pertama dan ketiga faktor tersebut sama dengan nol sebagaikombinasi linier
dari nilai perbedaan.
Menurut Carey (1998), semua perhitungan statistik multivariat didasarkan pada akar-akar
karakteristik dari matriks A yang dibentuk dari
𝐴 = 𝐻𝐸 −1 (1)
dengan H : matriks varians-kovarians perlakuan pada MANOVA
E : matriks varians-kovarians error pada MANOVA.
Dalam uji multivariat sendiri ada beberapa uji yang digunakan, yaitu:
Wilks’ Lamda
Statistik uji digunakan jika asumsi homogenitas dipenuhi. Nilai Wilks’ Lamda berkisar
antara 0-1. Statistik uji ini yang sering dipakai (Web 2). Statistik uji Wilks’ Lamda dirumuskan
sebagai:
𝐸 𝑠 1
𝛬= 𝐻+𝐸
= 𝑖=1 1+𝜆 (2)
𝑖
dengan 𝛬 : Wilks’ Lamda; 𝐸 : determinan dari matriks E;𝑠 : banyaknya akar-akar karakteristikdari
matriks A;𝜆𝑖 : akar-akar karakteristik ke-i matriks A.
Statistik Wilks’ Lamda di atas dapat ditransformasikan menjadi suatu statistik yang
berdistribusi F. Khususnya
Kasus 1: 𝑝 = 1, 𝑔 ≥ 2
1−𝛬 𝑛−𝑔
𝛬 𝑔−1
~ 𝐹𝑔−1,𝑛−𝑔 . (3)
Kasus 2: 𝑝 ≥ 1, 𝑔 = 2
1−𝛬 𝑛−𝑝−1
𝛬 𝑝−1
~ 𝐹𝑝,𝑛−𝑝−1 (4)
Beberapa ahli statistik menganggapnya paling kuat dari 4 statistik yang lain.
Adapun aturan pengujiannya adalah tolak 𝐻0 ketika 𝑉 ≥ 𝐶, dengan nilai 𝐶 diperoleh dari tabel nilai
kritis statistik tersebut (Giri, 2004).
Hotelling’s Trace
Statistik uji ini jarang digunakan oleh para ahli (Web 2). Berikut rumus dari Hotelling’s
Trace:
𝑠
𝐻𝑜𝑡𝑒𝑙𝑙𝑖𝑛𝑔 = 𝑡𝑟𝑎𝑐𝑒 𝐻𝐸 −1 = 𝑖=1 𝜆𝑖 . (6)
Statistik Hotelling’s Trace di atas dapat ditransformasikan menjadi suatu statistik yang
berdistribusi F (Web 3). Khususnya
𝑣1 𝐻𝑜𝑡𝑒𝑙𝑙𝑖𝑛𝑔
𝑣2
× 𝑛 𝑚𝑖𝑛 𝑝,𝑞 1
~𝐹𝑣1 ,𝑣2 , (7)
Roy’s Largest Root digunakan jika asumsi dipenuhi dan berkorelasi dengan kuat. Tetapi uji
ini harus hati-hati dalam penggunaanya (Web 2).
𝑅𝑜𝑦 ′ 𝑠 𝐿𝑎𝑟𝑔𝑒𝑠𝑡 𝑅𝑜𝑜𝑡 = 𝑚𝑎𝑥 𝜆𝑖 . (8)
Adapun aturan pengujiannya adalah tolak 𝐻0 ketika 𝑅𝑜𝑦 ′ 𝑠 𝐿𝑎𝑟𝑔𝑒𝑠𝑡 𝑅𝑜𝑜𝑡 ≥ 𝐶, dengan nilai 𝐶
diperoleh dari tabel nilai kritis statistik tersebut (Giri, 2004).
Keempat tes multivariat tersebut menggunakan uji statistik sebagai berikut:
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 (tidak ada perbedaan antar perlakuan)
𝐻𝑎 : 𝜇1 ≠ 𝜇2 ≠ ⋯ ≠ 𝜇𝑘 (setidaknya ada perbedaan antar dua perlakuan).
Kriteria pengujiannya tolak 𝐻0 jika p-value < 0.05 dan 𝐹𝑖𝑡𝑢𝑛𝑔 > 𝐹𝑡𝑎𝑏𝑒𝑙 .
b. Sphericity
Pada dasarnya, asumsi Sphericitymengacu padakesamaanvariansdariperbedaan diantaralevel
pada faktorrepeated measures.Dengan kata lain, kitamenghitungperbedaanantara setiap
pasanganlevelfaktorrepeated measuresdankemudian
menghitungvariansdarinilaiperbedaan.Sphericitymensyaratkan bahwavariansuntuk
setiapnilaiperbedaansama. Kita mengasumsikanbahwa hubunganantara tiap
pasangkelompokadalahsama. Untuk menguji asumsi Sphericity dapat menggunakan tes Mauchly,
uji Greenhouse Geisser dan tes Huynh Feldt.
Hipotesis untuk Sphericity:
𝐻0 : 𝜎𝑦21 −𝑦2 = 𝜎𝑦21 −𝑦3 = 𝜎𝑦22 −𝑦3 (tidak ada perbedaan yang signifikan diantara varians perbedaan)
𝐻𝑎 : 𝜎𝑦21 −𝑦2 ≠ 𝜎𝑦21 −𝑦3 ≠ 𝜎𝑦22 −𝑦3 (ada perbedaan yang signifikan diantara varians perbedaan)
dengan 𝑦1 − 𝑦2 : perbedaan level 1 dengan level 2 pada faktorrepeated measure
𝑦1 − 𝑦3 : perbedaan level 1 dengan level 3 pada faktorrepeated measure
𝑦2 − 𝑦3 : perbedaan level 2 dengan level 3 pada faktorrepeated measure.
Kriteria pengujiannya tolak 𝐻0 jika hasil p-value dari Mauchly Tests< 0.05, yang artinya
bahwa ada perbedaan yang signifikan diantara varians perbedaan, dengan kata lain bahwa kondisi
Sphericity tidak ditemui (Field, 2012). Jika tes Mauchly dari Sphericity tidak signifikan, maka tes
within-subjects effects dapat dilakukan. Sedangkan jika tes Mauchly dari Sphericity signifikan, tes
multivariat yang digunakan (Ho, 2006).
Jika data melanggar asumsi Sphericity, ada beberapa pembenaran yang dapat diterapkan
untuk menghasilkan rasio Fyang valid. SPSS membuat tiga pembenaran berdasarkan perkiraan
Sphericity yang dianjurkan oleh Greenhouse Geisser dan Huynh Feldt. Kedua perkiraan ini
menimbulkan faktor koreksi yang diterapkan pada derajat kebebasan yang digunakan untuk menilai
rasio Fyang telah diteliti.
1
Koreksi Greenhouse Geisser biasanya dilambangkan dengan 𝜀 bervariasi antara dan 1,
𝑘−1
dimana k adalah jumlah kondisi repeated measures. Semakin 𝜀 dekat ke 1, varians dari perbedaan
semakin homogen.
Ketika estimasi Greenhouse Geisser lebih besardari 0,75 maka hipotesis nol ditolak. Ketika
perkiraan Sphericity lebihbesar dari 0.75 maka koreksi Huynh Feldtharus digunakan, tetapi ketika
perkiraan Sphericity kurang dari 0,75 atau Sphericity sama sekali tidak diketahui maka koreksi
Greenhouse Geisser harus digunakansebagai gantinya(Field, 2009).
Ukuran pengaruh keseluruhan untuk uji multivariat terkait dengan Wilks’ Lamda 𝛬 adalah
multivariat eta kuadrat dan dapat dihitung menggunakan persamaan berikut:
Multivariat𝜂 2 = 1 − 𝛬. (10)
Nilai parsial eta kuadrat dan multivariat eta kuadrat berkisar antara 0 sampai 1. Nilai 0
menunjukkan tidak ada hubungan antara faktor repeated measures dan variabel terikat, sedangkan
nilai 1 menunjukkan adanya hubungan yang kuat. (Web 1)
d. Pairwise Comparisons
Desain within-subjects direkomendasikan menggunakan pendekatan Bonferroni.
Pendekatan ini harus digunakan terlepas dari apakah peneliti merencanakan untuk menguji semua
perbandingan berpasangan atau hanya membuat keputusan untuk memeriksa data (Maxwell dkk,
2004)
Uji statistik disusun sebagai berikut:
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 (tidak ada perbedaan antar perlakuan)
𝐻𝑎 : 𝜇1 ≠ 𝜇2 ≠ ⋯ ≠ 𝜇𝑘 (ada perbedaan antar perlakuan).
Kriteria pengujiannya tolak 𝐻0 jika p-value < 0.05.
Prosedur
a. Variabel Penelitian
1. Variabel terikat (level) : banyaknya perlakuan, yaitu minggu pertama, minggu kedua dan
minggu ketiga.
2. Variabel bebas (faktor repeated measures) :
One-way repeated measures: rata-rata respon mahasiswa.
Two-way repeated measures : kelas dan rata-rata respon mahasiswa.
b. Langkah-langkah dalam Analisis Data
1. Menghitung rata-rata respon tiap mahasiswa pada tiap minggu.
2. Menganalisa hasil Sphericity. Jika signifikan (p-value< 0.05) dilanjutkan tes multivariat,
sebaliknya jika tidak signifikan dilanjutkan tes within-subject effects.
3. Jika dilanjutkan tes multivariat, setelah itu menganalisa keempat uji pada tes multivariat.
Tolak Ho saat p-value < 0.05 dan sebaliknya. Untuk memperkuat hasil tersebut,kemudian
menghitung nilai-nilai dari keempat uji menggunakan persamaan (1), (2) , (5), (6) dan (8).
Statistik uji yang dianalisis adalah Wilks’ Lamda sehingga untuk menghitung penolakan Ho
digunakan persamaan (3) dan (4). Tolak Ho saat 𝐹𝑖𝑡𝑢𝑛𝑔 > 𝐹𝑡𝑎𝑏𝑒𝑙 dan sebaliknya.
4. Jika dilanjutkan tes within-subject effects, setelah itu menganalisa p-value dari Greenhouse
Geisser dan Huynh-Feldt. Tolak Ho saat p-value < 0.05 dan sebaliknya. Untuk
memperkuat hasil tersebut, kemudian membuat perubahan derajat kebebasan untuk
pembilang dan penyebut yang baru.
5. Menghitung pengaruh faktor dari repeated measures menggunakan persamaan (9) atau
(10).
6. Menganalisa hasil p-value dari Pairwise Comparisons. Tolak 𝐻0 jika p-value < 0.05.
Tabel 2a. Rata-rata dan standar deviasi Tabel 2b. Hasil dari tes multivariat untuk
Kelas A Kelas A minggu pertama, kedua dan ketiga
Mean Standart Deviasi Nama Uji p-value
Minggu pertama 4.019 0.396 Pillai’s Trace 0.008
Minggu kedua 4.098 0.296 Wilks’ Lamda 0.008
Minggu ketiga 4.223 0.232 Hotelling’s Trace 0.008
Roy’s Largest Root 0.008
Untuk mengetahui apakah rata-rata dari minggu pertama sampai minggu ketiga berbeda
secara signifikan, dapat dilakukan tes multivariat dengan melihat Tabel 2b. Dari semua uji
diperoleh kesimpulan bahwa semua menolak Ho karena semua uji menghasilkan p-value yang
sama yaitu 0.008 < 0.05. Maka ada perbedaan yang signifikan antara rata-rata respon
mahasiswa pada minggu pertama sampai minggu ketiga.
Pada tes multivariat yang meliputi uji Pillai’s Trace, Wilks’ Lamda, Hotelling’s Trace
dan Roy’s Largest Root, nilai-nilai dari keempat uji tersebut juga digunakan untuk memperkuat
hasil hipotesis. Setiap uji dapat dihitung nilainya dengan menghitung akar-akar karakteristik
terlebih dahulu. Dengan menggunakan persamaan (1) dapat diperoleh:
0.605 0.077 3.262 −1.876 0.5763 0.4691
𝐻= ,𝐸= dan 𝐸 −1 = .
0.077 0.010 −1.876 2.305 0.4691 0.8156
0.3848 0.3466 0.4290
Sehungga matriks 𝐴 = dan didapatkan akar-akar karakteristik .
0.0491 0.0443 0.0001
Setelah akar-akar karakteristik diperoleh maka uji-uji dalam tes multivariat dapat dihitung
menggunakan persamaan (2), (5), (6) dan (8) sehingga diperoleh:
1 1 0.4290 0.0001
𝛬 = 1+0.4290 . 1+0.0001 = 0.6997; 𝑉 = 1+0.4290 + 1+0.0001 = 0.3003
Dengan𝛼 = 0.05 diperoleh nilai dari 𝐹𝑡𝑎𝑏𝑒𝑙 yaitu 𝐹3−1,29−3 = 𝐹2,26 = 3.37. Jadi 𝐻0 ditolak
karena𝐹𝑖𝑡𝑢𝑛𝑔 > 𝐹𝑡𝑎𝑏𝑒𝑙 . Artinya bahwa ada perbedaan yang signifikan antara rata-rata respon
mahasiswa pada minggu pertama sampai minggu ketiga.
Kemudian mengukur pengaruh rata-rata respon mahasiswa tersebut menggunakan
multivariat eta kuadrat sehingga diperoleh
Multivariat𝜂 2 = 1 − 0.6997 = 0.3003.
Dari hasil tersebut menunjukkan bahwa tidak ada hubungan antara rata-rata respon mahasiswa
dan perlakuan yang diberikan setiap minggunya.
Tabel 2d menunjukkan semua perbandingan berpasangan (dengan interval konfidensi
Bonferroni) diantara 3 level. Dengan membandingkan respon setiap minggunya, kita dapat
memasang-masangkan data rata-rata respon antar minggu pertama sampai minggu ketiga.
Tabel 2d. Hasil analisa perbandingan berpasangan Kelas A
Respon mahasiswa p-value Analisa
Minggu ke-1 dan ke-2 1 𝐻0 diterima
Minggu ke-1 dan ke-3 0.092 𝐻0 diterima
Minggu ke-2 dan ke-3 0.042 𝐻0 ditolak
Dapat dilihat dari Tabel 2d, dengan = 5% maka rata-rata respon mahasiswa minggu
kedua dan minggu ketiga berbeda secara signifikan (p-value< 0.05). Rata-rata respon
mahasiswa minggu pertama dengan minggu kedua dan rata-rata respon minggu pertama dengan
minggu ketiga tidak berbeda secara signifikan (p-value> 0.05).
Kasus 2
Akan diuji apakah ada perbedaan yang signifikan pada Kelas B minggu pertama,
minggu kedua dan minggu ketiga. Dari hasil analisis mengindikasikan bahwa tes Mauchlydari
Sphericity tidak signifikan (p-value= 0.299 > 0.05). Hasiltes within-subject
effectsmengindikasikan bahwa within-subjects variabel rata-rata respon mahasiswa tidak
signifikan karena p-value = 0.736 >0.05. Artinya, tidak ada perbedaan yang signifikan diantara
varians perbedaan dari minggu pertama, minggu kedua dan minggu ketiga.
Setelah hasil tes Mauchlydari Sphericity sudah diperoleh, kemudian dari tes within-
subject effects dibuat sebuah perubahan derajat kebebasan untuk pembilang dan penyebut. Hal
ini dapat diperoleh dengan mengalikan kedua nilai ini menggunakan Huynh-Feldt karena
perkiraan Sphericity lebih dari 0.75. Perubahan derajat kebebasan pembilangnya adalah
2 × 0.921 = 1.966. Rasio F = 0.308 harus dievaluasi dengan derajat kebebasan yang baru ini.
Setelah dihitung dengan derajat kebebasan yang baru diperoleh F yang sama yaitu 0.308 dan p-
value = 0.733 > 0.05. Ternyata setelah dievaluasi dengan derajat kebebasan yang baru tetap
memperoleh kesimpulan yang sama dengan sebelumnya, yaitu tidak ada perbedaan yang
signifikan diantara varians perbedaan dari minggu pertama, minggu kedua dan minggu ketiga.
Dari Tabel 3a dapat disimpulkan bahwa rata-rata minggu pertama sampai rata-rata
minggu ketiga perbedaannya tidak terlalu jauh.
Tabel 3a. Rata-rata dan standar deviasi Tabel 3b. Hasil analisa perbandingan
Kelas B berpasangan Kelas B
Mean Standar deviasi Respon mahasiswa p-value Analisa
Minggu pertama 3.939 0.300 Minggu ke-1 dan ke-2 1 𝐻0 diterima
Minggu kedua 3.989 0.184 Minggu ke-1 dan ke-3 1 𝐻0 diterima
Minggu ketiga 3.955 0.219 Minggu ke-2 dan ke-3 1 𝐻0 diterima
Dari hasil tersebut menunjukkan bahwa tidak ada hubungan antara rata-rata respon mahasiswa
dan perlakuan yang diberikan setiap minggunya.
Untuk interaksi Kelas dengan Rata-rata respon mahasiswa, tes Mauchlydari Sphericity
menghasilkan nilai 0.454 dan signifikan karena p-value = 0.042 < 0.05. Asumsi Sphericity juga
dilanggar, maka harus menginterpretasi tes multivariat. Keempat tes multivariat pada Tabel 4e
menunjukkan bahwa efek interaksi signifikan karena p-value = 0.023 < 0.05. Hal ini
menunjukkan bahwa respon mahasiswa tergantung pada dua kelas yang berbeda.
Tabel 4e. Hasil tes multivariat dari interaksi Kelas dengan Rata-rata respon mahasiswa
Nama Uji p-value
Pillai’s Trace 0.023
Wilks’ Lamda 0.023
Hotelling’s Trace 0.023
Roy’s Largest Root 0.023
Nilai-nilai dari keempat uji pada tes multivariat yang meliputi uji Pillai’s Trace, Wilks’
Lamda, Hotelling’s Trace dan Roy’s Largest Root untuk interaksi Kelas dengan Rata-rata
respon mahasiswa juga digunakan untuk memperkuat hasil hipotesis. Setiap uji dapat dihitung
nilainya dengan menghitung akar-akar karakteristik terlebih dahulu. Menggunakan persamaan
(1) dapat diperoleh:
0.094 −0.293 2.898 −1.695 0.5433 0.3389
𝐻= ,𝐸= dan 𝐸 −1 = .
−0.293 0.907 −1.695 2.717 0.3389 0.5795
−0.0482 −0.1379
Sehingga matriks 𝐴 = dan didapatkan akar-akar karakteristik
0.1482 0.4263
−0.0003
. Setelah akar-akar karakteristik diperoleh maka uji-uji dalam tes multivariat dapat
0.3784
dihitung menggunakan persamaan (2), (5), (6) dan (8) sehingga diperoleh:
1 1 −0.0003 0.3784
𝛬 = 1−0.0003 . 1+0.3784 = 0.7257; 𝑉 = 1−0.0003 + 1+0.3784 = 0.2742
Dengan𝛼 = 0.05 diperoleh nilai dari 𝐹𝑡𝑎𝑏𝑒𝑙 yaitu 𝐹𝑝,𝑛−𝑝−1 = 𝐹3,25 = 2.99. Jadi 𝐻0
ditolak karena𝐹𝑖𝑡𝑢𝑛𝑔 > 𝐹𝑡𝑎𝑏𝑒𝑙 . Hal ini menunjukkan bahwa respon mahasiswa tergantung pada
dua kelas yang berbeda.
Kemudian mengukur pengaruh interaksi Kelas dengan Rata-rata respon mahasiswa
tersebut menggunakan multivariat eta kuadrat sehingga diperoleh
Multivariat𝜂 2 = 1 − 0.7257 = 0.2743.
Dari hasil tersebut menunjukkan bahwa tidak ada hubungan antara Kelas dengan Rata-rata
respon mahasiswa terhadap perlakuan yang diberikan setiap minggunya.
Tabel 4f menunjukkan semua perbandingan berpasangan antara dua kelas dan rata-rata
respon mahasiswa tiga minggu dengan menggunakan interval konfidensi Bonferroni 95%.
Dapat dilihat dari Tabel 4f dengan = 5%, rata-rata respon mahasiswa di Kelas A dan Kelas B
pada minggu pertama, kedua dan ketiga tidak berbeda secara signifikan (p-value> 0.05). Artinya
tidak ada perbedaan rata-rata respon mahasiswa di minggu pertama sampai ketiga.
SIMPULAN
Pada makalah ini telah dibahas studi tentang respon mahasiswa dengan metode one-way
dan two-wayrepeated measures untuk dua kelas Listening FBS-UKSW. Berdasarkan hasil yang
diperoleh dapat disimpulkan bahwa:
One-wayRepeated Measures
Pada kelas A
Berdasarkan tes multivariat, ada perbedaan yang signifikan antara rata-rata respon
mahasiswa pada minggu pertama sampai minggu ketiga. Tetapi varians dari minggu
pertama, minggu kedua dan minggu ketiga tidak berbeda secara signifikan. Dari hasil
parsial eta kuadrat menunjukkan bahwa tidak ada hubungan antara rata-rata respon
mahasiswa dan perlakuan setiap minggunya. Dalam pengujian pairwise comparisons,
respon minggu kedua dengan respon minggu ketiga berbeda secara signifikan sedangkan
respon minggu pertama dengan minggu kedua dan respon minggu pertama dengan
minggu ketiga tidak berbeda secara signifikan.
Pada kelas B
Berdasarkan tes within-subject effects, varians dari minggu pertama, minggu kedua dan
minggu ketiga tidak berbeda secara signifikan. Dari hasil parsial eta kuadrat menunjukkan
bahwa tidak ada hubungan antara rata-rata respon mahasiswa dan perlakuan setiap
minggunya. Dalam pengujian pairwise comparisons, rata-rata respon mahasiswa minggu
pertama, kedua dan ketiga juga tidak berbeda secara signifikan.
Two-way Repeated Measures
Berdasarkan uji yang dilakukan, dapat disimpulkan bahwa terdapat perbedaan respon
Kelas A dengan Kelas Btetapi tidak ada perbedaan respon mahasiswa dari minggu pertama
sampai minggu ketiga. Untuk interaksi Kelas dengan Rata-rata respon mahasiswa menunjukkan
bahwa respon mahasiswa tergantung pada dua kelas yang berbeda. Pengujian Pairwise
Comparisonsyang dilakukan untuk dua kelas yang berbeda mengindikasikan tidak ada
perbedaan antara respon mahasiswa di minggu pertama sampai ketiga.
DAFTAR PUSTAKA
Carey, G. (1998). Multivariate Analysis of Variance (MANOVA): I. Theory. Diakses tanggal 1
November 2013 pukul 12.40 WIB dari
http://ibgwww.colorado.edu/~carey/p7291dir/handouts/manova1.pdf.
Field, A. (2009). Discovering Statistics Using SPSS. (3thed.). India : Sage.
Field, A. (2012). Discovering Statistics Repeated Measures ANOVA. Diakses tanggal 29
Oktober 2013 dari http://www.discoveringstatistics.com.
Giri, N.C. (2004). Multivariate Statistical Analysis. (2nded). New York : Marcel Dekker.
Ho, R. (2006). Handbook of Univariate and Multivariate Data Analysis and Interpretation with
SPSS. New York : Chapman & Hall/CRC Taylor & Francis Group.
Maxwell, S.E. & Delaney, H.D. (2004). Designing Experiments And Analyzing Data A Model
Comparison Perspective. (2nded.). London: Lawrence Erlbaum Associates.
Patel, S. & Bhavsar, C.D. (2013). Analysis of Pharmocokinetic Data by Wilk‟s Lamda (An
Important Tool of Manova). International Journal of Pharmaceutical Science Invention,
Vol. 2, 36-44.
Pritasari, N.F., Parhusip, H.A. & Susanto, B. (2013). Analisis Respon Mahasiswa Kelas
Listening Menggunakan Metode Paired Comparisons. Prosiding, Seminar Nasional
Matematika VII yang diselenggarakan oleh Jurusan Matematika FMIPA dan Prodi
Pendidikan Matematika Program Pascasarjana UNNES tanggal 26 Oktober 2013.
Semarang: Universitas Negeri Semarang.
Rahandika, A. (2013). The Students Perceptions toward Different Task Types in Public
Listening Class. Skripsi. Program Studi Pendidikan Bahasa Inggris, Fakultas Bahasa dan
Sastra, Universitas Kristen Satya Wacana. Salatiga.
Stevens, J.P. (2009). Applied Multivariate Statistics For The Social Sciences. (5thed.). New
York : Routledge Taylor & Francis Group.
Web 1: http://oak.ucc.nau.edu/rh232/courses/EPS625/Handouts/RM-
ANOVA/Understanding%20Repeated-Measures%20ANOVA.pdf. Diakses tanggal 30
Oktober 2013 pukul 09.53 WIB.
Web 2:
https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=6&cad=rja&ved
=0CFQQFjAF&url=http%3A%2F%2Fwww.chsbs.cmich.edu%2Fk_han%2Fpsy613%2F
manova1.doc&ei=4tZ5UvzpOqzwiQfH-
oCwAw&usg=AFQjCNFOCcK9hRRVQczMgt0tSqX6Al8z5Q&sig2=w5KyDbLxz-Ma-
MqVVyntzA&bvm=bv.55980276,d.aGc. Diakses tanggal 6 November 2013 pukul
12.45 WIB.
Web 3: http://www.stat.ncsu.edu/people/bloomfield/courses/st784/twa-08-3.pdf. Diakses
tanggal 7 November 2013 pukul 08.27 WIB.
Web 4: http://www.zu.ac.ae/main/files/contents/research/training/one-
wayrepeatedmeasureanova.pdf. Diakses tanggal 7 November 2013 pukul 09.12 WIB.
Abstrak
Penelitian ini bertujuan memberikan inovasi baru mengenai pemetaan
karakteristik kemiskinan pada kabupaten/kota di provinsi Nusa Tenggara Barat,
menggunakan metode analisis Biplot. Analisis Biplot didasarkan pada singular value
decomposition, matriks orthonormal, dan faktorisasi dari matriks data. Penelitian ini
menghasilkan Square Root Biplot (SQRT) atau Biplot Simetri, yaitu grafik Biplot yang
memetakan secara bersamaan kabupaten/kota dengan karakteristik kemiskinan di
provinsi NTB. Analisis Biplot dalam penelitian ini memberikan penyajian yang cukup
baik mengenai informasi data yang sebenarnya berdasarkan nilai 𝑝2 sebesar 84,59%.
Grafik Biplot menampilkan wilayah yang memiliki kesamaan karakteristik kemiskinan
ada pada kabupaten Bima dan kabupaten Sumbawa, dengan jarak Euclid terdekat
sebesar 0.266. Sedangkan jarak terjauh ada pada kabupaten Lombok Tengah dan kota
Mataram, sebesar 9.779. Keragaman karakteristik kemiskinan ditunjukkan dengan
panjang vektor, vektor terpanjang pada penduduk miskin yang bekerja di sektor
pertanian (𝑋7 ) dan vektor terpendek pada angka partisipasi sekolah penduduk miskin
(𝑋3 ).
PENDAHULUAN
Kemiskinan merupakan masalah yang sering dihadapi di setiap daerah di Indonesia
seperti halnya provinsi Nusa Tenggara Barat. Jumlah penduduk miskin di provinsi Nusa
Tenggara Barat (NTB) pada Maret 2011 sebesar 19,73%, dan menurun pada Maret 2012
sebesar 18,63% (Berita Resmi Statistik, 2012). Angka penurunan sebsar 1,10% dipengaruhi
oleh beberapa faktor karakteristik kemiskinan di antaranya faktor sosial ekonomi dan faktor
pendidikan. Penurunan yang kurang signifikan menyebabkan perlunya pemetaan karakteristik
kemiskinan, sehingga upaya pengentasan kemiskinan tepat sasaran. Karakteristik kemiskinan
yang digunakan merupakan data kemiskinan makro. Data kemiskinan makro menunjukkan
jumlah dan persentase penduduk miskin di setiap daerah berdasarkan estimasi. Data ini
digunakan untuk perencanaan dan evaluasi program kemisikinan dengan target geografis. Oleh
karena itu, perlunya dilakukan pemetaan karakteristik kemiskinan pada kabupaten/kota di
Provinsi NTB menggunakan analisis Biplot. Analisis Biplot merupakan teknik statistik
deskriptif dimensi ganda dengan menyajikannya secara visual dan simultan sejumlah objek
pengamatan dan variabel dalam suatu grafik. Oleh karena itu, tujuan penelitian ini yaitu untuk
mengetahui gambaran pemetaan karakteristik kemiskinan di Provinsi NTB menggunakan
analisis Biplot. Sehingga manfaat dari pemetaan ini dapat digunakan sebagai bahan acuan
Pemerintah Daerah Provinsi NTB untuk melakukan upaya pengentasan kemiskinan yang tepat
sasaran pada karakteristik kemiskinan di wilayah tersebut.
METODE PENELITIAN
Jenis Penelitian
Penelitian ini menggunakan pendekatan kuantitatif dan aplikatif, yaitu mengaplikasikan
data – data numerik ke dalam analisis Biplot. Analisis Biplot adalah salah satu upaya
menggambarkan data - data yang ada pada tabel ringkasan kedalam grafik berdimensi dua.
Grafik yang dihasilkan dari Biplot ini merupakan grafik yang berbentuk bidang datar. Dengan
penyajian seperti ini, ciri-ciri variabel dan objek pengamatan serta posisi relatif antara objek
pengamatan dengan variabel dapat dianalisis (Kohler dan Luniak, 2005).
Data Penelitian
Penelitian ini menggunakan data sekunder yang diperoleh dari Badan Pusat Statistik
(BPS) Provinsi Nusa Tenggara barat. Data yang digunakan yaitu data karakteristik kemiskinan
tahun 2011, terdiri dari 10 kabupaten/kota yang merupakan Objek penelitian dan 10
karakteristik kemiskinan yang merupakan variabel penelitian. Objek penelitian meliputi Kab.
Lombok Barat, Kab. Lombok Tengah, Kab. Lombok Timur, Kab. Sumbawa, Kab. Dompu, Kab.
Bima, Kab. Sumbawa Barat, Kab. Lombok Utara, Kota Mataram, Kota Bima. Variabel
penelitian merupakan karakteristik kemiskinan meliputi Jumlah Penduduk Miskin (𝑋1 ), Angka
Melek Huruf Penduduk Miskin (𝑋2 ), Angka Partisipasi Sekolah Penduduk Miskin (𝑋3 ),
Penduduk miskin yang tidak bekerja (𝑋4 ), Penduduk miskin yang bekerja di sektor Informal
(𝑋5 ), Penduduk miskin yang bekerja di sektor formal (𝑋6 ), Penduduk miskin yang bekerja di
sektor pertanian (𝑋7 ), Penduduk bekerja di bukan sektor pertanian (𝑋8 ), Pengeluaran perkapita
untuk makanan (𝑋9 ), Luas lantai perkapita rumah tangga miskin (𝑋10 ).
Prosedur Penelitian
Prosedur penelitian ini meliputi observasi pendahuluan, perancangan penelitian,
pengumpulan data, analisis data, interpretasi hasil, dan kesimpulan. Observasi pendahuluan
dilakukan dengan survey data-data yang relevan, dengan tujuan untuk memberikan gambaran
dan informasi mengenai karakteristik kemiskinan di setiap kabupaten/kota di provinsi NTB.
Perancangan penelitian meliputi penetapan rumusan masalah, tujuan penelitian, penentuan alat
dan bahan, pengumpulan data, serta penentuan teknik analisis data. Langkah selanjutnya yaitu
pengumpulan data, data yang dikumpulkan disini adalah data sekunder yang berhubungan
dengan karakteristik kemiskinan. Selanjutnya analisis data menggunakan Biplot, kemudian
interpretasi hasil Biplot yaitu memberikan gambaran atau penjelasan secara deskriptif mengenai
kedekatan antar objek yang diamati, keragaman variabel, hubungan atau korelasi antar variabel,
dan nilai variabel pada suatu objek. Berdasarkan hasil interpretasi akan ditarik kesimpulan
mengenai analisis Biplot terhadap posisi kabupaten/kota terhadap karakteristik yang dimilikinya
serta karakteristik kemiskinan mana saja yang paling dominan di suatu kabupaten/kota di
provinsi NTB.
maka vektor baris 𝒈𝒊 dan vektor 𝒉𝒋 akan digambarkan dalam dimensi dua. Namun, jika Y
mempunyai rank lebih dari dua maka persamaan di atas menjadi :
𝟏
𝒓 𝟐 𝑻
𝒚𝒊𝒋 = 𝒌=𝟏 𝒖𝒊𝒌 𝝀𝒌 𝜶𝒌𝒋 (3)
dengan 𝒖𝒊𝒌 merupakan elemen ke-(i,k) pada matriks U, 𝜶𝒌𝒋 𝑻 merupakan elemen ke-(k,j) pada
𝟏
T 𝟐
matriks A serta 𝝀𝒌 adalah elemen diagonal ke-k matriks Lyang merupakan akar kuadrat nilai
eigen𝒀𝑻 𝒀 .
Menurut Gabriel (1971) dalam Matjik dan Sumertajaya, 2011, data pengamatan awal
matriks X yang terdiri dari n objek dan p variabel tereduksi menjadi beberapa himpunan data
yang terdiri dari n baris dengan m kolom.
Jika ada sebanyak m kolom yang ditentukan, maka persamaan (2) menjadi;
𝟏
𝒎 𝟐 𝑻
𝒎𝒚𝒊𝒋 = 𝒌=𝟏 𝒖𝒊𝒌 𝝀𝒌 𝜶𝒌𝒋 , 𝒎 <𝑟 (4)
Dengan 𝟐𝒚𝒊𝒋 merupakan elemen matriks Yberdimensi dua, sedangkan 𝒈∗𝒊 mengandung elemen
dua kolom pertama vektor 𝒈𝒊 , dan 𝒉∗𝒊 mengandung dua kolom pertama vektor 𝒉𝒋 .
Sehingga dari matriks Y pada dimensi dua diperoleh matriks dengan ukuran tereduksi
yaitu matriks Gdan H sebagai berikut (Johnson danWichern, 2002) :
𝑔11 𝑔12 11 12
⋮ ⋮ ⋮ ⋮
𝑮 = 𝑔𝑖1 𝑔𝑖2 dan 𝑯 = 𝑖1 𝑖2
⋮ ⋮ ⋮ ⋮
𝑔𝑛1 𝑔𝑛2 𝑝1 𝑝2
Masing-masing pada matriks G dan H merupakan titik-titik koordinat dari n objek dan titik-
titik koordinat dari p variabel.
Rencer (2002), mengemukakan ukuran Biplot dengan pendekatan matriks Y berdimensi
dua dalam bentuk :
(𝜆 1 + 𝜆 2 )
𝑝2 = 𝑟 (7)
𝑘=1 𝜆 𝑘
Dengan 𝜆1 adalah nilai eigen terbesar pertama, 𝜆2 adalah nilai eigen terbesar kedua dan
𝜆𝑘 , 𝑘 = 1,2, … , 𝑟 adalah nilai eigen ke-k. Apabila nilai 𝑝2 mendekati satu, maka Biplot
memberikan penyajian yang semakin baik mengenai informasi data yang sebenarnya.
Biplot mempunyai beberapa tipe. Perbedaan tipe ini berdasarkan pada nilai 𝛼yang
digunakan. Nilai 𝛼yang digunakan dalam Biplot adalah 0 ≤ 𝛼 ≤ 1. Namun nilai 𝛼yang lazim
digunakan dalah 𝛼 = 1; 𝛼0.5; dan 𝛼0 (Nugroho, 2008).
1) Biplot dengan 𝛼1 disebut juga dengan Biplot komponen utama. Jika 𝛼 yang
digunakan adalah 𝛼 = 1 maka Biplot yang dibentuk disebut Biplot RMP (Row Metric
Preserving). Biplot RMP ini digunakan untuk menduga jarak Euclid secara optimal.
Sehingga Biplot untuk 𝛼 = 1 diperoleh:
𝑮 = 𝑼𝑳𝟏 = 𝑼𝑳dan 𝑯 = 𝑨𝑳𝟏−𝟏 = 𝑨 (8)
Pada kondisi ini jarak Euclid antara 𝑔𝑖 dan 𝑔𝑗 sama dengan jarak antara 𝑦𝑖 dan 𝑦𝑗 pada
pengamatan sesungguhnya. Selain itu koordinat 𝑗𝑇 merupakan koefisien variabel ke-j
dalam dua komponen utama pertama.
2) Nilai 𝛼lain yang digunakan dalam pembuatan Biplot yaitu 𝛼 = 0.5. Untuk nilai 𝛼ini,
Biplot yang dibentuk disebut Biplot Simetri atau Biplot SQRT (Square Root Biplot)..
Biplot untuk 𝛼 = 0.5 diperoleh:
𝑮 = 𝑼𝑳𝟎,𝟓 dan 𝑯 = 𝑨𝑳𝟏−𝟎,𝟓 = 𝑨𝑳𝟎,𝟓 (9)
3) Jika 𝛼yang digunakan adalah 𝛼0, maka akan terbentuk tipe Biplot yang disebut
Biplot CMP (Column Metric Preserving).
Saat 𝛼 = 0 diperoleh matriks G dan H sebagai berikut
diperoleh𝑮 = 𝑼𝑳𝟎 = 𝑼 dan 𝑯 = 𝑨𝑳𝟏−𝟎 = 𝑨𝑳 (10)
𝑻
sehingga terbentuk 𝒀𝑻 𝒀 = 𝑮𝑯𝑻 (𝑮𝑯𝑻 )
= 𝑯𝑮𝑻 (𝑮𝑯)𝑻
= 𝑯𝑮𝑻 𝑮𝑯𝑻
= 𝑯𝑼𝑻 𝑼𝑯𝑻
= 𝑯𝑯𝑻 (11)
Matriks U merupakan matriks orthonormal dan 𝒀𝑻 𝒀 = 𝑛 − 1 𝑺dengan n merupakan
banyaknya objek serta Smerupakan matriks varian kovarian dari matriks Y, sehingga 𝑯𝑻 =
𝑛 − 1 𝑺 .Hasil kali elemen 𝑗 𝑘𝑇 akan sama dengan (𝑛 − 1) kali kovarian 𝑠𝑗𝑘 variabel ke-j dan
2
variabel ke-k. Elemen diagonal utama matriks 𝑯𝑯𝑻 , 11 2
+ 21 , … , 𝑗21 + 𝑗22 , … , 𝑝1
2 2
+ 𝑝2
merupakan variansi dari variabel. Sedangkan 𝑗21 + 𝑗22 , 𝑗 = 1,2, . . , 𝑝 merupakan panjang vektor
variabel (dengan pusat jarak Euclid di titik O(0,0)). Sehingga dapat dikatakan bahwa panjang
vektor variabel sebanding dengan variansi variabel (Matjik dan Sumertajaya, 2011).
Valid N (listwise) 10
a. Hasil grafik Biplot untuk 𝛼 = 0.5 ditunjukkan pada gambar di bawah ini:
Pada penelitian ini dihasilkan grafik biplot dengan 𝛼 = 0.5. Alasan terpilihnya biplot
dengan 𝛼 = 0.5 yaitu karena hasil kali matriks koordinat Objek (G) dan matriks koordinat
variabel (H) sama dengan elemen-elemen pada matriks data awal 𝒀 ≅ 𝑮𝑯𝑻.Sehingga biplot
dalam penelitian ini merupakan Square Root Biplot (SQRT) atau Biplot Simetri. Biplot Simetri
merupakan tipe Biplot yang membuat kesamaan penskalaan atau pembobotan pada baris dan
kolom secara bersamaan, sehingga digunakan untuk menggambarkan gabungan vektor objek
yaitu kabupaten/kota serta variabel yang merupakan karakteristik kemiskinan secara bersamaan
dalam satu plot (grafik).
sehingga diperoleh nilai 𝑝2 sebesar 84.59%. Nilai 𝑝2 mendekati satu, maka Biplot dalam
penelitian ini memberikan penyajian yang cukup baik mengenai informasi dari data yang
sebenarnya.
Mataram yang searah dengan vektor variabel 𝑋8 dan berlawan arah dengan vektor variabel 𝑋7 .
Hal ini menandakan penduduk miskin yang bekerja di bukan sektor pertanian (𝑋8 ) sebesar
50.54% berada di atas rata-rata yakni 23.11%. Sedangkan penduduk miskin yang bekerja di
sektor pertanian (𝑋7 ) sebesar 1.78% berada di bawah rata-rata yakni 39.64%. Interpretasi yang
sama juga berlaku untuk kabupaten/kota dan karakteristik kemiskinan lainnya.
menggunakan analisis faktor dan Cluster. Serta saran bagi pemerintah provinsi NTB dari hasil
pemetaan ini diharapkan program-program pemerintah dalam mengentaskan kemiskinan lebih
tepat sasaran, karena dari plot terlihat beberapa daerah yang memiliki karaktersitik kemiskinan
yang sama. Sehingga nantinya diperoleh distribusi kesejahteraan yang merata di setiap
kabupaten/kota.
DAFTAR PUSTAKA
Berita Resmi Statistik, 2012. BPS Provinsi NTB. BRS No. 44/07/52/TH.VI , 2 Juli 2012
Johnson, R.A. dan D.W. Wichern, 2002, Applied Multivariate Statistical Analysis, Fifth Edition.
Prentice Hall Inc, New Jersey.
Kohler, U. dan Luniak, M. (2005). Data inspection using Biplots. The Stata Journal Vol 5,
Number 2, pp. 208–223.
Matjik, A.A., dan Sumertajaya, (2011) I. M., Sidik Peubah Ganda dengan Menggunakan
SAS. IPB Press. Dermaga. Bogor.
Nugroho, S., 2008. Statistika Multivariat Terapan. UNIB Press. Bengkulu
Rencer, A. C., 2002. Methods of Multivariate Analysis. Brigham Young University.
Abstrak
Model epidemi routing menjelaskan pengiriman paket data pada jaringan
mobile melalui analogi pada model epidemi penyebaran penyakit. Analogi didasarkan
pada kemiripan proses dan variabel. Pengiriman paket data dapat dilihat berdasarkan
banyaknya node yang menerima paket data. Perubahan banyaknyanode yang
menerima paket data terhadap waktu dapat dinyatakan dengan persamaan diferensial.
Waktu delay merupakan waktu yang dibutuhkan untuk mengirim paket dari satu node
ke node yang lain. Setiap pengiriman paket data memiliki waktu delay yang berbeda,
sehingga waktu delay dapat dipandang sebagai variabel random yang memiliki fungsi
distribusi probabilitas.
Tujuan penelitian ini adalah mengonstruksi model epidemi routing dan
menentukan probabilitas waktu delay. Selanjutnya, model epidemi routing dan
probabilitas waktu delay diterapkan pada kasus pengiriman informasi pada area
militer dan disimulasikan dengan mengambil laju pengiriman paket, 𝛽yang berbeda.
Hasil simulasi menunjukkan semakin besar 𝛽maka semakin cepat waktu yang
diperlukan agar semua node menerima paket data dan probabilitas kumulatif waktu
delay menuju 1.
1. Pendahuluan
Model epidemi merupakan model matematika yang dapat menggambarkan pola
penyebaran penyakit. Banyak ilmuwan yang meneliti dan memodelkan pola penyebaran
penyakit, diantaranya Mc.Kendrick dan Kermack [5]. Pada tahun 1927 Mc.Kendrick dan
Kermack berhasil memodelkan pola penyebaran penyakit dalam bentuk deterministik yang
sesuai dengan kasus epidemi sebenarnya. Kesesuaian model epidemi dengan kasus epidemi
sebenarnya, mengakibatkan banyak dilakukan pengembangan model epidemi. Menurut Isham
[4], pengembangan model epidemi dapat dilakukan dengan menambah variabel atau menambah
perlakuan. Pengembangan model epidemi juga dapat dilakukan dengan melakukan analogi
antara proses penyebaran penyakit dengan proses lain yang memiliki kemiripan proses. Salah
satu proses yang mirip dengan penyebaran penyakit adalah proses pengiriman paket data pada
routing (Zhang [10]).
Routing merupakan proses pemilihan jalur pengiriman paket data pada suatu jaringan
mobile (Andrew [1]). Jaringan mobile dibentuk oleh beberapa node yang dapat berpindah
tempat atau bersifat mobile. Menurut Liu [7] dan Zhang [10], pengiriman paket data pada
routing dapat dinyatakan dengan algoritma store- carry-forward. Maksud dari algoritma store-
carry-forward adalah node menerimapaket data, membawa paket data dan mengirimkannya ke
node lain yang belummemiliki paket data sampai semua node memiliki paket data. Menurut
Pada model epidemi routing, node-node dibagi dalam kelompok node tanpa paket data
(𝑆) dan kelompok node yang memiliki paket data (𝐼). Node 𝑆dapat terkirimi paket data dengan
laju pengiriman paket data sebesar 𝛽, sehingga node 𝑆akan berkurang ke node 𝐼sebesar 𝛽𝑆𝐼.
Karena setiap node memiliki kemungkinan yang sama untuk menerimat paket data, banyaknya
node kelompok 𝑆berpindah ke kelompok 𝐼sebesar 𝛽𝑆𝐼. Sehingga proses pengiriman dan
penerimaan paket data antar node disajikan dalam Gambar 1.
Jika diasumsikan 𝐼(0) = 1 yang berarti mula-mula terdapat sebuah node yang memiliki paket
data, maka banyaknya node yang menerima paket data dapat dinyatakan sebagai
𝑁
𝐼 𝑡 = , (2.3)
1 + 𝑁 − 1 𝑒 −𝛽𝑁𝑡
dengan laju pengiriman paket data 𝛽 > 0.
Jika nilai 𝛽semakin besar maka nilai 𝑒 −𝛽𝑁𝑡 semakin mendekati 0. Hal ini
mengakibatkan banyaknya node yang menerima paket data mendekati 𝑁. Sedangkan jika
𝛽bernilai 0 maka 𝑒 −𝛽𝑁𝑡 bernilai 1, berakibat hanya terdapat sebuah node yang menerima paket
data yaitu node awal. Sehingga dapat disimpulkan bahwa semakin besar 𝛽maka banyaknya
node yang menerima paket data semakin cepat mendekati N.
Ketika terjadi pengiriman paket data pada jaringan mobile dimungkinkan terdapat waktu
penundaan pengiriman paket data atau waktu delay (Groenevelt [3]). Menurut Zhang [10] dan
Zhou [11], waktu delay merupakan selang waktu dari pertama kali paket data diterima oleh
sebuah node sampai dikirimkan ke node yang lain, 𝑡 < 𝑇𝑑 < 𝑡 + 𝛥𝑡dengan 𝛥𝑡 kecil.
Pengiriman paket yang satu dengan yang lain memiliki waktu delay yang berbeda, sehingga
waktu delay tidak dapat diprediksi secara pasti. Oleh karena itu, waktu delay dapat dipandang
sebagai variabel random. Ketidakpastian waktu delay dapat dinyatakan dalam fungsi distribusi
kumulatif waktu delay. Menurut Zhang [10], fungsi distribusi kumulatif dari 𝑇𝑑 , 𝑃𝑁 (𝑡) =
𝑃𝑟(𝑇𝑑 < 𝑡).
Fungsi distribusi kumulatif 𝑇𝑑 sulit diperoleh secara langsung. Menurut Small [8] dan
Lin [6] perubahan fungsi distribusi kumulatif 𝑇𝑑 untuk 𝛥𝑡kecil dapat dinyatakan dengan
𝑑𝑃𝑁 𝑡 𝑃𝑁 𝑡 + ∆𝑡 − 𝑃𝑁 𝑡
= lim
𝑑𝑡 ∆𝑡→0 ∆𝑡
𝑃 𝑇𝑑 > 𝑡 + ∆𝑡 − 𝑃 𝑇𝑑 > 𝑡
= lim − . 3.1
∆𝑡→0 ∆𝑡
𝑁
𝑃𝑁 𝑡 = 1 − , (3.6)
𝑒𝛽𝑁𝑡 + (𝑁 − 1)
dengan laju pengiriman paket data 𝛽 > 0.
Jika nilai 𝛽semakin besar maka nilai 𝑒 𝛽𝑁𝑡 juga semakin besar tergantung pada 𝑁. Hal
ini mengakibatkan probabilitas kumulatif waktu delay semakin mendekati 1. Sedangkan jika
𝛽bernilai 0 maka 𝑒 𝛽𝑁𝑡 bernilai 1, berakibat probabilitas kumulatif waktu delay bernilai 0.
Sehingga dapat disimpulkan bahwa semakin besar 𝛽maka probabilitas kumulatif waktu delay
semakin cepat mendekati 1.
4. Penerapan Kasus
Pada bagian ini diberikan kasus pengiriman paket data jaringan mobile di area militer.
Pada area militer tertentu terdapat 100 node mobile yang dapat mengirimkan paket data dengan
laju 0.222 jam/node (Groenevelt [3]). Semua node dalam jaringan mobile tersebut diharapkan
dapat menerima paket data dengan terdapat sebuah sumber atau node awal yang memiliki paket
data. Banyaknya node pada waktu t pada jaringan mobile di area militer tersebut dapat
dinyatakan dengan
100
𝐼 𝑡 = . (4.1)
1 + 99𝑒 −22.2𝑡
Pada model epidemi routing juga diharapkan mampu mencapai minimum waktu
penundaan pengiriman paket data (delay).Pengiriman paket yang satu dengan yang lain
memiliki waktu delay yang berbeda, sehingga waktu delay tidak dapat diprediksi dengan pasti.
Oleh karena itu waktu delay dapat dipandang sebagai variabel random. Ketidakpastian waktu
delay dapat dinyatakan dalam fungsi distribusi kumulatif waktu delay. Fungsi distribusi
kumulatif waktu delay pada jaringan mobile dalam area militer tersebut adalah
100
𝑃𝑁 𝑡 = 1 − . (4.2)
𝑒 22.2𝑡 + 99
Persamaan (4.1) dan persamaan (4.2) yang menyatakan banyaknya node yang menerima paket
data dan probabilitas kumulatif waktu delay dapat dilihat pada Gambar 2.
Gambar 2 (𝑎) menunjukan bahwa pada waktu 0.87 jam semua node dalam jaringan
mobile telah menerima paket data. Gambar 2 (𝑏) menunjukan bahwa probabilitas kumulatif
waktu delay kurang dari 0,87 jam dalam jaringan mobile menuju 1. Hal ini menunjukan
probabilitas waktu delay mendekati 0 atau dapat dikatakan sudah tidak terjadi waktu delay.
Sehingga semua node dalam jaringan mobile pada area militer tersebut menerima paket dan
probabilitas delay mencapai minimum setelah 0,87 jam. Banyaknya node yang menerima paket
data dan probabilitas waktu delay pengiriman paket data dalam area militer tersebut hanya
dipengaruhi oleh laju pengiriman paket data.
Gambar 2. (a) Banyaknya node yang menerima paket data dan (b) probabilitas waktu delay
Pengaruh laju pengiriman paket data 𝛽terhadap pola pengiriman paket data dan
probabilitas waktu delay dalam jaringan mobile dapat diperjelas dengan simulasi. Simulasi pola
pengiriman paket data dan probabilitas waktu delay untuk 𝛽 = 0.15, 𝛽 = 0.222, 档𝑎𝑛 𝛽 = 0.9
dapat dilihat pada Gambar 3.
Gambar 3. (𝑎) Banyaknya node yang menerima paket data dan (b) probabilitas waktu delay
dengan 𝛽 = 0.15, 𝛽 = 0.222, 𝑑𝑎𝑛 𝛽 = 0.9
Gambar 3 (𝑎) menunjukan bahwa untuk 𝛽 = 0.15 semua node dalam jaringan mobile
dapat menerima paket data dalam waktu 1.28 jam, untuk 𝛽 = 0.222 memerlukan waktu 0.87
jam, dan 𝛽 = 0.9 memerlukan waktu 0.22 jam. Sedangkan dari Gambar 3 (𝑏) terlihat bahwa
untuk 𝛽 = 0.15 probabilitas waktu delay menuju 1 setelah 1.28 jam, untuk 𝛽 = 0.222 setelah
0.87 jam, dan 𝛽 = 0.9 setelah 0.22 jam. Sehingga dapat disimpulkan bahwa semakin besar laju
pengiriman paket data (𝛽)maka semakin cepat waktu yang diperlukan agar semua node
menerima paket data dan probabilitas waktu delay cepat menuju 1. Hasil simulasi ini
memperjelas pengaruh laju pengiriman paket data (𝛽)terhadap banyaknya node yang menerima
paket data dan probabilitas waktu delay yang telah dijelaskan sebelumnya.
5. Kesimpulan
Model epidemi routing pada jaringan mobile dinyatakan sebagai
𝑁
𝐼 𝑡 = ,
1 + 𝑁 − 1 𝑒 −𝛽𝑁𝑡
dengan syarat terdapat satu node awal yang memiliki paket data, sedangkan probabilitas
kumulatifwaktu delay pada model epidemi routing yaitu
𝑁
𝑃𝑁 𝑡 = 1 − ,
𝑒𝛽𝑁𝑡 + (𝑁 − 1)
dengan probabilitas waktu delay mula-mula 0, laju pengiriman paket data 𝛽 > 0 dan banyaknya
node dalam jaringan N. Simulasi menunjukan semakin besar laju pengiriman paket data
(𝛽) maka semakin cepat waktu yang diperlukan agar semua node menerima paket data dan
probabilitas waktu delay juga semakin cepat menuju 1.
DAFTAR PUSTAKA
[1] Andrew S.T., Computer Networks, Pearson Education, Inc., Amsterdam, 2003.
[2] Campbell,L. Stephen, An Introduction to Differential Equations and Their Application,
second ed., Wadswordh, Inc, California, USA, 1990.
[3] Groenevelt, R., P. Nain, and G. Koole, The Message Delay in Mobile Ad Hoc Network,
Perform (2005), no. 62, 210-228.
[4] Isham, V., Stochastic Models for Epidemics, Research Report 263, Department of
Statistical Science, University College London, 2004.
[5] Kermack,W.O. and A. G. McKendrick, A Contribution to The Mathematical Theory
ofEpidemics, Proceedings of the Royal Society of London Series A 115(1927), 700-721.
[6] Lin, Y., B. Li, B. Liang, Stochastic Analysis of Network Coding in Epidemic Routing, ACN
MobiOpp (2007).
[7] Liu, J., X. Jiang, H. Nishiyama, and N. Kato, General Model for Store-Carry-
ForwardRouting Schemes with Multicast in Delay Tolerant Networks, IEEE (2011), 494-
500.
[8] Small, T., and Z.J. Haas, The Shared Wireless Infostation Model-A New Ad Hoc
NetworkingParadigm, MobiHoc, Maryland, USA (2003), 233-244.
[9] Sun,L., Epidemic Content Distribution in Mobile Networks, Master of science thesis, KTH
Royal Institute of Technology, Stockholm, Swedia, Februari 2013.
[10] Zhang, E., G. Neglia, J. Kurose, and D. Towsley, Performance Modeling of
EpidemicRouting, Tech. Report 44, UMass Computer Science, 2005.
[11] Zhou, S., L. Ying, S. Tirthapura, Delay, Cost and Infrastructure Tradeoff of Epidemic
Routingin Mobile Sensor Networks, Proceedings of 11 the 6th International Wireless
Communications and Mobile Computing Conference.
Abstrak
Support Vector Machine (SVM) adalah metode yang sangat popular untuk klasifikasi
data biner pada data mining. SVM dapat diaplikasikan secara luas seperti pengenalan
pola, analisis regresi, dan estimasi probabilitas. SVM memanfaatkan optimasi dengan
quadratic programming yang apabila digunakan untuk data berdimensi tinggi dan data
dengan jumlah besar menjadi kurang efisien. Oleh karena itu para peneliti
mengembangkan suatu teknik dengan mengubah formulasi SVM menggunakan
smoothing technique yang disebut Smooth-SVM (SSVM). Teknik ini mampu
mengkonversi quadratic programming pada SVM menjadi linear programming.
Penelitian selanjutnya berkembang dengan memodifikasi smooth function pada SSVM
kedalam bentuk polynomial smooth function seperti: quadratic polynomial function,
fourth polynomial function, piecewise polynomial function dan spline function.
Dibandingkan dengan ketiga polynomial smooth function lainnya, piecewise polynomial
function mempunyai performansi yang lebih baik. Piecewise polynomial function jika
diterapkan pada model SSVM, maka akan diperoleh model Piecewise Polynomial
Smooth Support Vector Machine (PPSSVM). Penelitian ini menggunakan dua model
yaitu Smooth-SVM (SSVM) dan PPSSVM yang ditemukan oleh Wu dan Wang.
Penelitian ini akan mengkaji performansi piecewise polynomial function dan
konvergensi kedua model secara teoritis serta mencoba menerapkan model terbaik
untuk klasifikasi desa tertinggal di Provinsi Kalimantan Timur menggunakan data
PODES (Potensi Desa) 2011.
PENDAHULUAN
SVM adalah suatu teknologi pembelajaran statistik yang dapat menghasilkan
performansi generalisasi terbaik. SVM diperkenalkan untuk pertama kalinya oleh Vapnik pada
tahun 1995 dan sangat berhasil melakukan prediksi, baik dalam kasus klasifikasi maupun
regresi. Metode ini berusaha untuk menemukan fungsi pemisah optimal yang bisa memisahkan
dua set data dari dua kelas atau disebut juga hyperplane terbaik diantara fungsi yang tidak
terbatas (Gunn, 1998).
Lee dan Mangasarian, (2001) menyatakan bahwa SVM memanfaatkan optimasi
dengan quadratic programming yang apabila digunakan untuk data berdimensi tinggi dan data
dengan jumlah besar menjadi kurang efisien. Oleh karena itu para peneliti mengembangkan
smoothing technique untuk mengubah optimasi yang terbatas menjadi optimasi yang tanpa
batas menggunakan formulasi dari SVM standar. Teknik tersebut adalah Smooth-SVM (SSVM)
yang mampu mengkonversi quadratic programming pada SVM menjadi linear programming
dengan menggunakan algoritma Newton-Armijo.
METODE PENELITIAN
Data dan Prosedur Penelitian
Data yang digunakan dalam penelitian ini adalah data sekunder. Variabel respon
berasal dari Kemendagri pada profil desa dan kelurahan 2011: data dasar tipologi klasifikasi,
kategori desa kelurahan (2012). Variabel prediktor berasal dari BPS yaitu data PODES Provinsi
Kalimantan Timur Tahun 2011 yang terdiri dari 16 variabel. Penelitian dilakukan terhadap 1465
desa. Untuk melakukan analisis data dalam penelitian ini digunakan program aplikasi
MATLAB. Langkah-langkah analisis data penelitian ini antara lain sebagai berikut:
1. Melakukan analisis secara teoritis performansi smooth function dan konvergensi kedua
modeluntuk mendapatkan model terbaik. Langkah-langkah untuk menyelesaikan tahap ini
adalah sebagai berikut:
a. Performansi smooth function: membandingkan selisih antara smooth function dengan
plus function.
b. Konvergensi kedua model: dengan membuktikan bahwa problem optimasi model
SSVM dan PPSSVM dapat mendekati problem optimasi model awal ketika k
mendekati tak hingga.
2. Model terbaik kemudian digunakan untuk klasifikasi desa tertinggal di Provinsi
Kalimantan Timur menggunakan data PODES 2011. Langkah-langkahnya adalah sebagai
berikut:
):
min ve ' y 12 || w ||22 (1)
( w , , y )R p1n
y 0
dimana:
v : Parameter yang ditentukan sebagai pengontrol (trade off)
y : Vektor variabel slack berukuran n x 1 yang mengukur kesalahan klasifikasi dan bernilai
nonnegatif.
e : Vektor kolom berukuran n dan bernilai 1.
w : Vektor normal berukuran p x1 .
: Nilai bias yang menentukan lokasi relatifhyperplane terhadap kelas asli.
Hyperplane margin yang mungkin dibentuk dalam memisahkan objek-objek dalam
masalah klasifikasi dua kelas secara linier adalah sebagai berikut:
x ' w 0, (2)
Sehingga kedua bidang memisahkan dua kelas dengan soft margin yang ditentukan oleh
variabel slack nonnegatif, adalah sebagai berikut:
x ' w y i 1 untuk x ' Ai dan Dii 1
(3)
x ' w y i 1 untuk x ' Ai dan Dii 1
Dimana vektor x adalah bagian dari matriks A berukuran p x 1. Dimana i= 1,2,…,n.
Persamaan di atas merupakan subject to bagi fungsi SVM yang dapat ditulis dalam satu
persamaan matriks sebagai berikut:
D(Aw e ) y e dan y 0 (4)
Penyelesaian persamaan (1) akan mudah diselesaikan dengan meminimumkan fungsi
Lagrange terhadap w, , y serta meminimumkan terhadap Lagrange multiplier α dan β .
1
L ( w , , y , α, β) || w ||22 ve ' y α '(D( Aw e ) e ) β ' y (5)
2
Nonlinier SVM dengan bidang pemisah yang nonlinier diperoleh dengan
mentransformasi formulasi SVM standar sebagai berikut:
w A ' Du (6)
Sangat sulit untuk mengetahui fungsi transformasi yang tepat, untuk itu pada SVM
digunakan „kernel trik’. Teknik ini dapat tercapai tanpa perlu mengetahui pemetaan
nonliniernya. Pemetaan tersebut dilakukan melalui sebuah fungsi kernel, yaitu (Hsu dkk, 2008):
a. Kernel Linier
K xi , x xTi x (7)
b. Polynomial Kernel
K xi , x xTi x r , 0
d
(8)
K xi , x exp | xi x |2 , 0 (9)
d. Eksponensial Kernel
Fungsi kernel yang umum digunakan adalah kernel Gaussian. Dengan , r dan d merupakan
parameter kernel dan i,j=1,2,…,n.
Dengan menggantikan A’A dengan kernel nonlinier K(A,A’) menghasilkan nonlinear
generalized SVM adalah sebagai berikut:
1
minp1n ve ' y u ' D ' K ( A, A ')Du (11)
( w , , y )R 2
dengan kendala D( K (AA ')Du e ) y e
y0
268 Makalah Pendamping: Matematika 3
Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2
Sejak pertama kali muncul, metode SVM telah banyak dikembangkan dan
dimodifikasi demi meningkatkan performansi dan efisiensinya. Tahun 2001 Lee dan
Mangasarian merekomendasikan formulasi baru dari SVM dengan kernel dan nonlinier untuk
analisis klasifikasi menggunakan smoothing technique sehingga dinamakan smooth support
vector machine (SSVM).
Pendekatan smoothing Lee dan Mangasarian. (2001) menjadikan variabel slack y
v
menjadi 2-norm yang diboboti . Dengan demikian problem optimasi pada SSVM adalah:
2
y 0,
di mana untuk memperoleh solusi problem (12), kendala-kendalanya dapat ditulis sebagai
berikut:
y (e D(Aw e )) (13)
Subtitusi persamaan (13) terhadap persamaan (12) menghasilkan fungsi objektif tanpa kendala
sebagai berikut
v 1
min || (e D( Aw e )) ||22 (w ' w 2 ) (14)
w , 2 2
Dimana () menggantikan komponen-komponen bernilai negatif dengan nilai nol. Fungsi
objektif dalam persamaan (14) tidak memiliki turunan kedua, smoothing technique yang
diusulkan Lee dan Mangasarian (2001) dilakukan dengan menggantikan fungsi plus dengan p(x,
) yaitu integral dari fungsi sigmoidneural network (1 exp( x))1 atau dapat dituliskan
sebagai berikut
1
p( x, ) x log(1 x ), 0 (15)
di mana adalah smoothing parameter. Menggantikan dengan p(x, ), maka diperoleh
Sedangkan problem optimasi untuk SSVM non linier diperoleh sebagai berikut:
v 1
minn1 (w, ) : minn1 || p(e D( K ( A, A ')Du e ), ) ||22 (u ' u 2 ) (17)
( u , )R ( u , )R 2 2
Program optimasi linier maupun non linier dapat diselesaikan dengan algoritma Newton-
Armijo.
Langkah-langkah algoritma Newton-Armijo dimulai dengan inisiasi (w 0 , 0 ) R n1 ,
kemudian mengulangginya sampai gradient dari fungsi objektif (16) atau (17) sama dengan nol
atau (wi , i ) 0 . Selainnya, menghitung (wi 1 , i 1 ) sebagai berikut :
n 1
Newton Direction: menentukan direction d R
i
1) dengan menyelesaikan n +1
persamaan linier dengan n +1 variabel sebagai berikut:
2 (wi , i )d i (wi , i )' (18)
w i 1
, i 1 wi , i i d i
(19)
1 1
dimana i maksimumkan 1, , ,... sehingga:
2 4
wi , i w , d w , d
i i
i
i
i
i i i
(20)
1
dengan 0,
2
Saat w , 0 , iterasi pada algoritma Newton-Armijo berhenti, dan
i i
diperoleh nilai w dan yang konvergen. Dengan demikian fungsi pemisah yang diperoleh
untuk kasus klasifikasi linier adalah :
f ( x) sign(x ' w ), (21)
Sedangkan fungsi pemisah untuk kasus klasifikasi nonlinier adalah sebagai berikut:
f ( x) sign(x ' w ) sign(u ' D ' K (A, A ') ), (22)
Seperti yang dijelaskan sebelumnya, Lee dan Mangasarian (2001) menemukan SSVM
dengan menggantikan fungsi plus dengan p(x, ) yaitu integral dari fungsi sigmoid neural
network (1 exp( x))1 atau seperti pada persamaan (15), di mana adalah smooth function.
Beberapa peneliti kemudian memodifikasi smooth function ke dalam bentuk polynomial smooth
function, yaitu quadratic polynomial function, fourth polynomial functionl, spline polynomial
function, dan piecewise polynomial function. Fungsi piecewise polynomial salah satunya
diusulkan oleh Wu dan Wang adalah sebagai berikut (2013):
1
0, x ,
3k
3 2
3
1 1
2 k x 3k , x 0,
3k (23)
f ( x, k ) 3
3 2 1 1
x k x ,0 x ,
2 3k 3k
1
x, x ,
3k
berbasis 2 atau logaritma biner. Perlu diperhatikan bahwa nilai log 2 v dan log 2 digunakan
paling banyak satu kali dalam metode UD tersarang dan tidak ada titik yang ditempatkan di
sudut.
Metode UD pada penelitian ini menggunakan 10-fold cross validation dalam
pembagian data training-testing. Metode ini melakukan pengulangan sebanyak 10kali untuk
membagi sebuah himpunan contoh (sampel) secara acak menjadi 10-subset yang saling bebas.
Setiap ulangan disisakan satu subset untuk testing dan sisanya digunakan untuk training. Hasil
dari percobaan dan pembuktian teoritis, menunjukkan bahwa 10-fold cross validation adalah
pilihan terbaik untuk mendapatkan hasil validasi yang akurat (Kohavi, 1995).
Ukuran ketepatan klasifikasi dapat dilihat dari akurasi klasifikasi. Akurasi
menunjukkan performansi teknik klasifikasi secara keseluruhan, semakin tinggi akurasi
klasifikasi berarti semakin baik performansi teknik klasifikasi.
tp tn
Akurasi klasifikasi (%) = (24)
tp fp tn fn
HASIL PENELITIAN DAN PEMBAHASAN
Penelitian ini diawali dengan analisis secara teoritis yang terdiri dari dua tahap. Tahap
pertama menganalisis performasi smooth function dari kedua model dilanjutkan dengan
menganalisis konvergensi dari kedua model. Tahap berikutnya adalah menerapkan model
terbaik untuk klasifikasi desa tertinggal di Provinsi Kalimantan Timur dengan data PODES
2011.
(i) p( x, k ) x ;
Pembuktian
1 1
(i) Untuk 0 x , p( x, ) ( x ) x log(1 x ) x log 2
Untuk x 0 maka didapatkan: p( x, ) ( x ) p( x, ) p(0, )
1
log 2
1
Oleh karena itu p( x, ) ( x ) log 2 atau p( x, ) x
1 2x
(ii) Untuk 0 x , maka p( x, )2 ( x )2 x log 2 (1 x ) log(1 x )
2
log 2 2
2
log 2
Untuk x 0 , maka p( x, )2 adalah fungsi monoton naik, sehingga didapatkan:
2
log 2
p( x, ) ( x ) p( x, ) p(0, )
2 2 2 2
log 2 2
2
Pembuktian.
(i) f(x,k) memenuhi persamaan pada titik x 31k , x 0,
1 1 1
𝑓 −3k , k = 0, lim− 𝑓 𝑥, 𝑘 = lim+ 𝑓 𝑥, 𝑘 , 𝑓 3𝑘
, 𝑘 = 3𝑘
𝑥→0 𝑥→0
1 1
𝑓′ −3k , 𝑘 = 0, lim 𝑓′ 𝑥, 𝑘 = lim+ 𝑓′ 𝑥, 𝑘 , 𝑓′ −3𝑘 , 𝑘 = 1
𝑥→0− 𝑥→0
1 1
𝑓′′ −3k , 𝑘 = 0, lim− 𝑓′′ 𝑥, 𝑘 = lim+ 𝑓′′ 𝑥, 𝑘 , 𝑓′′ −3𝑘 , 𝑘 = 0
𝑥→0 𝑥→0
Jika x 31k , x 0, disubtitusikan ke dalam persamaan f(x,k), maka hasil pada (i) akan
1 3 1
Jika x 0 , gunakan persamaan Q( x) f ( x, k ) ( x) k 2 ( x k )3 x
3k 2 3
9 2 1
Sehingga Q' ( x) k ( x )2
2 3k
Q' ( 31k ) 0
1 1
Dan Q" ( x) 9k 2 ( x ) 9k 2 ( x ) 0 . Ini mengindikasikan bahwa Q( x)
3k 3k
monoton turun pada 31k , 0
1 3 1
Jika 0 x , gunakan persamaan Q( x) f ( x, k ) ( x) x k 2 ( x)3 x
3k 2 3k
9 1
Sehingga Q ' ( x) 1 k 2 ( x) 2
2 3k
Q' ( 31k ) 0
1 1
Dan Q" ( x) 9k 2 ( x) 9k 2 ( x) 0 . Ini mengindikasikan bahwa Q( x)
3k 3k
monoton turun pada 0, 31k . Sehingga Q( x) Q 31k f ( x, k ) ( x)
1 1
(iii) Jika x atau x , maka nilai dari f(x,k) dan x+ adalah sama, sehingga
3k 3k
f ( x, k )2 x2 0 Pertidaksamaan pada (iii) terpenuhi.
adalah fungsi positif, kontinu dan fungsi monoton naik untuk 31k x 0
1 1
sehingga akan didapatkan f ( x, k ) 2 f (0, k )2 2
324k 216k 2
2
1 3 2 1
3
untuk 0 x , misalkan s ( x ) f ( x , k ) 2
x
2
x k x x
2
3k 2 3k
6 3
9 1 1
k 4 x 3k 2 x x
4 3k 3k
3 3 1
6
1
3
s ( x) 2 a a a
k 4 3 3
1
Untuk a 0, , titik maksimum pada s(a) adalah a= 0.0605 dan
3
1
s(a) f ( x, k )2 x2 0.0046 . Sehingga diperoleh hasil
216k 2
1
f ( x, k ) 2 x2
216k 2
Berdasarkan hasil pada Lemma 1 dan Theorema 1, maka diperolah perbandingan performansi
dari smooth function adalah sebagai berikut:
Theorema 2 (Lee dan Mangasarian, 2001). Jika 1k , dan k>0. Maka hasil dari performansi
(i) Jika smooth function yang didefiniskan pada (15), maka berdasarkan pada Lemma 1
diperoleh:
2
2
log 2 1 1
log 2 log 2 2log 2 2 0.69267 2
2
p( x, k ) 2 x2 (25)
k k k k
(ii) Jika smooth function yang didefiniskan pada (23), berdasarkan pada Theorem 1 maka,
1 1
f ( x, k )2 x2 2
0.0046 2 (26)
216k k
Theorem 2 menunjukkan bahwa piecewise function f(x,k) mempunyai performasi terbaik
untuk plus function x+. Ketika k mempunyai nilai yang pasti, maka akan sangat mudah
mendapatkan perbedaan dari smooth function di atas.
Konvergensi SSVM dan PPSSVM
Pembuktian untuk konvergensi dari model SSVM dan PPSSVM akan diperoleh ketika
k mendekati tak hingga. Hal tersebut diperoleh ketika problem optimasi mendekati model awal
(15).
Theorema 3 (Lee dan Mangasarian, 2001). Jika A Rmxn , R mx1 , definisi dari fungsi riil
f ( x) : Rn R dan g ( x, k ) : Rn N R adalah sebagai berikut:
1 1
Ax
2
f ( x)
2
x 2
2 2 2
1 1
g x, k f Ax , k 2 x
2 2
2
2 2
Untuk model SSVM dengan α > 0, maka:
(i) f ( x) dan g ( x, k ) adalah fungsi kecebungan yang kuat.
(ii) x* adalah solusi unik untuk min xRn f x dan xk* juga merupakan solusi uniq dari
min xRn g x, k
(ii) x* adalah solusi unik untuk min xRn f x dan xk* juga merupakan solusi uniq dari
min xRn g x, k
kecembungan yang kuat. Jika Lv ( f ( x)) adalah level set dari f ( x) dan Lv ( g ( x, k )) adalah
level set dari g ( x, k ) , maka berdasarkan pada hasil (ii) Theorem 1 diperoleh:
Lv (( f ( x, k ) Lv ( f ( x)) x | x
2
2
2v
Makalah Pendamping: Matematika 3 275
Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013
Oleh karena itu, Lv ( g ( x, k )) dan Lv ( f ( x)) adalah strict convex set. Dikarenakan hal
tersebut, keduanya merupakan solusi yang unik untuk min xRn f x dan min xRn g x, k
(ii) Jika x* adalah problem optimasi untuk min xRn f x dan xk* adalah problem optimasi
untuk min xRn g x, k , disebabkan oleh problem optimasi dan sifat kecembungan dari
f xk* f x* f x* xk* x*
1 * 2
xk x*
1
xk* x*
2
2 2
2 2
(iii) p( x, ) 0 , maka:
xk* x* g x* , f x* f xk* , f ( xk* )
2
g ( x* , ) f ( x* )
1 2 1 2
p( Ax* b), ( Ax* b)
2 2 2 2
m log 2 2y
2
* 2
Sehingga diperoleh x x *
log 2
2
k 2
(iv) Ketika k mendekati tak hingga , maka:
m log 2
2
* 2 2y
lim x x *
lim log 2 0 Sehingga lim xk* x*
k 2
k
k 2 k
Model PPSSVM
(v) Jika kedua persamaan diatas dijumlahkan dengan catatan f ( x, k ) x maka akan
diperoleh:
g x , k f x* f xk* , k f xk* f x* , k f x*
*
f Ax* , k Ax
1 2 1 2
*
2 2 2 2
2 m
Berdasarkan pada hasil (iii) pada Theorema 3 xk* x* , maka diperoleh
2 216k 2
kesimpulan bahwa persamaan (29) adalah benar.
Hasil dari (iv) pada Theorema 3 menjelaskan bahwa problem optimasi model PPSSVM
mendekati model SVM standar ketika k mendekati positif tak hingga.
Hasil analisis teoritis menunjukkan bahwa model PPSSVM lebih baik dibandingkan
dengan model SSVM. Untuk menunjukan secara jelas perbedaan performansi smooth function
dengan plus function, maka kita gunakan k=10 untuk semua fungsi tersebut dan hasilnya dapat
dilihat pada gambar 1.
Terlihat pada Gambar 1 bahwa piecewise polynomial function mempunyai performansi yang
terbaik untuk plus function. Hal tersebut ditunjukkan pada kurva piecewise polynomial function
yang lebih mendekati pada kurva plus function.
DAFTAR PUSTAKA
Andari, S. (2013), Smooth Support Vector Machine dan Multivariate Adaptive Regression
Splines Untuk Mendiagnosis Kanker Payudara. Tesis ITS.
Anguita, D., Ghelardoni, L., and Ghio, A., (2012). The „K‟ in K-fold Cross Validation. ESANN
2012 proceedings, European Symposium on Artificial Neural Network, Computational
Intelligence and Machine Learning. Bruges (Belgium).
Badan Pusat Statistik, (2005), Identifikasi dan Penentuan Desa Tertinggal 2002. BPS, Jakarta.
Bertsimas, D. and Shioda, R. (2007), Clasification and regression via integer optimazion,
Journal of Operation Research, Vol 55, No.2, hal 252-271.
Breiman, L., Friedman, J., Olshen, R. and Stone, C. (1984). Classification and Regression
Trees, Wadsworth International Group.
Dirjen Pemberdayaan Masyarakat Desa (PMD) Kemendagri, (2012), Profil Desa dan
Kelurahan 2011: Data Dasar Tipologi, Klasifikasi, Kategori Desa dan Kelurahan Menurut
Provinsi, Dirjen PMD Kemendagri, Jakarta.
Fang, K.T., Winker, P., Lin, D.K.J., and Zhang, Y. (2000), Uniform Design: Theory and
Application, American Statistical Association and American Society for Quality, Vol. 42,
No 3, hal 237 – 248.
Gajdos, C., tarter, P.I., Bleiweiss, I.J., Herman, G., de Csepel, J., Estabrook, A., and Rademaker,
A.W. (2002), Mammography appearance of nonpalpable breast cancer reflects pathologi
characteristics, Annals of Surgery, Vol 235, No. 2, hal 246 – 251.S
Gunn, S. (1998), Support Vector Machines for Clasification and Regression, Technical Report,
ISIS.
Huang, C.M., Lee, Y.J., Lin D.K.J., and Huang, S.Y. (2007), Model selection for support vector
machine via uniform design, Computational Statistics and Data Analysis, Vol. 52. hal. 335-
346.
Hsu, C.W., Chang, C. C., and Lin, C. J. (2008). A practical guide to Support Vector
Classification, Taipe: Information Engineering National Taiwan University.
Kohavi, R. (1995), A Study of Cross-Validation and Bootstrap for Accuracy Estimation and
Model Selection, Appears in the International Joint Coference on Artificial Intelligence
(IJCAI), 1995.
Luo, L., Lin, C., Peng, H. and Zhou, Q. (2006), A Study on Piecewise Polynomial Smooth
Approximation to the Plus Function,In proceedings of the ICARCV.
Lee, Y.J., and Mangasarian, O.L. (2001), A Smooth Support Vector Machine, Jurnal of
Computational Optimization and applications 20:5-22.
Mangasarian, O.L., and Musicant, D.R. (1999), Succesive overrelaxation for support vector
machines, IEEE Transactions on Neural Network, 10, hal. 1032 – 1037.
Metz, C.E. (2006), Receiver Operating Characteristic Analysis: A Tool for the Quantative
Evolution of Observer Performance and Imaging Systems, Journal of Amerian College of
Radiology, Vol.3, hal. 413 – 422.
Purnami, S.W., and Embong, A. (2008b), Smooth Support Vector Machine for breast cancer
classification, The 4th IMT-GT 2008 Conference of Mathematics, Statistics and Its
Application (ICMSA 2008), Banda Aceh, Indonesia.
Purnami, S.W., Embong, A., Zain, J.M., and Rahayu, S.P. (2009), A Comparison of Smoothing
Function In Smooth Support Vector Machine, will be presented in International
Conference on Software Engineering & Computer Systems.
Purnami, S.W., Embong, A., and Zain, J.M. (2009), Application of data mining technique using
best polynomial smoot support vector machine in breast cancer diagnosis, International
Conference in Robotic, Vision, Signal Symposisum and Power Application (Rovsip 2009)
Langkawi Kedah, Malaysia.
Vapnik, V. (1995), The Nature of Statistical Learning Theory, Springer-Verlag, New York
Wu, Q., andWenqing, W. (2013), Piecewise-Smooth Support Vector Machine for Clasification,
Hindawi Publishing Corporation Matematical Problems in Engineerin, Volume 2013,
Article ID 135149.
Yuan, Y., and Huang, T. (2005), A Polynomial Smooth Support Vector Machine for
Classification, Springer-Verlag, Berlin Heidelberg, LNAI 3584: 157-164.
Yuan, Y., Yan J., and Xu, C. (2005), Polynomial Smooth Support Vector Machine (PSSVM),
Chinese Journal of Computers, 28: 9-17.
Yuan, Y., Fan, W., and Pu, D. (2007), Spline Function Smooth Support Vector Machine For
Clasification, Journal of Industrial and Management Optimization 3(3): 529 – 542.
Abstract
Kemiskinan merupakan salah satu masalah serius yang dihadapi oleh bangsa ini.
Pelaksanaan program pengentasan kemiskinan secara langsung diimplementasikan dengan
perumusan beberapa program yang ditujukan untuk membantu kantong-kantong (wilayah)
kemiskinan dengan sasaran wilayah merujuk kepada identifikasi desa tertinggal. Oleh
karena itu identifikasi mengenai status ketertinggalan desa yang tepat sangat diperlukan
terlebih jika itu berhubungan dengan masalah yang cukup krusial seperti perencanaan
program pembangunan dan bantuan dana untuk pembangunan. Beberapa penelitian telah
banyak dilakukan untuk melakukan klasifikasi terhadap status ketertinggalan desa. RSVM
adalah metode klasifikasi untuk data yang berukuran besar dengan beberapa keunggulan
seperti waktu pemrosesan yang lebih pendek dan penggunaan memori yang lebih kecil.
Metode tersebut menggunakan fungsi kernel dan teknik K-fold Cross Validation (KCV)
dalam seleksi model dan estimasi error. Penelitian ini akan mengkaji dan membandingkan
penggunaan lebih dari satu fungsi kernel dan mengatur jumlah subset dalam teknik KCV
sehingga mendapatkan estimasi yang tepat dalam pembentukan model terbaik pada
klasifikasi status ketertinggalan desa di Provinsi Jawa Timur.
PENDAHULUAN
Kemiskinan merupakan salah satu masalah yang dihadapi oleh bangsa ini. Pemerintah
telah berupaya keras untuk terus menekan angka kemiskinan, dengan terus memperbaiki
perencanaan pembangunan dengan tujuan untuk meningkatkan kesejahteraan masyarakat.
Upaya tersebut dapat dilihat melalui lebih dari 50 program penanggulangan kemiskinan yang
terdapat di 21 kementrian dan lembaga negara (Menko Kesra, 2009).
Pelaksanaan program pengentasan kemiskinan secara langsung pada awalnya
diimplementasikan oleh dengan perumusan beberapa program yang ditujukan untuk membantu
kantong-kantong (wilayah) kemiskinan dengan sasaran penduduk miskin. Sasaran wilayah
merujuk kepada identifikasi wilayah-wilayah (desa/kecamatan) miskin/tertinggal. Sejak tahun
2009, pemerintah melalui Tim Koordinasi Penanggulangan Kemiskinan (TKPK) yang
selanjutnya menjadi Tim Nasional Percepatan Penanggulangan Kemiskinan (TNP2K), akan
meningkatkan cakupan serta keterlibatan masyarakat melalui harmonisasi dan sinkronisasi
program penanggulangan kemiskinan agar lebih efektif dan terukur tingkat keberhasilannya
(Menko Kesra, 2009).
Harmonisasi dan sinkronisasi program penanggulangan kemiskinan diimplementasikan
melalui pengelompokan tiga klaster program, yaitu Program Bantuan dan Perlindungan Sosial,
Program Pemberdayaan Masyarakat (PNPM) Mandiri, serta Program Pemberdayaan Usaha
Mikro dan Kecil dengan Kredit Usaha Rakyat (KUR) sebagai salah satu instrumennya (TNP2K,
2012).
PNPM Mandiri merupakan payung dan kerangka kebijakan bagi program-program
penanggulangan kemiskinan berbasis pemberdayaan masyarakat yang merupakan instrumen
untuk mengkoordinasikan seluruh program kemiskinan berbasis pemberdayaan masyarakat pada
semua kementerian dan lembaga (Menko Kesra, 2009). Salah satu ciri program PNPM Mandiri
adalah memberikan Bantuan Langsung Masyarakat (BLM) untuk kegiatan yang dilaksanakan
secara swakelola oleh masyarakat.
Ruang lingkup kegiatan PNPM Mandiri terbuka bagi semua kegiatan penanggulangan
kemiskinan yang diusulkan dan disepakati masyarakat yang diantaranya meliputi penyediaan
prasarana/sarana lingkungan dan infrastruktur pemukiman, sosial dan ekonomi melalui kegiatan
padat karya (TNP2K, 2012). Desa sasaran program dan kegiatan telah ditetapkan oleh
pemerintah melalui Keputusan Menteri Negara Pembangunan Daerah Tertinggal.
Sehubungan dengan penentuan desa sasaran tersebut, Badan Pusat Statistik (BPS)
sebagai penyedia data resmi statistik pemerintahan di Indonesia, memberikan data dasar
sekaligus melakukan identifikasi dan pengelompokan desa tertinggal sebagai pendekatan untuk
mengidentifikasi daerah kantong-kantong kemiskinan.
Penetapan kriteria ketertinggalan selanjutnya dilakukan dengan menggunakan enam
kriteria dasar sesuai kepmen PDT nomor 1 Tahun 2005, yaitu perekonomian masyarakat,
sumber daya manusia, sarana dan prasarana (infrastruktur), kemampuan keuangan lokal (celah
fiskal), aksesbilitas, dan karakteristik daerah (Edy, 2009).
Provinsi Jawa Timur sebagai provinsi dengan jumlah penduduk terbesar kedua di
Indonesia memiliki jumlah desa terbanyak sebesar 8.502 desa. Banyaknya desa tersebut
menyebabkan penentuan status ketertinggalan desa menjadi sangat penting, khususnya apabila
berkaitan dengan perencanaan anggaran dan pengambilan kebijakan.
Provinsi Jawa Timur memiliki jumlah penduduk miskin nomor dua terbesar di
Indonesia pada tahun 2011 yaitu sebesar 5,2 juta jiwa yang sebagian besar terdapat di pedesaan.
3,49 juta jiwa penduduk miskin di Provinsi Jawa Timur berada di pedesaan yang merupakan
jumlah penduduk miskin terbesar di wilayah pedesaan di Indonesia (18,45 persen). Hal tersebut
menunjukkan bahwa kantong kemiskinan di provinsi tersebut terdapat di wilayah sehingga
klasifikasi status ketertinggalan desa yang tepat sangat diperlukan di sini.
Beberapa penelitian yang telah dilakukan mengenai identifikasi desa tertinggal
menggunakan metode seleksi variabel yang diduga menjadi faktor penentu status ketertinggalan
desa. Salah satu metode yang digunakan antara lain Dewi Wahyuningsih (2009) yang
menganalisis karakteristik desa tertinggal dengan Structural Equation Modelling (SEM),
sedangkan Syarif (2008), melakukan pemodelan desa tertinggal di Jawa Barat Tahun 2005
dengan Pendekatan MARS. Penelitian lain mengenai ketertinggalan daerah adalah Evaluasi
karena itu penelitian ini akan menggunakan teknik KCV dengan beberapa nilai k untuk
mendapatkan model berdasarkan KCV yang mempunyai tingkat akurasi tertinggi.
Berdasarkan paparan di atas, permasalahan yang akan diselesaikan melalui penelitian
ini adalah bagaimana ketepatan metode klasifikasi RSVM menggunakan beberapa fungsi kernel
berdasarkan KCV dengan nilai K yang memiliki tingkat akurasi tertinggi
Berdasarkan permasalahan yang telah dirumuskan sebelumnya, tujuan yang ingin
dicapai melalui penelitian ini adalah membandingkan tingkat ketepatan klasifikasi untuk status
ketertinggalan desa di Provinsi Jawa Timur melalui pendekatan RSVM dengan beberapa fungsi
kernel berdasarkan KCV yang memiliki tingkat akurasi tertinggi.
Manfaat yang ingin diperoleh dari hasil penelitian ini adalah memperoleh klasifikasi
yang tepat mengenai status ketertinggalan desa di Provinsi Jawa Timur untuk membantu
perencanaan dan pengambilan keputusan agar lebih efektif dan tepat sasaran dengan
menggunakan machine learning. Selain itu penelitian ini juga diharapkan dapat menambah
wawasan keilmuan dalam menerapkan RSVM dengan menggunakan fungsi kernel dan teknik
KCV sebagai salah satu alternatif metode untuk klasifikasi sampel dalam ukuran besar
khususnya untuk status ketertinggalan desa.
METODE PENELITIAN
Jenis, Waktu dan Tempat Penelitian
Penelitian ini menggunakan pendekatan kuantitatif dengan metode machine learning yaitu
menggunakan Reduce Support Vector Machine (RSVM).
Target/Subjek Penelitian
Penelitian dilakukan terhadap populasi desa di Provinsi Jawa Timur. Sebanyak 8.502
desa di Provinsi Jawa Timur akan diteliti dan dikaji mengenai status ketertinggalan yang
dimiliki.
Data
Data yang digunakan dalam penelitian ini adalah data sekunder yaitu data Potensi Desa
(PODES) dan data Klasifikasi desa/kelurahan tahun 2011. Data merupakan data Populasi yang
dikumpulkan melalui sensus. Data PODES dikumpulkan oleh Badan Pusat Statistik (BPS) yang
pendataannya dilaksanakan pada tahun 2011, sedangkan data klasifikasi desa/kelurahan
merupakan data yang dikeluarkan oleh Dirjen Pemberdayaan Masyarakat Desa (PMD)
Kementrian Dalam Negeri (Kemendagri).
Variabel Penelitian
Variabel yang akan digunakan dalam penelitian ini dipilih berdasarkan referensi dari
penelitian sebelumnya yaitu pada publikasi BPS mengenai identifikasi dan Penentuan Desa
tertinggal 2002, indikator desa tertinggal menurut Kementrian Pembangunan Daerah Tertinggal
(PDT) Tahun 2007 dan Profil Desa dan Kelurahan (2012) menurut Kementrian Dalam Negeri
c.q. Dirjen PMD.
Profil desa dan kelurahan memuat tipologi dan klasifikasi desa dan kelurahan yang
merupakan karakteristik desa dan kelurahan berdasarkan potensi sumber daya alam dan
interaksi dengan kegiatan sosial ekonomi masyarakat (pola nafkah). Tipologi desa dan
kelurahan mempertemukan konsep sumber daya alam, konsep pemberdayaan masyarakat, dan
pola nafkah, dan aspek kewilayahan. Proksi terhadap profil desa dan kelurahan disusun
berdasarkan data Potensi Desa dari Badan Pusat Statistik (BPS) antaralain PODES Tahun
2011.Penelitian dilakukan pada seluruh desa/kelurahan yang ada di Provinsi Jawa Timur yaitu
sebanyak 8.502 desa/kelurahan.
Variabel respon (Y) merupakan variabel yang berisi kelas yang terdiri atas dua kategori
yaitu {+1} untuk desa/kelurahan tertinggal dan {-1} untuk desa/kelurahan tidak tertinggal.
Pengukuran variabel respon didapat Profil Desa dan Kelurahan yang dikeluarkan dari Dirjen
PMD, sedangkan variabel prediktor didapatkan dari hasil pendataan PODES Provinsi Jawa
Timur Tahun 2011 yaitu sebanyak 17 variabel.
Teknik Analisis Data
Smooth Support Vector Machine (SSVM)
SSVM adalah pengembangan baru dari SVM dengan fungsi kernel dan non linier untuk
analisis klasifikasi menggunakan metode smoothing. SVM pertama kali diperkenalkan oleh
Boser, Guyon dan Vapnik pada tahun 1992 sebagai rangkaian harmonis konsep-konsep
unggulan dalam statistical learning theory. Prinsip dasar SVM adalah linier classifier dan
selanjutnya dikembangkan agar dapat bekerja pada problem non linier dengan memasukkan
konsep kernel trick pada ruang kerja berdimensi tinggi (Vapnik, 1995).
SSVM seperti halnya SVM digunakan untuk klasifikasi dua kategori atau binomial untuk
memisahkan titik-titik yang berasal dari dua kelas yang berbeda misalnya kelas {+1} dan {-1},
dengan hyperplane tunggal pada ruang berdimensi banyak yang membentuk partisi yang
kemudian diselesaikan secara non linier (Vapnik and Cortez, 1995). Margin adalah jarak antara
hyperplane dengan pola terdekat masing-masing class. Pola yang paling dengan ini disebut
support vector.
Program algoritma dari SVM linier standar adalah
1
minve ' y w ' w
( w ,b , y )R p1n
2
dengan kendala D(Aw e ) y e (1)
y0
v : merupakan parameter dalam SVM yang bernilai positif
y : adalah vektor variabel slack berukuran n x 1 yang mengukur kesalahan
klasifikasi dan bernilai nonnegative
e : adalah vektor kolom berukuran n dan bernilai satu
Makalah Pendamping: Matematika 3 285
Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013
x'w (2)
Terdapat dua bidang pemisah yang paralel dengan bidang pemisah di atas yang merupakan
batas kedua kelas yaitu
x ' w 1
(3)
x ' w 1
dengan jarak tertentu yang disebut margin. Margin terbesar dapat ditemukan dengan
1
memaksimalkan nilai jarak antara hyperplane dan titik terdekatnya yaitu . x
w
merupakan vektor yang menyusun ruang riil berdimensi R dan menentukan lokasi
p
relatif terhadap kelas asli. Pada persamaan tersebut y diminimasi dengan bobot v.
Sehingga bidang yang memisahkan kedua kelas dengan soft margin adalah
x ' w y i 1, untuk x ' Ai dan Dii 1
x ' w y i 1, untuk x ' Ai dan Dii 1
(4)
dengan kendala D( Aw e ) y e
y0
v
Dalam pendekatan smoothing, y diminimasi dengan bobot , sehingga problem dari
2
SVM yang dimodifikasi menjadi SSVM adalah
v 1
minn1m y'y (w'w 2 )
( u , , y )R 2 2
dengan kendala D(Aw e ) y e (5)
y0
dimana untuk memperoleh solusi dari problem tersebut variabel slack dapat ditulis menjadi
v 1
(e - D(Aw - e )) 2 (w'w 2 )
2
min (7)
( w, )Rn1 2 2
dimana 0
4. Sigmoid ,dengan fungsi K ( Ai , Aj ) tanh( AiT Aj r )
dimana 0
GSVM memecahkan problem matematis untuk kernel umum K ( A, A ') sehingga
f (u) adalah fungsi cembung pada R m yang meminimasi parameter u dan v merupakan
bilangan positif yang memboboti error klasifikasi e'y dibandingkan minimasi dari u . Program
solusi untuk u dan menghasilkan bidang pemisah nonlinier yaitu
Formulasi linier SSVM didapatkan bila K (A, A ') AA ' , w = A'Du dan
1
f (u) u'DAA'Du . Sehingga digunakan tujuan klasifikasi yang berbeda yang meminimasi
2
parameter u dan dalam persamaan nonlinier
v 1
min2 m1 y'y + (u'u 2 )
( u , , y )R 2 2
dengan kendala D( K ( A, A')Du - e ) y e (10)
y0
yang dapat ditulis menjadi
Sehingga didapatkan SSVM dengan problem optimasi tanpa kendala sebagai berikut :
v 2 1
minm1 (e - D( K ( A, A')Du - e )) (u'u 2 ) (12)
( u , )R 2 2 2
yang merupakan fungsi objektif mempunyai solusi unik tetapi tidak mempunyai turunan kedua,
dan tidak smooth, oleh karena itu disarankan untuk menerapkan metode Newton dengan teknik
smoothing dan menggantikan x atau fungsi plus dengan p( x, ) yaitu integral dari fungsi
1
sigmoid neural network sehingga dapat dituliskan menjadi
1 x
1
p( x, ) x log(1 x ), 0 (13)
Fungsi p di atas (dengan sebagai parameter penghalus) digunakan untuk menggantikan fungsi
plus sehingga didapatkan model SSVM yaitu
v 1
p(e - D(Aw - e ), ) 2 (w'w 2 )
2
minp1 (14)
( w, )R 2 2
Persamaan di atas yang telah dimodifikasi dengan penambahan parameter penghalus
dan dapat diperoleh turunan keduanya sehingga penyelesaian problem tersebut dapat dilakukan
dengan menerapkan algoritma konvergen kuadrat Newton dengan tahapan Armijo atau disebut
Algoritma Newton Armijo yang membuat algoritma tersebut konvergen secara global.
Reduce Support Vector Machine (RSVM)
SVM dengan kernel linier dan non linier menjadi algoritma yang cukup terkenal untuk
klasifikasi. Melalui kernel mapping, bermacam model SVM berhasil dengan efektif dan fleksibel
untuk model non linier. Namun terdapat beberapa keterbatasan yang dimiliki SVM di antaranya
masalah banyaknya waktu dan penyimpanan yang diperlukan untuk memecahkan masalah
pemrograman khususnya untuk data dengan ukuran besar. Kesulitan yang dihadapi dalam
penggunaan kernel non linier pada data berukuran besar secara garis besar ada dua. Pertama
adalah kesulitan komputasi dalam memecahkan problem optimasi tanpa kendala yang besar
yang melibatkan fungsi kernel yang membutuhkan memori sangat besar bahkan sebelum
dimulainya proses pencarian solusi. Kedua adalah kesulitan dalam penggunaan formula untuk
bidang pemisah pada x yang merupakan titik baru yang tidak terlihat. Hal tersebut berarti data
yang berukuran besar memerlukan memori besar dan waktu penghitungan yang lama. Untuk
menangani kesulitan komputasi tersebut, sebagai alternatif, disarankan metode Reduced Support
Vector Machine (RSVM) yang disarankan oleh Lee dan Mangasarian ( 2001).
RSVM diturunkan dari Generalized Support Vector Machine (GSVM) dan Smooth
Support Vector Machine (SSVM) (Lee and Huang, 2005; Purnami, Zain, Heriawan, 2012).
RSVMberangkat dari ide menggunakan bagian kecil (m) dari total dataset (m) yang dipilih
secara random atau acak ( m selalu lebih kecil dibandingkan m ) yang disebut A . Untuk
selanjutnya digunakan A ' untuk menggantikan A ' pada kedua probel optimasi tanpa kendala
untuk mengatasi masalah ukuran matriks dan waktu pemrosesan.
Formulasi RSVM
K ( A, A ') R mxm dan memodifikasi formulasi berikut untuk data reduced A Rmxn yang
v 1
minm1m y'y (u'u 2 )
( u , , y )R 2 2
dengan kendala D( K ( A, A')Du - e ) y e (15)
y0
Data yang diperoleh akan diolah menggunakan metode RSVM dengan menggunakan
software Matlab. Pendekatan machine learning dengan seleksi parameter dilakukan dalam
penelitian ini untuk mendapatkan model terbaik menggunakan Uniform Design (UD) dan K-fold
Cross Validation (KCV). Dalam penelitian ini dilakukan perbandingan penggunaan fungsi
kernel Gaussian dan Linear dengan nilai K sebesar 3,4,5, dan 10 pada KCV untuk mendapatkan
model terbaik. Langkah-langkah dan metodenya adalah sebagai berikut
1. Analisis Deskriptif
2. Memperoleh klasifikasi status ketertinggalan desa/kelurahan di Provinsi Jawa Timur
dengan metode RSVM menggunakan fungsi kernel dan teknik KCV dengan nilai K yang
memiliki tingkat akurasi tertinggi
i. Membangkitkan atau membentuk subset matriks dari elemen full matriks secara
random untuk menggantikan / representasi dari full matriks
ii. Menerapkan fungsi kernel RBF/Gaussian, dan Linear dalam model RSVM
iii. Membuat partisi data dengan KCV dengan nilai k sebesar 3,4,5, dan 10 dalam
mendapatkan parameter untuk membangun model RSVM
iv. Menentukan kombinasi parameter yang paling tepat untuk model fungsi kernel
Gaussian, dan Linear dengan teknik KCV berdasarkan tingkat akurasi tertinggi
v. Membangun model RSVM menggunakan fungsi kernel Gaussian, dan Linear
berdasarkan teknik KCV yang mempunyai tingkat akurasi tertinggi
3. Membandingkan tingkat akurasi ketepatan klasifikasi untuk status ketertinggalan
desa/kelurahan di Provinsi Jawa Timur dengan pendekatan RSVM dengan fungsi kernel
Gaussian, dan Linear berdasarkan teknik KCV dengan nilai K yang mempunyai tingkat
akurasi tertinggi
Tabel di atas menunjukkan secara umum, kernel linear memberikan hasil yang lebih
baik dibandingkan dengan kernel RBF, hal tersebut ditunjukkan dengan training error yang
lebih kecil dan tingkat akurasi yang lebih besar.
Apabila dilihat dari teknik KCV, 10-fold CV ternyata memang memberikan hasil yang
paling baik dibandingkan ketiga nilai K yang lain baik dari sisi training error pada kedua fungsi
kernel yaitu berturut-turut sebesar 0,34 persen dan 0,25 persen. Tingkat akurasi pada
penggunaan 10-fold CV juga paling tinggi yaitu sebesar 0,60 persen dan 0,74 persen.
Berdasarkan uraian di atas terlihat bahwa penggunaan fungsi kernel Linear dan 10-fold
CV pada metode RSVM akan memberikan training error terendah dan tingkat akkurasi tertinggi
pada klasifikasi status ketertinggalan desa di Provinsi Jawa Timur.
DAFTAR PUSTAKA
Agresti, A., 1996, An Introduction to Categorical Data Analysis, John Willey and Son, Inc,
United States of America
Andari, S., 2012, Smooth Support Vector Machine dan Multivariate Adaptive Regression
Splines Untuk Mendiagnosis Kanker Payudara, Tesis, Mahasiswa Jurusan Statistika
Fakultas MIPA ITS, Surabaya.
Anguita, D., Gelardoni, L., Ghio, A., Oneto, L., and Ridella, S., (2012), The K in K-fold Cross
Validation, European Symposium on Artificial Neural Networks, Computational
Intelligence and Machine Learning (ESANN 2012) Proceedings, Bruges (Belgium), 25-
27 April 2012 .
Badan Pusat Statistik, 2005, Identifikasi dan Penentuan Desa Tertinggal 2002, Badan Pusat
Statistik, Jakarta.
Badan Pusat Statistik, 2011, Pedoman Pendataan PODES 2011, Badan Pusat Statistik, Jakarta.
Badan Pusat Statistik, 2012, Profil Kemiskinan Indonesia September 2011, Berita Resmi
Statistik No. 06/01/Th. XV, 2 Januari 2012, Badan Pusat Statistik, Jakarta
BAPPENAS, 1993, Panduan Pelaksanaan Program IDT 1994-1999, Jakarta.
Chien, L.J., Chang, C.C. and Lee, Y.J., 2010, Variant methods of reduced set selection for
reduced support vector machines, Journal of Information Science and Engineering, Vol.
26 (1).
Cortes, C. And Vapnik, V., 1995, Support vector networks, Machine Learning, 20, 273-297.
Dimulyo S., 2009, Penggunaan Geographically Weighted Regression-Kriging untuk
Klasifikasi Desa Tertinggal, dalam Seminar Nasional Aplikasi Teknologi Informasi
(SNATI) 2009, Yogyakarta.
Dirjen Pemberdayaan Masyarakat Desa (PMD) Kemendagri, (2012), Profil Desa dan
Kelurahan 2011 : Data Dasar Tipologi, Klasifikasi, Kategori Desa dan Kelurahan
Menurut Provinsi,Dirjen PMD Kemendagri, Jakarta.
Djuraidah, A., 2009, Analisis Status Ketertinggalan Daerah dengan Analisis Diskriminan,
Seminar Nasional Matematika dan Pendidikan Matematika, UNY, Yogyakarta.
Edy, L., 2009, Pencapaian Pembangunan Daerah Tertinggal Lima Tahun Terakhir, Jurnal
Sekretariat Negara, No : 13, Agustus 2009.
Gunn, S., 1998, Support Vector Machines for Clasification and Regression, Technical Report,
ISIS.
Hidayat, S., 2008, Permodelan Desa Tertinggal di Jawa Barat Tahun 2005 dengan Pendekatan
Mars, Tesis Mahasiswa Jurusan Statistika Fakultas MIPA ITS, Surabaya
Hsu, C.W., Chang, C. C., & Lin, C. J., 2008. A practical guide to Support Vector Classification,
Taipe: Information Engineering National Taiwan University.
Huang, C.M., Lee, Y.J., Lin, D.K.J. and Huang, S.Y., 2007, “Model selection for support
vector machines via uniform design”, A Special issue on Machine Learning and Robust
DataMining of Computational Statisticsand Data Analysis, Vol. 52, pp. 335-346.
Kementrian Pembangunan Daerah Tertinggal, 2011, Indikator Primer Daerah Tertinggal Tahun
2011, KPDT : kpdt.bps.go.id/index.php?AnalisisData/ analisa1#, Jakarta (diakses 5 Juli
2013).
Kohavi, R., 1995, A study of cross-validation and bootstrap for accuracy estimation and model
selection. InInternational joint Conference on artificial intelligence, volume 14, pages
1137–1145, 1995.
Lee, Y. J., 2001, Support vector machines in data mining, PhD thesis, University of Wisconsin-
Madison, USA.
Lee, Y.J., & Mangasarian, O.L., 2001, A Smooth Support Vector Machine, Jurnal of
Computational Optimization and applications 20:5-22.
Lee, Y.J., & Mangasarian, O.L., 2001 “RSVM: Reduced Support Vector Machines”, In
Proceedings of the First SIAM International Conference on Data Mining.
Lee, Y.J. and Huang, S.Y., 2007, “Reduced Support Vector Machines: A Statistical Theory”,
IEEE Trans.Neural Network, Vol.18, no. 1.
Lin, K.M and Lin, C.J., 2003, “A study on reduced supportvector machines”, IEEE
Trans.Neural Network, Vol.14,no.6, pp.1449-1459.
Menteri Negara Pembangunan Daerah Tertinggal Republik Indonesia, 2005, Strategi Nasional
Pembangunan Daerah Tertinggal, Kementerian Negara Pembangunan Daerah Tertinggal
Republik Indonesia, Jakarta
Menteri Koordinator Kesejahteraan Masyarakat, 2009, Membangun Kesejahteraan dan
Kemandirian Bangsa, Kemenkesra
http://www.setneg.go.id/index.php?option=com_content&task=view&id=2263&Itemid=
219 (diakses tanggal 24 Agustus 2013).
Mubyarto, 1994, Keswadayaan Masyarakat Desa Tertinggal, Aditya Media,
Yogyakarta.
Narayan, D., Patel, R., Schafft, K., Rademacher, A., Schulte, S.K, 1999, Can Anyone Hear Us?
Voice From 47 Countries. Poverty Group, PREM. World Banks.
Nugroho, A.S., Witarto, A.A., Handoko, Dwi, Support Vector Machine : Teori dan Aplikasinya
dalam Bioinformatika, http://ilmukomputer.com (diakses 4 Juli 2013).
Purnami, S.W., Zain, J.M., Heriawan, T., (2011), An alternative algorithm for classification
large categorical dataset: k-mode clustering reduced support vector machine.
International Journal of Database Theory and Application Vol. 4, No. 1, March 2011.
Putra, A.S., 2013, Daerah Tertinggal, Perdesaan Swadaya/Tertinggal dan Kecamatan Tertinggal,
http://opentrade2222.blogspot.com/2013/05/daerah-tertinggal-perdesaan.html (diakses
tanggal 24 Agustus 2013).
Tim Nasional Percepatan Penanggulangan Kemiskinan (TNP2K), 2012, Buku Saku PNPM
Mandiri, TNP2K, Jakarta.
Tim Nasional Percepatan Penanggulangan Kemiskinan (TNP2K), 2012, Daftar Indikatif Lokasi
dan Alokasi BLM Program PNPM Mandiri 2012, TNP2K, Jakarta.
Vapnik, V., 1995, The Nature of Statistical Learning Theory, Springer-Verlag, New York.
Wahyuningsih, D., 2009, Analisis Karakteristik Desa Tertinggal dengan Stuctural Equation
Modelling, Tesis Jurusan Statistika Fakultas MIPA ITS, Surabaya.
Abstrak
Uji kenormalan berdasarkan pada kategori fungsi distribusi empiris ada empat yaitu
uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling.
Keempat uji tersebut memiliki statistik uji yang berbeda. Hal ini menyebabkan adanya
perbedaan kesimpulan diantara keempat uji tersebut sehingga perlu untuk
dibandingkan. Hasil perbandingan dari uji-uji tersebut menggunakan simulasi Monte
Carlo bahwa uji Anderson-Darling mempunyai kepekaan paling tinggi untuk menolak
ketidaknormalan suatu data.
Kata kunci : uji Kolmogorov-Smirnov, uji Kuiper, uji Cramer-von Mises, uji
Anderson-Darling,Simulasi Monte Carlo.
kenormalan data.
Selanjutnya, dalam penelitian ini dilakukan pengembangan terhadap hasil penelitian
Stephens yaitu perbandingan menggunakan metode simulasi Monte Carlo dengan 10.000 kali
pengulangan dan ukuran sampel 10, 20,...,100. Hasil perbandingan keempat uji tersebut
disajikan dalam bentuk grafik persentase menolak H0.
2. PEMBAHASAN
2.1 Prosedural. Prosedural merupakan langkah-langkah pengujian hipotesis untuk mengetahui
sampel acak berasal dari populasi berdistribusi normal atau tidak. Berikut langkah-langkah
pengujian hipotesis.
(1) Hipotesis
H0 : sampel acak berasal dari populasi berdistribusi normal
H1 : sampel acak tidak berasal dari populasi berdistribusi normal
(2) Tingkat signifikansi ()
(3) Daerah kritis
H0 ditolak jika statistik uji > nilai kritis.
Nilai kritis bergantung pada yang diambil.
(4) Statistik uji
Modifikasi statistik Kolmogorov-Smirnov dinyatakan
0,85
𝐷∗ = 𝑛 − 0,01 + 𝐷
𝑛
𝑖 (𝑖−1)
dengan 𝐷 + = max𝑖=1,2,…,𝑛 − 𝑧𝑖 , 𝐷 − = max𝑖=1,2,…,𝑛 𝑧𝑖 − , dan
𝑛 𝑛
𝐷 = max 𝐷 +, 𝐷 −
Dimana 𝐷 adalah statistik Kolmogorov-Smirnov, 𝑛 adalah banyaknya sampel acak dan
(𝑥 𝑖 −𝑥 )
𝑧𝑖 adalah distribusi probabilitas kumulatif normal standar untuk 𝑤𝑖 = dengan 𝑥𝑖
𝑠
Mises.
Modifikasi statistik Anderson-Darling ditentukan dengan
∗ 0,75 2,25 2
𝐴2 = 1 + + 2 𝐴
𝑛 𝑛
1 𝑛
dengan 𝐴2 = −𝑛 − 𝑛 𝑖=1 2𝑖 − 1 ln 𝑧𝑖 + ln(1 − 𝑧𝑛+1−𝑖 ) .
2.2 Simulasi Monte Carlo untuk Keempat Uji. Langkah awal dari simulasi ini adalah
membangkitkan bilangan acak dari distribusi eksponensial, chi-kuadrat, gamma, beta, dan
uniform. Bilangan acak yang dibangkitkan tersebut dipandang sebagai sampel acak.
2.2.1 Sampel Berdistribusi Eksponensial. Pada simulasi pertama, sampel dibangkitkan dari
distribusi eksponensial dengan parameter 𝜃 = 7. Hasil simulasi disajikan dalam grafik
persentase menolak H0 dengan bervariasi ukuran sampel yang tampak dalam Gambar 1. Gambar
1 menunjukkan semakin besar ukuran sampel, persentase menolak H0 untuk keempat uji
tersebut juga semakin besar.
100
90
80
Persentase menolak H0
70
60
50
Kolmogorov-Smirnov
40 Kuiper
Cramer-von Mises
Anderson-Darling
30
10 20 30 40 50 60 70 80 90 100
n
Uji Anderson-Darling memiliki persentase menolak H0 yang lebih besar dari uji Kuiper
dan Cramer-von Mises. Namun, perbedaan persentase menolak H0 untuk ketiga uji tersebut
tidak signifikan sehingga dianggap memiliki kepekaan yang sama. Sedangkan uji Kolmogorov-
Smirnov memiliki persentase menolak H0 yang paling kecil diantara ketiga uji tersebut. Tetapi
mulai 𝑛 = 50, uji Kolmogorov-Smirnov sudah memiliki kepekaan yang sama dengan ketiga
uji yang lain. Ini artinya keempat uji tersebut sama kuat dalam menguji kenormalan sehingga
dapat memberikan kesimpulan yang sama.
2.2.2 Sampel Berdistribusi Chi-Kuadrat. Simulasi kedua ini, sampel yang dibangkitkan
berasal dari distribusi chi-kuadrat dengan derajat bebas 𝜐 = 3. Hasil simulasi disajikan dalam
grafik persentase menolak H0 dengan 𝑛 = 10,20, … ,100 yang tampak dalam Gambar 2. Pada
Gambar 2, menunjukkan bahwa hasil simulasi kedua ini hampir sama dengan hasil simulasi
yang pertama. Ketika sampel dibangkitkan dari distribusi chi-kuadrat dengan ukuran sampel
semakin besar, persentase menolak H0 untuk keempat uji tersebut juga semakin besar.
100
90
80
Persentase menolak H0
70
60
50
40
Kolmogorov-Smirnov
Kuiper
30
Cramer-von Mises
Anderson-Darling
20
10 20 30 40 50 60 70 80 90 100
n
100
90
Persentase menolak H0 80
70
60
50
40
30 Kolmogorov-Smirnov
Kuiper
20 Cramer-von Mises
Anderson-Darling
10
10 20 30 40 50 60 70 80 90 100
n
2.2.4 Sampel Berdistribusi Beta. Hasil simulasi keempat tampak pada Gambar 4, yang
mana sampel dibangkitkan dari distribusi beta dengan parameter a = 3 dan b = 1. Dari gambar
tersebut, uji Anderson-Darling yang memiliki persentase menolak H0 paling besar daripada
ketiga uji yang lain. Namun, ketika ukuran sampel sebesar 100, persentase menolak H0 untuk
keempat uji tersebut hampir sama dan selisihnya tidak signifikan. Oleh karena itu, keempat uji
tersebut dapat dianggap memiliki kepekaan yang sama untuk menolak H0 ketika H0 salah
sehingga sama kuat dalam menguji kenormalan dan dapat menghasilkan kesimpulan yang sama
pula.
100
90
80
Persentase menolak H0
70
60
50
40
30 Kolmogorov-Smirnov
Kuiper
20 Cramer-von Mises
Anderson-Darling
10
10 20 30 40 50 60 70 80 90 100
n
2.2.5 Sampel Berdistribusi Uniform. Hasil simulasi kelima disajikan dalam Gambar 5. Pada
simulasi kelima ini, sampel yang dibangkitkan berasal dari distribusi uniform dengan interval a
=-3 dan b =3. Dari gambar tersebut, ketika ukuran sampel diambil kecil, dalam hal ini n = 10
tampak bahwa uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling
dapat memberikan kesimpulan yang sama. Hal ini karena keempat uji tersebut memiliki
perbedaan persentase menolak H0 yang tidak signifikan. Tetapi, ketika ukuran sampel diambil
besar, yaitu 100, terlihat bahwa uji Anderson-Darling memiliki persentase menolak H0 yang
paling besar diantara keempat uji tersebut sedangkan uji Kolmogrov-Smirnov mempunyai
persentase menolak H0 yang paling kecil. Selain itu, tampak bahwa uji Kuiper dan Cramer-von
Mises memiliki selisih persentase menolak H0 yang tidak signifikan sehingga kepekaan kedua
uji tersebut sama. Dengan demikian, Gambar 5 menunjukkan bahwa semakin besar sampel yang
diambil, uji Anderson-Darling akan semakin kuat untuk menolak H0 ketika H0 salah.
100
90
80
70
Persentase menolak H0
60
50
40
30
20 Kolmogorov-Smirnov
Kuiper
10 Cramer-von Mises
Anderson-Darling
0
10 20 30 40 50 60 70 80 90 100
n
3. KESIMPULAN
Berdasarkan hasil simulasi Monte Carlo, diperoleh kesimpulan bahwa uji Anderson-
Darling memiliki kepekaan tertinggi untuk menguji ketidaknormalan suatu data. Sebaliknya, uji
Kolmogorov-Smirnov merupakan uji yang paling lemah dalam menguji ketidaknormalan suatu
data.
DAFTAR PUSTAKA
[1] Arshad, M., M. T. Rsool and M. I. Ahmad, Anderson darling and modified anderson darling
test for generalized pareto distribution, Pakistan Journal of Applied Sciences 3 (2003), no.
2, 85-88.
[2] Conover, W. J., Practical nonparametric statistics, Third Edition, John Wiley and Sons, Inc,
1999.
[3] Daniel, W. W., Statistika nonparametrik terapan, Gramedia, Jakarta, 1989.
[4] Razali, N. M. and Y. B. Wah, Power comparisons of shapiro-wilk, kolmogorov-smrinov,
liliefors, and anderson-darling tests, Journal of Statistical Modelling and Analytics 2
(2011), 21-33.
[5] Stephens, M. A., Edf statistics for goodness of _t and some comparisons, Journal of the
American Statistical Association 69 (1974), 730-737.
Abstrak
Penyakit demam berdarah dengue disebabkan oleh virus dengue yang disebarkan
oleh nyamuk Aedes Aegypti. Sebagian besar kelurahan di Kota Surakarta merupakan
daerah endemis demam berdarah. Penelitian ini bertujuan untuk mendeteksi pola
penyebaran penyakit demam berdarah secara spasial di Kota Surakarta menggunakan
Indeks Moran. Data diambil dari Dinas Kesehatan Surakarta pada tahun 2012. Hasil
penelitian menunjukkan bahwa terdapat autokorelasi spasial dalam penyebaran
penyakit demam berdarah di Kota Surakarta dan kejadiannya berpola clustered.
PENDAHULUAN
Demam berdarah dengue atau dalam istilah kedokteran Dengue Hemorrhagik Fever
(DHF) adalah suatu penyakit yang disebabkan oleh infeksi virus Dengue dan ditularkan melalui
gigitan nyamuk Aedes Aegypti betina dan beberapa spesies Aedes lainnya. Populasi nyamuk ini
akan meningkat pesat pada saat musim hujan. Namun nyamuk Aedes Aegypti juga dapat hidup
dan berkembang biak pada bak-bak penampungan air sepanjang tahun
(http://www.blogdokter.net).
Demam berdarah banyak ditemukan di daerah tropis dan subtropis. Asia menempati
urutan pertama dalam jumlah penderita demam Dengue setiap tahun.
(http://www.blogdokter.net). Kasus demam berdarah di Indonesia tercatat masih tinggi bahkan
paling tinggi dibanding Negara lain di ASEAN (http://health.detik.com).
Sebagian besar kecamatan di Kota Surakarta, Jawa Tengah merupakan daerah endemis
demam berdarah dengan jumlah penderita hampir meningkat setiap tahunnya.
(http://www.mediaindonesia.com). Dari 51 kelurahan yang ada, terdapat 40 kelurahan yang
merupakan daerah endemis dengan jumlah penderita 826 orang dan 12 orang diantaranya
meninggal pada tahun 2008 (Dinas Kesehatan Kota Surakarta, 2009). Terdapat 46 kelurahan
yang merupakan daerah endemis pada tahun 2009 dengan jumlah penderita 684 orang dan 7
diantaranya meninggal ( Dinas Kesehatan Kota Surakarta, 2010). Sedangkan pada tahun
2010 terdapat 49 kelurahan yang merupakan daerah endemis dengan jumlah penderita 533
orang dan 9 diantaranya meninggal (Dinas Kesehatan Kota Surakarta, 2011)
Melihat tingginya angka kasus DBD di Kota Surakarta, maka perlu dilakukan penelitian
yang berhubungan dengan komponen ruang guna menentukan pola epidemi kasus demam
berdarah. Epidemi demam berdarah bervariasi dari satu tempat ke tempat lain, sehingga
komponen ruang juga harus diperhatikan. Autokorelasi spasial merupakan teknik untuk
mengukur tingkat hubungan dalam data yang dipengaruhi oleh keadaan geografis (data spasial)
(Griffith, 2003). Data spasial (ruang) merupakan suatu data yang dipengaruhi oleh ruang
ataupun posisi relatif suatu objek yang diamati (Anselin, 1992).
Untuk mengukur hubungan spasial antar daerah dapat digunakan indeks global dan
indeks local (Wen etal. 2010). Indeks Moran merupakan indeks global yang digunakan
untuk mengukur adanya hubungan spasial dalam penyebaran penyakit. Hubungan spasial ini
diperlukan untuk mengetahui apakah terdapat autokorelasi spasial dalam penyebaran penyakit
demam berdarah yang terjadi di Kota Surakarta.
Penelitian yang berkaitan dengan penyebaran penyakit demam berdarah telah
dilakukan oleh Nakhapakorn dan Supet (2006), kemudian oleh Astutik et al. (2011).
Nakhapakorn dan Supet (2006) meneliti tentang distribusi spasial kasus demam berdarah
yang terjadi di Thailand. Dalam penelitiannya, ia menggunakan indeks Moran, Geary dan
LISA untuk mengukur hubungan spasial antar daerah. Sedangkan Astutik et al. (2011)
mendeteksi hubungan spasial temporal kasus demam berdarah yang terjadi di provinsi Jawa
Timur menggunakan multivariat Moran dan multivariat LISA. Berdasarkan penelitian yang
telah dilakukan oleh Nakhapakorn dan Supet (2006), dan Astutik et al.(2011), maka kasus
kejadian DBD di Kota Surakarta dapat dianalisis secara spasial.
METODE PENELITIAN
Data Penelitian
Data yang digunakan dalam penelitian ini adalah data jumlah penderita DBD di
Surakarta tahun 2012 yang meliputi 51 kelurahan yang berada di 5 kecamatan.Data tersebut
diambil dari di Dinas Kesehatan Kota Surakarta. Data dianalisis menggunakan bantuan software
OpenGeoda dengan melakukan input data ke file shp (shape file) daerah Surakarta.
dengan
𝑛 𝑛
𝑊= 𝑖=1 𝑗 =1 𝑤𝑖𝑗
Selanjutnya membandingkan nilai indeks Moran dengan nilai E[I] untuk mengetahui
1
pola penyebaran penyakit demam berdarah. Nilai 𝐸 𝐼 = − 𝑛−1 = −0,02 dengan n merupakan
jumlah kelurahan yang ada di Kota Surakarta sebanyak 51 kelurahan. Jika nilai indeks Moran
kurang dari -0,02, maka terdapat autokorelasi spasial negatif dan jika nilai indeks Moran lebih
dari -0,02, maka terdapat autokorelasi spasial positif. Ternyata nilai indeks Moran yang
diperoleh lebih besar dari -0,02, sehingga dapat disimpulkan bahwa terdapat autokorelasi spasial
positif dengan pola penyebaran Clustered. Gambar 1 merupakan Moran scatterplot dan nilai
indeks Moran hasil outputOpenGeoda 9.15.
menunjukkan bahwa daerah yang mempunyai jumlah penderita demam berdarah tinggi
berdekatan dengan daerah yang mempunyai jumlah penderita demam berdarah tinggi dan
daerah yang mempunyai jumlah penderita demam berdarah rendah berdekatan dengan daerah
yang mempunyai jumlah penderita demam berdarah rendah.
KESIMPULAN
Berdasarkan hasil analisis menggunakan bantuan Software OpenGeoda diperoleh nilai indeks
Moran yang signifikan, yang berarti bahwa pada tahun 2012 terdapat hubungan spasial yang
mempengaruhi penyebaran penyakit demam berdarah dengan pola penyebaran bersifat
clustered.
DAFTAR PUSTAKA
Anselin, L. (1992). Spatial Data Analysis with GIS : An Introduction to Aplicationin the Social
Sciences. National Center for Geographic Information and Analysis of California
Santa Barbara, CA93106.
________. (1995). Local Indicator of Spatial Association. Geographical Analysis27: 93-115.
Astutik, S , B. Rahayudi, A. Iskandar, R. Fitriani, and S. Murtini. (2011). Detection of
Spatial –Temporal Autocorrelation using Multivariate Moran and LISA Method on
Dengue Haemorrhagic Fever (DHF) Incidence, East Java, Indonesia. European
Journal of Scientific Research Vol (49:2) page 279-285.
Dinas Kesehatan Kota Surakarta. (2009). Profil Kesehatan Kota Surakarta Tahun 2008.
Surakarta.
________. (2010). Profil Kesehatan Kota Surakarta Tahun 2009. Surakarta.
________. (2011). Profil Kesehatan Kota Surakarta Tahun 2010. Surakarta.
Griffith, D. (2003). Spatial Autocorrelation Concept. Department of Geography. Syracuse
University.
Abstrak
Dalam makalah ini diterapkan pemodelan data fuzzy Model Tahani untuk membantu
merekomendasikan pemilihan kendaraan bermotor roda dua dengan kriteria linguistik
terhadap data kendaraan yang memiliki spesifikasi secara pasti. Dengan menggunakan
model ini dihasilkan nilai fire strength yang menjadi dasar pembuatan rekomendasi. Tiga
kemungkinan rekomendasi yang dihasilkan yakni: tidak terdapat hasil rekomendasi,
terdapat satu hasil rekomendasi dan terdapat lebih dari satu rekomendasi kendaraan
bermotor. Ketiga kemungkinan rekomendasi ini dihasilkan berdasar pada nilai fire strength
yang diperoleh menurut kriteria linguistik tertentu.
PENDAHULUAN
Dalam kegiatan jual-beli suatu barang atau jasa, merepresentasi kebutuhan pelanggan
merupakan salah satu faktor penting, dimana pembeli memiliki kriteria akan barang atau jasa
yang diinginkannya. Dalam kehidupan sehari-hari kriteria yang dikemukakan pembeli sering
kali bersifat ambigu dikarenakan setiap individu pembeli memiliki persepsi yang berbeda,
sebagai contoh kriteria harga adalah mahal, murah. Kriteria seperti ini disebut sebagai kriteria
linguistik. Pada kenyataannya kriteria suatu barang biasanya dinyatakan secara pasti atau
deterministik, misalnya harga sebesar tiga belas juta rupiah. Dalam hal ini proses pengambilan
keputusan akan sulit jika seseorang menyebutkan kriteria-kriteria dalam bentuk linguistik.
Data dalam bentuk kualitatif atau linguistik dapat dikelola menggunakan konsep
himpunan fuzzy. Kriteria-kriteria seperti harga, suhu, kecepatan dalam teori himpunan fuzzy
direpresentasikan sebagai variabel fuzzy, yang mana masing-masing variabel fuzzy dinyatakan
dalam beberapa himpunan fuzzy sesuai dengan domain yang ditentukan berdasarkan data crisp.
Sebagai contoh variabel fuzzy harga dikaitkan pada himpunan fuzzy murah, sedang dan mahal
dengan batas-batas domain tertentu.
Bila terdapat beberapa kriteria linguistik dan dimiliki data spesifikasi barang dalam
bentuk crisp, maka untuk menentukan barang yang sesuai kriteria linguistik yang ditentukan,
dapat menggunakan metode pengambilan inferensi yang didasarkan pada pemodelan data fuzzy
Model Tahani. Beberapa penerapan fuzzy Model Tahani yaitu dalam pengambilan keputusan
pembelian mobil (Eliyani, 2009) dan pengambilan keputusan pembelian handphone (Amalia,
2010).
Dalam penelitian ini dikaji bagaimana menentukan rekomendasi pemilihan suatu barang
berdasarkan kriteria linguistik terhadap sejumlah barang yang memiliki spesifikasi pasti, dalam
hal ini adalah kendaraan bermotor roda dua. Seperti diketahui bahwa terdapat banyak sekali
merk dan tipe kendaraan bermotor roda dua, yang mana masing-masing mempunyai spesifikasi
berbeda. Dengan menggunakan fuzzy Model Tahani diharapkan dapat dihasilkan suatu
keputusan atau rekomendasi jenis kendaraan yang sesuai dengan kriteria linguistik yang
ditentukan.
METODE PENELITIAN
Penelitian ini merupakan penerapan fuzzy Model Tahani untuk pemilihan kendaraan
bermotor roda dua berdasarkan kriteria linguistik yang dinyatakan sebagai variabel fuzzy dan
dikaitkan dengan himpunan fuzzy yang sesuai, didasarkan pada spesifikasi data berbagai
kendaraan bermotor roda dua yang diperoleh dari internet yang diakses pada tanggal 10
September 2013.
Landasan teori yang akan digunakan sebagai dasar pengkajian akan dipaparkan secara
singkat yaitu tentang himpunan fuzzy dan fuzzy Model Tahani.
Himpunan Fuzzy
Himpunan crisp memiliki definisi secara tegas, artinya bahwa setiap elemen dalam
himpunannya selalu dapat ditentukan secara tegas apakah ia merupakan anggota dari himpunan
atau tidak. Pada kenyataanya tidak semua himpunan terdefinisi secara tegas, misalnya himpunan
kendaraan murah. Pada himpunan kendaraan murah kita tidak dapat menyatakan secara tegas
apakah kendaraan itu murah atau tidak, sebagai contoh didefinisikan kendaraan murah memiliki
harga kurang dari atau sama dengan Rp 13.000.000,- maka kendaraan dengan harga Rp
13.150.000,- atau Rp. 15.000.000,- menurut definisi tersebut tidak termasuk kendaraan yang
murah. Namun harga Rp.13.150.000,- dapat dipandang sebagai harga yang masih murah karena
lebih dekat dengan nilai 13 juta dibanding 15 juta ke 13 juta, hal ini menimbulkan kekabur pada
arti murah. Untuk mengatasi hal ini maka Zadeh mengaitkan elemen-elemen pada himpunan
tersebut dengan suatu fungsi yang dapat menyatakan derajat kesesuaian elemen-elemen dalam
semestanya. Pada contoh di atas misalkan kendaraan seharga Rp.13.150.000,- dikaitkan dengan
suatu fungsi dan mempunyai nilai fungsi sebesar 0,2.
Misalkan dimiliki himpunan A yang dikaitkan dengan himpunan fuzzy𝐴, maka secara
matematis himpunan fuzzy 𝐴 dalam semesta X dapat dinyatakan sebagai himpunan pasangan
terurut yang didefinisikan oleh :
𝐴= 𝑥, 𝜇𝐴 𝑥 |𝑥 ∈ 𝑋
(a) (b)
Gambar 1. Representasi Fungsi Keanggotaan FuzzyLinear.
Rumus fungsi keanggotaan linear naik dinyatakan seperti pada persamaan (1),
sedangkan fungsi keanggotaan linear turun dinyatakan seperti pada persamaan (2).
0; 𝑥 ≤ 𝑎
𝑥−𝑎
𝜇 𝑥 = 𝑏−𝑎
; 𝑎≤𝑥≤𝑏 (1)
1; 𝑥 ≥ 𝑏
1; 𝑥 ≤ 𝑎
𝑏−𝑥
𝜇 𝑥 = 𝑏−𝑎
; 𝑎≤𝑥≤𝑏 (2)
0; 𝑥 ≥ 𝑏
0; 𝑥 ≤ 𝑎 𝑎𝑡𝑎𝑢 𝑥 ≥ 𝑏
𝑥−𝑎
𝜇 𝑥 = 𝑏−𝑎
; 𝑎≤𝑥≤𝑏 (3)
𝑐−𝑥
; 𝑏≤𝑥≤𝑐
𝑐−𝑏
sebagai dasar pengambilan keputusan. Nilai fire strength merupakan nilai derajat keanggotaan
hasil dari operasi-operasi himpunan fuzzy, sehingganilai fire strength berada pada interval [0,1].
Sebagai contoh, seseorang ingin memilih kendaraan bermotor roda dua dengan kriteria :
“harga murah dan kapasitas silinder besar, atau panjang-kendaraan pendek dan harga sedang”.
Maka berdasarkan kriteria tersebut dibentuk himpunan fuzzy hasil operasi dari masing-masing
himpunan fuzzy dengan fungsi keanggotaannya seperti dibawah ini :
𝜇𝐾𝑟𝑖𝑡𝑒𝑟𝑖𝑎 = 𝜇𝐻𝑎𝑟𝑔𝑎𝑀𝑈𝑅𝐴𝐻 ∩ 𝑆𝑖𝑙𝑖𝑛𝑑𝑒𝑟𝐵𝐸𝑆𝐴𝑅 ∪ 𝜇𝑃𝑎𝑛𝑗𝑎𝑛𝑔𝑃𝐸𝑁𝐷𝐸𝐾 ∩ 𝐻𝑎𝑟𝑔𝑎𝑆𝐸𝐷𝐴𝑁𝐺
Dengan fungsi keanggotaan diatas untuk mendapatkan nilai fire strength untuk setiap
kendaraan dapat dicari dengan rumus dibawah ini :
𝜇𝐾𝑟𝑖𝑡𝑒𝑟𝑖𝑎 𝑥
= 𝑚𝑎𝑥 𝑚𝑖𝑛 𝜇𝐻𝑎𝑟𝑔𝑎𝑀𝑈𝑅𝐴𝐻 𝑥 , 𝜇𝑆𝑖𝑙𝑖𝑛𝑑𝑒𝑟𝐵𝐸𝑆𝐴𝑅 𝑥 , 𝑚𝑖𝑛 𝜇𝑃𝑎𝑛𝑗𝑎𝑛𝑔𝑃𝐸𝑁𝐷𝐸𝐾 𝑥 , 𝜇𝐻𝑎𝑟𝑔𝑎𝑆𝐸𝐷𝐴𝑁𝐺 𝑥
Kendaraan roda dua yang mempunyai nilai fire strength lebih besar dari 0 merupakan
kendaraan roda dua yang direkomendasikan karena memenuhi kriteria linguistik yang
diinginkan.
Data
Dalam penelitian ini dikaji data 17 kendaraan bermotor roda dua dari berbagai merk dan
tipe yang dinyatakan sebagai kode A, B, C, dst. Variabel- variabel fuzzy yang digunakan sebagai
kriteria adalah harga, kapasitas-silinder, panjang-kendaraan, volume-tangki-bbm dan jarak-
mesin-ke-tanah. Data tersaji pada Tabel 1.
Tabel 1. Spesifikasi Kendaraan Bermotor Roda Dua *
No. Kode Harga Kapasitas Panjang Tangki Bahan Jarak Mesin
(Jutaan Rupiah) Silinder (mm) Bakar (lt) ke Tanah
(cc) (mm)
1 A 13.125 109 1919 3.7 135
2 B 13.150 108 1863 3.7 140
3 C 22.750 150 2008 12 148
4 D 17.300 124 1923 4.1 130
5 E 17.500 134 1960 4 140
6 F 19.850 149 2050 12 152
7 G 24.000 149 2000 12 167
8 H 12.550 113 1850 3.5 135
9 I 18.875 147 1945 4.2 140
10 J 15.250 124 1895 4.1 135
11 K 12.450 113 1910 4 145
12 L 13.715 124 1900 4 155
3. Penyusunan kriteria.
Kriteria linguistik sering kali memuat kata penghubung “atau” dan “dan”. Kata “atau”
dikaitkan dengan operasi gabungan pada himpunan fuzzy, “dan” dikaitkan dengan operasi
irisan pada himpunan fuzzy. Data crisp pada setiap kriteria (x) dipetakan sesuai dengan
fungsi keanggotaan pada variabel dan himpunan fuzzynya seperti pada Tabel 2, sehingga
setiap data akan diperoleh derajat keanggotaannya. Kriteria pemilihan disusun berdasarkan
kombinasi operasi-operasi antara himpunan-himpunan fuzzy dan variabelnya, sehingga
banyaknya kriteria yang terbentuk bergantung pada banyaknya variabel fuzzy yang
digunakan dan himpunan fuzzy masing-masing variabelnya. Pada penelitian ini terdapat
sebanyak lima variabel fuzzy dan setiap variabel fuzzy mempunyai tiga himpunan fuzzy
ditambah kemungkinan tidak memilih satupun himpunan fuzzy pada variabel tersebut,
sehingga setiap variabel fuzzy memiliki 4 kemungkinan dipilih. Jadi, banyaknya kombinasi
pilihan dari kelima variabel fuzzy tersebut adalah 45 = 512 kombinasi pilihan.
4. Penentuan nilai fire stregth.
Pada tahap ini kriteria yang dinyatakan dalam variabel dan himpunan fuzzy akan diolah
dengan menggunakan operasi himpunan fuzzy gabungan dan irisan. Dengan rumus seperti
pada persamaan (5) dan (6) atau kombinasi dari keduanya.
5. Penentuan hasil rekomendasi.
Nilai fire strength yang diperoleh pada langkah sebelumnya akan menjadi dasar
pengambilan keputusan rekomendasi. Kendaraan dengan nilai fire strength lebih besar dari 0
(nol) merupakan kendaraan yang direkomendasikan. Apabila terdapat beberapa kendaraan
dengan nilai fire strength lebih besar dari 0 (nol), maka kendaraan dengan fire strength
terbesar merupakan hasil rekomendasi terbaik.
Tabel 3. Derajat Keanggotaan Setiap Kendaraan menurut Variabel dan Himpunan Fuzzynya.
Harga (Rp) Kapasitas Silinder (cc) Panjang Kendaraan (mm) Volume Tangki Bahan Bakar (lt) Jarak Mesin ke Tanah (mm)
Kode
Murah Sedang Mahal Kecil Sedang Besar Pendek Sedang Panjang Sedikit Sedang Banyak Pendek Sedang Panjang
A 0.71 0.29 0.00 0.95 0.05 0.00 0.19 0.81 0.00 0.92 0.08 0.00 0.54 0.46 0.00
B 0.71 0.29 0.00 1.00 0.00 0.00 0.85 0.15 0.00 0.92 0.08 0.00 0.22 0.78 0.00
C 0.00 0.16 0.84 0.00 0.00 1.00 0.00 0.40 0.60 0.00 0.03 0.97 0.00 0.80 0.20
D 0.00 0.85 0.15 0.19 0.81 0.00 0.14 0.86 0.00 0.76 0.24 0.00 0.87 0.13 0.00
E 0.00 0.83 0.17 0.00 0.72 0.28 0.00 0.79 0.21 0.80 0.20 0.00 0.22 0.78 0.00
F 0.00 0.53 0.47 0.00 0.04 0.96 0.00 0.05 0.95 0.00 0.03 0.97 0.00 0.63 0.37
G 0.00 0.00 1.00 0.00 0.04 0.96 0.00 0.46 0.54 0.00 0.03 0.97 0.00 0.00 1.00
H 0.85 0.15 0.00 0.75 0.25 0.00 1.00 0.00 0.00 1.00 0.00 0.00 0.54 0.46 0.00
I 0.00 0.65 0.35 0.00 0.13 0.87 0.00 0.92 0.08 0.72 0.28 0.00 0.22 0.78 0.00
J 0.21 0.79 0.00 0.19 0.81 0.00 0.47 0.53 0.00 0.76 0.24 0.00 0.54 0.46 0.00
K 0.87 0.13 0.00 0.75 0.25 0.00 0.29 0.71 0.00 0.80 0.20 0.00 0.00 0.93 0.07
L 0.57 0.43 0.00 0.19 0.81 0.00 0.41 0.59 0.00 0.80 0.20 0.00 0.00 0.51 0.49
M 1.00 0.00 0.00 0.75 0.25 0.00 0.06 0.94 0.00 0.68 0.32 0.00 0.22 0.78 0.00
N 0.35 0.65 0.00 0.13 0.87 0.00 0.54 0.46 0.00 0.92 0.08 0.00 0.35 0.65 0.00
O 0.14 0.86 0.00 0.13 0.87 0.00 0.20 0.80 0.00 0.20 0.80 0.00 1.00 0.00 0.00
P 0.00 0.87 0.13 0.00 0.00 1.00 0.00 0.00 1.00 0.00 0.00 1.00 0.00 0.46 0.54
Q 0.27 0.73 0.00 0.75 0.25 0.00 0.65 0.35 0.00 0.48 0.52 0.00 0.00 0.63 0.37
Nilai fire strength untuk Kriteria-1 disajikan pada Tabel 4, hanya terdapat satu nilai fire
strength yang lebih besar dari 0 (nol), yaitu bernilai 0.15 yang merupakan kode kendaraan D.
Jadi kendaraan yang direkomendasikan sesuai dengan Kriteria-1 adalah kendaran D.
Hasil nilai fire strength untuk Kriteria-2 dapat dilihat pada Tabel 5. Kombinasi kriteria
harga murah dan volume-tangki-bbm banyak memberikan hasil semua nilai fire strength sama
dengan 0 (nol), seperti terlihat pada kolom-6 Tabel 5. Hal ini berarti tidak ada kendaraan yang
direkomendasikan untuk kriteria tersebut. Sedangkan untuk Kriteria-2, terdapat enam nilai fire
strength yang lebih besar dari 0 (nol), yaitu bernilai : 0.05, 0.07, 0.20, 0.35, 0.46, 0.49 pada
kode kendaraan : F, K, C, Q, G, L , ini berarti 6 kendaraan tersebut memenuhi Kriteria-2 .
Kendaraan dengan fire strength terbesar, yaitu 0.49 untuk kode kendaraan L merupakan
kendaraan yang mendapat rekomendasi terbaik untuk Kriteria-2.
DAFTAR PUSTAKA
Amalia, L. 2010. Model Fuzzy Tahani Untuk Pemodelan Sistem Pendukung Keputusan (SPK).
Seminar Nasional Aplikasi Teknologi Informasi 2010, Yogyakarta.
Eliyani. 2009. Decision Support System Untuk Pembelian Mobil Menggunakan Fuzzy Database
Model Tahani. Seminar Nasional Aplikasi Teknologi Informasi 2009., Yogyakarta.
Bojadziev, M & Bojadziev, G. 2007. Fuzzy Logic for Business, Finance, and Management 2nd
Edition.,World Scientific. Singapore.
Kusumadewi, S & Purnomo, H. 2004. Aplikasi Logika Fuzzy Untuk Pendukung
Keputusan.,Graha Ilmu. Yogyakarta.
Susilo, F. 2003. Penghantar Himpunan & Logika Kabur Serta Aplikasinya. Universitas Sanata
Dharma. Yogyakarta.
Wang, L-X. 1997. A Course in Fuzzy System and Control., Prentice Hall Internasional.
Amerika.
http://www.suzuki.co.id/suzuki_motorcycle.htm. Diakses tanggal 10 September 2013.
http://www.suzuki.co.id/suzuki_motorcycle.htm. Diakses tanggal 10 September 2013.
http://www.suzuki.co.id/suzuki_motorcycle.htm. Diakses tanggal 10 September 2013.