Anda di halaman 1dari 19

BAB II

LANDASAN TEORI

2.1 Perkara Pertanahan


Sengketa pertanahan adalah perselisihan pertanahan antara orang
perseorangan, badan hukum atau lembaga yang tidak berdampak luas secara sosio
politis.Perkara pertanahan adalah perselisihan pertanahan yang penyelesaiannya
dilaksanakan oleh lembaga peradilan. (www.bpn.go.id).
Sengketa tanah adalah konflik antara dua pihak atau lebih yang
mempunyai kepentingan berbeda terhadap satu atau beberapa obyek hak atas
tanah yang dapat mengakibatkan akibat hukum bagi keduanya (Irawan Surojo,
2006).

2.2 Peradilan Tata Usaha Negara (PTUN)


Menurut Prajudi Atmosudirjo, pengertian peradilan tata usaha negara
(PTUN) dapat dibagi menjadi dua, yaitu dalam artian luas dan dalam artian
sempit. Pengertian PTUN dalam artian luas adalah peradilan yang menyangkut
pejabat-pejabat dan instansi-instansi administrasi negara, baik yang bersifat
perkara pidana, perkara perdata, perkara agama, perkara adat, dan perkara
administrasi negara. Sedangkan pengertian PTUN dalam arti sempit adalah
peradilan yang menyelesaikan perkara-perkara administrasi negara.
Menurut Ketentuan pasal 1 ayat 7 UU nomor 51 tahun 2009, Tata usaha
negara adalah administrasi negara yang melaksanakan fungsi untuk
menyelenggarakan urusan pemerintahan, baik dipusat maupun didaerah. Adapun
sengketa tata usaha negara adalah sengketa yang timbul dalam bidang tata usaha
negara antara orang atau badan hukum perdata dengan badan atau pejabat tata
usaha negara (pasal 1 ayat 10 UU no 51 tahun 2009).
Adapun pengertian-pengertian yang berkaitan dengan peradilan tata usaha
negara dapat diuraikan sebagai berikut : (Pasal 1 Undang-undang Nomor 5 Tahun
1996)
1. Keputusan Tata Usaha Negara (KTUN) adalah penetapan tertulis yang
dikeluarkan oleh Badan atau Pejabat Tata Usaha Negara yang berisi
tindakan hukum tata usaha negara yang berdasarkan peraturan perundang-
undangan yang berlaku yang bersifat konkret, individual, dan final, yang
menimbulkan akibat hukum bagi seseorang atau badan hukum perdata.
2. Sengketa Tata Usaha Negara adalah sengketa yang timbul dalam bidang
Tata Usaha Negara antara orang atau badan hukum perdata dengan Badan
atau Pejabat Tata Usaha Negara, baik di pusat maupun di daerah, sebagai
akibat dikeluarkannya Keputusan Tata Usaha Negara (KTUN), termasuk
sengketa kepegawaian berdasarkan peraturan perundang-undangan yang
berlaku.
3. Gugatan Tata Usaha Negara adalah permohonan yang berisi tuntutan
terhadap Badan atau Pejabat Tata Usaha Negara dan diajukan ke
pengadilan untuk mendapatkan keputusan.

2.2.1 Subjek Sengketa di PTUN


Subjek pada sengkata di PTUN dibagi menjadi 2, yaitu :
1. Penggugat
Penggugat adalah seseorang atau badan hukum perdata yang merasa
kepentingannya dirugikan oleh suatu keputusan tata usaha negara dapat
mengajukan gugatan tertulis pada pengadilan yang berwenang yang berisi
tuntutan kepada tata usaha negara agar keputusan tata usaha negara yang
disengketakan dinyatakan batal atau tidak sah dengan atau disertai tata
usaha negara ganti rugi dan rehabilitasi (pasal 53 ayat 1 UU no.5 tahun
1986 dan UU no.9 tahun 2004).

II-2
2. Tergugat
Tergugat adalah badan atau pejabat tata usaha negara yang mengeluarkan
keputusan berdasarkan wewenang yang ada padanya atau yang
dilimpahkan kepadanya, yang digugat oleh orang atau badan hukum
perdata (pasal 1 ayat 6 UU no.5 tahun 1986 dan UU no.9 tahun 2004).

2.2.2 Syarat Pengajuan Gugatan ke PTUN


Dalam mengajukan gugatan ke PTUN ada beberapa hal yang harus
dipenuhi oleh penggugat, diantaranya :
1. Adanya identitas penggugat. Identitas yang dimaksud adalah seperti nama,
alamat, kewarganegaraan, pekerjaan.
2. Adanya identitas dari tergugat. Identitas tergugat berupa nama, dan alamat
dari tergugat.
3. Melampirkan data akta yang dimiliki. Akta yang dimaksud merupakan akta
hak tanah yang dimiliki oleh penggugat. Adapun hak-hak tersebut diatur
dalam pasal 53 Undang-Undang No. 9 Tahun 2004, yaitu :
a. Hak Milik
b. Hak Guna Usaha
c. Hak Guna Bangunan
d. Hak Pakai
e. Hak Membuka Tanah
4. Menjelaskan objek gugatan yang mejadi perihal penggugat mengajukan
gugatan. Objek gugatan merupakan hal atau apa yang digugat oleh
penggugat. Dalam hal ini merupakan KTUN yang dikeluarkan oleh pejabat
TUN. Menurut pasal 106 ayat 1 Peraturan Menteri Agraria No. 9 Tahun
1999, yang menjadi objek gugatan adalah :
a. Surat Keputusan (SK) yang dikeluarkan terdapat kesalahan prosedur.
b. Surat Keputusan (SK) yang dikeluarkan terdapat kesalahan penerapan
Undang-Undang.
c. Surat Keputusan (SK) yang dikeluarkan terdapat kesalahan objek hak.
d. Surat Keputusan (SK) yang dikeluarkan terdapat tumpang tindih hak.

II-3
5. Melampirkan alasan-alasan gugatan yang mendasari gugatan penggugat. Ada
beberapa alasan yang mendasari adanya gugatan atas KTUN yang
dikeluarkan oleh PTUN. Alasan-alasan ini diatur dalam pasal 53 Undang-
Undang No. 9 Tahun 2004, yaitu sebagai berikut :
a. KTUN tersebut bertentangan dengan undang-undang yang berlaku.
b. KTUN tersebut tidak prosedural dan tidak substansial.
c. KTUN tersebut dikeluarkan oleh pihak yang tidak berwenang.
d. KTUN tersebut bertentangan dengan asas-asas umum pemerintahan yang
baik.
e. KTUN tersebut dikeluarkan tidak melalui proses inventarisasi dan
pemerikasaan terhadap fakta-fakta yang relevan.
f. KTUN tersebut bersifat konkrit, individual dan final serta menimbulkan
akibat hukum.
g. KTUN tersebut tidak memerlukan persetujuan atasan atau instansi lain.
h. KTUN tersebut merupakan perbuatan tergugat yang sewenang-wenang
dan merugikan penggugat.
i. KTUN tersebut menyebabkan hak-hak penggugat sebagai pemilik tanah
terabaikan.
j. Gugatan yang diajukan oleh penggugat sesuai dengan waktu yang
dibenarkan.
6. Melampirkan permohonan penggugat yang diharapkan agar dikabulkan oleh
majelis hakim. Permohonan ini diatur dalam pasal 53 Undang-Undang No. 9
Tahun 2004, yaitu sebagai berikut :
a. Pembatalan atau menyatakan tidak sah KTUN yang dikeluarkan.
b. Ganti rugi.
c. Rehabilitasi.
7. Membayar biaya pendaftaran kasus ke adminstrasi PTUN.

II-4
2.3 Definisi Data Mining
Data mining merupakan suatu metode menemukan suatu pengetahuan
dalam suatu database yang cukup besar. Data mining adalah proses menggali
dan menganalisa sejumlah data yang sangat besar untuk memperoleh sesuatu
yang benar, baru, sangat bermanfaat dan akhirnya dapat dimengerti suatu corak
atau pola dalam data tersebut (Han & Kamber, 2006). Data mining didefinisikan
sebagai proses menemukan pola dalam data. Proses ini harus otomatis atau
biasanya secara semi-otomatis.Pola yang dihasilkan harus berarti bahwa pola
tersebut memberikan beberapa keuntungan.Pola tersebut diidentifikasi,
divalidasi, dan digunakan untuk membuat sebuah prediksi (Witten dkk, 2011).

2.3.1 Tugas Data Mining


Tugas data mining secara garis besar dibagi menjadi dua kategori utama,
yaitu (Tan dkk, 2006) :
1. Tugas prediktif.
Tujuan utama dari tugas ini adalah untuk memprediksikan nilai
dari atribut tertentu berdasarkan nilai dari atribut lainnya. Atribut yang
diprediksi dikenal sebagai target atau dependent variable, sedangkan
atribut yang digunakan untuk membuat prediksi disebut penjelas atau
independent variable.
2. Tugas deskriptif.
Tujuan utama dari tugas ini adalah untuk memperoleh pola
(correlation, trend, cluster, trajectory, anomaly) untuk menyimpulkan
hubungan di dalam data. Tugas deskriptif merupakan tugas data mining
yang sering dibutuhkan pada teknik postprocessing untuk melakukan
validasi dan menjelaskan hasil proses data mining. Inti dari tugas data
mining adalah pemodelan prediktif, analisa asosiasi, analisa cluster, dan
deteksi terhadap anomali yang dapat dilihat pada Gambar 2.1

II-5
Gambar 2.1 Empat Tugas Inti Data Mining (Tan dkk, 2006)
Pemodelan prediktif mengacu pada proses membangun model untuk
variabel target sebagai fungsi dari variabel penjelas. Ada dua tipe dari pemodelan
prediktif, yaitu klasifikasi (classification) yang digunakan untuk variabel target
yang diskret, dan regresi (regression) yang digunakan untuk variable target yang
kontinyu. Analisa asosiasi digunakan untuk menemukan pola yang
mendeskripsikan fitur-fitur data yang saling berhubungan. Pola-pola ini biasanya
digambarkan dalam bentuk aturan implikasi. Analisa cluster merupakan proses
untuk mencari kelompok-kelompok data, sedemikian sehingga data yang berada
dalam satu kelompok memiliki kemiripan dibandingkan data yang terletak pada
kelompok lain. Deteksi anomali merupakan proses identifikasi data yang memiliki
perbedaan karakteristik yang signifikan dengan data yang lain atau yang dikenal
dengan istilah outlier (Tan dkk, 2006).

2.3.2 Pengelompokan Data Mining


Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang
dapat dilakukan, yaitu (Kusrini dan Emha Taufiq Luthfi, 2009):
1. Deskripsi
Terkadang peneliti dan analis secara sederhana ingin mencoba mencari
data untuk menggambarkan pola dan kecenderungan yang terdapat
dalam data. Sebagai contoh, petugas pengumpulan suara mungkin
tidak dapat menentukan keterangan atau fakta bahwa siapa yang tidak

II-6
cukup professional akan sedikit didukung dalam pemilihan presiden.
Deskripsi dari pola dan kecenderungan sering memberikan
kemungkinan penjelesan untuk suatu polaatau kecenderungan.
2. Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variable target
estimasi lebih kearah numerik dari pada kearah kategori. Model
dibangun menggunakan record lengkap yang menyediakan nilai dari
variabel target sebagai prediksi. Selanjutnya, pada peninjauan
berikutnya estimasi nilai dari variabel target dibuat berdasarkan nilai
variabel predikasi. Sebagai contoh akan dilakukan estimasi tekanan
darah sistolik pada pasien rumah sakit berdasarkan umur pasien, jenis
kelamin, indeks berat badan, dan level sodium darah. Hubungan antara
tekanan darah sistolik dan nilai variabel prediksi dalam proses
pembelajaran akan menghasilkan model estimasi. Model estimasi yang
dihasilkan dapat digunakan untuk kasus baru lainnya.
3. Prediksi.
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa
dalam predikasi nilai dari hasik akan ada dimasa mendatang. Contoh
prediksi bisnis dan penelitian adalah:
a. Prediksi harga beras dalam tiga bulan yang akan dating.
b. Prediksi persentasi kenaikan kecelakaan lalu lintas tahunepan
jika batas bawah kecepatan dinaikkan. Beberapa metode dan
teknik yang digunakan dalam klasifikasi dan estimasi dapat
pula digunakan (untuk keadaan yang tepat) untuk prediksi.
4. Klasifikasi

Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh,


penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu
pendapatan tinggi, pendapatan sedang, dan pendapatan rendah. Contoh
lain klasifikasi dalam bisnis dan penelitian adalah:
a. Menentukan apakah suatu transaksi kartu kredit merupakan
transaksi yang curang atau tidak.

II-7
b. Memperkirakan apakah suatu pengajuan hipotek oleh nasabah
merupakan suatu kredit yang baik atau buruk.
c. Mendiagnosis penyakit seorang pasien untuk mendapatkan
termasuk kategori penyakit apa.
5. Pengklusteran (Clustering)
Pengkluteran merupakan pengelompokan record, pengamatan, atau
memperhatikan dan membentuk kelas objek-objek yang memiliki
kemiripan. Kluster adalah kumpulan record yang memiliki kemiripan
satu dengan yang lainnya dan memiliki ketidakmiripan dengan record-
record dalam kluster lain. Pengklusteran berbeda dengan klasifikasi
yaitu tidak adanya variabel target dalam pengklusteran. Pengklusteran
tidak mencoba untuk melakukan klasifikasi, mengestimasi, atau
memprediksi nilai dari variabel target. Akan tetapi, algoritma
pengklusteran mencoba untuk melakukan pembagian terhadap
keseluruhan data menjadi kelompok-kelompok yang memiliki
kemiripan (homogeny), yang mana kemiripan dalam satu kelompok
akan bernilai maksimal, sedangkan kemiripan dengan record dalam
kelompok lain akan bernilai minimal. Contoh pengklusteran dalam
bisnis dan penelitian adalah:
a. Mendapatkan kelompok-kelompok konsumen untuk target
pemasaran dari satu suatu produk bagi perusahaan yang tidak
memiliki dana pemesaran yang besar.
b. Untuk tujuan audit akuntansi, yaitu melakukan pemisahan
terhadap perilaku financial dalam baik dan mencurigakan.
c. Melakukan pengklusteran terhadap ekspresi dari gen, untuk
mendapatkan kemiripan perilaku dari gen dalam jumlah besar.
6. Asosiasi
Tugas asosiasi dalam data mining adalah menemukan attribut yang
muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut
analisis keranjang belanja. Contoh asosiasi dalam bisnis dan penelitian
adalah:

II-8
a. Meneliti jumlah pelanggan dari perusahaan telekomunikasi
seluler yang diharapkan untuk memberikan respon positif
terhadap penawaran upgrade layanan yang diberikan.
b. Menentukan barang dalam supermarket yang dibeli secara
bersamaan dan yang tidak pernah dibeli secara bersamaan.

2.3.3 Langkah-langkah Data Mining


Berikut merupakan beberapa tahapan awal hingga hasil dari penambangan
data (Fayyad, 1996):

Gambar 2.2 Langkah-Langkah Data Mining

1. Pemilihan (data selection)


Pemilihan data dari sekumpulan data operasional perlu dilakukan
sebelum tahap penggalian informasi dalam KDD dimulai.
2. Pemrosesan awal (preprocessing)
Sebelum proses penambangan data dapat dilaksanakan, perlu dilakukan
proses cleaning dengan tujuan untuk membuang duplikasi data,
memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada
data, seperti kesalahan cetak (tipografi). Juga dilakukan proses
enrichment, yaitu proses “memperkaya” data yang sudah ada dengan
data atau informasi lain yang relevan dan diperlukan untuk KDD,
seperti data atau informasi eksternal.

II-9
3. Transformasi
Data di ubah atau digabung ke dalam format yang sesuai untuk diproses
dalam data mining. Beberapa metode data mining membutuhkan format
data yang khusus sebelum bisa diaplikasikan. Sebagai contoh beberapa
motode standar seperti analisis asosiasi dan clusteringhanya bisa
menerima input data kategorikal. Karenanya data berupa angka numerik
yang berlanjut perlu dibagi- bagi menjadi beberapa interval. Proses ini
sering disebut transformasi data.
4. Penambangan data (data mining)
Proses mencari pola atau informasi menarik dalam data terpilih dengan
menggunakan teknik atau metode tertentu. Teknik, metode, atau
algoritma dalam penambangan data sangat bervariasi. Pemilihan
metode atau algoritma yang tepat sangat bergantung pada tujuan dan
proses KDD secara keseluruhan.
5. Interpretasi/Evaluasi
Pola informasi yang dihasilkan dari proses penambangan data perlu
ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang
berkepentingan. Tahap ini merupakan bagian dari proses KDD yang
disebut dengan interpretation.Tahap ini mencangkup pemeriksaan
apakah pola atau informasi yang ditemukan bertentangan dengan fakta
atau hipotesa yang ada sebelumnya atau tidak.

2.4 Klasifikasi
Klasifikasi adalah metode data mining yang dapat digunakan untuk proses
pencarian sekumpulan model (fungsi) yang dapat menjelaskan dan membedakan
kelas-kelas data atau konsep, yang tujuannya supaya model tersebut dapat
digunakan memprediksi objek kelas yang labelnya tidak diketahui atau dapat
memprediksi kecenderungan data-data yang muncul di masa depan. Metode
klasifikasi juga bertujuan untuk melakukan pemetaan data ke dalam kelas yang
sudah didefinisikan sebelumnya berdasarkan pada nilai atribut data (Han dan
Kamber, 2006). Proses klasifikasi tersebut seperti terlihat pada gambar 2.3.

II-10
Gambar 2.3 Proses Klasifikasi

2.5 Naïve Bayes


Naive Bayes merupakan teknik prediksi berbasis probabilistik sederhana
yang berdasar pada penerapan teorema Bayes (aturan Bayes) dengan asumsi
independensi (ketidaktergantungan) yang kuat (naif). Dengan kata lain, dalam
Naive Bayes model yang digunakan adalah “model fitur independen” (Prasetyo,
2012).
Naive Bayes adalah salah satu algoritma pembelajaran induktif yang
paling efektif dan efisien untuk machine learning dan data mining. Performa
Naive Bayes yang kompetitif dalam proses klasifikasi walaupun menggunakan
asumsi keindependenan atribut (tidak ada kaitan antar atribut). Asumsi
keindependennan atribut ini pada data sebenarnya jarang terjadi, namun walaupun
asumsi keindependennan atribut tersebut dilanggar performa pengklasifikasian
Naive Bayes cukup tinggi, hal ini dibuktikan pada berbagai penelitian empiris
(Shadiq, 2009).
Dari definisi di atas dapat diambil kesimpulan bahwa Naive Bayes adalah
sebuah teknik klasifikasi probabilistik yang berdasarkan teorema bayes yang
menggunakan asumsi keindependenan atribut (tidak ada kaitan antar atribut)
dalam proses pengklasifikasiannya.

II-11
2.5.1 Teorema Bayes
Bayes merupakan teknik prediksi berbasis probabilistik sederhana yang
berdasar pada penerapan aturan Bayes dengan asumsi indepedensi yang kuat.
Dengan kata lain, Naive Bayes merupakan model fitur independen. Maksud
independensi yang kuat pada fitur dalam Bayes adalah sebuah fitur data tidak
berkaitan dengan ada atau tidaknya fitur lain dalam data yang sama (Han, 2006).
Prediksi Bayes didasarkan pada teorema Bayes dengan formula umum
sebagai berikut (Han, 2006):
( | ) ( )
( | ) (2.1)
( )

Keterangan :
P (H|E) : Probabilitas akhir bersyarat suatu hipotesis H terjadi jika bukti E
terjadi.
P(E|H) : Probabilitas sebuah bukti E terjadi akan mempengaruhi hipotesis
H.
P(H) : Probabilitas awal hipotesis H terjadi tanpa memandang bukti
apapun.
P(E) : Probabilitas awal bukti E terjadi tanpa memandang hipotesis atau
bukti yang lain.
Ide dasar dari aturan Bayes adalah bahwa hasil dari hipotesis atau
peristiwa (H) dapat diperkirakan berdasarkan bukti (E) yang diamati. Ada
beberapa hal penting dari aturan Bayes tersebut, yaitu (Han, 2006) :
1. Sebuah probabilitas awal H atau P(H) adalah probabilitas dari suatu hipotesis
sebelum bukti diamati.
2. Sebuah probabilitas akhir H atau P(H|E) adalah probabilitas dari suatu
hipotesis setelah bukti diamati

2.5.2 Naïve Bayes Untuk Klasifikasi dan Prediksi


Kaitan antara Naive Bayes dengan klasifikasi, korelasi hipotesis dan bukti
klasifikasi adalah bahwa hipotesis dalam teorema Bayes merupakan label kelas
yang menjadi target pemetaan dalam klasifikasi, sedangkan bukti merupakan
fitur-fitur yang menjadi masukannya. Jika X adalah vektor masukkan yang berisi

II-12
fitur dan Y adalah label kelas, maka dalam Naive Bayes dituliskan dengan notasi
P(Y|X). Notasi tersebut berarti probabilitas label kelas Y didapatkan setelah fitur-
fitur X diamati. Notasi ini disebut juga probabilitas akhir (posterior probability)
untuk Y, sedangkan P(Y) disebut probabilitas awal (prior probability) Y (Han,
2006).
Selama proses pelatihan harus dilakukan pembelajaran probabilitas akhir
P(Y|X) pada model untuk setiap kombinasi X dan Y berdasarkan informasi yang
didapat dari data latih. Dengan membangun model tersebut, suatu data uji X’
dapat diklasifikasikan dengan mencari nilai Y’ dengan memaksimalkan nilai
P(X’|Y’) yang didapat (Han, 2006).
Formula Naive Bayes untuk klasifikasi adalah :
( ) ( | )
( | ) (2.2)
( )

P(Y|X) adalah probabilitas data dengan vektor X pada kelas Y. P(Y)


adalah probabilitas awal kelas Y. ( | ) adalah probabilitas independen
kelas Y dari semua fitur dalam vektor X. Nilai P(X) selalu tetap sehingga dalam
perhitungan prediksi nantinya kita tinggal memilih yang terbesar sebagai kelas
yang dipilih sebagai hasil prediksi. Probabilitas independen ( | )
merupakan pengaruh dari semua fitur data terhadap setiap kelas Y, yang
dinotasikan sebagai berikut (Han, 2006) :
( | ) ( | ) (2.3)

Setiap set fitur X = {X1, X2, X3, ..., Xq} terdiri atas q atribut.
Naive Bayes lebih mudah untuk menghitung fitur bertipe kategoris, namun
untuk fitur bertipe numerik (kontinu) ada perlakuan khusus, yaitu (Han, 2006):
1. Melakukan diskretisasi pada setiap fitur kontinu dan mengganti nilai fitur
tersebut dengan nilai interval diskret.
2. Menggunakan distribusi Gaussian untuk merepresentasikan probabilitas
bersyarat dari fitur kontinu pad asebuah kelas P(Xi|Y). Distribusi Gaussian
dikarakteristikkan dengan dua parameter yaitu mean ( ) dan varian ( ).
Untuk setiap kelas yj, probabilitas bersyarat kelas yj untuk fitur Xi adalah :

II-13
( )

( | ) (2.4)

Parameter bisa didapat dari mean sampel Xi dari semua data latih yang
menjadi milik kelas yj. Sedangkan didapat dari varian sampel data latih.
Berdasarkan penjelasan sebelumnya maka dapat didaptkan formula-
formula utama dalam proses klasifikasi dengan Naive Bayes Classfier yaitu:

1. Probabilitas atribut pada setiap kelas :

( | ) (2.5)

2. Probabilitas kelas :

( ) (2.6)

3. Probabilitas akhir :
( | )
(2.7)
Proses perhitungan dalam penentuan kelas akhir pada Naive Bayes
Classifier dimulai dengan mengetahui tipe dari fitur-fitur pada setiap kelas. Jika
bertipe kategoris lakukan perhitungan probabilitasnya, namun jika bertipe
numerik maka gunakan distribusi Gaussian untuk mencari nilai probabilitasnya.
Selanjutnya menghitung probabilitas masing-masing kelas. Probabilitas akhir
didapatkan dengan mengalikan probabilitas setiap fitur dan probabilitas kelasnya.
Label kelas dipilih berdasarkan nilai probabilitas akhir yang paling tinggi.

2.6 K-Nearest Neighbor (KNN)


Algoritma K-Nearest Neighbor merupakan metode klasifikasi yang
mengelompokan data baru berdasarkan jarak data baru itu kebeberapa
data/tetangga (neighbord) terdekat (Santoso, 2007).
Algoritma K-Nearest Neighbor adalah sebuah metode untuk melakukan
klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling

II-14
dekat dengan objek tersebut. Nearest Neighbor adalah pendekatan untuk mencari
kasus dengan menghitung kedekatan antara kasus baru dan kasus lama yaitu
berdasarkan pada pencocokan bobot dari sejumlah fitur yang ada (Kusrini, 2009).

2.6.1 Manhattan Distance


Menurut (Bramer, 2007) yang dikutip (Henny, 2013) Manhattan Distance
adalah formula untuk menghitung jarak antara dua titik. Perhitungan Manhattan
Distance untuk mencari jarak minimal dari dua buah titik (x1,y1) dan (x2,y2)
dapat dilakukan dengan menghitung |x2-x1|+|y2-y1| (Henny, 2013).
Manhattan Distance merupakan salah satu pengukuran yang paling banyak
digunakan meliputi penggantian perbedaan kuadrat dengan menjumlahkan
perbedaan absolute dari variabel-variabel. Fungsi ini hanya akan menjumlahkan
selisih nilai x dan y dari dua buah titik, rumusManhattan, seperti yang
ditunjukkan pada Persamaan 2.8:
D(x, y) = || - || = ∑ | | ......................................................(2.8)
d : jarak antara titik pada data training x dan titik data testing y yang
akan diklasifikasi, dimana x=x1,x2,…,xi dan y=y1,y2,…,yi
i : merepresentasikan nilai atribut
n : merupakan dimensi atribut.

2.7 Modified K-Nearest Neighbor (MKNN)


Modified K-Nearest Neighbor (MKNN) merupakan metode perkembangan
dari metode K-Nearest Neighbor (KNN). Ide utama dari metode ini adalah hal
pertama yang dilakukan adalah perhitungan validitas untuk semua data yang
terdapat pada data latih. Selanjutnya, dilakukan perhitungan Weight Voting pada
semua data uji menggunakan validitas data. (Hamid Parvin,dkk 2010).

2.7.1 Validitas Data Training


Validitas digunakan untuk menghitung jumlah titik dengan label yang
sama untuk semua data pada data latih. Validitas setiap data tergantung pada
setiap tetangga terdekatnya. Setelah dilakukan validitas data, selanjutnya data

II-15
tersebut digunakan sebagai informasi lebih mengenai data tersebut. Persamaan
yang digunakan untuk menghitung validitas setiap data latih adalah :
( ) ∑ ( ( ) ( ( ))) (2.9)

Dimana :
K : Jumlah titik terdekat
Lbl (x) : Kelas x
Ni (x) : Label kelas titik terdekat x
Fungsi S digunakan untuk menghitung kesamaan antara titik adan data
ke-b tetangga terdekat. Persamaan untuk mendefinisikan fungsi S terdapat dalam
persamaan dibawah ini :

( ) { (2.10)

Dimana :
a : Kelas a pada data training
b : Kelas lain selain a pada data training

2.7.2 Weight Voting


Dalam metode MKNN, pertama weight masing-masing tetangga dihitung
dengan menggunakan 1 / ( ). Kemudian, validitas dari setiap data pada
data latih dikalikan dengan weight berdasarkan pada jarak Euclidean.
Sehingga metode MKNN, didapatkan persamaan weight voting tiap
tetangga sebagai berikut :
( ) ( ) (2.11)

Dimana :
W(i) : Perhitungan Weight Voting
Validasi (x) : Nilai Validitas
: Jarak Euclidean
Setelah melakukan perhitungan weight voting, kemudian akan diambil k-
terbesar dari nilai weight voting. Kemudian diambil mayoritas dari nilai tersebut.

II-16
Nilai dari data mayoritas adalah kelas dari data uji. Cara kerja dari algoritma
MKNN dapat dilihat pada gambar 2.4.

Gambar 2.4 Langkah Kerja Algoritma MKNN

2.8 Evaluasi
Evaluasi adalah kunci dalam pembuatan aplikasi atau sistem berbasis data
mining. Performa dari suatu model kasifikasi dapat diukur dengan tingkat
akurasinya. Akurasi dari sebuah klasifikasi memberikan hasil latih dengan bentuk

II-17
persentase dari kelompok data latih yang diklasifikasikan benar dari
pengklasifikasian yang telah dilakukan. Perhitungannya adalah (Han, 2006):
(2.12)

2.9 Penelitian Terkait


Berikut pada tabel 2.1 merupakan penelitian terkait yang digunakan
sebagai referensi dan bahan pembelajaran dalam penelitian ini :
Tabel 2.1 Penelitian Terkait

N
Nama Judul Metode Kesimpulan
No
1Mega Kombinasi Metode Knn, Kombinasi metode knn
1. Kartika KNN dan naïve bayes naïve dan naïve bayes mampu
Sari, dkk untuk klasifikasi data bayes menghasilkan akurasi yang
(2015) lebih tinggi dibandingkan
ketika dikerjakan terpisah
2 Alfa Implementasi metode Naïve Penelitian ini berhasil
2. Saleh klasifikasi naïve bayes bayes memprediksi besarnya
(2016) dalam memprediksi penggunaan listrik rumah
besarnya penggunaan tangga dengan persentase
listrik rumah tangga akurasi 78,33%
Bustami
3 Penerapan algoritma Naive Pada penelitian ini mampu
3. (2014) naïve bayes untuk Bayes mengklasifikasikan data
mengklasifikasi data Classifi nasabah menjadi kedalam
nasabah asuransi cation klasifikasi lancar, kurang
lancar, dan tidak lancer
4Sutrisn Implementasi MKNN MKNN Penelitian ini mampu
4. o,dkk dengan otomatisasi nilai melakukan klasifikasi
(2014) k pada pengklasifikasian dengan akurasi 98,83%
penyakit tanaman
kedelai
5Harmin Membandingkan knn Knn, Penelitian ini
5. parvin dan MKNN pada MKNN menghasilkan bahwa
et al beberapa dataset tingkat akurasi MKNN
(2008) lebih tinggi dari knn
7Muham Perbandingan naïve Naive Penelitian ini

II-18
N
Nama Judul Metode Kesimpulan
No
6. mad bayes classifier dan Bayes, menghasilkan bahwa
Rifqi support vector machine Support metode naive bayes
Ma’arif Vector memiliki akurasi yang lebih
untuk klasifikasi judul
Machine tinggi dari metode SVM
artikel

K.M.Po Analysis of Face Euclide Penelitian ini


nnmoli Recognition using an membandingkan algoritma
Distance euclidean distance, dan
Manhattan Distance
, manhattan distance, dalam
Algorithm with Image Manhatt proses segmentasi untuk
Segmentation an face recognition. Penelitian
7. Distance ini menghasilkan bahwa
algoritma manhattan
distance mampu
memberikan akurasi yang
lebih baik daripada
algoritma euclidean
distance.
Shradd A comparative study on Euclide Penelitian ini
ah distance measuring an menggunakan teknik
Pandit Distance clustering kemudian
approaches for
dan , membandingkan ke lima
Suchita clustering Manhatt metode tersebut
Gupta an berdasarkan pengaplikasian,
(2011) Distance kelebihan, kekurangan, dan
, Cosine efisiesnsi dari masing-
8. Distance masing metode. Penelitian
, ini menghasilkan bahwa
Similarit kelima metode tersebut
y memiliki kelebihan dan
Distance kekurangan yang berbeda-
, beda, seperti tipe data yang
Jaccard mendukung, dan area
Index pengaplikasian dari metode
Distance tersebut.

II-19

Anda mungkin juga menyukai