Anda di halaman 1dari 63

KLASIFIKASI LAHAN SAWAH MENGGUNAKAN

ALGORITMA K-NEAREST NEIGHBOR

SKRIPSI

KHADIZA RINA

131402065

PROGRAM STUDI S1 TEKNOLOGI INFORMASI


FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2019

Universitas Sumatera Utara


KLASIFIKASI LAHAN SAWAH MENGGUNAKAN
ALGORITMA K-NEAREST NEIGHBOR

SKRIPSI

Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah


Sarjana Teknologi Informasi

KHADIZA RINA
131402065

PROGRAM STUDI S1 TEKNOLOGI INFORMASI


FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2019

Universitas Sumatera Utara


Universitas Sumatera Utara
Universitas Sumatera Utara
iv

UCAPAN TERIMA KASIH

Puji dan syukur kehadirat Allah SWT, karena rahmat dan izin-Nya penulis dapat
menyelesaikan penyusunan skripsi ini, sebagai syarat untuk memperoleh gelar Sarjana
Komputer, pada Program Studi S1 Teknologi Informasi Fakultas Ilmu Komputer dan
Teknologi Informasi Universitas Sumatera Utara.

Ucapan terima kasih penulis sampaikan kepada:

1. Bapak Prof. Runtung Sitepu, SH., M.Hum selaku Rektor Universitas Sumatera
Utara.
2. Bapak Prof. Dr. Drs. Opim Salim Sitompul, M.Sc. selaku Dekan Fasilkom-TI
Universitas Sumatera Utara.
3. Bapak Romi Fadillah Rahmat, B.Comp.Sc., M.Sc., selaku Ketua Program Studi
S1 Teknologi Informasi Universitas Sumatera Utara dan sekaligus sebagai
dosen pembimbing pertama.
4. Ibu Sarah Purnamawati, ST., M.Sc., selaku Sekretaris Program Studi S1
Teknologi Informasi Universitas Sumatera Utara dan juga sekaligus dosen
pembimbing kedua.

5. Bapak Ainul Hizriadi, S.Kom, M.Sc, selaku Dosen Pembanding I yang memberi
saran dan bimbingan kepada penulis.
6. Bapak Seniman, S.Kom, M.Kom, selaku Dosen Pembanding II yang memberi saran
dan bimbingan kepada penulis.
7. Kedua Orang tua penulis, Muhammad Akhir dan Budiani Marpaung, yang
selalu memberikan do’a, kasih sayang, nasehat dan dukungan kepada penulis
dari mulai mengikuti pendidikan hingga selesainya tugas akhir ini.
8. Teman – teman Haholongan, Inu Wulandari, S.Kom, Regania Pasca Rassy,
S.Kom, Elsa Trida Sawitri, S.Kom, Enno Putri Syah Alami, S.Kom, Chintya
Dwi Hevlima Sianipar, S.Kom, Suci Dwi Nur, S.Kom, Hengky Wijaya, S.Kom,
Arfan Rahmat, S.Kom, Rifandi Indrayudha Prawira, S.Kom, Fadhil Ramadhan,
S.Kom, Afin Zaky, S.Kom dan Odysius, S.Kom.

Universitas Sumatera Utara


v

9. Rido Toryan Pratama Putra, S.Kom yang selalu memberi semangat, nasehat dan
motivasi kepada penulis.
10. Kak Rona, Rhama dan Josef selaku tim dan rekan seperjuangan dalam
membantu akreditasi program studi Teknologi Informasi.
11. Keluarga besar Sanggar Kaligrafi An-Nida yang selalu mendukung penulis dan
menjadi keluarga penulis selama masa tugas akhir.
12. Semua dosen, staff dan pegawai di Jurusan Teknologi Informasi serta Fakultas
Ilmu Komputer dan Teknologi Informasi yang tidak dapat saya sebutkan satu-
persatu.
13. Seluruh teman – teman angkatan 2013 khususnya Kom A, teman – teman
mahasiswa Teknologi Informasi lainnya. Semoga Allah SWT membalas
kabaikan kalian.
14. Semua pihak yang terlibat langsung ataupun tidak langsung yang tidak dapat
penulis ucapkan satu persatu yang telah membantu penyelesaian skripsi ini.

Semoga Allah SWT melimpahkan berkah kepada semua pihak yang telah memberikan
bantuan, perhatian, serta dukungan kepada penulis dalam menyelesaikan skripsi ini.

Universitas Sumatera Utara


vi

ABSTRAK

Kesuburan tanah pada lahan sawah untuk tanaman padi merupakan salah satu faktor
penentu keberhasilan usaha pertanian. Namun ada kalanya banyak usaha pertanian yang
gagal atau hasil tidak maksimal karena kurangnya pemahaman tentang tingkat
kesuburan tanah untuk jenis tanaman yang tepat dan sesuai dengan sampel tanah dari
petani sendiri. Fokus utama penelitian ini adalah untuk membuat sistem klasifikasi
kualitas lahan sawah yang baik menggunakan parameter seperti kelembapan tanah,
kelembapan udara, tinggi air dan intensitas cahaya. Dalam hal ini lahan sawah akan
digolongkan menjadi dua kategori yaitu lahan sawah ideal dan tidak ideal. Pada
penelitian ini, dikembangkan sistem untuk klasifikasi lahan sawah dengan algoritma K-
Nearest Neighbor. Tahapan keseluruhan pada penelitian ini adalah preprocessing
(normalisasi, binning by boundaries, labelling) dan klasifikasi menggunakan K-Nearest
Neighbor. Algoritma tersebut menghitung jarak pada setiap data yang ada pada data
training kemudian mengklasifikasi data berdasarkan dengan mayoritas pada nilai
ketetanggaan (nilai k) tertentu. Hasil pengujian pada penelitian ini adalah akurasi
sebesar 93,33% dimana nilai k yang digunakan yaitu 3.

Kata kunci : klasifikasi lahan sawah, K-Nearest Neighbor, mechine learning.

Universitas Sumatera Utara


vii

ABSTRACT

The soil fertility of paddy field for the rice plants are one of the critical success factors of
agriculture. However, many agriculture were fail or the results not maximum because the
understanding lack about soil fertility level for the types of plant are appropriate and
suitable with soil samples from the farmers. The main focus of this research is to make the
clasification system of the good paddy field quality by using parameter like soil moisture,
air moisture, high water and light intensity. In this case, the paddy field would be
categorized into two such as the ideal and unideal paddy field. The research has developed
by system to clasification the paddy field by using K - Nearest Neighbor algorithm. The
whole steps of this research were preprocessing (normalization, binning by boundaries,
labelling) and the clasification by using K-Nearest Neighbor. The algorithm was calculate
the distance on any existing data in the training data, then making the data clasification
based on the majority to the spesific value of the neighborhood (value K). The trial result
of this research was accurate by 93,33% where value K used by 3.

Keywords : The Paddy field Clasification, K - Nearest Neighbor, Mechine Learning.

Universitas Sumatera Utara


DAFTAR ISI

Hal.
PERSETUJUAN ii
PERNYATAAN iii
UCAPAN TERIMA KASIH iv
ABSTRAK vi
ABSTRACK vii
DAFTAR ISI viii
DAFTAR TABEL xi
DAFTAR GAMBAR xii

BAB 1 PENDAHULUAN 1
1.1. Latar Belakang 1
1.2. Rumusan Masalah 3
1.3. Tujuan Penelitian 3
1.4. Batasan Masalah 3
1.5. Manfaat Penelitian 4
1.6. Metodologi Penelitian 4
1.7. Sistematika Penulisan 5

BAB 2 LANDASAN TEORI 6


2.1. Lahan Sawah 6
2.2. Padi 8
2.3. Kelembaban Udara 9
2.4. Kelembaban Tanah 9
2.5. Intensitas Cahaya 10
2.6. Machine Learning 11
2.7. Algoritma K-Nearest Neighbor 12
2.8. PHP 14

Universitas Sumatera Utara


ix

2.9. Metode Evaluasi 14


2.10. Penelitian Terdahulu 15

BAB 3 ANALISIS DAN PERANCANGAN SISTEM 18


3.1. Data yang Digunakan 18
3.2. Arsitektur Umum 19
3.2.1. Input 19
3.2.2. Preprocessing 19
3.2.3. Proses 21
3.2.4. Output 25
3.3. Alur Program 26
3.4. Analisis Sistem 26
3.5. Perancangan Antarmuka Sistem 27
3.5.1. Perancangan Menu Sistem 27
3.5.2. Tampilan Antarmuka Sistem 28
3.6. Metode Evaluasi 29

BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM 30


4.1. Implementasi Sistem 30
4.1.1. Spesifikasi Perangkat Keras dan Perangkat Lunak yang Digunakan 30
4.1.2. Implementasi Perancangan Antarmuka 31
a. Tampilan Halaman Beranda 31
b. Tampilan Halaman Data Training 31
c. Tampilan Halaman Data Testing 32
d. Tampilan Halaman Pengaturan 32
e. Tampilan Halaman Tentang 33
4.1.3. Prosedur Operasional 34
4.2. Pengujian Sistem 37
4.2.1. Pengujian 1 38
4.2.2. Pengujian 2 38
4.2.3. Pengujian 3 39

Universitas Sumatera Utara


x

4.2.4. Pengujian 4 40
4.2.5. Pengujian 5 41
4.3. Hasil Pengujian Sistem 42

BAB 5 KESIMPULAN DAN SARAN 44


5.1. Kesimpulan 44
5.2. Saran 44

DAFTAR PUSTAKA 45

Universitas Sumatera Utara


xi

DAFTAR TABEL

Hal.

Tabel 2.1 Range Nilai Optimal 7

Tabel 2.2 Confusion Matrix 15

Tabel 2.3 Penelitian Terdahulu 17

Tabel 3.1 Data yang Digunakan 18

Tabel 3.2 Contoh Data yang Diinput 19

Tabel 3.3 Contoh Data Training 23

Tabel 3.4 Contoh Data Testing 23

Tabel 3.5 Hasil Perhitungan Jarak 25

Tabel 3.6 Confusion Matrix 29

Tabel 4.1 Tabel Proses Pegujian 37

Tabel 4.2 Hasil Confusion Matrix pada Pegujian 1 38

Tabel 4.3 Hasil Confusion Matrix pada Pegujian 2 39

Tabel 4.4 Hasil Confusion Matrix pada Pegujian 3 39

Tabel 4.5 Hasil Confusion Matrix pada Pegujian 4 40

Tabel 4.6 Hasil Confusion Matrix pada Pegujian 5 41

Tabel 4.7 Hasil Pegujian Sistem 42

Universitas Sumatera Utara


xii

DAFTAR GAMBAR

Hal.

Gambar 2.1 Ilustrasi Klasifikasi Algoritma K-Nearest Neighbor 12

Gambar 3.1 Arsitektur Umum 19

Gambar 3.2 Proses Data Training 22

Gambar 3.3 Pseudo code K-Nearest Neighbor 25

Gambar 3.4 Alur Program 26

Gambar 3.5 Perancangan Menu Sistem 27

Gambar 3.6 Tampilan Antarmuka Sistem 28

Gambar 4.1 Tampilan Halaman Beranda 31

Gambar 4.2 Tampilan Halaman Data Training 32

Gambar 4.3 Tampilan Halaman Data Testing 32

Gambar 4.4 Tampilan Halaman Pengaturan 33

Gambar 4.5 Tampilan Halaman Tentang 33

Gambar 4.6 Halaman Sign in 34

Gambar 4.7 Mengatur Nilai Parameter 35

Gambar 4.8 Tampilan Memilih Data Training 35

Gambar 4.9 Tampilan Data Training 36

Gambar 4.10 Tampilan Memilih Data Testing 36

Gambar 4.11 Tampilan Data Testing 37

Gambar 4.12 Grafik Hasil Evaluasi 42

Gambar 4.13 Kegagalan Klasifikasi 43

Universitas Sumatera Utara


BAB 1
PENDAHULUAN

1.1. Latar Belakang

Lahan sawah merupakan salah satu ciri kehidupan masyarakat tradisional yang umum
dijumpai di beberapa negara yang sebagian besar penduduknya mengonsumsi beras
sebagai makanan pokoknya, seperti di Asia (Asia Tenggara, Asia Selatan, dan Asia
Timur). Lahan sawah merupakan suatu daerah dipermukaan bumi dengan sifat-sifat
tertentu yang meliputi biosfer, atmosfer, tanah, lapisan geologi, hidrologi, populasi
tanaman dan hewan serta hasil kegiatan manusia masa lalu dan sekarang, sampai pada
tingkat tertentu dengan sifat-sifat tersebut mempunyai pengaruh yang berarti terhadap
fungsi lahan oleh manusia pada masa sekarang dan masa yang akan datang (Sitorus,
2005). Lahan sawah merupakan ciri kehidupan masyarakat tradisional sudah ada sejak
zaman purba. Bukti bukti lahan sawah sudah ada sejak zaman purba menurut Rostam
dan Anuar (1984) telah dikaji oleh ahli arkeologi yang menginformasikan bahwa lahan
sawah dengan tanaman utamanya padi dimulai di India dan Cina lebih dari 1.000 tahun
yang lalu sebelum masehi. Kegiatan pertanian lahan sawah dengan tanaman pokok padi
mulai dikembangkan ke kawasan Asia lainnya termasuk ke Indonesia. Karena beberapa
negara Asia merasa cocok beras sebagai makanan pokok maka perkembangan lahan
sawah di negara-negara Asia cukup pesat.
Kesuburan tanah merupakan salah satu faktor penentu keberhasilan usaha
pertanian. Namun ada kalanya banyak usaha pertanian yang gagal atau hasil tidak
maksimal karena kurangnya pemahaman tentang tingkat kesuburan tanah untuk jenis
tanaman yang tepat dan sesuai dengan sampel tanah dari petani sendiri. Permasalahan
pendidikan dan pengetahuan petani sering juga menjadi penghambat dalam
pemanfaatan lahan sawah. Oleh karena itu, peningkatan pendidikan bagi petani melalui

Universitas Sumatera Utara


2

pendidikan formal maupun nonformal menjadi sangat penting, sebagai langkah untuk
meningkatkan kualitas sumber daya petani. Meningkatnya kualitas sumber daya petani
diharapkan dapat meningkatkan kemampuan petani dalam melakukan kegiatan
produksi lahan sawah sehingga produksinya dapat meningkat (Sirojusilam, 2005).
Aspek lain yang sering menjadi masalah dalam pemanfaatan lahan sawah adalah
faktor iklim. Faktor iklim yang dimaksud yaitu suhu, curah hujan, sinar matahari dan
cuaca. Tanaman padi yang ditanam pada lahan sawah membutuhkan kelembapan dan
suhu tertentu dengan cuaca dan sinar matahari yang cukup sehingga jika tidak sesuai
dengan kondisi tersebut maka tanaman padi tidak akan tumbuh dengan baik. Oleh
karena itu, iklim sebagai salah satu faktor yang menentukan keberhasilan dalam
pemanfaatan lahan sawah harus benar-benar dapat diinformasikan dengan baik kepada
para petani.
Selain permasalahan diatas, ada juga permasalahan perbedaan jenis dan kualitas
tanah yang juga sering menjadi masalah bagi petani dalam memanfaatkan lahan
sawahnya. Hal ini terjadi karena di belahan dunia ini terdapat berbagai jenih tanah
dengan kualitas yang sangat berbeda yang akan memengaruhi tanaman yang ditanam
pada lahan sawah. Kualitas tanah yang ada pada lahan sawah sangat ditentukan oleh
tekstur, struktur, kandungan bahan organik, pori-pori atau porositasnya. Tanaman padi
akan tumbuh dengan baik pada jenis tanah lempung berpasir yang subur dan pada
daerah tertentu. Namun demikian, karena penyebaran kualitas dan jenis tanah tidak
merata di seluruh wilayah maka untuk mendapatkan hasil yang baik dari jenis tanaman
yang akan ditanam pada lahan sawah harus berpedoman pada tingkat kesesuaian
lahannya.
Penelitian tentang identifikasi lahan sawah sebelumnya dilakukan oleh
(Ardiansyah, et al. 2015) identifikasi lahan sawah menggunakan citra Landsat 8
multitemporal. Metode yang digunakan yaitu Normalized Difference Vegetation Index
(NDVI), Principal Component Analysis (PCA) dan kombinasi kanal. Klasifikasi citra
dilakukan dengan menggunakan sembilan kelas, yaitu air, pemukiman, mangrove,
kebun, tegalan, sawah 1, sawah 2, sawah 3 dan sawah 4. Hasil analisis menunjukkan
luas lahan sawah yang diperoleh dari metode PCA sebesar 50.009 ha, kombinasi kanal
sebesar 51.016 ha dan metode NDVI sebesar 45.893 ha. Tingkat ketelitian pada metode
PCA 84,848%, kombinasi kanal mempunyai ketelitian 81,818% dan NDVI mempunyai
ketelitian 75,758%.

Universitas Sumatera Utara


3

Fokus utama penelitian ini adalah untuk membuat sistem klasifikasi kualitas
lahan sawah yang baik menggunakan parameter seperti kelembapan tanah, kelembapan
udara, tinggi air dan intensitas cahaya. Dalam hal ini lahan sawah akan digolongkan
menjadi dua kategori yaitu lahan sawah ideal dan tidak ideal. Berdasarkan latar
belakang diatas, maka penulis membuat sebuah penelitian dengan judul “Klasifikasi
Lahan Sawah menggunakan algoritma K-Nearest Neighbor”.

1.2. Rumusan masalah

Kurangnya pengetahuan dan pemahaman petani akan tingkat kesuburan tanah yang
tidak sama satu sama lain untuk ditanami jenis tanaman yang tepat membuat petani
kesulitanan dalam menentukan jenis tanaman yang tepat untuk mereka tanam.
Klasifikasi kualitas lahan sawah diperlukan untuk membantu para petani dikarenakan
banyak usaha pertanian yang gagal atau hasil tidak maksimal karena kurangnya
pemahaman tentang tingkat kesuburan tanah untuk jenis tanaman yang tepat dan sesuai
dengan sampel tanah dari petani sendiri. Maka dari itu, diperlukan sebuah sistem untuk
menghasilkan kualitas lahan sawah yang baik.

1.3. Tujuan penelitian

Penelitian ini bertujuan untuk melakukan analisis terhadap parameter yang


mempengaruhi status kesuburan tanah dan untuk mengklasifikasi lahan sawah agar
menghasilkan tanaman padi yang berkualitas dengan menerapkan algoritma K-Nearest
Neighbor.

1.4. Batasan masalah

Pada penelitian ini, penulis membuat batasan masalah agar tidak menyimpang dari
tujuan penelitian, adapun batasan masalah sebagai berikut:
1. Menggunakan data yang diambil secara berkala setiap lima menit.
2. Parameter yang diproses adalah kelembapan tanah, kelembapan udara,
intensitas cahaya, dan ketinggian air.
3. Proses yang dapat dilakukan oleh sistem adalah mengklasifikasi lahan sawah
ideal atau tidak.
4. Hasil data yang diproses adalah lahan sawah ideal atau tidak ideal.

Universitas Sumatera Utara


4

1.5. Manfaat penelitian

Manfaat dari penelitian ini sebagai berikut:


1. Membantu petani untuk memilih lahan sawah yang baik untuk tanaman padi.
2. Menjadi referensi untuk penelitian selanjutnya pada bidang data mining.

1.6. Metode penelitian

Tahapan-tahapan yang akan dilakukan pada penelitian ini sebagai berikut:


1. Studi Literatur
Pada tahap ini dilakukan pengumpulan bahan referensi mengenai lahan sawah,
tanaman padi, dan algoritma K-Nearest Neighbor dari berbagai buku, jurnal,
artikel, dan beberapa sumber referensi lainnya.

2. Pengumpulan dan Analisis Data


Pada tahap ini dilakukan pengumpulan dan pengolahan data dan melakukan
analisis terhadap studi literatur untuk mendapatkan informasi dan pemahaman
mengenai K-Nearest Neighbor sebagai metode untuk menyelesaikan masalah
pada penelitian ini.

3. Perancangan Sistem
Pada tahap ini dilakukan perancangan arsitektur, pelatihan, dan perancangan
antarmuka. Proses perancangan berdasarkan hasil analisis studi literatur yang
telah didapatkan.

4. Implementasi
Pada tahap ini dilakukan implementasi dari analisis dan perancangan yang telah
dilakukan kedalam kode program sesuai dengan alur yang telah ditentukan.

5. Pengujian Sistem
Pada tahap ini akan dilakukan pengujian terhadap sistem klasifikasi lahan sawah
yang telah dibangun untuk memastikan hasil klasifikasi telah berjalan sesuai
dengan yang diharapkan.

Universitas Sumatera Utara


5

6. Dokumentasi dan Penyusunan Laporan


Pada tahap ini dilakukan dokumentasi dan penyusunan laporan hasil analisis dan
implementasi K-Nearest Neighbor dalam klasifikasi lahan sawah untuk tanaman
padi.

1.7. Sistematika penulisan


Agar pembahasan lebih sistematis, maka tulisan ini dibuat dalam lima bab, yaitu:
Bab 1: Pendahuluan
Bab ini berisi latar belakang dari penelitian yang dilaksanakan, rumusan masalah, tujuan
penelitian, batasan masalah, manfaat penelitian metodologi penelitian serta sistematika
penulisan.
Bab 2: Landasan Teori
Bab ini membahas tentang teori-teori yang berhubungan pada penelitian ini. Teori-teori
yang berhubungan dengan lahan sawah, tanaman padi, kelembapan tanah, kelembapan
udara, intensitas cahaya, ketinggian air dan algoritma K-Nearest Neighbor.
Bab 3: Analisis dan Perancangan Sistem
Bab ini membahas analisis dan perancangan, dimulai dari analisis terhadap
permasalahan yang ada, dan penyelesaian. Pada bab ini dijabarkan tentang arsitekur
umum, proses yang dilakukan serta tahapan pada metode yang digunakan.
Bab 4: Implementasi dan Pengujian
Bab ini berisi membahas tentang implementasi sistem dan hasil pengujian terhadap
aplikasi yang telah dibangun.
Bab 5: Kesimpulan dan Saran
Bab ini berisi tentang kesimpulan hasil penelitian dan saran-saran yang berkaitan
dengan penelitian selanjutnya.

Universitas Sumatera Utara


BAB 2
LANDASAN TEORI

Bab ini membahas tentang teori pendukung dan penelitian sebelumnya yang
berhubungan dengan lahan sawah, tanaman padi, kelembapan tanah, kelembapan udara,
intensitas cahaya, ketinggian air dan penerapan algoritma K-Nearest Neighbor untuk
identifikasi lahan sawah.

2.1. Lahan Sawah

Lahan sawah merupakan salah satu ciri kehidupan masyarakat tradisional yang umum
dijumpai di beberapa negara yang sebagian besar penduduknya mengonsumsi beras
sebagai makanan pokoknya. Lahan sawah biasanya dicirikan oleh adanya pematang
yang mengelilinginya dengan maksud untuk membatasi antara bidang lahan sawah yang
satu dengan bidang sawah lainnya. Di samping itu, pematang lahan juga dibuat untuk
tujuan mencegah keluar masuknya air secara berlebihan sehingga kondisi air dapat
diatur sesuai dengan kebutuhan.
Tanah sawah didefinisikan sebagai tanah yang digunakan untuk bertanam padi
sawah yang digenangi, baik terus-menerus sepanjang tahun maupun bergiliran dengan
tanaman palawija. Istilah tanah sawah bukan merupakan istilah taksonomi, tetapi
merupakan istilah umum seperti halnya tanah hutan, tanah perkebunan, tanah pertanian,
dan sebagainya. Segala macam jenis tanah dapat disawahkan asalkan air cukup tersedia.
Padi sawah juga ditemukan pada berbagai macam iklim yang jauh lebih beragam
dibandingkan dengan jenis tanaman lain,sehingga tidak mengherankan bila sifat tanah
sawah sangat beragam sesuai dengan sifat tanah asalnya (Hardjowigenoet al. 2004).
Berdasarkan pengairannya lahan sawah dibedakan menjadi :
1. Lahan sawah berpengairan (irigasi).

Universitas Sumatera Utara


7

Yaitu lahan sawah yang memperoleh pengairan dari sistem irigasi, baik yang bangunan
penyadap dan jaringan-jaringannya diatur dan dikuasai dinas pengairan PU maupun
dikelola sendiri oleh masyarakat.
Lahan sawah irigasi terdiri atas :
• Lahan sawah irigasi teknis.
• Lahan sawah irigasi setengah teknis.
• Lahan sawah irigasi sederhana.
• Lahan sawah irigasi non PU

2. Lahan sawah tak berpengairan (non irigasi).


Yaitu lahan sawah yang tidak memperoleh pengairan dari sistem irigasi tetapi
tergantung pada air alam seperti : air hujan, pasang surutnya air sungai/laut, dan air
rembesan.
Lahan sawah non irigasi meliputi :
• Lahan sawah tadah hujan.
• Lahan sawah pasang surut.
• Lahan sawah lainnya (lebak, polder, rembesan, lahan rawa yang dapat ditanami
padi dan lain-lain).

Lahan sawah mempunyai nilai optimal untuk ditanami tanaman padi. Range nilai
optimal lahan sawah yang cocok untuk ditanami tanaman ditunjukkan pada tabel 2.1.

Tabel 2.1 Range Nilai Optimal


No. Parameter Range optimal Peneliti Tahun

1 Tinggi air 1 – 7 cm Muammar Michael 2010


Kelembapan Hesdianto Eko
2 50 – 90% 2015
udara Mareja, S.P
Kelembapan
3 60 – 90 % Chusnul Arif 2014
tanah
100,000 –
4 Intensitas cahaya Anonym 2002
500,000 lux

Universitas Sumatera Utara


8

2.2. Padi

Padi (bahasa latin: Oryza sativa L.) merupakan salah satu tanaman budidaya terpenting
dalam peradaban. Padi diduga berasal dari India atau Indocina dan masuk ke Indonesia
dibawa oleh nenek moyang yang migrasi dari daratan Asia sekitar 1500 SM. Padi
merupakan tanaman yang termasuk genus Orzya L. yang meliputi kurang lebih 25
spesies, tersebar di daerah tropis dan daerah subtropics, seperti Asia, Afrika, Amerika
dan Australia. Padi yang ada sekarang merupakan persilangan antara Oryzaofficianalis
dan Oryzasativa F. Spontane. Produksi padi dunia menempati urutan ketiga dari semua
serealia, setelah jagung dan gandum. Namun, padi merupakan sumber karbohidrat
utama bagi mayoritas penduduk dunia.
Padi merupakan tanaman yang dapat tumbuh dengan baik pada kondisi tergenang.
Akan tetapi, kondisi genangan yang di atas normal juga akan mempengaruhi kondisi
tanaman Padi itu sendiri, terutama produksi padi yang dihasilkan. Perbedaan waktu dan
lama Penggenangan akan memberikan pengaruh yang berbeda pada pertumbuhan padi
sawah. Tinggi dan lamanya penggenangan secara substansial mempengaruhi
pertumbuhan tanaman Padi. Tinggi genangan memberikan informasi kondisi tanah
aerob atau anaerob, tetapi Penelitian tentang Bagaimana tinggi genangan dan lama
penggenangan mempengaruhi pertumbuhan tanaman Dan toleransi tanaman padi
terhadap penggenangan masih terbatas (Rachmawati, 2013). Pemberian air irigasi ke
lahan pertanian bertujuan untuk memenuhi kebutuhan air Tanaman agar dapat tumbuh
secara optimal, namun ketidakpastian ketersedian air menjadi Permasalahan utama pada
saat sekarang. Hal tersebut merupakan salah satu akibat dari Perubahan iklim global
sehingga mempengaruhi irigasi padi (Da Silva et al. 2012). Melkonyan (2015)
menyatakan bahwa dampak perubahan iklim menyebabkan kekeringan yang membuat
Gagal panen dan penurunan produksi padi. Permasalahan tersebut dapat diatasi dengan
Pengelolaan penggunaan air irigasi yang tepat dan efisien (Azis, 2011). Pada budidaya
padi Konvensional, umumnya petani menggenangi lahan sawahnya terus menerus
sehingga Menyebabkan pemborosan air dan meningkatkan cost untuk memenuhi
kebutuhan air Tanaman. Menurut Puslitbangtanak (2004), tinggi genangan air yang
diterapkan petani di Indonesia dapat mencapai 15 cm. Sedangkan studi literature
Menunjukan ketinggian Genangan air yang optimum untuk tanaman padi adalah 1 cm
hingga 7 cm. (Muammar Michael, 2010)

Universitas Sumatera Utara


9

2.3. Kelembaan Udara

Kelembaban udara adalah banyaknya kandungan uap air di udara (atmosfer). Udara
atmosfer adalah campuran dari udara kering dan uap air. Kelembaban udara ditentukan
oleh banyaknya uap air dalam udara. Kalau tekanan uap air dalam udara mencapai
maksimum, maka mulailah terjadi pengembunan. Kelembaban udara juga merupakan
jumlah kandungan uap air yang ada dalam udara. Kandungan uap air di udara berubah-
ubah bergantung pada suhu. Makin tinggi suhu, makin banyak kandungan uap airnya.
Alat pengukur kelembapan udara adalah higrometer. Kisaran kelembaban optimum
untuk tanaman padi adalah 50 – 90 %. (Hesdianto Eko Mareja, S.P, 2015)
Macam-macam kelembaban udara sebagai berikut :
1. Kelembaban relatif / Nisbi yaitu perbandingan jumlah uap air di udara dengan
yang terkandung di udara pada suhu yang sama. Misalnya pada suhu 270 C,
udara tiap-tiap 1 m3 maksimal dapat memuat 25 gram uap air pada suhu yang
sama ada 20 gram uap air,maka lembab udara pada waktu itu =
20 x 100 % = 80 %
2. Kelembaban absolut / mutlak yaitu banyaknya uap air dalam gram pada 1 m 3.
Contoh : 1 m3 udara suhunya 250 C terdapat 15 gram uap air maka kelembaban
mutlak = 15 gram. Jika dalam suhu yang sama , 1 m3 udara maksimum
mengandung 18 gram uap air, maka kelembaban relatifnya =
15/18 X 100 % = 83,33 %.

2.4. Kelembaban Tanah

Kelembaban tanah merupakan salah satu variabel kunci dalam proses hidrologi yang
berperan penting dalam menentukan ketersediaan air sebagai unsur yang sangat
fundamental dalam kehidupan mahluk hidup. Kelembaban tanah adalah air yang
ditahan pada ruang atau pori di antara partikel tanah. Tingkat suhu dan kelembaban
tanah sangat bervariasi sejalan dengan perubahan proses pertukaran energi matahari
terutama yang melalui permukaan tanah. Fenomena ini berlaku di dalam penampang
tanah melalui serangkaian proses yang kompleks. (Kurnia et al. 2006)
Kelembaban tanah pada alam terbuka beragam sesuai dengan perubahan cuaca
yang terus-menerus terjadi sehingga dapat mempengaruhi bidang pertemuan tanah

Universitas Sumatera Utara


10

dengan atmosfer. Parameter tanah yang mempengaruhi kelembapan tanah dan suhu
tanah antara lain kapasitas panas spesifik, penghantar panas, difusivitas panas, serta
sumber dan keluaran panas internal pada waktu tertentu (Kurnia et al. 2006).
Kelembaban tanah sangat penting untuk di ketahui sebagai dasar untuk perhitungan
akurat dari jumlah air yang dibutuhkan pada proses irigasi dan penyiraman tanaman.
Kelembaban tanah kering sebesar 0% diasumsikan saat kondisi tanah kering tidak
terdapat kandungan air di dalam tanah walaupun sebenarnya terdapat kadar air kapasitas
lapang tanah. Selanjutnya, saat kondisi tanah jenuh sebesar 100% diasumsikan kondisi
tanah memiliki lapisan dan pori tanah yang telah terisi penuh dengan kandungan air
walaupun sebenarnya terdapat sedikit rongga udara didalam pori tanah terutama pada
lapisan dasar tanah. Tanah jenuh memiliki nilai asumsi kelembaban 100% sedangkan
tanah kering memiliki asumsi kelembaban bernilai 0%. Kondisi tanah normal memiliki
nilai kelembaban tanah sekitar 62,2% dengan range 60 – 90%. (Chusnul Arif, 2014)

2.5. Intensitas Cahaya

Intensitas cahaya matahari adalah kualitas cahaya matahari untuk membantu tanaman
untuk tumbuh dan berfotosintesis. Cahaya matahari adalah sumber energi utama bagi
kehidupan seluruh makhluk hidup didunia. Bagi manusia, hewan dan tumbuhan cahaya
matahari adalah penerang dunia ini. Tanaman memerlukan cahaya matahari
tumbuh hijau. Dengan air tanpa cahaya matahari, tanaman akan tumbuh tinggi dengan
cepat, namun akan terlihat kuning dan kekurangan air, meskipun saat
disentuh, daunnya teraba amat basah. Selain itu, bagi tumbuhan khususnya yang
berklorofil cahaya matahari sangat menentukan proses fotosintesis.
Fotosintesis adalah proses dasar pada tumbuhan untuk menghasilkan makanan.
Makanan yang dihasilkan akan menentukan ketersediaan energi untuk pertumbuhan
dan perkembangan tumbuhan. Sinar matahari memang berguna bagi fotosintesis pada
tumbuhan, namun efek lain dari sinar matahari ini adalah menekan pertumbuhan sel
tumbuhan. Hal ini menyebabkan tumbuhan yang diterpa cahaya matahari akan lebih
pendek daripada tumbuhan yang tumbuh di tempat gelap.
Intensitas cahaya pada siang hari di dataran tinggi di Indonesia (1000 m dpl)
adalah sebesar 50.000 lux dengan range optimal 100.000 – 500.000 lux. (Anonim,
2002)

Universitas Sumatera Utara


11

Rumus intensitas cahaya :

E = F (lux)
A (2.1)

Keterangan :
E = Iluminasi / intensitas penerangan / kekuatan penerangan / tingkat pencahayaan (lux)
F= fluks cahaya (lumen)
A = luas permukaan bidang (m2)

2.6. Machine Learning

Machine Learning merupakan salah satu cabang dari disiplin ilmu kecerdasan buatan
yang membahas mengenai pembangunan sistem yang berdasarkan pada data. Salah satu
teknik pengaplikasian machine learning adalah supervised learning. Oleh karena itu hal
yang pertama kali disiapkan adalah data. Data biasanya akan dibagi menjadi 2
kelompok, yaitu data training dan data testing. Data training nantinya akan digunakan
untuk melatih algoritma untuk mencari model yang cocok, sementara data testing akan
dipakai untuk mengetes dan mengetahui performa model yang didapatkan pada tahapan
testing.
Machine Learning merupakan studi dari ilmu komputer yang memberi komputer
kemampuan untuk belajar tanpa harus di program secara langsung atau explisit.
(Samuel, 1959). (Das, et al., 2017) menjelaskan dalam prosesnya, machine learning
dapat di kategorikan berdasarkan pembelajarannya.
• Supervised Learning (Pembelajaran terarah)
Data masukan atau data pelatihan memiliki label yang sudah di tentukan
sebelumnya, misalnya Benar/Salah, Positif/Negatif, dsb. Fungsi
pengklasifikasian data dibangun dan dilatih untuk memprediksi label data uji.
• Unsupervised Learning (Pembelajaran tidak terarah)
Data masukan atau data pelatihan tidak diberi label. Pengklasifikasi dirancang
dengan mendeduksi pola-pola yang ada atau mengelompokkannya dalam set
data pelatihan.
• Semi-supervised Learning (Pembelajaran semi terarah)

Universitas Sumatera Utara


12

Data pelatihan berisi data yang diberi label dan tidak berlabel. Pengklasifikasi
dilatih untuk mempelajari pola-pola untuk mengklasifikasikan dan memberi
label data yang digunakan untuk memprediksi.

2.7. Algoritma K-Nearest Neighbor

K-Nearest Neighbor merupakan salah satu metode untuk mengambil keputusan


menggunakan pembelajaran dimana hasil dari dataset masukan yang baru diklasifikasi
berdasarkan yang terdekat dalam dataset nilai. Algoritma K-Nearest Neighbor adalah
sebuah metode untuk melakukan klasifikasi terhadap objek yang berdasarkan dari data
pembelajaran yang jaraknya paling dekat dengan objek tersebut. K-Nearest Neighbor
merupakan algoritma supervised learning dimana hasil dari query instance yang baru
diklasifikan berdasarkan mayoritas dari kategori pada algoritma K-Nearest Neighbor.
Dimana kelas yang paling banyak muncul yang nantinya akan menjadi kelas hasil dari
klasifikasi.
K-Nearest Neighbor adalah algoritma yang mengklasifikasikan data berdasarkan
pada klasifikasi tetangganya. Hal ini berarti jika sebuah data dikelilingi oleh empat titik
data merah dan satu titik data hitam, maka pemilihan terbesar akan menyimpulkan
bahwa data yang baru dimasukkan merupakan kelompok data merah seperti yang
ditunjukkan pada Gambar 2.1.

Gambar 2.1. Ilustrasi Klasifikasi Algoritma K-Nearest Neighbor

Kedekatan didefinisikan dalam jarak metrik, seperti jarak Euclidean. Jarak Euclidean
dapat dicari dengan menggunakan persamaan 1:

Universitas Sumatera Utara


13

𝑫𝒙𝒚= √ Σ ( 𝒙𝒊 – 𝒚𝒊 ) 𝟐 𝒏𝒊 = 𝟏
(2.2)

Keterangan :
𝐷 : jarak kedekatan
𝑥 : data training
𝑦 : data testing
𝑛 : jumlah atribut individu antara 1 s.d. 𝑛
𝑓 : fungsi similitary atribut 𝑖 antara kasus 𝑋 dan kasus 𝑌
𝑖 = atribut individu antara 1 sampai dengan 𝑛

Langkah-langkah untuk menghitung metode K-Nearest Neighbor antara lain:


1. Menentukan K (Jarak tetangga terdekat);
2. Menghitung jarak antara data yang diuji dengan data training (data latih). Pada
tahap ini menghitung jarak data yang mau diprediksi dihitung dengan semua
data training (data latih);
3. Mengurutkan nilai jarak atau me-ranking berdasarkan K ke dalam kelompok
yang mempunyai Euclid terkecil (mengurutkan hasil jarak secara dari terkecil
ke terbesar);
4. Mengumpulkan kategori Y (Klasifikasi Nearest Neighbor) berdasarkan nilai K
atau ambil data tetangga terdekat setelah diurutkan sebelumnya, dan tentukan
nilai K yang bagus;
5. Langkah selanjutnya, penentuan klasifikasi. Dari hasil training, akan diperoleh
data yang mendominasi.
K-Nearest Neighbor memiliki beberapa kelebihan yaitu ketangguhan terhadap
training data yang memiliki banyak noise dan efektif apabila training data-nya besar.
Sedangkan, kelemahan K-Nearest Neighbor adalah K-Nearest Neighbor perlu
menentukan nilai dari parameter k (jumlah dari tetangga terdekat), training berdasarkan
jarak tidak jelas mengenai jenis jarak apa yang harus digunakan dan atribut mana yang
harus digunakan untuk mendapatkan hasil terbaik, dan biaya komputasi cukup tinggi
karena diperlukan perhitungan jarak dari tiap query instance pada keseluruhan training
sample. (Yofianto, 2010)

Universitas Sumatera Utara


14

2.8. PHP

PHP merupakan singkatan dari Hypertext Preprocessor yaitu suatu bahasa


pemrograman yang difungsikan untuk membangun suatu website dinamis (Saputra,
2011). PHP menyatu didalam code HTML, dimana HTML digunakan sebagai kerangka
layout web, sedangkan PHP difungsikan sebagai prosesnya.
PHP berjalan pada sisi server sehingga PHP disebut juga sebagai bahasa server
side scripting. Server side scripting artinya setiap untuk menjalankan PHP, wajib
adanya web server. PHP bersifat open source sehingga dapat dipakai secara gratis dan
mampu lintas platform, yaitu dapat berjalan pada sistem operasi Windows maupun
Linux.
Beberapa alasan mengapa menggunakan PHP yaitu karena :
1. Mudah dipelajari, alasan tersebut menjadi salah satu alasan utama untuk
menggunakan PHP.
2. Mampu lintas platform, yaitu PHP mudah diaplikasikan pada berbagai platform
sistem operasi dan hampir semua browser juga mendukung PHP.
3. Tidak berbayar atau gratis.
4. PHP memiliki tingkat akses yang cepat.
5. Didukung oleh beberapa macam web server seperti: Apache, IIS, Lighttpd,
Xitami.
6. Mendukung database baik yang gratis maupun yang berbayar, seperti MySql,
PostgreSQL, mSQL, Informix, SQL, server, Oracle.

2.9. Metode Evaluasi

Penelitian ini melakukan evaluasi dengan menggunakan metode confusion matrix.


Confusion matrix adalah alat yang berguna untuk menganalisis seberapa baik classifier
mengenali tuple dari kelas yang berbeda (Han & Kamber, 2011). Nilai dari True-
Positive dan True-Negative memberikan informasi ketika classifier melakukan
klasifikasi data bernilai benar, sedangkan False-Positive dan False-Negative
memberikan informasi ketika classifier salah dalam melakukan klasifikasi data
(Fibrianda & Bhawiyuga, 2018). Pada penelitian ini, flow trafik normal ditandai dengan

Universitas Sumatera Utara


15

nilai positif dan flow trafik botnet ditandai dengan nilai negatif. Tabel confusion matrix
ditunjukkan pada Tabel 2.2.
Tabel 2.2 Confusion Matrix

Prediksi Ideal Tidak Ideal


Aktual
Ideal True Positive (TP) False Negative (FN)
Tidak Ideal False Positive (FP) True Negative (TN)

TP + TN
Akurasi = (3.1)
TP + TN + FP + FN

TP
Recall = (3.2)
TP + FN

TP
Precision = (3.3)
TP+FP

2 x (Precision x Recall)
F-Measure = (3.4)
Precion + Recall

Keterangan :
• True Positive (TP) adalah kondisi dimana data dengan label ideal berhasil
diklasifikasi sebagai lahan sawah yang ideal.
• False Positive (FP) adalah kondisi dimana data dengan ideal gagal diklasifikasi
sebagai lahan sawah yang ideal.
• True Negative (TN) adalah kondisi dimana data dengan label tidak ideal berhasil
diklasifikasi sebagai lahan sawah tidak ideal.
• False Negative (FN) adalah kondisi dimana data dengan label tidak ideal gagal
diklasifikasi sebagai lahan sawah tidak ideal.

2.10. Penelitian Terdahulu

Penelitian tentang identifikasi lahan sawah sebelumnya dilakukan oleh (Ardiansyah, et


al. 2015) identifikasi lahan sawah menggunakan citra Landsat 8 multitemporal. Metode
yang digunakan yaitu Normalized Difference Vegetation Index (NDVI), Principal
Component Analysis (PCA) dan kombinasi kanal. Klasifikasi citra dilakukan dengan

Universitas Sumatera Utara


16

menggunakan sembilan kelas, yaitu air, pemukiman, mangrove, kebun, tegalan, sawah
1, sawah 2, sawah 3 dan sawah 4. Hasil analisis menunjukkan luas lahan sawah yang
diperoleh dari metode PCA sebesar 50.009 ha, kombinasi kanal sebesar 51.016 ha dan
metode NDVI sebesar 45.893 ha. Tingkat ketelitian pada metode PCA 84,848%,
kombinasi kanal mempunyai ketelitian 81,818% dan NDVI mempunyai ketelitian
75,758%.
Penelitian selanjutnya yang dilakukan oleh (Nurlina, 2011) identifikasi dan
pemetaan lahan sawah dengan citra satelit resolusi tinggi dan tracking GPS.
mengidentifikasi dan memetakan lokasi-lokasi terpilih kawasan sentra tanaman pangan
khususnya komoditi padi di Kalimantan Selatan khususnya di Kabupaten Hulu sungai
tengah. Luas lahan sawah yang telah dipetakan sebesar 2.071,58 ha atau 20.49% dari
luas kecamatan. Lahan sawah ini terdiri dari sawah irigasi seluas 1.403,62 ha atau
13,88%, sawah tadah hujan sebesar 340,09 ha atau 3,36% dan lebak seluas 327,87 ha
atau 3,24 %.
Selanjutnya penelitian oleh (Sofi, et al. 2016) K-Nearest Neighbor dengan
Correlation Atribute Eval untuk Memprediksi Luas Lahan Panen Tanaman Padi di
Karawang. Penelitian melakukan prediksi terhadap luas lahan panen padi dikabupaten
karawang. Untuk dapat melakukan prediksi yang baik dibutuhkan atribut-atribut yang
relevan yang didapat dari seleksi fitur dengan Correlation Attribute Eval. Terdapat 6
atribut yang relevan terhadap prediksi luas lahan panen padi di kabupaten karang yaitu
atribut produksi, luas tanam, luas baku sawah, luas sawah, produktivitas dan wereng
batang coklat. Algoritma K-Nearest Neighbor dengan Correlation Attribute Eval
mengalami peningkatan akurasi sebesar 0,37%
Selanjutnya penelitian oleh (Chusnul, et al. 2014) yaitu Penentuan Kelembaban
Tanah Optimum untuk Budidaya Padi Sawah Sri (System Of Rice Intensification)
Menggunakan Algoritma Genetika. Kelembaban tanah optimum untuk budidaya padi
metode SRI telah dicari dengan model Algoritma Genetika dengan tujuan untuk
memaksimalkan produksi dan produktifitas air. Optimasi dilakukan berdasarkan data
pengukuran pada tiga musim tanam dengan hasil kelembaban tanah optimum adalah
0.622 (basah), 0.593 (basah), 0.455 (agak basah), dan 0.350 cm3/cm3 (kering). Model
Algoritma Genetika memperkirakan produksi dapat ditingkatkan 4.40% sekaligus juga
meningkatkan produktifitas air sebesar 8.40% dan nilai manfaat air sebesar 15.2%
dengan banyaknya air irigasi yang dihemat sebesar 12.28%.

Universitas Sumatera Utara


17

Tabel 2.3 Penelitian Terdahulu


No. Judul Penelitian Penulis Tahun Akurasi
Ardiansyah,
Identifikasi Lahan Sawah
Sawitri
1 Menggunakan NDVI dan 2015 84,84%
Subiyanto,
PCA pada Citra Landsat 8
Abdi Sukmono
Identifikasi Dan Pemetaan
Lahan Sawah Dengan
2 Nurlina 2015 89%
Citra Satelit Resolusi
Tinggi Dan Tracking Gps
K-Nearest Neighbor
dengan Correlation Sofi Defiyanti,
Atribute Eval untuk Betha Nurina
3 2016 90,31%
Memprediksi Luas Lahan Sari, dan Vika
Panen Tanaman Padi di Saraswati
Karawang
Penentuan Kelembaban
Tanah Optimum untuk
Chusnul Arif,
Budidaya Padi Sawah Sri
Budi Setiawan,
4 (System Of Rice 2014 89,13%
dan Masaru
Intensification)
Mizoguchi
Menggunakan Algoritma
Genetika

Universitas Sumatera Utara


BAB 3
ANALISIS DAN PERANCANGAN SISTEM

Pada bab ini akan dibahas mengenai analisis dan perancangan sistem. Pada tahap
analisis, menjelaskan analisis data yang dipakai untuk data latih dan data uji, serta
analisis terhadap metode yang akan digunakan. Pada tahap analisis akan dilakukan
analisis terhadap algoritma K-Nearest Neighbor. Pada tahap perancangan sistem akan
dibahas mengenai tampilan antarmuka pada aplikasi yang akan dibangun.

3.1. Data yang digunakan

Data yang digunakan dalam penelitian ini adalah data yang berasal dari salah satu
penelitian sebelumnya yaitu data monitoring tanaman padi yang diambil disalah satu
lahan sawah didaerah Lubuk Pakam. Dimana data tersebut merupakan besarnya nilai
kelembaban tanah, kelembaban udara, intentitas cahaya serta ketinggian air pada ruang
lingkup tanaman padi. Pengumpulan data dilakukan dengan menggunakan sensor
arduino nano dan raspberry pi sebagai server yang dikerjakan secara periodik. Total
data yang digunakan berjumlah 1014 data. Setelah data terkumpul kemudian dilakukan
analisa data yang sesuai dengan kebutuhan sistem ini. Analisis data tersebut dilakukan
berdasarkan klasifikasi menggunakan algoritma K-Nearest Neigbor. Tabel data yang
digunakan pada penelitian ini, dapat dilihat pada Tabel 3.1

Tabel 3.1 Tabel Data yang Digunakan


Kelembaban Kelembaban Intensitas
No. Waktu Tinggi Air
Udara Tanah Cahaya
1 2018-01-04 5 cm 50% 70% 100.293 lux

2 2018-01-04 7 cm 51% 80% 105.163 lux


.... 2018-01-04 3 cm 56% 67% 99.632 lux
1014 2018-08-17 2 cm 10% 87% 9.2469 lux

Universitas Sumatera Utara


19

3.2. Arsitektur Umum

Input Pre-Processing
Data Training Normalisasi

Data Testing Binning by boundaries

Labelling

Akurasi Proses

Output Klasifikasi algoritma


Nilai
Precision, Hasil K-Nearest Neighbor
Recall dan
F-Measure
Gambar 3.1 Arsitektur Umum

Tahapan – tahapan yang dilakukan pada Gambar 3.1 dijelaskan sebagai berikut :
3.2.1. Input
Input data terdiri dari dua bagian yaitu data training dan data testing. Input data
yang digunakan pada penelitian ini merupakan data parameter lahan sawah
seperti tinggi air, kelembapan tanah, kelembapan udara dan intensitas cahaya
yang dibuat dalam format dokumen .csv. Kemudian dokumen tersebut diinput
untuk diolah oleh sistem. Adapun contoh untuk parameter yang akan diproses
dapat dilihat pada Tabel 3.2

Tabel 3.2 Contoh data yang diinput


tinggi kelembaban_ kelembaban_
No. date_t intensitas_cahaya
_air udara tanah
2018-01-04
1 3 cm 50% 70% 100.293 lux
13:02:49

3.2.2. Pre-Processing
Data yang telah diinput dan dibaca akan masuk ke pemrosesan selanjutnya,
yaitu:

Universitas Sumatera Utara


20

a. Normalisasi
Pada tahap ini data yang akan digunakan akan dinormalisasi terlebih dahulu.
Normalisasi data ini menggunakan Min-Max normalization yaitu sebuah
cara normalisasi sebuah data dengan range minimal dan maksimal yang baru
yang sudah ditentukan, cara ini biasanya disebut Interpolation
Normalization. Untuk menggunakan cara ini, cukup dengan rumus:

(Xlama − Minlama)
𝑋𝑏𝑎𝑟𝑢 = x (Maxbaru − Minbaru) + Minbaru
(Maxlama − Minlama)
Keterangan :
Xlama = nilai yang akan dinormalisasi
Minlama = nilai range minimal
Maxlama = nilai range maksimal
Maxbaru = nilai range maksimal baru
Minbaru = nilai range minimal baru

Berikut ini merupakan data tinggi air yang akan dinormalisasikan:


Xlama = 3 cm
Minlama = 1cm
Maxlama = 7 cm
Maxbaru = 5
Minbaru = 1

(3 − 1)
𝑇𝑖𝑛𝑔𝑔𝑖 𝐴𝑖𝑟 = x (5 − 1) + 1 = 2,3
(7 − 1)

Selanjutnya normalilasi data kelembapan udara sebagai berikut:


Xlama = 50%
Minlama = 50%
Maxlama = 90%
Maxbaru = 5
Minbaru = 1
(50% − 50%)
𝐾𝑒𝑙𝑒𝑚𝑏𝑎𝑏𝑎𝑛 𝑢𝑑𝑎𝑟𝑎 = x (5 − 1) + 1 = 1
(90% − 50%)

Universitas Sumatera Utara


21

Selanjutnya normalisasi data kelembapan tanah sebagai berikut:


Xlama = 70%
Minlama = 60%
Maxlama = 90%
Maxbaru = 5
Minbaru = 1
(70% − 60%)
𝐾𝑒𝑙𝑒𝑚𝑏𝑎𝑏𝑎𝑛 𝑡𝑎𝑛𝑎ℎ = x (5 − 1) + 1 = 2,3
(90% − 60%)

Selanjutnya normalisasi data intensitas cahaya sebagai berikut:


Xlama = 100,293 lux
Minlama = 100,000 lux
Maxlama = 500,000 lux
Maxbaru = 5
Minbaru = 1
(100,293 − 100,000)
𝐼𝑛𝑡𝑒𝑛𝑠𝑖𝑡𝑎𝑠 𝑐𝑎ℎ𝑎𝑦𝑎 = x (5 − 1) + 1 = 1,1
(500,000 − 100,000)

b. Binning by Boundaries
Tahapan ini diawali dengan membaca isi data yang diinput pada pengaturan
parameter. Kemudian sistem menyimpan data parameter ideal minimal dan
maksimal. Selanjutnya, sistem membaca isi data training dan membaca
setiap parameter sesuai dengan data pada pengaturan. Setelah itu, sistem
menghitung data yang sesuai dengan data pengaturan.
c. Labelling
Tahapan berikutnya yaitu labelling. Setelah sesuai dengan pengaturan,
mesin akan mengklasifikasi hasil data sesuai dengan jumlah hitungan
parameter yaitu untuk membuat tanda pada data training sebagai data latih
dan data pacuan untuk pembelajaran terhadap data testing.

3.2.3. Proses
Tahapan selanjutnya yaitu klasifikasi hasil data sesuai dengan jumlah hitungan
parameter. Jika nilai parameter tinggi air sesuai dengan data yang ada pada

Universitas Sumatera Utara


22

pengaturan, maka nilai = 1. Kemudian sistem membaca lagi jika nilai parameter
kelembapan tanah sesuai dengan data pengaturan, maka nilai = 1. Jadi, jumlah
nilai yang sesuai dengan pengaturan berjumlah 2. Selanjutnya, sistem membaca
lagi nilai parameter kelembapan udara dan intensitas cahaya. Jika nilai tidak
sesuai, maka hasil klasifikasi tidak ideal. Jika nilai kelembapan udara atau
intensitas cahaya sesuai dengan data pengaturan, maka nilai = 3 dan sistem akan
mengklasifikasi data parameter tersebut ideal. Proses data training akan
ditunjukkan pada gambar 3.2

Gambar 3.2 Proses Data Training


Pada tahap selanjutnya ditentukan nilai K = 3 (K dapat ditentukan sesuai
dengan tingkat akurasi paling tinggi). Kemudian, menghitung jarak antara data
testing dan data training. Pada tahapan ini, menghitung jarak data yang ingin
diklasifikasi dihitung dengan semua data training. Lalu diurutkan nilai jarak
atau me-ranking berdasarkan nilai K kedalam kelompok yang mempunyai
Euclid terkecil (mengurutkan hasil jarak dari terkecil ke terbesar). Selanjutnya,
mengumpulkan kategori klasifikasi (klasifikasi Nearest Neigbor) berdasarkan
nilai K atau ambil data tetangga terdekat setelah diurutkan sebelumnya, dan
tentukan nilai K yang paling baik. Langkah selanjutnya, penentuan klasifikasi,
akan diperoleh data yang paling mendekati dengan jarak tetangga yang paling
dekat.
Berikut ini, pada Tabel 3.3 merupakan data training yang akan diukur
jarak Euclidean-nya dengan data baru yaitu pada Tabel 3.4.

Universitas Sumatera Utara


23

Tabel 3.3 Contoh Data Training


Tinggi Kelembaban Kelembaban Intensitas
No. Waktu
Air Udara Udara Cahaya
4/1/2018
1 3 cm 50% 76% 100.314 lux
13:27:53
10/1/2018
2 5 cm 64% 64% 72.435 lux
15:26:37
10/1/2018
3 7 cm 56% 53% 69.123 lux
15:31:32
4/10/2018
4 9 cm 23% 52% 36.934 lux
9:20:54
8/14/2018
5 2 cm 66% 89% 20.846 lux
12:35:21

Tabel 3.4 Contoh Data Testing


Tingg Kelembaban Kelembaban Intensitas
No. Waktu
i Air Udara Udara Cahaya
15/03/2018
1 2 cm 22% 90% 11.195 lux
15:46
6/8/2018
2 4 cm 0% 39% 1.532 lux
16:04
4/10/2018
3 5 cm 70% 82% 211.585 lux
9:20

Adapun langkah-langkah yang dilakukan, ialah sebagai berikut:


1. Menentukan parameter k (jumlah tetangga paling dekat). Pada
perhitungan yang akan dilakukan, k yang digunakan adalah 3.
2. Menghitung kuadrat jarak Euclidean objek terhadap data training
yang diberikan. Perhitungan yang dilakukan antara kelima data
training pada tabel 3.3 dengan data baru yaitu data nomor 1 pada
tabel 3.4.

Perhitungan data training 1


𝑑𝑥𝑦 = √(0 − 2)2 + (56 − 22)2 + (53 − 90)2 + (69.123 − 211.195)2

= √(−2)2 + 342 + (−37)2 + (−142.072)2


= √4 + 1156 + 1369 + 20184.453184
= √22713.453184
= 150.7098

Universitas Sumatera Utara


24

Perhitungan data training 2


𝑑𝑥𝑦 = √(3 − 2)2 + (50 − 22)2 + (76 − 90)2 + (100.314 − 211.195)2

= √12 + 282 + (−14)2 + (−110.881)2


= √1 + 784 + 196 + 12294.596161
= √13275.596161
= 115.2197

Perhitungan data training 3


𝑑𝑥𝑦 = √(2 − 2)2 + (66 − 22)2 + (89 − 90)2 + (20.846 − 211.195)2

= √02 + 442 + (−1)2 + (−190.349)2


= √0 + 1936 + 1 + 35232.741801
= √38169.741801
= 195.3707

Perhitungan data training 4


𝑑𝑥𝑦 = √(5 − 2)2 + (64 − 22)2 + (64 − 90)2 + (72.435 − 211.195)2

= √32 + 422 + (−26)2 + (−138.76)2


= √9 + 1764 + 676 + 19254.3376
= √21703.3376
= 147.3205

Perhitungan data training 5


𝑑𝑥𝑦 = √(9 − 2)2 + (23 − 22)2 + (52 − 90)2 + (36.934 − 211.195)2

= √72 + 12 + (−38)2 + (−174.261)2


= √49 + 1 + 1444 + 30366.896121
= √31860.896121
= 178.4962

3. Mengurutkan hasil perhitungan jarak secara ascending (berurutan


dari nilai rendah ke tinggi) pada Tabel 3.5

Universitas Sumatera Utara


25

Tabel 3.5 Hasil Perhitungan Jarak


Nomor Data
Jarak Label
Training
2 115.2197 Ideal
4 147.3205 Ideal
1 150.7098 Tidak ideal
5 178.4962 Tidak ideal
3 195.3707 Ideal

4. Mengumpulkan kategori Y, klasifikasi nearest neighbor berdasarkan


nilai k dimana nilai k adalah 3. Sehingga nomor data training yang
jaraknya mendekati yaitu 2, 4, dan 1.
5. Dengan menggunakan kategori nearest neighbor yang paling
mayoritas maka dapat diprediksikan kategori objek. Nomor 2 dan 4
adalah kelas ideal dan nomor 1 adalah kelas tidak ideal, yang mana
kelas ideal lebih banyak dibandingkan kelas tidak ideal. Maka data
testing nomor 1 masuk kedalam kelas ideal.

Adapun pseudo code K-Nearest Neighbor ditunjukkan pada Gambar 3.3.

Gambar 3.3 Pseudocode K-Nearest Neighbor


3.2.4. Output
Dari dokumen yang diinput, Output dari perancangan sistem ini adalah
klasifikasi lahan sawah. Proses klasifikasi telah selesai apabila telah ditentukan
kategori dari data yang diinput.

Universitas Sumatera Utara


26

3.3. Alur Program

Gambar 3.4 Alur Program

3.4. Analisis Sistem

Sistem yang dibangun pada penelitian ini adalah sistem untuk menyelesaikan
permasalahan klasifikasi untuk menentukan kualitas lahan sawah. Selumnya, sistem
klasifikasi untuk menentukan kualitas lahan sawah sudah pernah dibuat dengan input,
output dan algoritma yang berbeda. Algoritma yang diajukan untuk melakukan
klasifikasi lahan sawah pada penelitian ini adalah algoritma K-Nearest Neighbor.
Algoritma K-Nearest Neighbor ini bertujuan untuk mendapatkan hasil yang tepat dan
akurat pada klasifikasi lahan sawah. Algoritma untuk mengklasifikasi lahan sawah pada

Universitas Sumatera Utara


27

penelitian ini terdiri dari tahapan-tahapan utama yaitu: input data berupa file berekstensi
.csv yang berisi data parameter lahan sawah yang masing-masing akan dipisahkan
menjadi data training dan data testing. Kemudian data training dan data testing akan
melalui tahapan pre-processing sebagai berikut: binning by boundaries, labelling dan
klasifikasi menggunakan K-Nearest Neighbor. Setelah tahapan tersebut dilakuka, maka
data testing akan diklasifikasi menggunakan algoritma K-Nearest Neighbor, dengan
output berupa hasil klasifikasi. Sistem akan mengklasifikasi kualitas lahan sawah ini
kedalam dua kategori, yaitu :
1. Ideal : Sistem akan mengklasifikasi lahan sawah apabila jumlah data
yang sesuai dengan parameter bernilai > 2.
2. Tidak ideal : Sistem akan mengklasifikasi lahan sawah apabila jumlah data
yang sesuai dengan parameter bernilai < 2.

3.5. Perancangan Antarmuka Sistem

3.5.1. Perancangan Menu Sistem


Menu ini menampilkan tampilan seperti halaman antarmuka. Pada halaman ini terdapat
lima menu yaitu Beranda, Data Training, Data Testing, Pengaturan dan Tentang. Pada
halaman ini, jika di-klik pada salah satu menu seperti pengaturan atau tentang, maka
secara otomatis akan langsung terarah ke halaman tujuan. Ilustrasi dari rancangan
halaman ini ditunjukkan pada Gambar 3.3.

Gambar 3.5 Perancangan Menu Sistem

Universitas Sumatera Utara


28

3.5.2. Tampilan Antarmuka Sistem


Struktur antarmuka yang akan dibuat pada sistem terdiri dari 5 menu yaitu menu
Beranda, menu Data Training, menu Data Testing, menu Pengaturan dan menu
Tentang. Pada menu Beranda akan ditampilkan judul tugas akhir yang telah
diselesaikan. Pada menu Pengaturan akan ditampilkan pengaturan nilai minimal dan
maksimal parameter yang ideal. Pada menu Tentang akan ditampilkan informasi
tentang pembuat program. Sedangkan pada menu Data Training dan Data Testing akan
ditampilkan form untuk memasukkan data yang akan dilatih dan diuji sehingga bisa
menghasilkan klasifikasi. Perancangan menu sistem dapat dilihat pada Gambar 3.4.

Gambar 3.6 Tampilan Antarmuka Sistem


Keterangan :
1. Bagian ini merupakan menu Beranda yang menampilkan penjelasan singkat
tentang sistem.
2. Bagian ini merupakan menu Data Training yang menampilkan data training
yang digunakan.
3. Bagian ini merupakan Data Testing yang merupakan data testing untuk melihat
hasil klasifikasi.
4. Bagian ini merupakan menu Pengaturan yang berfungsi untuk mengatur nilai
minimal dan maksimal parameter yang ideal.
5. Bagian ini merupakan menu Tentang yang berisi tentang pembuat sistem.
6. Bagian ini merupakan kolom untuk mengupload file data training atau data
testing.

Universitas Sumatera Utara


29

7. Bagian ini merupakan tombol untuk memilih file data yang akan diinput dan
diproses.
8. Bagian ini merupakan tabel untuk menampilkan hasil klasifikasi dan nilai jarak
terdekat.

3.6. Metode Evaluasi

Penelitian ini melakukan evaluasi dengan menggunakan metode confusion matrix.


Confusion matrix adalah alat yang berguna untuk menganalisis seberapa baik classifier
mengenali tuple dari kelas yang berbeda (Han & Kamber, 2011). Nilai dari True-Positive
dan True-Negative memberikan informasi ketika classifier melakukan klasifikasi data
bernilai benar, sedangkan False-Positive dan False-Negative memberikan informasi ketika
classifier salah dalam melakukan klasifikasi data (Fibrianda & Bhawiyuga, 2018) . Tabel
confusion matrix ditunjukkan pada Tabel 3.6.
Tabel 3.6 Confusion Matrix
No. Variable Jumlah
1 True Positive (TP) 45
2 True Negative (FN) 3
3 False Positive (FP) 1
4 True Negative (TN) 11
Total 60

Dari Tabel 3.3 dapat dihitung nilai akurasi, recall, precesion, dan F-measure yang secara
berurutan menggunakan 3.1, 3.2, 3.3 dan 3.4 sebagai berikut :

TP 44 44
Recall = = = = 0.95
TP + FN 44 +2 46
TP 44 44
Precision = = = = 0.95
TP + FP 44 + 2 46
2 x (Precision x Recall) 2 x ( 0.95 x 0.95 ) 1.805
F-Measure = = = = 0.95
Precion + Recall 0.95 + 0.95 1.9
TP + TN 44 + 12 56
Akurasi = = = = 0.93
TP + TN + FP + FN 44 + 12 + 2 + 2 60

Universitas Sumatera Utara


BAB 4
IMPLEMENTASI DAN PENGUJIAN SISTEM

Pada bab ini akan dijelaskan tentang proses pengimplementasian algoritma K – Nearest
Neighbor untuk mengklasifikasi surat laporan kehilangan pada sistem, sesuai perancangan
sistem yang telah dilakukan di Bab 3 serta melakukan pengujian sistem yang telah
dibangun.

4.1. Implementasi Sistem

Dalam tahap implementasi sistem, perancangan sistem yang telah dilakukan di Bab 3 yaitu
mulai dari pre-processing, proses, serta algoritma dan metode yang digunakan akan
diimplementasikan kedalam sistem dengan menggunakan bahasa pemrograman PHP.

4.1.1. Spesifikasi Perangkat Keras dan Perangkat Lunak yang Digunakan

Spesifikasi perangkat keras dan perangkat lunak yang digunakan untuk membangun sistem
ini adalah sebagai berikut:

1. Intel® Core™ i3-2310 CPU @ 2.10GHz 2.10 GHz

2. Memori RAM yang digunakan sebesar 2,00 GB DDR3

3. Kapasitas hardisk 500 GB HDD

4. Sistem operasi Windows 7 Ultimate 64-bit

Universitas Sumatera Utara


31

5. Software yang digunakan adalah Sublime Text 3

6. XAMPP Control Panel v3.2.1

4.1.2. Implementasi Perancangan Antarmuka

Implementasi perancangan antarmuka berdasarkan perancangan antarmuka system yang


telah dibahas pada Bab 3 adalah sebagai berikut.

a. Tampilan Halaman Beranda

Beranda adalah halaman yang pertama kali muncul ketika sistem dijalankan user.
Pada tampilan beranda ini terdapat penjelasan singkat dan logo dari sistem.
Tampilan halaman Beranda dapat dilihat pada Gambar 4.1.

Gambar 4.1 Tampilan Halaman Beranda

b. Tampilan Halaman Data Training

Halaman data training adalah halaman untuk menampilkan data training serta
klasifikasi dari tiap parameter lahan sawah. Pada halaman ini, terdapat menu Pilih
File yang berfungsi untuk menginput data. Data yang diproses dengan format
Command-separated Values (CSV). Setelah data selesai diproses, maka akan
beralih ke halaman hasil yang akan menampilkan hasil klasifikasi lahan sawah. Jika
data yang dimasukkan tidak dalam format CSV, maka ketika diproses, halaman

Universitas Sumatera Utara


32

akan menunjukkan error. Hasil perancangan antarmuka halaman data training


ditunjukkan pada Gambar 4.2.

Gambar 4.2 Tampilan Halaman Data Training

c. Tampilan Halaman Data Testing

Halaman data testing adalah halaman untuk menampilkan data testing serta
klasifikasi dari tiap parameter lahan sawah setelah dilakukan proses data training.
Sama halnya dengan data training, pada halaman ini, terdapat menu Pilih File yang
berfungsi untuk menginput data. Data yang diproses juga dengan format Command-
separated Values (CSV). Setelah data selesai diproses, maka akan terlihat hasil
klasifikasi lahan sawah yang hasilnya mengacu pada data training yang telah
diproses. Hasil klasifikasi yang diproses merupakan hasil yang dikelompokkan
sesuai dengan kelas berdasarkan jarak terdekat pada data training. Hasil
perancangan antarmuka halaman data testing ditunjukkan pada Gambar 4.3.

Gambar 4.3 Tampilan Halaman Data Testing

d. Tampilan Halaman Pengaturan

Halaman pengaturan adalah halaman yang dibuat untuk mengatur berapa nilai
minimal dan dan maksimal parameter tinggi air, kelembaban udara, kelembaban
tanah dan intensitas cahaya. User bisa mengatur berapa nilai minimal dan maksimal
parameternya sesuai dengan ketentuan dan berdasarkan penelitian yang sudah ada.

Universitas Sumatera Utara


33

Setelah selesai mengatur nilai parameter minimal dan maksimal maka user
kemudian memproses ke halaman data training. Hasil perancangan antarmuka
halaman Pengaturan ditunjukkan pada Gambar 4.4.

Gambar 4.4 Tampilan Halaman Pengaturan


e. Tampilan Halaman Tentang
Halaman Tentang adalah halaman yang berisi informasi tentang pembuat sistem.
Tampilan halaman Tentang dapat dilihat pada Gambar 4.5.

Gambar 4.5 Tampilan Halaman Tentang

Universitas Sumatera Utara


34

4.1.3. Prosedur Operasional


Tampilan yang pertama kali muncul pada sistem klasifikasi lahan sawah ini adalah Beranda
(Gambar 4.1). Sebelum memulai proses data training dan data testing, user terlebih dahulu
mengatur berapa nilai minimal dan maksimal parameter yang ideal pada menu Pengaturan.
Setelah nilai parameter ideal nya diatur user kemudian menuju ke menu Data Training.
Pada menu Data Training (Gambar 4.2), user memilih file data training yang ingin
diproses dalam format CSV. Setelah data training berhasil diproses, kemudian user
memilih menu Data Testing (Gambar 4.3) dan kemudian memasukkan file yang ingin
diproses. Prosedur operational yang dilakukan user adalah sebagai berikut.

1. Saat sistem pertama kali dijalankan akan menampilkan menu Sign in. Tujuannya
adalah supaya sistem dan data lebih aman. Tampilan halaman sign in seperti pada
Gambar 4.6.

Gambar 4.6 Halaman Sign in

2. Atur nilai minimal dan maksimal parameter ideal untuk kesuburan lahan sawah
pada menu Pengaturan seperti yang ditunjukkan pada Gambar 4.7.

Universitas Sumatera Utara


35

Gambar 4.7 Mengatur Nilai Parameter


3. Pada menu Data Training, pilih data yang ingin diproses. Setelah file diinput, maka
akan terlihat nama file yang diinput tersebut seperti pada Gambar 4.8.

Gambar 4.8 Tampilan Memilih Data Training

4. Proses training akan berlangsung secara otomatis setelah user menekan tombol
Open. Hasil training akan terlihat setelah proses selesai. Proses ini bertujuan untuk
melakukan preprocessing data dan memproses data yang ada didalam database
seperti yang ditunjukkan pada Gambar 4.9.

Universitas Sumatera Utara


36

Gambar 4.9 Tampilan Data Training

5. Pilih menu Data Testing untuk melakukan klasifikasi. Sebelum melakukan


klasifikasi pada data testing, terlebih dahulu user harus menjalakan data training,
jika tidak, hasil dari data testing akan menampilkan hasil yang tidak akurat. Input
file dengan mengklik tombol Pilih File seperti yang ditunjukkan pada Gambar 4.10.

Gambar 4.10 Tampilan Memilih Data Testing

6. Pada menu data testing, proses klasifikasi akan memakan waktu yang sedikit lama
meskipun jumlah data testing hanya sedikit. Hal ini dikarenakan data testing
melakukan klasifikasi yang mengacu pada data training yang berjumlah lebih
banyak. Setelah data testing berhasil diklasifikasi, sistem akan menampilkan hasil

Universitas Sumatera Utara


37

klasifikasi sebanyak jumlah data yang ada pada data testing dan sestem
menampilkan nilai jarak Euclidian seperti pada gambar 4.11.

Gambar 4.11 Tampilan Data Testing

4.2. Pengujian Sistem

Apabila sistem sudah selesai dibangun, langkah selanjutnya yang akan dilakukan adalah
pengujian sistem. Pengujian sistem ini bertujuan untuk mengetahui apakah sistem
berfungsi dengan baik serta mengukur berapa tingkat akurasi algoritma K-Nearest
Neighbor yang diimplementasikan pada sistem klasifikasi lahan sawah ini.

Untuk menghitung akurasi sistem dalam melakukan klasifikasi dilakukan dengan


menghitung rata-rata akurasi dari setiap pengujian. Tahap pengujian sistem akan dilakukan
sebanyak 5 kali dengan nilai K yang berbeda-beda seperti yang ditunjukkan pada tabel 4.1.

Tabel 4.1. Tabel Proses Pengujian

No. Nilai K Jumlah Data Training Jumlah Data Testing


1 1 200 60
2 3 200 60
3 5 200 60
4 7 200 60
5 9 200 60

Universitas Sumatera Utara


38

4.2.1. Pengujian 1

Pengujian ini menggunakan data testing berjumlah 60 data dan menggunakan nilai k = 1.
Hasil pengujian sistem dapat dilihat pada confusion matrix pada Tabel 4.2.

Tabel 4.2 Hasil dari Confusion Matrix pada Pengujian 1

No. Variable Jumlah


1 True Positive (TP) 44
2 False Negative (FN) 1
3 False Positive (FP) 2
4 True Negative (TN) 13
Total 60

Berdasarkan hasil dari confusion matrix dapat dihitung perhitungan akurasi, recall,
precision, dan F-measure, sebagai berikut:

TP 44 44 = 0.97 x 100% = 97,77%


Recall = = =
TP + FN 44 + 1 45
TP 44 44
Precision = = = = 0.95 x 100 = 95,65%
TP + FP 44 + 2 46
2 x (Precision x Recall) 2 x ( 0.95 x 0.97 )
F-Measure = = = 0.95 x 100% = 95,98%
Precion + Recall 0.95 + 0.97
TP + TN 44 + 13
Akurasi = = = 57 = 0,95 x 100 = 95%
TP + TN + FP + FN 44 + 13 + 2 + 1 60

4.2.2. Pengujian 2

Pengujian ini menggunakan 200 data training dan data testing berjumlah 60 data dan
menggunakan nilai k = 3. Hasil pengujian sistem dapat dilihat pada confusion matrix pada
Tabel 4.3.

Universitas Sumatera Utara


39

Tabel 4.3 Hasil dari Confusion Matrix pada Pengujian 2

No. Variable Jumlah


1 True Positive (TP) 44
2 False Negative (FN) 2
3 False Positive (FP) 2
4 True Negative (TN) 12
Total 60

Berdasarkan hasil dari confusion matrix dapat dihitung perhitungan akurasi, recall,
precision, dan F-measure, sebagai berikut:

TP 44 44 = 0.95 x 100% = 95,65%


Recall = = =
TP + FN 44 + 2 46
TP 44 44
Precision = = = = 0.95 x 100 = 95,65%
TP + FP 44 + 2 46
2 x (Precision x Recall) 2 x ( 0.95 x 0.95 )
F-Measure = = = 0.95 x 100% = 95%
Precion + Recall 0.95 + 0.95
TP + TN 44 + 12
Akurasi = = = 56 = 0,93 x 100 = 93,33%
TP + TN + FP + FN 44 + 12 + 2 + 2 60

4.2.3. Pengujian 3

Pengujian ini menggunakan 200 data training dan data testing berjumlah 60 data dan
menggunakan nilai k = 5. Hasil pengujian sistem dapat dilihat pada confusion matrix pada
Tabel 4.4.

Tabel 4.4 Hasil dari Confusion Matrix pada Pengujian 3

No. Variable Jumlah


1 True Positive (TP) 46
2 False Negative (FN) 6
3 False Positive (FP) 0

Universitas Sumatera Utara


40

4 True Negative (TN) 8


Total 60

Berdasarkan hasil dari confusion matrix dapat dihitung perhitungan akurasi, recall,
precision, dan F-measure, sebagai berikut:

TP 46 46 = 0.88 x 100% = 88,46%


Recall = = =
TP + FN 46 + 6 52
TP 46 46
Precision = = = = 1 x 100 = 100%
TP + FP 46 + 0 46
2 x (Precision x Recall) 2 x ( 1 x 0.88 )
F-Measure = = = 0.93 x 100% = 93,61%
Precion + Recall 1 + 0.88
TP + TN 46 + 8
Akurasi = = = 54 = 0,9 x 100 = 90%
TP + TN + FP + FN 46 + 8 + 0 + 6 60

4.2.4. Pengujian 4

Pengujian ini menggunakan 200 data training dan data testing berjumlah 60 data dan
menggunakan nilai k = 7. Hasil pengujian sistem dapat dilihat pada confusion matrix pada
Tabel 4.5.

Tabel 4.5 Hasil dari Confusion Matrix pada Pengujian 4

No. Variable Jumlah


1 True Positive (TP) 46
2 False Negative (FN) 7
3 False Positive (FP) 0
4 True Negative (TN) 7
Total 60

Berdasarkan hasil dari confusion matrix dapat dihitung perhitungan akurasi, recall,
precision, dan F-measure, sebagai berikut:

Universitas Sumatera Utara


41

TP 46 46 = 0.86 x 100% = 86,79%


Recall = = =
TP + FN 46 + 7 53
TP 46 46
Precision = = = = 1 x 100 = 100%
TP + FP 46 + 0 46
2 x (Precision x Recall) 2 x ( 1 x 0.86 )
F-Measure = = = 0.92 x 100% = 92,47%
Precion + Recall 1 + 0.86
TP + TN 46 + 7
Akurasi = = = 53 = 0,88 x 100 = 88,33%
TP + TN + FP + FN 46 + 7 + 0 + 7 60

4.2.5. Pengujian 5

Pengujian ini menggunakan 200 data training dan data testing berjumlah 60 data dan
menggunakan nilai k = 9. Hasil pengujian sistem dapat dilihat pada confusion matrix pada
Tabel 4.6.
Tabel 4.6 Hasil dari Confusion Matrix pada Pengujian 5
No. Variable Jumlah
1 True Positive (TP) 46
2 False Negative (FN) 8
3 False Positive (FP) 0
4 True Negative (TN) 6
Total 60

Berdasarkan hasil dari confusion matrix dapat dihitung perhitungan akurasi, recall,
precision, dan F-measure, sebagai berikut:

TP 46 46 = 0.85 x 100% = 85,18%


Recall = = =
TP + FN 46 + 8 54
TP 46 46
Precision = = = = 1 x 100 = 100%
TP + FP 46 + 0 46
2 x (Precision x Recall) 2 x ( 1 x 0.85 )
F-Measure = = = 0.91 x 100% = 91,89%
Precion + Recall 1 + 0.85
TP + TN
Akurasi = = 46 + 6
= 52 = 0,86 x 100 = 86,66%
TP + TN + FP + FN 46 + 6 + 0+ 8 60

Universitas Sumatera Utara


42

4.3. Hasil Pengujian Sistem

Hasil pengujian sistem dilakukan sebanyak 5 kali dengan nilai k yang berbeda-beda dan dengan
data yang sama untuk mencari rata-rata nilai akurasi dari pengujian dengan menggunakan data
yang digunakan dalam penelitian. Selain untuk mencari rata-rata 5 pengujian untuk mencari
nilai k yang mempunyai nilai akurasi paling tinggi, dapat dilihat pada tabel 4.7.

Tabel 4.7 Hasil Pengujian Sistem


Nilai Akurasi Recall Precision F-Measure
TP FN FP TN
K (%) (%) (%) (%)

1 44 1 2 13 95 97,77 95,65 95,98


3 44 2 2 12 93,33 95,65 95,65 95
5 46 6 0 8 90 88,46 100 93,61
7 46 7 0 7 88,33 86,79 100 92,47
9 46 8 0 6 86,66 85,18 100 91,89

Rata - rata 90,66 90,77 98,26 93,79

Gambar 4.12 Grafik Hasil Evaluasi

Universitas Sumatera Utara


43

Pada hasil klasifikasi terdapat beberapa kegagalan yang ditunjukkan pada gambar 4.13.

Gambar 4.13 Kegagalan Klasifikasi


Kegagalan klasifikasi disebabkan data testing tergantung kepada jarak terdekat data
training dan jumlah anggota kelas terbanyak dalam database. Dalam database data training
yang memiliki total 200 data, kelas terbanyak adalah lahan sawah ideal berjumlah 126,
sementara lahan sawah tidak ideal hanya berjumlah 74. Sehingga, klasifikasi data testing
tersebut sangat ditentukan pada kedekatan jarak serta jumlah anggota kelas terbanyak data
training.

Universitas Sumatera Utara


BAB 5
KESIMPULAN DAN SARAN

Bab ini membahas tentang kesimpulan yang diperoleh dari implementasi algoritma
K - Nearest Neighbor untuk mengklasifikasi kualitas lahan sawah dan saran - saran yang
dapat digunakan sebagai referensi untuk pengembangan penelitian selanjutnya.

5.1. Kesimpulan
Dari hasil pengujian sistem pada Bab 4, diperoleh kesimpulan sebagai berikut.
1. Algoritma K-Nearest Neighbor mampu melakukan klasifikasi lahan sawah
menggunakan nilai k = 3 dengan hasil pengujian nilai akurasi sebesar 93,33%.
Jumlah data training dan data testing yang digunakan mempengaruhi nilai
akurasi pengujian, semakin banyak data yang digunakan akan semakin akurat
hasilnya.
2. Dari lima pengujian dengan nilai k yang berbeda dan data training yang sama,
menghasilkan akurasi tertinggi dari pengujian pada data testing dengan nilai
k = 1 sebesar 95% dan hasil terendah yaitu nilai k = 9 dengan nilai 86,66%.

5.2. Saran
Saran yang dapat diberikan penulis untuk pengembangan penelitian selanjutnya yaitu:
1. Algoritma K - Nearest Neighbor dapat digabungkan dengan algoritma
klasifikasi yang lain untuk meningkatkan hasil akurasi dan mempermudah
proses klasifikasi agar lebih bekerja dengan maksimal.
2. Sistem klasifikasi kualitas lahan sawah ini dapat dikembangkan pada aplikasi
mobile.
3. Penelitian selanjutnya diharapkan dapat menambah parameter yang berbeda
sebagai data training dan data testing.
4. Jumlah data training dan data testing ditambah untuk menambah kemampuan
sistem dalam mengklasifikasi lahan sawah.

Universitas Sumatera Utara


DAFTAR PUSTAKA

Ardiansyah, Subiyanto, S., Sukmono, A. 2015. identifikasi lahan sawah menggunakan ndvi
dan pca pada citra LANDSAT 8. Jurnal Geodesi Undip.
Arif, C., Setiawan, B.I., & Mizoguchi, M. 2014. Penentuan kelembaban tanah optimum
untuk budidaya padi sawah sri (system of rice intensification) menggunakan
algoritma k-nearest neighbor. Institut Pertanian Bogor: Indonesia.
Arnomo, R.A., Saptomo, W.L.Y., & Harsadi, P. 2018. Implementasi k-nearest neighbor
untuk identifikasi kualitas air (studi kasus: PDAM kota Surakarta). STMIK Sinar
Nusantara.
Banjarsari, M.A., Budiman, H.I., & Farmadi, A. 2015. Penerapan k-optimal pada algoritma
knn untuk prediksi kelulusan tepat waktu mahasiswa program studi ilmu komputer
fmipa unlam berdasarkan ip sampai dengan semester 4. Kumpulan Jurnal Ilmu
Komputer: 50-64.
Chen, Q.H., Liu, Z.Y., & Wang, B. 2013. Investigation on hydrological function of paddy
field in four-lake region. Third International Conference on Intelligent System
Design and Engineering Applications.
Deviyanti, S., Sari, B.N., & Saraswati, V. 2017. K-nearest neighbor dengan correlation
atribute eval untuk memprediksi luas lahan panen tanaman padi di karawang.
Uversitas Singaperbangsa: Karawang.
Dirgahayu, D. 2015. Identifikasi parameter pertumbuhan tanaman padi menggunakan data
evi modis multitemporal (studi kasus di Sulawesi Selatan). Prosiding Pertemuan
Ilmiah Tahunan.
Domin, D.D., Effendy, I., & Adhyani, N.L. 2005. Deteksi kondisi kekeringan lahan
menggunakan data water vapor NIR modis. Institut Pertanian Bogor.
Gunawan, A., Jaya, I.N.S., & Saleh, M.B. 2010. Teknik cepat identifikasi lahan terbuka
melalui citra multi temporal dan multi spasial. Institut Pertanian Bogor.

Universitas Sumatera Utara


46

Halela, I.A., Nurhadiyono, B., Rahmanti, F.Z. 2018. Identifikasi jenis buah apel
menggunakan algoritma k-nearest neighbor (KNN) dengan ekstraksi fitur
histogram. Universitas Dian Nuswantoro.
Helmi. 2015. Peningkatan produktivitas padi lahan rawa lebak melalui penggunaan varietas
unggul padi rawa. Balai Pengkajian Teknologi Pertanian Sumatera Utara.
Imanda, A.C., Hidayat, N., & Furqon, M.T. 2018. Klasifikasi kelompok varietas unggul
padi menggunakan modified k-nearest neighbor. Jurnal Pengembangan Teknologi
Informasi dan Ilmu Komputer.
Indrayanti, Sugianti, D., & Karomi, M.A.A. 2017. Optimasi parameter k pada algoritma k-
nearest neighbor untuk klasifikasi penyakit diabetes mellitus. STMIK Widya
Pratama Pekalongan.
Kim, H.G., Kim, S.C., Hong, Y.K., Han, K.S., & Lee, S.G. 2012. A robot platform for
unmanned weeding in a paddy field using sensor fusion. IEEE International
Conference on Automation Science and Engineering.
Krisandi, N., Helmi, Prihandono, B. 2013. Algoritma k-nearest neighbor dalam klasifikasi
data hasil produksi kelapa sawit pada PT. minamas kecamatan Parindu. Buletin
Ilmiah Math. Stat dan Terapannya (Bimaster).
Leidiyana, H. 2013. Penerapan Algoritma K-Nearest Neighbor Untuk Penentuan Resiko
Kredit Kepemilikan Kendaraan Bemotor. Jurnal Penelitian Ilmu Komputer,
System Embedded & Logic: 66-76.
Lestari, U. 2012. Sistem aplikasi identifikasi lahan untuk budidaya tanaman pangan
menggunakan learning vector quantization (LVQ). Prosiding Seminar Nasional
Aplikasi Sains & Teknologi (SNAST) Periode III.
Lubis, N.M.A., & Razali, Z.N. 2017. Klasifikasi tanah lahan sawah terasering di desa huta
hotang kecamatan onan runggu berdasarkan toposekuen. Jurnal Agroekoteknologi
Fakultas Pertanian Universitas Sumatera Utara.
Lukitasari, M. 2012. Pengaruh intensitas cahaya matahari terhadap pertumbuhan tanaman
kedelai (glycine max). IKIP PGRI Madiun.
Nidomudin, A., Nugroho, A.P., Cholis, M.N. 2017. Sistem pakar deteksi tingkat kesuburan
tanah menggunakan fuzzy logic. Journal of Information Technology and Computer
Science (JOINTECS).

Universitas Sumatera Utara


47

Nulina. 2011. Identifikasi dan pemetaan lahan sawah dengan citra satelit resolusi tinggi dan
tracking GPS. Jurnal Fisika FLUX.
Nurfaijah, Setiawan, B.I., Arif, C., & Widodo, S. 2015. Sistem kontrol tinggi muka air
untuk budidaya padi. Institut Pertanian Bogor.
Ma, D., Tang, Y., Duan, J., Yi, C., Cheng, X., Wang, X., & Di, R. 2013. Experimental
study of paddy field used for farming and aquiculture. Third International
Conference on Intelligent System Design and Engineering Applications.
Michael, M., Rahmadi, A., Aji, H., & Gazi, M. 2018. Survei pengaruh ketinggian genangan
air pada tanaman padi di daerah Bandung Timur. Institut Pertanian Bogor.
Mustakim, Oktaviani, G.F. 2016. Algoritma k-nearest neighbor classification sebagai
sistem prediksi predikat prestasi mahasiswa. Jurnal Sains Teknologi dan Industri.
Putra, E. H., Susantok, M., & Aini, Q. 2015. Sistem pemantauan kondisi tanah sawah padi
berbasis wireless sensor network. Seminar Nasional Teknologi Informasi,
Komunikasi dan Industri.
Rahman, F., Sukmono, A., & Yuwono, B.D. 2017. Analisis kekeringan pada lahan
pertanian menggunakan metode NDDI dan perka BNPB nomor 02 tahun 2012
(studi kasus : kabupaten Kendal tahun 2015). Jurnal Geodesi Undip.
Razali, I.A., & Hanum, H. 2017. Identifikasi status hara dan produksi padi pada lahan
sawah terasering dan non terasering di kecamatan Onan Runggu kabupaten
Samosir. Jurnal Argoekoteknologi Fakultas Pertanian Universitas Sumatera
Utara.
Rivki, M., & Bachtiar, M.A. 2017. Implementasi algoritma k-nearest neighbor dalam
pengklasifikasian follower twitter yang menggunakan bahasa indonesia. Journal
of Information System.
Shudiq, W.J. 2017. Penerapan k-nearest neighbor berbasis algoritma genetika untuk
klasifikasi mutu padi organik. Sekolah Tinggi Teknologi Nurul Jadid.
Sibarani, W. 2015. Implementasi algoritma k-nearest neighbor untuk mengklasifikasikan
motif batik besurek Bengkulu. Skripsi. Universitas Sumatera Utara.
Soplanit, R., & Nukuhaly, S.H. 2012. Pengaruh pengolahan hara NPK terhadap
ketersediaan n dan hasil tanaman padi sawah (oryza satuva L.) di desa Waelo

Universitas Sumatera Utara


48

kecamatan Waepo kabupaten Buru. Program Studi Agroekoteknologi Fakultas


Pertanian Unpatti.
Suarjana, I.W., Supadma, A.A.N., & Arthagama, I.D.M. 2015. Kajian status kesuburan
tanah saah untuk menentukan anjuran pemukukan berimbang spesifik lokasi
tanamana padi di kecamatan manggis. E-Jurnal Agroekoteknologi Tropika.
Sudarmono. 2011. Klasifikasi kemampuan kesuburan tanah pada lahan sawah di kecamatan
panti dan kecamatan sukorambi kabupaten jember. Skripsi. Universitas Jember.
Syam, S. 2017. Prototipe alat ukur dan rekam kadar hara tanah sawah menggunakan sensor
warna. STMIK Handayani: Makassar.
Utami, D.N. 2017. Pengaruh intensitas cahaya terhadap pertumbuhan dan hasil beberapa
varietas padi (oryza sativa l.). Electronic thesis and Dissertation Unsyiah.
Widyantari, D.A.G., Susila, K.D., & Kusmawati, T. 2015. Evaluasi status kesuburan tanah
untuk lahan pertanian di kecamatan Denpasar Timur. E-Jurnal Agroekoteknologi
Tropika.
Wijayanto, N., & Nurunnajah. 2012. Intensitas cahaya, suhu, kelembaban dan perakaran
lateral mahoni (swietenia macrophylla king.) di RPH Babakan Madang, BKPH
Bogor, KPH Bogor. Jurnal Silvikultur Tropika.
Yudhistra, D.D., Ramadhan, M.D., Augusta, N., & Agustini, S. 2016. Pengukuran
kelembaban tanah menggunakan sensor kelembaban SEN0057 pada jenis tanah
jenuh, normal, dan kering. Institut Pertanian Bogor.

Universitas Sumatera Utara


Universitas Sumatera Utara
Universitas Sumatera Utara

Anda mungkin juga menyukai