Anda di halaman 1dari 11

BAB III

METODE PENELITIAN

3.1 Lokasi dan Waktu Penelitian


3.1.1 Lokasi Penelitian
Lokasi penelitian ini akan dilaksanakan di kantor Badan Pusat Statistik
kabupaten Timor Tengah Utara.

3.1.2 Waktu Penelitian


Waktu yang digunakan peneliti untuk penelitian ini dilaksanakan sejak
tanggal dikeluarkannya ijin penelitian dalam kurun waktu kurang lebih 2(dua)
bulan, 1 bulan pengumpulan data 1 bulan pengolahan data yang meliputi
penyajian dalam bentuk skripsi dan proses bimbingan berlangsung

3.2 Bahan dan Alat Penelitian


3.2.1 Perangkat Keras diantaranya :
Hardware yang digunakan dalam penelitian ini adalah laptop ACER
ASPIRE 3 dengan prosesor Intel Celeron N4000, RAM 4 GB, HDD 1 TB.

3.2.2Perangkat Lunak diantaranya :


Software yang digunakan dalam penelitian ini adalah Sistem Operasi
Windows 10 Pro 64bit, Microsoft Excel 2019 dan MATLAB R2017b.

3.3 Prosedur Penelitian

Gambar 3.1 Diagram alur penelitian


3.3.1 Penentuan Objek
Tahap awal yang dilakukan adalah penentuan objek yang digunakan
sebagai bahan penelitian klasifikasi Usaha Mikro Kecil Menengah (UMKM)
yang terdiri dari 3 klasifikasi yaitu usaha mikro,usaha kecil dan usaha
menengah.

3.3.2 Studi Literatur


Pada tahap berikut dilakukan pembelajaran literatur dari berbagai
bidang-bidang ilmu yang berhubungan dengan pengklasifikasian UMKM
berdasarkan kriteria, antara lain :
1. Algoritma K-Nearest Neighbor.
2. Kriteria-kriteria yang ada pada Usaha Mikro Kecil Menengah
(UMKM).
3. Klasifikasi Usaha Mikro Kecil Menengah (UMKM) menggunakan
algoritma K-Nearest Neighbor.

3.3.3 Pengumpulan Data


Pengumpulan data yang digunakan pada penelitian ini melalui
observasi, studi literatur dan wawancara. Variabel penelitian yang digunakan
adalah kriteria-kriteria dalam usaha mikro kecil menengah berdasarkan hasil
perhitungan menggunakan metode K-Nearest Neighbor. Penentuan kebutuhan
data penelitian adalah sebagai berikut :
1. Sampel data yang diambil yaitu 60 data.
2. Data UMKM bersumber dari Badan Pusat Statistik Kabupaten
Timor Tengah Utara dari tahun 2019-2021.

Tabel 3.1 Penentuan Kebutuhan Data Penelitian

N0. Kebutuhan Data Sumber Data Metode


Kegunaan Data
1. Data kriteria UMKM dan Studi Literatur Observasi
Menentukan kriteria
penggunaan metode K- untuk klasifikasi
nearest Neighbor UMKM
2. Identitas tiap atribut Wawancara Wawancara Menentukan nilai
UMKM identitas tiap atribut
UMKM
3. Data Usaha Mikro Kecil Kantor Badan Observasi Data yang didapat akan
Menengah Pusat Statistik digunakan sebagai data
Kabupaten Timor latih,
Tengah Utara
3.3.4 Perancangan Sistem
Sistem yang akan dibuat merupakan sistem yang mengimplementasikan
metode K-Nearest Neighbor untuk mengklasifikasi usaha mikro kecil
menengah. Sistem ini ditujukan untuk mengetahui kemampuan algoritma K-
Nearest Neighbor untuk memprediksi nilai akurasi yang dihasilkan dalam
menentukan klasifikasinya.

Gambar 3.2 Diagram Alur Perancangan Sistem

Perancangan sistem merupakan tahapan-tahapan dari sistem untuk


membuat rancangan penelitian dari awal sampai akhir. Sistem pada tahap
pertama akan membaca data, kemudian data akan masuk ke dalam tahap
preprocessing. Tahap seleksi data dilakukan untuk mencari atribut yang
digunakan. Tahap pembersihan data dilakukan untuk membersihkan noise,
data tidak konsisten dan missing value. Tahap penanganan outlier dilakukan
untuk menghilangkan data outlier. Selanjutnya akan melalui tahap
penyeimbangan data untuk mempertimbangkan keseimbangan kelas pada
masing-masing model. Selanjutnya akan melalui tahap transformasi data
untuk mengubah nilai data pada tiap atribut dengan melakukan normalisasi.
Tahap klasifikasi KNN, data dikelompokkan menjadi data latih dan data uji
menggunakan 3-fold cross validation dan 5-fold cross validation. Label latih
dan label uji digunakan sebagai target luaran data klasifikasi. Data latih
digunakan sebagai model dan akan dibandingkan dengan data uji untuk
menghasilkan akurasi.
3.3.4.1 Input data
Inputan data yang digunakan yaitu 60 data Usaha Mikro Kecil
Menengah dari tahun 2019-2021 di Kabupaten Timor Tengah Utara. Seluruh
data berjumlah 12 atribut dan 1 label, atribut tersebut antara lain adalah No,
Kecamatan, Kelurahan, Nama Perusahaan, Nama Pemilik, Alamat,
Telepon/HP, Jenis Usaha, Jumlah Karyawan, Aset, Omset, Tahun Berdiri dan
Kriteria sebagai label. Label dari UMKM ada tiga yakni mikro yang
menandakan usaha mikro, kecil yang menandakan usaha kecil, dan menengah
yang menandakan usaha menengah. Penjelasan mengenai masing-masing
atribut dapat dilihat pada tabel di bawah ini.

Tabel 3.2 Penjelasan Atribut UMKM

No. Atribut Keterangan


1 No. Nomor urut data UMKM
2 Kecamatan Nama kecamatan di mana UMKM berlokasi
3 Kelurahan Nama kelurahan di mana UMKM berlokasi
4 Nama Perusahaan Nama instansi dari UMKM
5 Nama Pemilik Nama pemilik dari UMKM
6 Alamat Alamat di mana UMKM berdomisili
7 Telepon/HP Nomor telepon pemilik UMKM
8 Jenis Usaha Fokus bidang UMKM
9 Jumlah Karyawan Total tenaga kerja UMKM (3/5/15/dll)
10 Aset Total kekayaan bersih perusahaan
(300000000/dll)
11 Omset Total penjualan tahunan perusahaan
(300000000/dll)
12 Tahun Berdiri Tahun awal UMKM berdiri (2003/2009/dll)
13 Kriteria Kategori UMKM (Mikro/Kecil/Menengah)

3.3.4.2 Seleksi data


Proses seleksi data merupakan proses memilih atribut yang
relevan dengan penelitian. Pada tahap ini, akan dilakukan analisis korelasi
untuk analisis atribut. Atribut data akan dicek apakah relevan dilakukan
penambangan data, atribut yang tidak relevan tidak akan digunakan.

3.3.4.3 Pembersihan data


Proses pembersihan data bertujuan untuk menghilangkan noise,
data yang tidak konsisten dan missing value. Untuk mengatasi missing
value, penulis melakukan 2 variasi pembersihan data yaitu dengan
melakukan imputasi K-Nearest Neighbor (KNN) dan data cleaning.
Penggunaan 2 variasi pembersihan data dalam penelitian ini bertujuan
untuk membandingkan akurasi yang dihasilkan pada masing-masing
variasi data. Contoh data dengan missing value dapat dilihat pada tabel
berikut.
Tabel 3.3 Contoh Data Missing Value
Jumlah Aset Omset Tahun Kriteria
Karyawan Berdiri
2 - - 2009 -
3 - 100000000 2002 Mikro
2 50000000 80000000 2000 Mikro
5 75000000 300000000 1996 Kecil
8 40000000 800000000 1992 Mikro
2 35000000 1260000000 1956 Mikro

3.3.4.4 Penanganan Outlier


Proses penanganan outlier bertujuan untuk membuang outlier
yang terdapat pada data penelitian. Outlier di deteksi menggunakan
boxplot untuk menggambarkan secara grafik dari data numeris melalui
lima ukuran (minimum, kuartil pertama, median, kuartil ketiga, dan
maksimum).

3.3.4.5 Penyeimbangan data


Data yang digunakan dalam penelitian ini merupakan data yang
tidak seimbang maka dilakukan penyeimbangan data. Penyeimbangan
data dalam penelitian ini menggunakan salah satu metode oversampling
yaitu Synthetic Minority Oversampling Technique (SMOTE). SMOTE
merupakan teknik yang diajukan untuk mengatasi ketidakseimbangan
kelas pada suatu data. SMOTE adalah pendekatan baru dengan cara kerja
menggunakan pendekatan oversampling pada kelas minoritas dengan
membuat sampel sintesis (Chawla, 2002).
Pada penelitian ini proses penyeimbangan data menggunakan
tools SMOTE yang terdapat di aplikasi Weka. Pada penyeimbangan data
ini dilakukan pengacakan data untuk mempertimbangkan keseimbangan
kelas data pada masing-masing model. Pengacakan data dilakukan
menggunakan fungsi randperm. Fungsi randperm merupakan salah satu
fungsi pada MATLAB yang berguna untuk melakukan permutasi acak.
Penggunaan fungsi randperm ini digunakan untuk mengacak data setelah
melalui proses penyeimbangan data. Contoh penggunaan fungsi
randperm dapat dilihat pada gambar berikut.

Gambar 3.3 Fungsi randperm

Berdasarkan gambar di atas, fungsi randperm digunakan untuk


melakukan pengacakan pada setiap baris dari data num. Hasil dari
pengacakan data tersebut selanjutnya akan melalui tahap transformasi
data.

3.3.4.6 Tansformasi Data


Proses transformasi data merupakan proses pengubahan data
menjadi bentuk yang sesuai untuk ditambang. Transformasi data untuk tiap
atribut adalah sebagai berikut.
a. Atribut “Aset”
Transformasi dilakukan terhadap atribut Aset berdasarkan sesuai
dengan jangkauan yang ditetapkan oleh UU No. 20 Tahun 2008.

Tabel 3.4 Transformasi Atribut Aset

Nilai Aset Keterangan Transformasi numerik


0 – 50000000 Mikro 1
50000000 – Kecil 2
500000000
500000000 – Menengah 3
10000000000
b. Atribut “Omset”
Transformasi dilakukan terhadap Omset berdasarkan sesuai dengan
jangkauan yang ditetapkan oleh UU No. 20 Tahun 2008.

Tabel 3.5 Transformasi Atribut Omset

Nilai Omset Keterangan Transformasi numerik


0 – 300000000 Mikro 1
300000000 – Kecil 2
2500000000
2500000000 – Menengah 3
50000000000

c. Atribut “Tahun Berdiri”


Atribut Tahun Berdiri diubah menjadi Lama Berdiri dihitung sejak
tahun awal berdiri sampai tahun 2018 sesuai tahun pada data.

Tabel 3.6 Atribut Tahun Berdiri

Tahun Berdiri
2006
2008
2007
2009
2007

Tabel 3.7 Atribut Lama Berdiri

Lama Berdiri
12
10
11
9
11

Transformasi data dilakukan pada atribut Lama Berdiri dikarenakan


meskipun data sudah bertipe numerik namun penyebarannya masih
acak sehingga dilakukan transformasi dengan normalisasi Z-Score.
Contoh hasil normalisasi Z-Score pada atribut lama berdiri dapat
dilihat pada tabel berikut.

Tabel 3.8 Contoh Hasil Normalisasi Z-Score Lama Berdiri

Lama Berdiri
-0,73494
-0,93469
-0,83482
-1,03456
-0,83482

d. Atribut “Jumlah Karyawan”


Transformasi data dilakukan pada atribut Jumlah Karyawan
dikarenakan meskipun data sudah bertipe numerik namun
penyebarannya masih acak sehingga dilakukan transformasi dengan
normalisasi Z-Score. Contoh hasil normalisasi Z-Score pada atribut
jumlah karyawan dapat dilihat pada tabel berikut.

Tabel 3.9 Contoh Hasil Normalisasi Z-Score Jumlah Karyawan

Jumlah Karyawan
-0.33749
-0.78109
0.10610
-0.33749
-0.78109

3.3.4.7 Komposisi Data Latih dan Data Uji


Pada proses perhitungan akurasi data imputasi dan data cleaning
akan dikelompokkan menjadi 2 yaitu data latih dan data uji dengan
menggunakan 3- fold cross validation dan 5-fold cross validation. Ilustrasi
pembagian komposisi data dapat dilihat pada gambar berikut.

Gambar 3.4 Pembagian Komposisi Data 3-Fold Cross Validation

Gambar 3.5 Pembagian Komposisi Data 5-Fold Cross Validation


3.3.4.8 Membangun model K-Nearest Neighbor
Setelah melalui tahap preprocessing, data akan di klasifikasikan
menggunakan metode K-Nearest Neighbor. Flowchart K- Nearest
Neighbor dapat dilihat pada gambar berikut

Gambar 3.6 Flowchart Modified K-Nearest Neighbor

Flowchart Modified K-Nearest Neighbor dimulai dengan menentukan


nilai k. Selanjutnya menghitung jarak euclidean antar data latih. Berdasarkan
jarak antar data latih cari k tetangga terdekat. Selanjutnya melakukan
perhitungan nilai validitas berdasarkan jarak antar data latih. Langkah
selanjutnya adalah melakukan perhitungan jarak euclidean antara data latih
dan data uji. Hasil perhitungan jarak data latih dan data uji serta perhitungan
nilai validitas kemudian diproses untuk mendapatkan nilai bobot.
Selanjutnya mencari k tetangga terdekat dan label mayoritas untuk
mendapatkan hasil klasifikasi.

3.3.5 Pengujian
Evaluasi hasil klasifikasi dilakukan dengan menghitung akurasi hasil
klasifikasi berdasarkan confusion matrix. Confusion matrix merupakan alat
pengukuran yang dapat digunakan untuk menghitung kinerja atau tingkat
kebenaran proses klasifikasi.

Anda mungkin juga menyukai