Anda di halaman 1dari 8

Nama : Innatubil issa

NIM : 1915016080
Kelas : IF B 19

REVIEW JURNAL MENGENAI REDUKSI DATA MINING


A. OPTIMASI SELEKSI FITUR DENGAN TEKNIK REDUKSI DIMENSI PADA
KLASIFIKASI ABSTRAK JURNAL
Jurnal : Penelitian Enjiniring
Volume dan halaman : Vol 22, Halaman 44-48
Tahun : 2018
Penulis : Syukriyanto Latif, Indrabayu, Intan Sari Areni
Reviewer : Innatubil issa

Tujuan Penelitian : Untuk mengetahui nilai parameter reduksi dimensi pada seleksi fitur
sehingga dapat meningkatkan akurasi dan mengurangi waktu komputasi.
Metode Penelitian : Penelitian eksperimental yang menerapkan term weighting dan teknik
reduksi dimensi pada proses seleksi fitur juga algiritmaNB dalam
klasifikasinya.
Sampel data : Data konten abstrak didapat pada laman www.computer.org dan dibagi
menjadi 3 kategori, yaitu Data Mining (DM), Intelligent transport
System(ITS) dan Multimedia(MM). Data yang digunakan sebanyak 150
dengan ekkstensi PDF.
Hasil Penelitian : Penelitian ini melalui beberapa proses. Dimulai dari preprocessing yaitu
case folding untuk mengubah semua huruf dalam dokumen menjadi
lowercase, tokenizing untuk pemotongan string input pada tiap kata yang
menyusunnya, filtering untuk mengambil kata-kata penting dari hasil
token dengan algoritma stoplist atau wordlist, dan stemming untuk
mentransformasikan kata-kata yang terdapat dalam suatu dokumen ke root
word. Setelah melewati proses preprocessing akhirnya menghasilkan
6.640 term. Dari hasil pembobotan feature selection dengan term
weighting dan teknik reduksi dimensi menggunakan TF thresholding,
selanjutnya digunakan sebagai data latih dan data uji pada proses naïve
bayes dengan 100% data digunakan sebagai data testing dan data training
dengan 9 kali uji coba reduksi dimensi yang berbeda. Kemudian akhirnya
didapatkan hasil nilai akurasi terbaik adalah saat dilakukan reduksi
dimensi 30% dengan nilai akurasi mencapai 87.33% dengan waktu
komputasi 4 menit 12 detik.
Kesimpulan : 1. Tahapan klasifikasi abstrak jurnal menggunakan metode teknik
reduksi dimensi untuk ekstraksi fitur dan Naïve bayes pada proses
klasifikasi.
2. dari hasil penelitian terlihat bahwa teknik reduksi dimensi sebesar
30% dapat meningkatkan hasil akurasi NB dengan rata-rata 87.33%
dengan waktu komputasi 4 menit 12 detik.
B. OPTIMASI CLUSTER PADA ALGORITMA K-MEANS DENGAN REDUKSI DIMENSI
DATASET MENGGUNAKAN PRINCIPAL COMPONENT ANALYSIS UNTUK
PEMETAAN KINERJA DOSEN
Jurnal : ISSN : 2088-4591
Volume dan halaman : Vol 5, Halaman 41-46
Tahun : 2015
Penulis : Ahmad Izzuddin
Reviewer : Innatubil issa

Tujuan Penelitian : Untuk pemetaan dosen berdasarkan kinerja dalam melaksanakan proses
pendidikan dan pengajaran menggunakan metode PCA dan teknik
clustering K-means.
Metode Penelitian : Penelitian ini mengkombinasikan algoritma K-means dengan metode
PCA.
Sampel data : Data hasil evaluasi kinerja dosen Program Studi Teknik Elektro
Fakultas Teknik Universitas Panca Marga Probolinggo Tahun 2014/2015.
Hasil Penelitian : Penelitian ini melalui beberapa tahapan meliputi pengumpulan data dan
pemilihan atribut, tahap reduksi dimensi dataset, tahap clustering dan
pengujian performansi algoritma. Implementasi algoritma K-means dalam
penelitian ini menggunakan alat bantu rapidMiner. Dari hasil percobaan
yang dilakukan, algoritma K-means dengan PCA dapat menghasilkan
kualitas cluster yang lebih baik dibandingkan dengan K-means tradisional.
Akhirnya hasil evaluasi cluster menunjukkan bahwa algoritma K-means
yang diawali dengan reduksi dimensi dataset menjadi 1 dimensi
menggunakan PCA lebih optimal dengan nilai DB Index sebesar 0.346
dengan jumlah segmentasi cluster yang terbentuk ada 4. Berdasarkan
penyajian yang diberikan pada bagian pembahasan, metode reduksi
dimensi dataset menggunakan PCA dapat digunakan untuk optimasi
cluster pada algoritma K-means.
Kesimpulan : 1. Dari penelitian yang dilakukan, reduksi dimensi dataset
menggunakan metode PCA terbukti dapat meningkatkan kualitas cluster
yang dihasilkan oleh algoritma K-means.
2. Hasil pengukuran validitas cluster dengan Davies-Bouldin Index
menunjukkan PCA K-means menghasilkan nilai DB Index paling kecil
dibandingkan dengan K-Means tradisional.
C. PENERAPAN PRINCIPAL COOMPONENT ANALYSIS (PCA) UNTUK REDUKSI
DIMENSI PADA PROSES CLUSTERING DATA PRODUKSI PERTANIAN DI
KABUPATEN BOJONEGORO
Jurnal : JIEET (Journal Information Engineering and Educational Technology)
Volume dan halaman : Vol 05, Halaman 49-54
Tahun : 2021
Penulis : Dyah Hediyati, I Made Suartana
Reviewer : Innatubil issa

Tujuan Penelitian : Untuk menguji kinerja PCA sebagai salah satu metode optimasi
algoritma clustering K-Means yang diterapkan pada data pertanian Kab.
Bojonegoro pada tahun 2017 hingga 2020.
Metode Penelitian : Penelitian menggunakan PCA sebelum diklasifikasikan menggunakan
algoritma K-means.
Sampel data : Data produksi pertanian tahun 2017 hingga 2020 yang disediakan oleh
BPS se-kabupaten Bojonegoro berbentuk file PDF.
Hasil Penelitian : Sistem yang dirancang pada penelitian ini berhasil berjalan dan
memberikan hasil sesuai yang diharapkan. Sistem mampu melakukan
clustering menggunakan algoritma K-means dengan PCA. Proses PCA
mampu menghasilkan Principal Component 1 hingga jumlah kolom
maksimal dari data yang digunakan. Data ini yang kemudian digunakan
pada proses clustering. Proses clustering dilakukan terhadap dua jenis data
berbeda, yaitu dataset asli dan dataset hasil proses PCA yang
menghasilkan data dengan jumlah 1 PC, 2 PC, dan 3 PC. Melalui
percobaan yang dilakukan, didapatkan nilai DB paling optimal terdapat
pada dataset yang direduksi menjadi 1 PC dan dibentuk menjadi 3 klaster.
Dataset yang melalui tahap reduksi dimensiakan mengalami peningkatan
nilai DB Index seiring meningkatnya jumlah fitur yang ada.
Kesimpulan : Evaluasi data hasil clustering menggunakan nilai DB Index
menunjukkan nilai paling optimal pada dataset yang doreduksi menjadi 1
PC dan dibentuk menjadi 3 klaster.
D. REDUKSI DATA LATIH DENGAN K-SVN SEBAGAI PEMROSESAN AWAL PADA
ANN BACK-PROPAGATION UNTUK PENGURANGAN WAKTU PELATIHAN
Jurnal : SIMETRIS
Volume dan halaman : Vol 06, Halaman 223-230
Tahun : 2015
Penulis : Eko Prasetyo
Reviewer : Innatubil issa

Tujuan Penelitian : Untuk melakukan uji coba penggunaan K-support Vector Nearest
Neighboor (K-SVNN) sebagai pemrosesan awal data untuk mereduksi
data latih yang kurang berpengaruh pada garis keputusan ANN Back-
Propagation.
Metode Penelitian : Melakukan eksperimen penggunaan K-SVNN sebagai pemrosesan awal
data latih sebelum digunakan sebagai masukan pada proses pelatihan
ANN Back-propagation.
Sampel data : 6 set data public yang diunduh dari UCI Machine Learning
Repository[7], yaitu : Iris (150 record, 4 fitur), Vertebral Column (310
record, 6 fitur), Wine (178 record, 13 fitur), Blood (748 record, 4 fitur),
dan Ionosphere (351 record, 33 fitur).
Hasil Penelitian : Hasil perbandingan kinerja ketika digunakan set data Iris menunjukkan
bahwa waktu latih yang dibutuhkan lebih pendek daripada tanpa
pemrosesan awal yaitu dari 25.09% hingga 46.26%. Akurasi kinerja
hampir sama pada semua pilihan K yang digunakan, selisih 1% hingga
2%. Untuk data latih yang berhasil direduksi mulai 54.25% hingga
71.25%.
Hasil perbandingan kinerja ketika digunakan set data Vertebral
Column menunjukkan bahwa waktu latih yang dibutuhkan juga lebih
pendek daripada tanpa pemrosesan awal seperti pada set data Iris,
pengurangan waktu yang berhasil didapatkan dari 15% hingga 20%.
Akurasi kinerja mempunyai selisih yang lebih besar daripada set data Iris
pada semua pilihan K yang digunakan, nilainya turun naik hingga 3%.
Untuk data latih yang berhasil direduksi mulai 29.84% hingga 38.31%.
Hasil perbandingan kinerja ketika digunakan set data Wine justru lebih
panjang daripada tanpa pemrosesan awal. Waktu latih secara keseluruhan
justru naik minimal 11.62% meskipun sebenarnya waktu untuk K-SVNN
juga jauh lebih pendek dari pada pelatihan ANN Back-propagation itu
sendiri. Akurasi kinerja yang diberikan masih perlu diragukan karena nilai
selisih dari 0% hingga 6.21% lebih rendah.
Hasil perbandingan kinerja ketika digunakan set data Glass
menunjukkan bahwa waktu latih yang dibutuhkan lebih pendek daripada
tanpa pemrosesan awal seperti pada set data Iris dan Vertebral Column
yaitu dari 61.05% hingga 80.24%. Akurasi kinerja lebih banyak turunnya
hingga 4.76%. Jumlah data yang berhasil direduksi hingga 72.67%.
Hasil perbandingan kinerja ketika digunakan set data Blood
menunjukkan bahwa waktu latih yang dibutuhkan lebih pendek daripada
tanpa pemrosesan awal yaitu dari 16.15% hingga 32.65%. Akurasi kinerja
naik turun, tetapi turunnya hanya mencapai 1.07%. Jumlah data yang
berhasil direduksi hingga 34.56%.
Kesimpulan : 1. K-SVNN dapat digunakan sebagai pemrosesan awal data untuk
mereduksi data latih dengan tetap mempertahankan kualitas hasil
pelatihan.
2. Penggunaan K-SVNN menunjukkan bahwa waktu pelatihan
berkurang sebesar 15% hingga 80%, sedangkan perbedaan akurasi
prediksi ada penurunan sebesar 0% hingga 4.76%.
3. Penggunaan K pada K-SVNN menjadi pilihan yang penting untuk
dipertimbangkan karena dapat mempengaruhi jumlah data yang direduksi.
E. TEKNIK DATA MINING UNTUK MENGKLASIFIKASIKAN DATA ULASAN
DESTINASI WISATA MENGGUNAKAN REDUKSI DATA PRINCIPAL COMPONENT
ANALYSIS (PCA)
Jurnal : Ilmiah Edutic
Volume dan halaman : Vol 7, Halaman 44-48
Tahun : 2021
Penulis : Alven Safik Ritonga, Isnaini Muhandhis
Reviewer : Innatubil issa

Tujuan Penelitian : Untuk mendapatkan model klasifikasi yang mempunyai akurasi tinggi
dalam melakukan klasifikasi ulasan kepuasan destinasi wisata.
Metode Penelitian : Kombinasi antara metode Principal Component Analysis (PCA) sebagai
metode reduksi dimensi data, dengan tiga metode data mining yaitu
Support Vector Machine (SVM), Jaringan Saraf Tiruan (JST), dan
Decision Trees.
Sampel data : Data set sekunder yang diperoleh dari website UCI (University of
California, Irvine) ulasan wisatawan mengenai destinasi wisata. Jumlah
data sebanyak 980 data, dibagi dua yaitu 70% sebanyak 686 data training
dan 30% sebanyak 295 data testing.
Hasil Penelitian : Dataset terdiri dari 11 atribut regular dengan 1 spesial atribut dengan 2
kelas. Jumlah dataset yang dipakai adalah 980. Tahap Prepocessing data
dilakukan dengan normalisasi rumus Min-Max, lalu direduksi
menggunakan metode PCA. Penelitian ini menggunakan 3 metode
klasifikasi yaitu ANN, SVM dan Decision Tree. Adapun akurasi
klasifikasi dari ketiga metode dengan mereduksi dataset dengan PCA,
metode SVM-PCA yang lebih baik dengan 91,50% disusul oleh metode
ANN-PCA sebesar 89,46% dan metode Decision PCA sebesar 88,78%.
Kesimpulan : 1. Ulasan kepuasan wisatawan terhadap destinasi wisata dapat
diklasifikasi dengan menggunakan data mining.
2. Mengurangi dataset menggunakan metode PCA, bisa meningkatkan
akurasi klasifikasi untuk beberapa metode data mining.
3. Dari ketiga metode data mining dan dikombinasikan PCA,
dihasilkan bahwa metode SVM-PCA mempunyai akurasi yang lebih baik
metode SVM-PCA dengan 91,50% disusul oleh metode ANN-PCA
sebesar 89,46% dan metode Decision-PCA sebesar 88,78%.

Anda mungkin juga menyukai