Anda di halaman 1dari 3

Lembar Kerja

Peer Discussion: Persiapan Data (Data Preprocessing)

Nama_Mhs1 : Lut Faizal Nama_Mhs2: ……………………………........

NIM :2020130005 NIM : ………………………………….

Uraikan perbandingan teknik persiapan data yang tertera pada table berikut berdasarkan informasi pada kolom parameter.
# Parameter DATA PREPROCESSING TECHNIQUES
Data Cleaning Data Integration Data Reduction Data Transformation
1. Dekripsi
2. Konteks Penggunaan Untuk mempelajari teknik Mengambil data dari Melakukan Untuk mengetahui statistik
Data Cleaning yang beberapa sumber data perbandingan tingkat prediksi agar mengetahui
diimplementasikan untuk untuk digabungkan akurasi dengan nilai yang paling akurat
pencarian Knowledge menjadi data persistem menggunakan algortima
terhadap data tidak lengkap tunggal C5.0 dan algoritma Naïve
dalam data mining Bayes Classifier (NBC)
3. Contoh Data
4. Algoritma (Min 1) Algoritma Teknik Mean Algoritma K-means dan Algortima C5.0 dan Algoritma Naïve Bayes
Substitusi dan teknik Mean gaussian mixture algoritma Naïve Bayes
Interval clustering Classifier (NBC
5. Uraian Prosedur (salah Teknik Data Clening yang Pertama-tama data Pertama-tama Algoritma Tahapan proses Naive
satu algoritma) digunakan adalah teknik diduplikat kemudian C5.0 merupakan Bayes
data Mean Substitusi dan dikelompokkan dan perpanjangan dari ID3. yaitu:
teknik Mean Interval, Dari digabung menjadi data algoritma klasifikasi yang 1. Menghitung jumlah
dua algoritma teknik data terintegrasi . Data yang berlaku dalam kumpulan kelas / label
cleaning memiliki terintegrasi kemudian data besar. Lebih baik 2. Menghitung Jumlah
perbedaan data dimana dianalisis menggunakan daripada C4.5 pada Kasus Per Kelas
dengan metode algoritma k-means dan kecepatan, memori dan 3. Kalikan Semua Variable
mean substitusi data tidak pencampuran efisiensi. C5.0 bekerja Kelas
lengkap diisi 3 setelah campuran Gaussian, dengan memisahkan 4. Bandingkan Hasil Per
dihitung sedangkan dengan kemudian divalidasi sampel berdasarkan Kelas
menggunakan algoritma dengan indeks pada atribut yang
teknik mean interval data Silhouette, Selanjutnya, menyediakan perolehan
tidak lengkap diisi dengan 2 temukan dan informasi maksimum.
setelah dijalankan kelompokkan data Kemudian Proses
algoritmanya.pada duplikat, yang label pengujian dalam
perbedaan ini yang akan datanya ada lebih dari membandingkan tingkat
diuji mana yang lebih satu data dan akurasi dengan
mendekati fakta setelah integrasikan ke dalam menggunakan Algoritma
diekstrak dari data mining data terintegrasi baru C5.0 dan Algoritma Naïve
dalam metode rough set dengan Bayes Classifier, Akurasi
menggabungkannya dataset dapat dilihat dari
sebagai kolom baru di hasil Recall dan
baris label data duplikat Precision, Recall adalah
identik. Langkah tingkat keberhasilan
terakhir adalah dalam menemukan
mengintegrasikan dari kembali sebuah
berbagai data dan informasi. Lalu hasil
menyimpannya ke proses klasifikasi dapat
dalam penyimpanan dirumuskan
data persisten tunggal. menggunakan algoritma
Prosedur ini dilakukan C5.0
dengan mencari data
duplikat dalam
kombinasi data
masukan dan
menjadikannya data
tunggal
6. Dst (silahkan
menambahkan
parameter )
n. Referensi (minimal 2, Jasmir. (2016). Hadaiq R. Sanabila, I. Dito Putro Utomo, M. Herry Derajad Wijaya,
APA Style) Implementasi Teknik W. (2019). Simulasi (2020). Analisis S. D. (2020).
Data Cleaning Dan Integrasi Data Komparasi Metode Implementasi Data
Teknik. Jurnal Aptikom, Menggunakan Klasifikasi Data Mining dengan
Page 99-106. Dataconement. Jurnal Mining dan Reduksi. Algoritma Naïve Bayes.
Ilmu Komputer dan JURNAL MEDIA JURNAL
Informasi, Vol 4,No INFORMATIKA INFORMATIKA, Page 1-
1. BUDIDARMA, Page 7.
437-444.

Anda mungkin juga menyukai