Oleh :
BAB 1 PEDAHULUAN
teknik
statistik,
matematika,
kecerdasan
buatan,
dan
1.2 Tujuan
Tujuan dari laporan ini adalah untuk meningkatkan pemahaman kepada mahasiswa
terhadap ilmu Data Mining dan aplikasi Weka agar mahasiswa dapat mengolah data dengan
metode yang digunakan.
Pembersihan data (untuk membuang data yang tidak konsisten dan noise)
Integrasi data (penggabungan data dari beberapa sumber)
Transformasi data (data diubah menjadi bentuk yang sesuai untuk di-mining)
Aplikasi teknik DM
Evaluasi pola yang ditemukan (untuk menemukan yang menarik/bernilai)
Presentasi pengetahuan (dengan teknik visualisasi)
b. Dapat terjebak dalam masalah yang disebut curse of dimensionality. Hal ini dapat
terjadi jika data pelatihan memiliki dimensi yang sangat tinggi (Contoh jika data
pelatihan terdiri dari 2 atribut maka dimensinya adalah 2 dimensi. Namun jika ada 20
atribut, maka akan ada 20 dimensi). Salah satu cara kerja algoritma ini adalah
mencari jarak terdekat antara k buah titik dengan titik lainnya. Jika mencari jarak
antar titik pada 2 dimensi, masih mudah dilakukan. Namun bagaimana mencari jarak
antar titik jika terdapat 20 dimensi. Hal ini akan menjadi sulit.
c. Jika hanya terdapat beberapa titik sampel data, maka cukup mudah untuk menghitung
dan mencari titik terdekat dengan k titik yang diinisialisasi secara random. Namun
jika terdapat banyak sekali titik data (misalnya satu milyar buah data), maka
perhitungan dan pencarian titik terdekat akan membutuhkan waktu yang lama.
BAB 3 PEMBAHASAN
Tahapan dalam melakukan data mining salah satunya adalah preprosesing data. Pertanyaannya
adalah mengapa data perlu di bersihkan sebelum diproses ?
Hal ini terjadi karena biasanya data yang akan digunakan belum baik, penyebabnya antara lain :
Disini kualitas data yang baik didasarkan oleh keputusan yang baik dan data warehouse
memerlukan integrasi kualitas data yang konsisten.
Teknik atau metode yang digunakan dalam data preprocessing, diantaranya:
Data cleaning
Menghilangkan nilai-nilai data yang salah, memperbaiki kekacauan data dan memeriksa
data yang tidak konsisten.
Data integrasi
Menggabungkan data dari beberapa sumber (database, data cube, atau file) ke dalam
penyimpanan data yang sesuai.
Data transformasi
Normalisasi dan pengumpulan data sehingga menjadi sama.
Data reduksi
Menguraikan data ke dalam bentuk yang lebih kecil ukurannya tetapi tetap menghasilkan
hasil analitis yang sama.
Data diskretisasi
Bagian dari data reduksi tetapi memiliki arti penting tersendiri, terutama untuk data
numerik.
Dari data yang kita dapat dari website www.data.go.id setelah kita masukan kedalam aplikasi
WEKA, maka pada tab prepocess akan terlihat seperti berikut,
Setelah itu data kita proses untuk di clustering dengan metode k-means, dengan jumlah cluster 2
Setelah data di cluster dengan metode k-means, maka kita bisa melihat cluster dengan visual
yang tersedia di aplikasi
Setelah selesai di cluster kita bisa menyimpan hasil cluster kita, dan melihat kembali dalam
bentuk table, seperti berikut
4.1 Kesimpulan
Berdasarkan dari penelitian yang telah dilaksanakan dan sudah diuraikan dalam penerapan
data mining dari data inflasi dan indeks harga konsumen, maka penulis dapat menarik
kesimpulan sebagai berikut :
1. Penerapan data mining dengan teknik clustering dan algoritma K-Means yang
dilakukan menghasilkan sebuah informasi mengenai data inflasi bulanan per
kabupaten.
2. Informasi mengenai data inflasi bulanan
DAFTAR PUSTAKA
www.scribd.com .
www.data.go.id .
Haryanto, 2012. Teknik Data Mining Untuk Mendapatkan Informasi Dari Keluaran