Oleh :
Kelas: Mosi 8
Rapid miner adalah perangkat lunak yang bersifat terbuka (open source). Rapid miner
merupakan solusi untuk melakukan analisis terhadap data mining, text mining dana analisis
prediksi. Rapid miner menggunakan berbagai teknik deskriptif dan prediksi dalam
memberikan wawasan kepada pengguna sehingga dapat membuat keputusan yang paling
baik. Rapid miner memiliki kurang lebih 500 operator data mining, termasuk operator untuk
input, output, data preprocessing dan visualisasi. Rapid miner merupakan software yang
berdiri sendiri untuk menganalisa data dan sebagai mesin data mining yang dapat
diintergrasikan pada produknya sendiri. Rapid miner ditulis dengan menggunakan bahasa
java sehingga dapat bekerja di semua sistem operasi.
Memiliki GUI, command line mode, dan Java API yang dapat dipanggil dari program
lain.
Banyaknya algoritma data mining, seperti decision treee dan self-organization map.
Bentuk grafis yang canggih, seperti tumpang tindih diagram histogram, tree chart dan
3D Scatter plots.
Banyaknya variasi plugin, seperti text plugin untuk melakukan analisis teks.
Menyediakan prosedur data mining dan machine learning termasuk: ETL (extraction,
transformation,
RapidMiner Text mining Mirip dengan text analytics, yaitu proses untuk mendapatkan
informasi bermutu tinggi dari teks. Predictive analytics Teknik-teknik statistika yang
menganalisa fakta masa kini dan masa lalu untuk memprediksi kejadian di masa depan.
RapidMiner Menyediakan prosedur data mining dan machine learning termasuk: ETL
(extraction, transformation, loading), data preprocessing, visualisasi, modelling dan evaluasi.
Proses data mining tersusun atas operator-operator yang nestable, dideskripsikan dengan
XML, dan dibuat dengan GUI. Ditulis dalam bahasa pemrograman Java. Mengintegrasikan
proyek data mining Weka dan statistika R.
Terminologi Dasar Atribut dan atribut target Atribut: karakteristik atau fitur dari data yang
menggambarkan sebuah proses atau situasi. ID, atribut biasa. Atribut target: atribut yang
menjadi tujuan untuk diisi oleh proses data mining. Label, cluster, weight. Peran atribut
(attribute role) Label, cluster, weight, ID, biasa
Terminologi Dasar Tipe nilai (value type) nominal: nilai secara kategori numeric: nilai
numerik secara umum integer: bilangan bulat real: bilangan nyata text: teks bebas tanpa
struktur binominal: nominal dua nilai polynominal: nominal lebih dari dua nilai
date_time: tanggal dan waktu date: hanya tanggal time: hanya waktu
Terminologi Dasar Data dan metadata Data menyebutkan obyek-obyek dari sebuah
konsep. Ditunjukkan sebagai baris dari tabel. Metadata menggambarkan karakteristik dari
konsep tersebut. Ditunjukkan sebagai kolom dari tabel. Modelling Penggunaan metoda
data mining terhadap data. Hasilnya disebut model.
Process control : Untuk mengontrol aliran proses, seperti loop atau conditional branch.
Modelling : Untuk proses data mining yang sesungguhnya. Seperti klasifikasi, regresi,
clustering, aturan asosiasi dll.
Berikut ini adalah Implementasi dari Program Rapidminer terhadap Data Siswa yang
mendapat Beasiswa dari kelompok kami:
Kita akan membuat Decision tree dari data diatas dengan menggunakan Rapidminer, berikut
ini adalah langkah-langkahnya :
2. Kemudian Klik new Process, maka akan tempil seperti gambar dibawah
3. Dibagian tab sebelah kiri ada tab operator, pilih Import data Read Excel Hal ini
digunakan untuk mengimport data kita. Ada berbagai macam pilihan disesuaikan
dengan data yang kita punya(dalam hal ini menggunakan excel) Lalu Klik and drag
Read Excel tersebut kedalam Main Process, seperti gambar dibawah.
4. Masih dalam keadaan terseleksi(untuk Read Excel) lihat di bagian sebelah kanan ada tab
parameter klik Import Configuration Wizard
5. Kemudian tampil jendela import wizard pilih direktori dimana file data siswa disimpan
lakukan next
7. Dilangkah ini, tentukan label dan tipe data untuk setiap atribut di data siswa kita
menggunakan Keterangan sebagai labelnya kemudian klik finish,dibawah ini
merupakan keterangan dari beberapa tipe data yang ada di rapidminer :
Polynom = tipe data ini untuk karakter baik angka ataupun huruf
(sama seperti varchar/text)
Binominom = tipe data ini untuk 2 kategori (Y/T, L,P, Besar/Kecil, dll)
Atribut = digunakan sebagai variable predictor/prediksi
Label = digunakan sebagai variable tujuan
8. Kemudian ketik decision tree pada filter kemudian klik dan drag ke main proses
9. Kemudian klik and drag out (pada Read Excel) KE tra(pada decision tree)
10. Kemudian klik and drag mod (pada decision tree) KE res
disebelah kanan main process
11. Klik proces Run atau klik pada toolbar , Maka akan tampil hasilnya yaitu decision tree dan