Anda di halaman 1dari 16

KEMENTERIAN PENDIDIKAN DAN KEBUDAYAAN

Modul Diklat UP/RESKILLING

Pemorgraman Python Untuk


Data Science
Tutorial (Pengenalan, Instalasi dan Bekerja
Dengan) Aplikasi RapidMiner

BALAI BESAR PENGEMBANGAN


PENJAMINAN MUTU PENDIDIKAN VOKASI
BIDANG OTOMOTIF DAN ELEKTRONIKA
DAFTAR ISI

DAFTAR ISI .................................................................................................................................................... 2


A. Pengenalan dan Instalasi rapid minier ..................................................................................................... 3
1. Apa itu Rapid Miner .................................................................................................................... 3
2. Spesifikasi Kebutuhan Perangkat ................................................................................................ 3
a. Persyaratan sistem dekstop ................................................................................................... 3
b. Konektivitas ............................................................................................................................ 3
3. Menginstalasi RapidMiner Studio ............................................................................................... 3
4. Menginstal lisensi di rapidminer studio ...................................................................................... 6
a. Menginstal lisensi secara otomatis......................................................................................... 6
b. Instalasi lisensi manual ........................................................................................................... 8
B. Bekerja dengan RapidMiner .................................................................................................................. 10
1. Pengenalan Tools RapidMiner .................................................................................................. 10
2. Lab 1 Pemrosesan data awal menggunakan RapidMiner .......................................................... 10
a. Mengimport data ................................................................................................................. 10
b. Me-retrieve dataset ............................................................................................................. 11
c. Memperbaiki missing value.................................................................................................. 12
d. Melakukan Data reduction (menghilangkan record pada missing value atribute ................ 13
e. Melakukan Filter data Sampling secara random .................................................................. 14
f. Mengatasi data tidak konsisten ............................................................................................ 14
g. Melakukan data reductioan – select atribute....................................................................... 15
3. Lab 2 Visualisasi data ................................................................................................................ 16
4. Lab 3 Membuat Model data ...................................................................................................... 16
DAFTAR PUSTAKA ....................................................................................................................................... 16

BBPPV BOE Program Diklat: Level: Tanggal:


70 01 02 VT
UP/Reskilling - BUN Mei’ 2022
VEDC Judul Diklat: Pemrograman Progli: Rev.Tanggal: Dibuat oleh:
Hal
2 - 16
MALANG Python untuk Data Science Teknologi Informasi 19/05/2022 Abd Munif, Eko. S
A. PENGENALAN DAN INSTALASI RAPID MINIER

1. Apa itu Rapid Miner


RapidMiner merupakan platform perangkat lunak yang bersifat open source. RapidMiner adalah
sebuah solusi untuk melakukan analisis terhadap pembelajaran mesin (machine learning), pembelajaran
mendalam (deep learning), penambangan teks (text mining), dan analisis prediktif (predictive analytics).
RapidMiner menggunakan berbagai teknik deskriptif dan prediksi dalam memberikan wawasan kepada
pengguna sehingga dapat membuat keputusan yang paling baik. RapidMiner menyediakan prosedur data
mining dan machine learning, di dalamnya termasuk: ETL (extraction, transformation, loading), data
preprocessing, visualisasi, modelling dan evaluasi. Proses data mining tersusun atas operator-operator
yang nestable, dideskripsikan dengan XML, dan dibuat dengan GUI.
Di kalangan dunia akademik, Rapidminer digunakan oleh mahasiswa, dosen atau peneliti dengan
latar belakang sistem informasi untuk permodelan sistem berbasis kecerdasan buatan (optimasi,
pengenalan pola gambar/ teks/grafik, peramalan). Tools yang sejenis dengan Rapidminer adalah Matlab
Simulink, WEKA, R, Orange, KNIME serta TANAGRA. Rapidminer dibangun menggunakan bahasa Java
sehingga dapat dijalankan diberbagai macam sistem operasi seperti Windows, Linux, UNIX

2. Spesifikasi Kebutuhan Perangkat

a. Persyaratan sistem dekstop


Hal penting yang harus diperhatikan dalam menyiapkan perangkat adalah memory. Memori yang
tersedia adalah faktor terpenting yang memengaruhi ukuran kumpulan data yang. Tidak ada persyaratan
minimal khusus pada CPU, analisis data adalah tugas yang intensif secara komputasi—semakin baik
perangkat keras semakin baik. RapidMiner Studio ini merupakan platform-independen dan berjalan di
setiap platform di mana Java Runtime Environment (JRE) yang sesuai tersedia.
Persyarayan minimum adalah: CPU dual core, procesor 2 GHz, RAM 2 GHz, ruang hardisk kosong > 1
GB, resolusi monitor 1280x1024. Persyaratan yang direkomendasikan CPU quad core, Prosesor 3GHz atau
lebih cepat, RAM 16GB, ruang harddisk kosong >100 GB

b. Konektivitas
Untuk membaca dan menulis data, RapidMiner dapat terhubung ke semua sistem database relasional
yang menawarkan driver JDBC yang sepenuhnya sesuai. Melalui operator yang didukung, RapidMiner
Studio dapat terhubung ke berbagai database NoSQL, konektor cloud, dan jenis file.
Database yang Didukung adalah Oracle, Microsoft SQL Server, MySQL (Dalam Bahasa Inggris),
PostgreSQL, Teradata, HP Vertica, IBM Netezza. Sedangkan NoSQL meliputi: MongoDB, Cassandra, Apache
Solr, Splunk (hanya baca). Layanan Layanan Cloud meliputi: Dropbox, Amazon S3, Microsoft Azure Blob
Storage, Salesforce,Twitter (hanya baca), Mozenda (hanya membaca), Zapier (hanya menulis). Format File
yang Didukung adalah: CSV (Nilai Dipisahkan Koma, MDB/ACCDB - Database Microsoft Access, XLS/ XLSX -
Spreadsheet Microsoft Excel (97-2003,2007-2013), XML - Bahasa Markup yang Dapat Diperluas, ARFF /
XRFF - Format file Weka, DBF - format File Database dBASE (hanya baca), SAV - Format file IBM SPSS (hanya
baca), SAS - Format file SAS hingga v9.2 (hanya baca), DTA - Format file Stata (hanya baca), QVX - QlikView
data eXchange (hanya menulis)

3. Menginstalasi RapidMiner Studio


Langkah-langkah yang dilakukan dalam proses instalasi RapidMiner adalah sebagai berikut:
a) Download software RapidMiner
di https://my.rapidminer.com/nexus/account/index.html#downloads

BBPPV BOE Program Diklat: Level: Tanggal:


70 01 02 VT
UP/Reskilling - BUN Mei’ 2022
VEDC Judul Diklat: Pemrograman Progli: Rev.Tanggal: Dibuat oleh:
Hal
3 - 16
MALANG Python untuk Data Science Teknologi Informasi 19/05/2022 Abd Munif, Eko. S
b) Pilih jenis sistem operasi yang sesuai, disini saya men-download pada sistem operasi windows 64
bit.

c) Setelah selesai download maka akan tampil seperti gambar berikut, lalu klik Next.

d) Lakukan instalasi seperti biasa, jika keluar jendela dialog License Agreement maka klik tombol I
Agree.

e) Setelah itu muncul seperti gambar dibawah ini anda dapat memilih dimana file installation
RapidMiner akan ditempatkan. Setelah selesai, silahkan tekan tombol install. Tunggu instalasinya
selesai, hingga muncul tulisan Finish.

BBPPV BOE Program Diklat: Level: Tanggal:


70 01 02 VT
UP/Reskilling - BUN Mei’ 2022
VEDC Judul Diklat: Pemrograman Progli: Rev.Tanggal: Dibuat oleh:
Hal
4 - 16
MALANG Python untuk Data Science Teknologi Informasi 19/05/2022 Abd Munif, Eko. S
f) Setelah proses instalasi berjalan dengan lancar, kita langsung saja membuka RapidMiner. Untuk
tampilan awal/pertama kali kita menjalan software tersebut kita akan diminta untuk membuat
sebuah akun agar dapat menggunakannya. Pilih saja dibagian Educational. Lalu isi data diri anda
selengkap-lengkapnya kemudian klik tombol Create my Account.

g) Langkah selanjutnya yaitu buka akun email yang telah didaftarkan, maka anda akan memperoleh
email dari RapidMiner kemudian didalam isi email itu klik “Confirm your email address”.

h) Setelah proses aktivasi selesai. Kemudian akan muncul seperti gambar dibawah ini lalu klik I’m
ready!

BBPPV BOE Program Diklat: Level: Tanggal:


70 01 02 VT
UP/Reskilling - BUN Mei’ 2022
VEDC Judul Diklat: Pemrograman Progli: Rev.Tanggal: Dibuat oleh:
Hal
5 - 16
MALANG Python untuk Data Science Teknologi Informasi 19/05/2022 Abd Munif, Eko. S
i) Kemudian akan mucul tampilan lingkungan terpadu (IDE) dari Rapidminer dan siap untuk
dijalankan.

4. Menginstal lisensi di rapidminer studio


RapidMiner Studio dapat secara otomatis mengambil lisensi terbaru yang terkait dengan akun, jika
pengguna sudah masuk ke RapidMiner Studio dan memiliki koneksi internet. Jika RapidMiner Studio tidak
memiliki koneksi internet (misal diblokir oleh firewall), pengguna dapat menginstal lisensi secara manual.

a. Menginstal lisensi secara otomatis


a) Dari menu Pengaturan, pilih Kelola Lisensi.

Jendela Kelola Lisensi terbuka, menampilkan lisensi yang terkait dengan akun Anda. Dari sini, Anda
dapat masuk ke server lisensi.

BBPPV BOE Program Diklat: Level: Tanggal:


70 01 02 VT
UP/Reskilling - BUN Mei’ 2022
VEDC Judul Diklat: Pemrograman Progli: Rev.Tanggal: Dibuat oleh:
Hal
6 - 16
MALANG Python untuk Data Science Teknologi Informasi 19/05/2022 Abd Munif, Eko. S
b) Klik Sinkronkan lisensi dari akun Anda untuk mendownload lisensi Anda.
c) Masukkan kredensial login Anda dan klik Login dan Instal untuk terhubung ke layanan:

Server lisensi secara otomatis memuat lisensi Anda ke RapidMiner Studio. Layar Kelola Lisensi yang
dihasilkan menampilkan informasi yang terkait dengan lisensi aktif Anda.

d) Klik Tutup untuk kembali ke RapidMiner Studio.

BBPPV BOE Program Diklat: Level: Tanggal:


70 01 02 VT
UP/Reskilling - BUN Mei’ 2022
VEDC Judul Diklat: Pemrograman Progli: Rev.Tanggal: Dibuat oleh:
Hal
7 - 16
MALANG Python untuk Data Science Teknologi Informasi 19/05/2022 Abd Munif, Eko. S
b. Instalasi lisensi manual
1) Mengakses kunci lisensi Anda
Untuk memasukkan kunci secara manual, pengguna harus terlebih dahulu menyalin kunci ke
clipboard.
1) Masuk ke portal akun Anda dan buka halaman Lisensi.

Saat halaman terbuka, pastikan tab Studio dipilih. Informasi lisensi Anda, termasuk jenis
lisensi dan kedaluwarsa, menampilkan:

2) Klik Lihat Kunci Lisensi di samping lisensi yang sesuai untuk menampilkan kunci.

3) Klik di kotak yang berisi kunci untuk memilihnya, lalu salin ke clipboard Anda.

BBPPV BOE Program Diklat: Level: Tanggal:


70 01 02 VT
UP/Reskilling - BUN Mei’ 2022
VEDC Judul Diklat: Pemrograman Progli: Rev.Tanggal: Dibuat oleh:
Hal
8 - 16
MALANG Python untuk Data Science Teknologi Informasi 19/05/2022 Abd Munif, Eko. S
2) Memasukkan kunci di RapidMiner Studio
Setelah menyalin kunci ke clipboard maka lakukan:
1) Dari menu Pengaturan, pilih Kelola Lisensi dan Jendela Kelola Lisensi akan terbuka.

2) Pilih Masukkan Lisensi dan tempelkan kunci lisensi Anda di jendela yang dihasilkan. Perhatikan
bahwa bagian atas jendela diisi dengan informasi lisensi, termasuk edisi dan kedaluwarsa.

3) Klik Instal Lisensi. Layar Kelola Lisensi menampilkan informasi terkait dengan lisensi aktif

4) Klik Tutup untuk kembali ke RapidMiner Studio.

BBPPV BOE Program Diklat: Level: Tanggal:


70 01 02 VT
UP/Reskilling - BUN Mei’ 2022
VEDC Judul Diklat: Pemrograman Progli: Rev.Tanggal: Dibuat oleh:
Hal
9 - 16
MALANG Python untuk Data Science Teknologi Informasi 19/05/2022 Abd Munif, Eko. S
B. BEKERJA DENGAN RAPIDMINER

1. Pengenalan Tools RapidMiner

Kunjungi tautan berikut: https://www.youtube.com/watch?v=WmpWAYeYIKg


Pengenalan Interface Rapidminer Studio meliputi pengenalan user interface, meretrieve dataset publik,
penjelasan beberapa dataset public, dan membuat Repository yang baru

2. Lab 1 Pemrosesan data awal menggunakan RapidMiner

Kunjungi Tautan berikut: https://www.youtube.com/watch?v=jB__hKsi408


Membuat folder repository untuk data dan proses, mengimport data excel ke repidminer secara langsung
dari proses "drag and drop", memilih sheet data excel, mengatur tipe data dan role atribut, menghilangkan
missing value, meretrive dataset, membuat visualisasi data

a. Mengimport data
1) Dari menu repository klik import data, cari file dataset: misal dataSet-jerry.csv (

BBPPV BOE Program Diklat: Level: Tanggal:


70 01 02 VT
UP/Reskilling - BUN Mei’ 2022
VEDC Judul Diklat: Pemrograman Progli: Rev.Tanggal: Dibuat oleh:
Hal
10 - 16
MALANG Python untuk Data Science Teknologi Informasi 19/05/2022 Abd Munif, Eko. S
2) Mengecek kesesuaian type data dengan datanya. Jika tidak cocok rubah type datanya sesuai
dengan data yang ditampilkan
3) Menyimpan file dengan nama dataset-jerry simpan di local repository/data
4) Klik finish dan cek di list repositorinya

b. Me-retrieve dataset
1) Menambahkan operator retrieve pada lembar proses di design view.
2) menghubungkan operator retrieve dengan dataset yang telah diimportkan melalui panel
parameter. Pada repository entri- klik gambar folder dan cari file data set di local repository

3) Cara lain dapat dilakukan dengan drag file dataset dari panel repository dan drop di lembar
proses pada design view

4) menjalankan proses pada desian dan melihat hasilnya

BBPPV BOE Program Diklat: Level: Tanggal:


70 01 02 VT
UP/Reskilling - BUN Mei’ 2022
VEDC Judul Diklat: Pemrograman Progli: Rev.Tanggal: Dibuat oleh:
Hal
11 - 16
MALANG Python untuk Data Science Teknologi Informasi 19/05/2022 Abd Munif, Eko. S
5) Klik statistik untuk melihat data statistik dari data set

6) Dari list data statistik dan tabel hasil retrieve Terdapat mising value pada beberapa atribute

c. Memperbaiki missing value


1) menambahkan operator replace missing values dan mengatur parameter parameternya. Atribute
filter type: singgle, atribute: online_game dan replenishment value: N

BBPPV BOE Program Diklat: Level: Tanggal:


70 01 02 VT
UP/Reskilling - BUN Mei’ 2022
VEDC Judul Diklat: Pemrograman Progli: Rev.Tanggal: Dibuat oleh:
Hal
12 - 16
MALANG Python untuk Data Science Teknologi Informasi 19/05/2022 Abd Munif, Eko. S
2) Menjalankan proses pada design dan melihat hasilnya

d. Melakukan Data reduction (menghilangkan record pada missing value atribute


1) menambahkan filter example
2) mengatur parameter condition class dan parameter string seperti gambar. Hal ini untuk
menghilangkan mising value pada atribure Online_Shooping

3) menjalankan proses desian dan melihat hasilnya

BBPPV BOE Program Diklat: Level: Tanggal:


70 01 02 VT
UP/Reskilling - BUN Mei’ 2022
VEDC Judul Diklat: Pemrograman Progli: Rev.Tanggal: Dibuat oleh:
Hal
13 - 16
MALANG Python untuk Data Science Teknologi Informasi 19/05/2022 Abd Munif, Eko. S
4) Pada atribut online shopping sudah tidak ada missing value. Data menjadi 9 record dua record
terlah dihapus

e. Melakukan Filter data Sampling secara random


1) menambahkan operator sample untuk mensumpling data set sejumlah 50%

2) menjalankan proses desain dan tampilkan hasilnya

f. Mengatasi data tidak konsisten


Data tidak konsisten dapat ditemukan pada atribute twitter dimana terdapat satu record yang berisi data
dengan nilai 99 sementara data lainnya adalah N atau Y
1) Buat desain proses dan pengaturan parameter pada operator replace seperti gambar berikut

BBPPV BOE Program Diklat: Level: Tanggal:


70 01 02 VT
UP/Reskilling - BUN Mei’ 2022
VEDC Judul Diklat: Pemrograman Progli: Rev.Tanggal: Dibuat oleh:
Hal
14 - 16
MALANG Python untuk Data Science Teknologi Informasi 19/05/2022 Abd Munif, Eko. S
2) menjalankan desain proses dan lihat hasilnya

g. Melakukan data reductioan – select atribute


1) Memilih beberapa atribut yang tidak digunakan atau tidak terkait dengan model data.
2) Menambahkan operator select atribute, mengatur paremeter atribut filter type: subset, memilih
atribute yang akan digunakan, memindah atribute ke selectetd atribute

BBPPV BOE Program Diklat: Level: Tanggal:


70 01 02 VT
UP/Reskilling - BUN Mei’ 2022
VEDC Judul Diklat: Pemrograman Progli: Rev.Tanggal: Dibuat oleh:
Hal
15 - 16
MALANG Python untuk Data Science Teknologi Informasi 19/05/2022 Abd Munif, Eko. S
3) menjalankan proses dan melihat hasilnya. Data sudah bersih tidak ada missing value dan tidak
inkonsisten data. Selanjutnya data telah siap untuk diproses selanjutnya.

3. Lab 2 Visualisasi data

Kunjungi link youtube Berikut:


• Visualizing Data in RapidMiner Studio (RapidMiner V. 9.x.x )
https://www.youtube.com/watch?v=IFOJ14apRJE
• Memvisualisasikan Data di Rapidminer Studio (RapidMiner V.7.x.x)
https://www.youtube.com/watch?v=jXRXI66inDM

4. Lab 3 Membuat Model data

Ikuti-langkah-langkah yang ada di modul utama pada materi proyek data science sub materi
Lab 12 Membuat Model Data dengan RapidMiner

DAFTAR PUSTAKA

RapidMiner Studio - RapidMiner Documentation, https://docs.rapidminer.com/latest/studio/


https://predatech.org/instalasi-rapidminer-pada-sistem-operasi-windows/
https://docs.rapidminer.com/latest/studio/installation/system-requirements.html
RapidMiner-v6-user-manual.pdf

BBPPV BOE Program Diklat: Level: Tanggal:


70 01 02 VT
UP/Reskilling - BUN Mei’ 2022
VEDC Judul Diklat: Pemrograman Progli: Rev.Tanggal: Dibuat oleh:
Hal
16 - 16
MALANG Python untuk Data Science Teknologi Informasi 19/05/2022 Abd Munif, Eko. S

Anda mungkin juga menyukai