Anda di halaman 1dari 13

TUGAS KELOMPOK

BIG DATA & DATA ANALYTICS


LAPORAN TUGAS PRAKTIKUM RAPIDMINER STUDIO

Disusun oleh

5200411436 Mogar Nurhandhi


5200411437 Muhamad Ikhwan
5200411439 Tegar Rangga Nur Ridwan

PROGRAM SARJANA 1 INFORMATIKA


FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS TEKNOLOGI YOGYAKARTA
2021
1. (13) menambahkan data siswa tambahan
Langkah langkah :
1) Menambahkan data siswa(dmhs) menggunakan operator read excel
2) Menambahkan data kedua (dmhs, pada cell lain) menggunakan operator read excel
3) Pada read excel kedua tambahkan operator generate attribute, setingan parameter
membuat attribute baru yaitu nama (nama awal + nama akhir)
4) Tambahkan operator read select attribute untuk hanya memilih attribute baru yaitu
nama (yang sudah di gabung)
5) Untuk menambahkan data memanjang kebawah / meneruskan data siswa maka
gunakan union (hubungkan kedua output data ke input union)
6) Koneksikan ke res output

Setingan parameter

Hasil akhir

2. (14) mengatur batas akhir pengumpulan nilai ujian (7 hari setelah ujian)
Langkah langkah :
1) Menambahkan 2 data menggunakan operator read excel
2) Data pertama sebagai data induk yang akan ditambahkan attribute batas pengumpulan
nilai
3) Data 1 diberikan operator date to nominal untuk mengkonversi menjadi format nominal
dd/MM/yyyy. Setelah itu juga diberikan operator generate id
4) Data 2 diberikan operator ajust date untuk menseting batas akhir penyetoran nilai
dengan setingan parameternya (ajust 7 dan date unit adalah day). Agar proses lebih
ringkas maka poses selanjutnya dilakukan pada sub proses, di dalam sini diberikan
operator rename untuk merubah nama attribute tanggal ujian menjadi batas akhir
pengumpulan nilai, selain itu diberikan juga operator select attribute untuk memilih
hanya attribute batas akhir yang digunakan. Selanjutnya diberikan operator date to
nominal untuk mengkonversi menjadi format nominal dd/MM/yyyy. Setelah itu juga
diberikan operator generate id
5) Keluar dari operator sub proses kedua data disatukan dengan operator join dengan tipe
inner menggunakan patokan id

Setingan parameter
Hasil akhir

3. (15) pengolahan data awal dan pemrosesan TF-IDF


Langkah langkah :
1) Menmabahkan data yang akan di olah menggunakan read excel
2) Cleansing data yang mengandung karakter tidak penting menggunakan operator
replace, setingan parameter replace what di isi regular exspresion
3) Berikutnya menggunakan operator nominal to tex untuk merubah value yang bernilai
nominal menjadi text
4) Proses berikutnya menambahkan operator process document from data
5) Dalam operator tersebut terdapat beberapa operator lagi yaitu tokenize untuk
memecah menjadi per kata, kemudian transform cases untuk merubah upper menjadi
lower, kemudian filter stopwords untuk menghilangkan kata yang tidak penting, lalu
filter token by length untuk membatasi kata yang masuk min 4 carakter dan max 25
carakter
6) Kemudian sambungkan output work e res output

Setingan parameter

Hasil akhir
STUDI KASUS 2 : KASUS COVID DI INDONESIA
1. Persiapan awal data
Langkah langkah :
1) Import data menggunakan operator read csv, kemudian double klik operator dan
masukan data covid_19_indonesia_time_series_all.csv
2) Atur juga tipe datanya agar sesuai
3) Berikutnya adalah membersihkan data tersebut dari karakter yang tidak diperlukan
menggunakan operator rename, setingan parameternya old name attribute Date
dibubah menjadi Date

Setingan parameter

2. Visualisasi total jumlah kematian berdasarkan provinsi


Langkah langkah :
➢ Ambil operator multiply agar adata bisa dipakai untuk soal lain
➢ Gunakan operator select attribute untuk memilih attribute lokasi dan total kematian
➢ Kemudian gunakan operator aggregate untuk melakukan total dan menggrouping data
berdasarkan lokasi(provinsi)
➢ Adapun setingan parameter aggregate adalah total kematian diberikan fungusi sum, dan
grub by berdasarkan lokasi(provinsi)

Setingan parameter
Hasil akhir visualisasi

3. Visualisasi total jumlah kasus baru berdasarkan provinsi


Langkah langkah :
➢ Ambil operator multiply agar adata bisa dipakai untuk soal lain
➢ Gunakan operator select attribute untuk memilih attribute lokasi dan total kasus baru
➢ Kemudian gunakan operator aggregate untuk melakukan total dan menggrouping data
berdasarkan lokasi(provinsi)
➢ Adapun setingan parameter aggregate adalah total kasus baru diberikan fungusi sum,
dan grub by berdasarkan lokasi(provinsi)

Setingan parameter

Hasil akhir visualisasi


4. Visualisasi total jumlah sembuh berdasarkan provinsi
Langkah langkah :
➢ Ambil operator multiply agar adata bisa dipakai untuk soal lain
➢ Gunakan operator select attribute untuk memilih attribute lokasi dan total jumlah
sembuh
➢ Kemudian gunakan operator aggregate untuk melakukan total dan menggrouping data
berdasarkan lokasi(provinsi)
➢ Adapun setingan parameter aggregate adalah total jumlah sembuh diberikan fungusi
sum, dan grub by berdasarkan lokasi(provinsi)

Setingan parameter

Hasil akhir visualisasi


5. Visualisasi soal 2,3,4 dan luas area berdasarkan provinsi
Langkah langkah :
➢ Ambil operator multiply agar adata bisa dipakai untuk soal lain
➢ Gunakan operator select attribute untuk memilih attribute lokasi dan total kematian,
total jumlah kasus baru, total jumlah sembuh, dan luas area
➢ Kemudian gunakan operator aggregate untuk melakukan total dan menggrouping data
berdasarkan lokasi(provinsi)
➢ Adapun setingan parameter aggregate adalah total kematian, total jumlah kasus baru,
total jumlah sembuh, dan luas area diberikan fungusi sum, dan grub by berdasarkan
lokasi(provinsi)

Setingan parameter
Hasil akhir visualisasi

6. Visualisasi soal 2,3,4 dan populasi berdasarkan provinsi


Langkah langkah :
➢ Ambil operator multiply agar adata bisa dipakai untuk soal lain
➢ Gunakan operator select attribute untuk memilih attribute lokasi dan total kematian,
total jumlah kasus baru, total jumlah sembuh, dan populasi
➢ Kemudian gunakan operator aggregate untuk melakukan total dan menggrouping data
berdasarkan lokasi(provinsi)
➢ Adapun setingan parameter aggregate adalah total kematian, total jumlah kasus baru,
total jumlah sembuh, dan populasi diberikan fungusi sum, dan grub by berdasarkan
lokasi(provinsi)

Setingan parameter
Hasil akhir visualisasi

7. Visualisasi soal 2,3,4 dan kepadatan penduduk berdasarkan provinsi


Langkah langkah :
➢ Ambil operator multiply agar adata bisa dipakai untuk soal lain
➢ Gunakan operator select attribute untuk memilih attribute lokasi dan total kematian,
total jumlah kasus baru, total jumlah sembuh, dan kepadatan penduduk
➢ Kemudian gunakan operator aggregate untuk melakukan total dan menggrouping data
berdasarkan lokasi(provinsi)
➢ Adapun setingan parameter aggregate adalah total kematian, total jumlah kasus baru,
total jumlah sembuh, dan kepadatan penduduk diberikan fungusi sum, dan grub by
berdasarkan lokasi(provinsi)

Setingan parameter
Hasil akhir visualisasi

8. Kesimpulan dari soal no 1 sampai 7


➢ Data tertinggi didominasi atau dipimpin Indonesia secara umum, namun dilihat dari
provinsi DKI Jakarta
➢ Untuk angka tertinggi jumlah kematian tertinnggi adalah provinsi jawa timur
➢ Untuk angka tertinggi jumlah kasus baru adalah DKI Jakarta
➢ Untuk angka tertinggi jumlah kesembuhan adalah DKI Jakarta
➢ Luas wilayah, kepadatan penduduk, dan populasi berpengaruh terhadap angka
pertambahan kasus, kematian, dan kesembuhan

Anda mungkin juga menyukai