Anda di halaman 1dari 5

FM-BINUS-AA-FPU-78/V2R1

BINUS University

Academic Career: Class Program:


Undergraduate / Master / Doctoral *) International / Regular / Smart Program /
Global Class / BINUS Online Learning *)

 Mid Exam  Compact Term Exam Term : Odd / Even / Compact *)


◼ Final Exam  Others Exam : Period (Only for BOL) : 1 / 2 *)

 Kemanggisan  Senayan  Semarang Academic Year :


 Alam Sutera  Bandung
 Bekasi  Malang 2022 / 2023
Exam Type* : Onsite / Online Faculty / Dept. : BINUS Online /
Computer Science
Day / Date** : Wednesday – Wednesday/09 – 16 Code - Course : COMP6725036 – Big
August 2023 Data Technologies
Time** : 00:00 – 12:00 WIB Code - Lecturer : Lecturer Team
Exam : ◼ Open Book ◼ Open Notes BULC (Only for BOL) : Bandung, Bekasi,
Specification***  Close Book  Submit Project Jakarta, Malang,
◼ Open E-Book  Oral Test Palembang, Semarang
Class : MLEE; MIBE; MJBE;
MEDE; MFDE; EMCA;
EMCB
Equipment*** : Student ID *** : 2502132286
 Exam Booklet ◼ Laptop  Drawing Paper – A3 Name *** : Septhian Manroe
 Calculator  Tablet  Drawing Paper – A2 Signature *** :
 Dictionary  Smartphone  Notes
🞸)
Strikethrough the unnecessary items **) For Online Exam, this is the due date ***) Only for Onsite
Exam

Please insert the test paper into the exam booklet and submit both papers after the test.

The penalty for CHEATING is DROP OUT!

No Daftar Pertanyaan Bobot


1 Big Data saat ini sudah bisa diterapkan ke berbagai bidang, salah satunya adalah di bidang 20
kesehatan. Jelaskan dengan sebuah contoh penerapan Big Data tersebut, lalu dari contoh yang
Anda jelaskan, insight apa yang nantinya diharapkan/dihasilkan!

2 Hadoop Distributed File System (HDFS) memiliki beberapa fitur, salah satunya adalah Data 20
Replication. Bagaimana HDFS mereplikasi data pada Big Data? Jelaskan dengan menyertakan
sebuah contoh!

3 Case study : Sebuah perusahaan startup Shopaa memiliki permasalahan dimana mereka 20
melakukan overhiring. Beberapa karyawan dilayoff untuk mengurangi pengeluaran perusahaan.

Verified by,

Dr. Yulius Denny Prabowo, S.Kom.,M.T.I (D6806) and sent to Department on


April 10, 2023
Page 1 of 3
FM-BINUS-AA-FPU-78/V2R1
Perusahaan membutuhkan anda untuk mengevaluasi mana yang harus dilayoff dengan membuat
sistem klasifikasi. Anda akan membuat suatu sistem klasifikasi menggunakan library Spark ML.
Sistem klasifikasi ini bertujuan untuk menganalisis apakah karyawan itu harus dilayoff atau tidak
berdasarkan input dari gaji, lama bekerja, dll.
a) Tentukan input tambahan yang dibutuhkan oleh sistem
b) Sebutkan komponen library yang digunakan dan jelaskan langkah-langkah pembuatan
sistem
c) Tentukan metric pengukuran yang dibutuhkan untuk evaluasi sistem dan jelaskan
alasannya

4 Case study : Seorang HR ingin mendapatkan insight mengenai perumusan gaji disuatu 20
perusahaan. Dalam hal ini HR ingin mengaitkan antara umur dan gaji. Untuk mempermudah
mendapatkan insight, maka dibutuhkan suatu sistem data visualization.
a) Sebutkan Teknik Data Visualization yang digunakan dan jelaskan alasannya
b) Sebutkan tool apa saja yang digunakan untuk dapat memvisualisasikan data tersebut.
c) Jelaskan cara kerja sistem data visualization yang dibuat
d) Berikan gambaran perkiraan bentuk dari sistem data visualization tersebut

5 Case study : Anda bekerja pada di suatu universitas Z untuk membantu memperbaiki sistem di 20
universitas dengan kemampuan big data. Tentunya ada banyak permasalahan yang terjadi di
universitas. Masalah seperti jumlah intake mahasiswa, pengadaaan fasilitas, kepuasan
mahasiswa, dll adalah sesuatu yang dialami oleh universitas Z. Buatlah suatu sistem big data
yang bisa menyelesaikan permasalahan di universitas Z.
a) Jelaskan problem permasalahan dan tujuan akhir dari sistem yang dibuat.
b) Sebutkan input yang dibutuhkan sistem.
c) Gambarkan dan jelaskan analytics flow yang dapat memecahkan permasalahan dari
sistem.
Berikut contoh untuk weather data analysis sesuai di ppt big data case study hal 12

Verified by,

Dr. Yulius Denny Prabowo, S.Kom.,M.T.I (D6806) and sent to Department on


April 10, 2023
Page 2 of 3
FM-BINUS-AA-FPU-78/V2R1

d) Jelaskan insight yang diperoleh setelah melalui seluruh analytics flow serta jelaskan
tindakan apa yang dapat dilakukan untuk menindaklanjuti insight yg diperoleh.

Jawaban
1. Big Data pada bidang kesehatan, setiap klinik, puskesmas maupun rumah sakit menggunakan software yang
berbeda dalam pencatatan pasien. Hal tersebut membuat data yang dikirimkan ke Dinas Kesehatan juga
berbeda tergantung jenis software yang digunakan. Dengan penerapan Big Data ini semua informasi kesehatan
bisa terpusat sehingga mudah diolah dan juga dianalisa untuk bisa mengetahui seperti apa kesehatan
penduduk yang ada di Indonesia ini yang mana sekarang aplikasi ini ada di dalam SATUSEHAT dimana rekam
medik kita akan tercetak secara elektorik di dalam aplikasi ini dan terintegrasi ke semua Rumah Sakit, klinik,
maupun puskesmas.

2. Bagaimana HDFS mereplikasi data pada Big Data HDFS menyimpan suatu data dengan cara membaginya
menjadi potong-potongan data yang disebut blok berukuran 64 MB dan kemudian disimpan pada node-node
yang tersebar dalam kluster. Ukuran blok tidak terpaku pada nilai tertentu sehingga dapat diatur sesuai
kebutuhan. Walaupun data disimpan secara tersebar, namun dari sudut pandang pengguna, data tetap terlihat
utuh dan diperlakukan seperti halnya mengakses file pada satu media penyimpanan. Berbeda dengan sistem
file pada umumnya, HDFS dapat bertumbuh tanpa batas, karena secara arsitektur dan administrasinya dapat
menambah jumlah node sesuai kebutuhan. Abstraksi satu file yang berada di beberapa node memungkinkan
ukuran file bertumbuh tanpa batas.

Setiap data yang disimpan pada HDFS memiliki lebih dari satu salinan, yang disebut sebagai Replication
Factor (RF). Secara default nilai RF adalah 3, yang berarti satu file tersimpan di 3 datanode berbeda sehingga
jika salah satu datanode rusak, maka file dapat diperoleh dari datanode lain. Datanode mengirimkan sinyal
setiap 3 detik yang disebut heartbeat kepada namenode untuk menunjukkan bahwa datanode tersebut masih
aktif. Apabila dalam 10 menit namenode tidak menerima heartbeat dari datanode, maka datanode tersebut
dianggap rusak atau tidak berfungsi sehingga setiap permintaan baca/tulis dialihkan ke node lain. Dengan
heartbeat, maka namenode dapat mengetahui dan menguasai kondisi kluster secara keseluruhan. Sebagai
respon atas heartbeat dari datanode, selanjutnya namenode akan mengirimkan perintah kepada datanode.

Verified by,

Dr. Yulius Denny Prabowo, S.Kom.,M.T.I (D6806) and sent to Department on


April 10, 2023
Page 3 of 3
FM-BINUS-AA-FPU-78/V2R1
Contoh: pada saat kita mengetikkan kata-kata perintah pada Command Prompt komputer client, maka file
akan ditransfer ke Hadoop cluster dan disimpan tersebar dalam komputer-komputer yang ditugaskan sebagai
DataNode dimana datanode yang telah ditugaskan menjadi refilica factor file..

3. Sistem klasifikasi ini bertujuan untuk menganalisis apakah karyawan itu harus dilayoff atau tidak berdasarkan
input dari gaji, lama bekerja, dll.
a. Tentukan input tambahan yang dibutuhkan oleh sistem
Nilai kinerja, nilai maximum, dan nilai minimum
b. Sebutkan komponen library yang digunakan dan jelaskan langkah-langkah pembuatan sistem
Spark SQL adalah library yang mengintegrasikan pemrosesan data relasional dengan Spark functional
programming API. Library ini mendukung pengolahan data menggunakan kueri, baik melalui SQL atau
melalui Bahasa Kueri Hive. Spark SQL menggunakan antarmuka seperti SQL untuk berinteraksi dengan
data dari berbagai format seperti CSV, JSON, Parket, hingga ke berbagai database engine seperti MySQL
dan SQL Server.
c. Tentukan metric pengukuran yang dibutuhkan untuk evaluasi sistem dan jelaskan alasannya

- Matriks berpasangan
Menentukan susunan prioritas elemen adalah dengan menyusun perbandingan berpasangan,
perbandingan tersebut ditransformasikan dalam bentuk matriks.
- Menentukan perbandingan nilai bobot kriteria
Setelah matriks berpasangan tersusun, maka komponen yang ada dalam matriks tersebut diberi bobot
atau nilai, dengan cara membanding setiap komponennya satu persatu antara baris san kolom dan dinilai
melalui skala perbandingan dari 1 sampai 9.

4. sistem data visualization


a. Sebutkan Teknik Data Visualization yang digunakan dan jelaskan alasannya
Teknik data visualization yang digunakan Comparison (perbandingan) berfungsi untuk membandingkan
nilai antara variabel satu dengan variabel lainnya.Selain itu, ia bisa juga berguna untuk menemukan nilai
tertinggi ataupun terendah dari data dan untuk membandingkan beberapa kategori dalam satu variabel
data. Sehingga didapatkan insight dalam menentukan gaji karyawan

b. Sebutkan tool apa saja yang digunakan untuk dapat memvisualisasikan data tersebut.
Power BI, QlikView, Plotly, Excel

c. Jelaskan cara kerja sistem data visualization yang dibuat


Sistem akan memperoses data inputan berupa gaji karyawan yang akan di tetapkan kemudia dikali
dengan jumlah jam kerja per jam, hari, perbulan dan tahun kemudian didapatkan hasil gaji yang akan
dibayarkan dalam rentan waktu yang tentukan.

d. Berikan gambaran perkiraan bentuk dari sistem data visualization tersebut

Bentuk sistem data visualization

Rp90,000,000.00
Rp80,000,000.00
Rp70,000,000.00
Rp60,000,000.00
Rp50,000,000.00
Rp40,000,000.00
Rp30,000,000.00
Rp20,000,000.00
Rp10,000,000.00
Rp-
per jam per hari per bulan per tahun

Verified by,

Dr. Yulius Denny Prabowo, S.Kom.,M.T.I (D6806) and sent to Department on


April 10, 2023
Page 4 of 3
FM-BINUS-AA-FPU-78/V2R1

5. Buatlah suatu sistem big data yang bisa menyelesaikan permasalahan di universitas Z
a. Jelaskan problem permasalahan dan tujuan akhir dari sistem yang dibuat.
Masalah seperti jumlah intake mahasiswa, pengadaaan fasilitas, kepuasan mahasiswa, dll adalah sesuatu
yang dialami oleh universitas Z dimana tujuan akhir dari sistem ini dapat memberikan informasi jumlah
intake mahasiswa, pengadaan fasilitas dan juga kepuasan mahasiswa terhadap kampus
b. Sebutkan input yang dibutuhkan sistem.
Nim,nama,jurusan,fakultas, nama fasilitas,jumlah fasilitas
c. Gambarkan dan jelaskan analytics flow yang dapat memecahkan permasalahan darisistem.

d. Jelaskan insight yang diperoleh setelah melalui seluruh analytics flow serta jelaskan tindakan apa
yang dapat dilakukan untuk menindaklanjuti insight yg diperoleh.

menurut saya dapat memecahkan di universitas Z, yaitu dengan melakukan prediksi berapa banyak
mahasiswa yang intake. sehingga tidak ketika demand akan banyak akan tersedia juga fasilitas
yang mendukung dan memadai untuk mahasiswa, yang akan berpengaruh terhadap tingkat
kepuasahan masiswa di universitas Z.

Verified by,

Dr. Yulius Denny Prabowo, S.Kom.,M.T.I (D6806) and sent to Department on


April 10, 2023
Page 5 of 3

Anda mungkin juga menyukai