Anda di halaman 1dari 3

Tugas Kelompok ke-3

Week 8
Jefri Setia Prayoga - 2402004436

Jawablah soal berikut dengan benar!

A. Soal Essay
1. Kapan kita menggunakan analisa kualitatif dan kuantitatif pada proses
pengolahan big data?
Jawab :
Kita menggunakan analisa kuantitatif ketika data yang didapatkan sifatnya
numerik atau dapat dihitung karena berbentuk angka statistik. Data
kuantitatif didapatkan dari kuesioner, angket, atau survei. Karena data
yang didapat dalam bentuk angka, maka teknik analisisnya juga
menggunakan model matematika atau statistik.
Sedangkan analisa kualitatif digunakan ketika data yang didapatkan
berupa data-data non-numerik atau bukan angka. Data kualitatif  
didapatkan dari wawancara dan observasi sehingga data yang didapat
lebih bersifat deskriptif dari suatu fenomena.  

2. Spark mempunyai berbagai macam tools. Sebut dan jelaskan tools


tersebut
Jawab :

• Spark Core: Spark Core menyediakan fungsionalitas umum (seperti


penjadwalan tugas dan input/output), yang digunakan oleh komponen
Spark lainnya. Spark menyediakan abstraksi data yang disebut dataset
terdistribusi tangguh (RDD) yang merupakan kumpulan elemen yang
dipartisi di seluruh node dalam cluster Spark. Elemen RDD dapat
dioperasikan secara paralel dalam cluster. RDD adalah koleksi objek
yang tidak dapat diubah dan didistribusikan.
• Spark Streaming: Spark Streaming adalah komponen Spark untuk
analisis data streaming seperti data sensor, data clickstream, log server
web, dll.
• Spark SQL: Spark SQL adalah komponen Spark yang memungkinkan
kueri data interaktif menggunakan kueri SQL.

COMP6725 - Big Data Technologies


• Spark MLlib: Spark MLlib adalah Spark machine learning library yang
menyediakan implementasi algoritma pembelajaran mesin yang umum
digunakan untuk pengelompokan, klasifikasi, regresi, pemfilteran
kolaboratif, dan pengurangan dimensi.
• Spark GraphX: Spark GraphX adalah komponen untuk melakukan
perhitungan grafik. GraphX menyediakan implementasi algoritma grafik
umum seperti PageRank, komponen terhubung, dan penghitungan
segitiga.

3. Sebut dan Jelaskan apa saja komponen dalam Spark MLlib?


Jawab :
MLib adalah library yang berisi berbagai macam algoritma Machine Learning
yang ditawarkan oleh Spark. MLib menyediakan berbagai function yang dapat
dipanggil untuk melakukan pembelajaran Supervised maupun Un-supervised,
Regression maupun Classification. Library ini dapat memenuhi kebutuhan
analisis untuk melihat pola tersembunyi dari data yang ada, setelah data dari
berbagai sumber didapatkan dan diolah.

4. Apakah keuntungan dan kerugian menggunakan metode Naive Bayes?


Serta bedanya dengan Teorema Bayes?

B. Soal Case
1. Carilah artikel atau jurnal mengenai penggunaan analisis big data, lalu
lakukanlah Analisa mengenai hal tersebut (minimal 3 artikel). Artikel atau
jurnal dapat dicari melalui google scholar. Scopus.com atau media lainnya.

No Judul Penerbit Abstrak Penjelasan


1 Data:
Metode:

Week 8 ©Arif Schlumb 2|3


erger-
Private
Tujuan:
Manfaat:
Analisa:
Hasil:
Saran:

Contoh artikel
1. https://www.sciencedirect.com/science/article/pii/S1389128617302591

Week 8 ©Arif Schlumb 3|3


erger-
Private

Anda mungkin juga menyukai