1. Jenis database NoSQL apa yang membuat dan menjalankan aplikasi yang berjalan
dengan dataset yang selalu terhubung menjadi lebih mudah dan sering digunakan untuk
jaringan media sosial
Grafik.
2. Property big data yang penting, salah satunya adalah falaut tolerance, yaitu
Kemampuan untuk terus beroperasi walaupun terjadi kegagalan pada beberapa
komponen.
3. Pernyataan yang benar mengenai MapReduce adalah
Memperoses data besar secara parallel dalam cluster commodity hardware,
implementaasi dari framework pemerosesan batch, membagi masalah besar
menjadi masalah kecil yang dapat diselesaikan dengan cepat.
4. Terdapat 2 teknologi penyimpanan big data, yaitu
On disk storage devices dan in memory storage devices.
5. Berikut ini yang bukan merupakan Hadoop operation mode adalah
Globally distributed mode.
6. Sistem penyimpanan data cluster adalah
Kumpulan server atau node digabungkan secara erat dengan spesifikasi
perangkat keras yang sama. Serta terhubung melalui jaringan dan bekerja
sebagai salah satu kesatuan.
7. Hadoop adalah platform pemrosesan big data yaitu data yang mempunyai karakteristik
kecuali
Jumlah fitur yang tertentu.
8. Hadoop adalah framework yang
Melibatkan satu atau lebih cluster computer, memungkinkan pemerosesa secara
terdistribusi terhadap data yang berukuran besar, menerapakan programming
model yang sederhana.
9. Database NoSQL menggunakan beragam model data untuk mengakses dan mengelola
data. Jenis database ini dioptimalkan secara khusus untuk aplikasi yang memerlukan…,
yang dicapai dengan mengurangi pembatasan kositensi data dari database lainnya
Volume data besar, latensi rendah dan model data fleksibel.
10. Komponen layanan inti Hadoop
MapReduce, HDFS dan YARN.
11. Property big data yang penting salah satunya adalah aviability, yaitu
Ketersediaan layanan secara terus menerus.
12. Berikut yang dimaksud dengan menganalisa data dalam konteks big data adalah
Descriptive analytics, diagnostic analytics, predictive analytics dan prescriptive
analytics.
13. Type data berikut yang dapat ditangani oleh Hadoop adalah
Tidak terstruktur, semi-terstruktur, terstruktur.
14. Property big data yang penting salah satunya adalah scalability yaitu
Kemampuan menangani penambahan beban yang diberikan tanpa penurunan
kinerja.
15. Property big data yang penting, salah satunya adalah reliability yaitu
Handal
16. Pemerosesan data terdistribusi adalah pemerosesan
Yang menerapakan divide and conquer dalam fisik terpisah, namun terhubung
bersama dalam satu cluster.
17. Hadoop adalah framework yang bekerja bersama tools lain yang beragam. Kelompok
yang umum bekerja bersama Hadoop adalah
MapReduce, MySQL and google apps.
18. YARN singkatan dari
Yet Another Resource Negotiator.
19. Bagian pekerjaan utama MapReduce adalah
Map dan reduce.
20. NoSQL database adalah singkatan dari
Not-only structured query language database.
M4
M5
21. Pernyataan yang tepat terkait data mining and knowledge discovery,
Mengintegrasikan teori dan heuristik
22. Regression, Decision Trees, Bayesian, Neural Networks, Naive Bayes Rules, Support
Vector machines, genetic algorithms adalah pendekatan yang digunakan untuk,
Klasifikasi
23. Metode untuk mempresentasikan hasil yang ditemukan dengan cara yang “bagus” secara
visual,
Visualisasi
24. Karakteristik Big data yang terus bertambah dengan cepat secara real-time dinamakan,
Volume
25. Attributes yang berisi informasi serperti item_ID, name, brand, category, supplier,
place_made and price, merupakan salah satu contoh jenis database,
Penjualan
26. Fungsi dari data mining adalah salah satunya dapat mengetahui pola yang sering ( atau
kumpulan item yang sering) misalnya item apa yang sering dibeli bersama di Walmart
anda, ini dikenal dengan istilah,
Asosiasi dan Analisis Korelasi
27. Pernyataan yang tepat terkait data minig and knowledge discovery,
Fokus pada seluruh proses penemuan pengetahuan
28. Metode untuk memprediksi kelas instace dari instance yang diberi label sebelumnya,
Klasifikasi
29. Pernyataan yang kurang sesuai dengan metode peringkasan,
Mengelompokan data takberlabel
30. Yang bukan metode clusterisasi,
Decision Tree
31. Untuk menghindari set pengujian yang tumpang tindih, data dibagi menjadi k himpunan
bagian dengan ukuran yang sama kemudian setiap subset secara bergantian digunakan
untuk pengujian dan sisanya untuk pelatihan,
K-fold cross-validation
32. Jenis tugas data mining yang melakukan prediksi kelas,
Klasifikasi
33. Jenis tugas data mining yang memfasilitasi penerimaan / penelusuran informasi bagi
pengguna,
Visualisasi
34. Melihat suatu objek data yang tidak sesuai dengan prilaku umum data, sering digunakan
dalam deteksi penipuan atau analisis kejadian langka,
Analisis Outlier
35. Urutan langkah melakukan klasifikasi,
Pisahkan data menjadi set pelatihan dan pengujian, buat model pada set pelatihan,
evaluasi pada set pengujian
36. Metode untuk mengelompokan secara “alami” dari instance yang diberi data tanpa tabel,
Klasterisasi
37. Proses pencarian konten baru dan konten yang perlu diperbaharui dengan megiriman
crawler keseluruh konten yang ditemukan dari tautan halaman merupakan salah satu
konsep data mining pada searcch engine yang dinamakan
Crawl
38. Metode klasifikasi pada fungsi data mining yang menggunkan nilai estimasi dari
probabilits bersyarat dinamakan metode,
Naive Bayessian
39. Seberapa mudah data dapat dipahami merupakan kualitas data dari,
Interpretabillity
40. Acuan yang tidak tepat ketika melakukan pengaturan parameter,
Data pengujian harus digunakan untuk penyetelan parameter
M6
41. Model pembelajaran yang mempelajari bagaimana sistem dapat menyimpulkan suatu
fungsi untuk mendeskripsikan struktur tersembunyi dari data yang tidak berlabel. Sistem
ini tidak memprediksi keluaran yang benar, tetapi mengeksplorasi data dan dapat menarik
ksimpulan dari kumpulan data untuk mendeskripsikan struktur tersembunyi dari data yang
tidak berlabel,
Unsupervised learning
42. Saat anda ingin mengungkap pengelompokan yang melekat dalam data seperti
mengelompokan hewan berdasarkan beberapa karakteristik/fitur mis jumlah kaki maka
model pembelajaran yang sesuai,
Unsupervised learning-clustering
43. Tahapan yang tepat ketika melakukan training,
Image features-training with labeled data –learned model
44. Gambar pada representasi diatas adala pola-pola struktur yang ada pada suatu koleksi data
(knowledge) dalam bentuk,
Pohon
45. Yang tidak digunakan pada Model Supervised learning,
Latent Simantic analysis
46. Model pembelajaran yang menggunakan data berlabel dan tidak berlabel untuk pelatihan,
Semi suprvised learning
47. Tahapan yang tepat ketika melakukan testing,
Image feature – learned model – prediction
48. Pola-pola struktur yang ada pada suatu koleksi data (knowledge) dapat direpresentasi
dalam bentuk if then rules,
Aturan
49. Yang bukan tujuan supervised learning untuk membangun model yang dapat
menghasilkan output yang benar untuk suatu data input dapat digunakan untuk,
Klaterisasi (Clustering)
50. Gambar pada representasi diatas adala pola-pola struktur yang ada pada suatu koleksi data
(knowledge) dalam bentuk,
Aturan
51. Jika variabel keluaran adalah berupa kategori misalnya apel jeruk termasuk pada machine
learning betipe,
Supervised – classification
52. Kumpulan data yang sudah dipastikan kebenarannya dari sis label, data awal, komponen2
data yang akan dijadikan kunci,
Training set
53. Model ini belajar dar kumpulan data berlabel dan kemudian digunakan untuk
memprediksi peristiwa di masa depan,
Supervised learning
54. Ciri – ciri dari masing-masing sample data misalnya smartphone, ciri memiliki,
Feature/ atribute
55. Salah satu teknik digunakan untuk mengkontrol fenomena over-fitting adalah dengan cara
menambah pinalti ke fungsi error
Regularization
56. Gambar pada representasi diatas adala pola-pola struktur yang ada pada suatu koleksi data
(knowledge) dalam bentuk,
Tabel
57. Sebuah proses yang mempersiapkan data sehingga data tersebut bisa kita extract menjadi
satu vektor,
Feature Extraction
58. Pembelajaran yang bertujuan memprediksi output dengan akurat untuk data baru dan
output ti bernilai kontinu rill, contoh untuk prediksi kerja CPU,
Regresi
59. Pembelajaran yang menghasilkan nilai output ti bernilai diskrit kelas,
Klasifikasi
60. Tujuan pembelajaran unsupervised adalah membangun model yang dapat menemukan
komponen/ variable / fitur tersembunyi pada data pelatihan, yang dapat digunakan untuk
hal berikut, kecuali,
Pengklasifikasian (Clasifcation)
M7
61. Algoritma yang paling banyak digunakan untuk task Association rules,
Apriori
62. Algoritma yang berusaha meemukan pola tersembunyi atau pengelompokan data tanpa
perlu campur tangan manusia,
Unsupervised Learning
63. Pendekatan reduksi dimensi lain yang memfaktorkan matriks A menjadi 3 matriks
perngkat rendah SDV dilambangkan dengan rumus A = USTV,
Autoencoders
64. Pembelajaran mesin tanpa pengawasan menggunakan algoritma pembelajaran mesin
untuk menganalsis dan mengelompokan set data tak berlabel,
Unspervised Learning
65. Yang bukan tugas dari pembelajaran tanpa pengawasan,
Regression
66. Algoritma yang bukan digunakan untuk pengelompokan (clustering),
Auto Encoder
67. Metode berbasis aturan untuk menemukan hubungan antara variabel dalam kumpulan data
tertentu, metode ini sering digunakan untuk nalisisi keranjang pasar, memungkinkan
perusahaan untuk lebih memahami hubungan antara produk yang berbeda,
Association
68. Teknik yang mengelompokan data yang tidak berlabel berdasarkan persamaan atau
perbedaannya. Algoritma ini digunakan untuk memproses objek data mentah dan tidak
terklaifikasi menjadi grup yang diwakili,
Clustering
69. Algoritma yang menggunakan pohon hash untuk menghitung kumpulan item, menavigasi
kumpulan data dengan cara yang pertama. Algorutma ini telah dipopulerkan melalui
analisisi keranjang pasar, yang mengarah ke mesin rekomendasi berbeda .
Apriori
70. Pengelompokan yang sebagai pendekatan bottom up dimana titik datanya diisolasi sebagai
pengelompokan terpisah pada awalnya, dan kemudian digabungkan bersama secara
iteratif atas dasar kesamaan hingga satu cluster tercapai,
Pendekatan Aglomeratif
71. Teknik yang digunakan ketika jumlah fitur, atau dimensi, dalam kumpulan data tertentu
terlalu tinggi. Teknik ini mengurangi jumlah input data ke ukuran yang dapat dikelola
sambil juga menjaga integritas set,
Dimensionality reduction
72. Algoritma yang menggunakan pohon hash untuk menghitung kumpulan item, menavigasi
kumpulan data dengan cara yang pertama. Algorutma ini telah dipopulerkan melalui
analisisi keranjang pasar, yang mengarah ke mesin rekomendasi berbeda, ini termasuk
kedalam task,
Association
73. Kemampuan untuk menemukan persamaan dan perbedaan informasi menjadikan
unsupervised learning sebagai solusi ideal tugas di bawah ini, kecuali.
Klasifikasi buah jeruk dan apel
74. Pendekatan unsupervised learning adalah,
Mempelajari bagaimana cara kerja pembelajaran tanpa pengawasan
75. Pengelompokan yang mengambil pendekatan top down dalam hal ini, satu cluster data
dibagi berdasarkan perbedaan antara titik data. Pengelompokan dengan cara ini tidak
umum digunakan,tetapi masih perlu diperhatikan........pemisahan titik data pada setiap
iterasi,
Pendekatan Divisive
76. Teknik yang memanfaatkan jaringan neural untuk mengompresi data dan kemudian
membuat ulang represetsi baru dari input data asli, terdapat lapisan tersembunyi seacara
khussus bertindak sebagai penghambat......di dalam lapisan keluaran,
Autoencoders
77. Salah satu bentuk pengelompokan yang memungkinkan titik data menjadi bagian dari
beberapa kluster dengan derajat keanggotaan terpisah ini disebut juga pengeompokan
lembut atau fuzzy k means,
Tumpang tindih (overlapping)
78. Salah satu bentuk pengelompokan yang enetapkan bahwa suatu titik data hanya dapat ada
dalam satu cluster. Ini juga bisa disebut sebagai pengelompokan keras . Algoritm yang
digunakan salah satunya adalah k means clustering,
Clustering Eksekutif (Specifically exlusive)
79. Jenis algoritma pengurangan dimensi yang digunakan untuk mrngurangi redundansi dan
mengompresi kumpulan data melalui ekstrasi fitur. Unuk transformasi linier.....arah
ortogonal ke komponen sebelumnya dengan varians terbanyak,
Primcipal component analysis
80. Teknik tanpa pengawasan yang membantu menyelesaikan estimasi kepadatan atau
masalah pengelompokan lunak......teknik yang paling umum digunakan adalah GMM,
Pendekatan Probabilistic
M8
81. Reinforcement learning tepat digunakan untuk menyelesaikan permasalahan utama dalam,
Permainan catur
82. Berikut ini merupakan contoh permasalahan yang dapat diselesaikan dengan
reinforcement learning,
Sistem percakapan, self driving car, bermain game,
83. Markov Decision Process dapat didefinisikan kedalam n tuple, dimana bernilai,
5
84. Efek dari suatu aksi yang dipilih dari suatu state yang bergantung hanya pada state
tersebut saja bukan pada state2 sbelumnya dikenal dengan sifat,
Markov
M9
101. Untuk memperbanyak feature yang berhasil diekstrak dalam alogaritma convolutional
neural network digunakan
Padding
102. Dalam alogaritma convolutional neural network, ReLU seringkali digunakan pada
Hidden layer
103. Berikut ini adalah teknik yang dapat digunakan pada pooling layer dalam alogaritma
convolutional neural network
Max pooling, average pooling, min pooling
104. Untuk menyelesaikan permasalahan klasifikasi biner menggunakan alogaritma berbasis
neural network lebih tepat digunakan fungsi aktivasi
ReLU
105. Sebuah citra berdimensi5x5 dengan filter 3x3 dan stide sebesar 2 akna menghasilkan
feature map berdimensi
4x4
106. Pooling layer pada alogaritma convolutional neural network terdapat pada
Hidden layer
107. Berikut ini merupakan contoh Algoritma Deep Learning,
alogaritma recurrent neural network, Algoritma long short term memory, alogaritma
convolutional neural network
108. Berikut ini adalah efek dari mengecilnya nilai stride dalam alogaritma convolutional
neural network,
Informasi yang diperoleh semakin detail
109. Dimensi dari feature map dalam alogaritma convolutional neural network bergantung
pada,
Padding, stride, dimensi filter dan input
110. Untuk mencegah terjadinya overfitting dalam alogaritma convolutional neural network
dilakukan,
Dropout regulazion
111. Berikut ini merupakan library phyton untuk algoritma deep learning,
Pytorch, keras, tensorflow
112. Pooling layer bertujuan untuk,
Mengurangi dimensi feature map, mempercepat prosess komputasi, mengatasi
overfiting
113. Algoritma deep learning berbasis,
Machine learnng, artificial intelligence, neural network
114. Berikut ini merupakan loss function dalam alogaritma berbasis neural network ,
Cross entropy
115. Parameter dalam alogaritma convolutional neural network yang menentukan berapa
jumlah pergeseran filter disebut sebagai,
Stride
116. Berikut ini merupakan fungsi aktivasi dalam alogaritma convolutional neural network,
Sigmoid, ReLU, tanh
117. Algoritma deep learning dapat menyelesaikan permasalahan berikut ini,
Deteksi objek, natural language processing, pengenalan suara
118. Tahapan feature extraction pada alogaritma convolutional neural network terdiri dari
beberapa lapisan (layer) berikut ini, kecuali,
Fully – connected layer
119. Salah satu ukuran dari confusion matrix yang dapat digunakan dalam mengukur tingkat
keberhasilan sistem dalam mengukur tingkat keberhasilan sistem dalam menemukan
kembali sebuah informasi adalah,
Recall
120. Hasil dari proses flatten pada alogaritma convolutional neural network menjadi masukan
dalam,
Fully – connected layer
1. Semakin banyak data hingga dapat melebihi terabyte merupakan penjelasan dari dimensi
big data dalam hal,
➢ Volume
2. Data Mobile positioning data MPD berupa,
➢ Lokasi, waktu, sumber sinyal
3. Proses menganalisa tulisan untuk menentukan nada emosional penulisnya merupakan
salah satu implementasi machine learning dalam,
➢ Sentiment Analysis
4. Visualisasi pada hasil analisis big data dapat disajikan dalam bentuk,
➢ Plot, Grafik 3D, table
5. Dataset dibentuk dari,
➢ Sekumpulan objek yang memiliki fitur yang sama
6. Contok aplikasi machine learning dan analitik prediktif,
➢ Penetapan harga barang, prediksi cashflow, prediksi harga saham
7. Data wherehouse dibuat dengan menerapkan serangkaian Langkah pemrosesan terhadap
data yang berasal dari beberapa basis data. Berikut ini adalah yang termasuk dalam
pemrosesan data tersebut.
➢ Transformasi data, integrasi data, data preparation
8. Social media termasuk dalam sumber data,
➢ Digital content
9. Keuntungan menggunakan mobile positioning data MDP adalah,
➢ Automatics counting, me-record visitor outsite immigration point, continues
counting
10. Metode untuk memprediksi kelas instance yang diberi label,
➢ Klasifikasi
11. Cara yang dapat dilakukan untuk meningkatkan analisis bigdata gemone bioinformatics
adalah,
➢ Pemanfaatan cloud computing, meningkatkan kecepatan prosesor, penerapan
teknologi GPU
12. Pilihan yang dapat menciptakan hasil yang paling optimal merupakan pendekatan analitik
dari,
➢ Preskriptif
13. Beragamnya jenis data di dalam big data yang meliputi data terstruktur, semi terstruktur
dan tidak terstruktur, merupakan dimensi big data dalam hal,
➢ Variety
14. Manakah yang benar dari pernyataan berikut ini,
➢ Prediktif, memperkirakan kenaikan harga emas
15. Karakteristik big data yang cepat sekali berubah baik dari sisi variable maupun tipe data
dinamakan,
➢ Velocity
16. Contoh solusi big data, kecuali
➢ Deteksi penipuaan, mesin rekomendasi, pendeteksi spam
17. Tools Bahasa pemrograman yang dapat digunakan dalam ilmu data science adalah,
➢ SQL, Python, R
18. Data yang dikumpulkan secara aktif dari sensor, misalnya melalui penginderaan jauh dan
gambar satelit merupakan sumber big data dalam hal,
➢ Sensing data
19. Salah satu library data science yang digunakan untuk pemrosesan sinyal, gambar, dan
rumus statistik, adalah,
➢ Scipy, GPText, OpenNPL
20. Berapa banyak spark context yang dapat aktif per java virtual machine,
➢ Semua salah (hanya 1, Tidak spesifik, lebih dri 1)
21. Berikut ini yang bukan merupakan fungsi dari spark context,
➢ Untuk mengatur konfigurasi
22. Spark dapat menjalankan…tugas pada setiap partisi,
➢ Banyak
23. Toleransi kesalahan pada resillent distributed data RDD dicapai menggunakan,
➢ Direct acyclic graph
24. Berikut ini yang bukan operasi action pada resillent distributed data adalah,
➢ Map
25. Apache spark berpotensi…lebih cepat untuk menjalankan program pemrosesan batch
didalam memori jika dibandingkan dengan Mapreduce,
➢ 100 kali
26. Manajemen memori dalam spark dikerjakan oleh,
➢ Spark core
27. Apache spark pertama kali diluncurkan open source pada tahun,
➢ 2010
28. API Machine Learning yang utama untuk spark saat ini adalah APi berbasis,
➢ Dataframe
29. Komponen berikut ini yang tidak terdapat diatas spark core adalah
➢ Spark RDD
30. Pernyataan berikut ini yang salah mengenai spark dan Hadoop adalah,
➢ Keduanya merupakan mesin komputasi cluster
31. Spark ditulis dalam Bahasa pemrograman,
➢ Scala (R, Python)
32. Berikut ini adalah beberapa manfaat penggunaan spark, kecuali
➢ Otomatis dalam mengoptimalkan kode program
33. Berikut ini yang bukan merupakan karakteristik dari apache spark adalah,
➢ Hanya dapat dijalankan pada hadoop YARN
34. Modul untuk memproses data terstruktur dalam spark adalah,
➢ Spark SQL
35. Berikut ini adalah pernyataan yang salah mengenai resillent distributed data RDD,
kecuali,
➢ RDD dalam apache spark adalah suatu kumpulan objek yang tidak dapat
berubah
36. Spark SQL menerjemahkan perintah kedalam bentuk kode yang diproses oleh,
➢ Executor nodes
37. Berikut ini yang bukan operasi transformasi pada RDD adalah,
➢ Filter
38. Spark lebih cepat dibandingkan dengan mapreduce karena,
➢ Didukung oleh api Bahasa pemrograman yang berbeda-beda
39. Cluster manager yang dapat digunakan pada spark adalah,
➢ Standalone scheduler, YARN, Mesos
40. Algoritma untuk mengukur seberapa pentingnya halaman situs web,
➢ Page rank
41. Fitur spark streaming,
➢ Pemulihan cepat dari kegagalan dan kekeliruan
42. Aliran data yang berkelanjutan dalam spark streaming disebut,
➢ Dstream
43. Alogritma untuk menemukan komponen terhubung dari suatu graf,
➢ Connected components
44. Urutan edge yeng memungkinkan anda berpindah dari vertex A ke vertex B disebut,
➢ Path
45. Yang diperlukan untuk menangani data besar dalam bentuk grafik,
➢ Analisis data grafik, visualisasi data grafik, database grafik
46. Contoh penggunaan spark streaming,
➢ Netflix, deteksi penipuan, uber
47. Manakah urutan yang benar untuk menjelaskan cara kerja spark streaming
1. Input data stream
2. Batch input data
3. Hasilnya adalah batch data yang telah
4. Oleh spark streaming data dibagi menjadi kumpulan
➢ 1-4-2-3
48. Contoh use case penggunaan spark graphx,
➢ Film baru yang paling direkomendasikan orang-orang 1 minggu terakhir,
orang2 mensitasi artikel, teman toni di facebook paling banyak
49. Langkah pipa pemrosesan data grafik
1. Pembuatan grafik
2. Pengolahan pasca
3. Pra pemrosesan data
4. Analisis
➢ 3-1-4-2
50. Pernyataan yang benar tentang apache spark, kecuali,
➢ Abstraksi memori terditribusi untuk komputasi dalam memori pada kluster
51. Contoh data base grafik
➢ Noe4j
52. Untuk menampilkan pola dibalik hubungan antara entitas data,
➢ Visualisasi grafik
53. Fitur spark graphx,
➢ Kecepatan, Pustaka algoritma, fleksibilitas
54. Algoritma untuk menentukan jumlah segitiga yang mewati setiap simpul dalam graf,
➢ Triangle count
55. Framework yang dapat digunakan untuk memproses data grafik dan menjalankan analisis
prediktif pada data,
➢ Spark graphX
56. Pernyataan yang benar spark streaming,
➢ Memproses menggunakan algoritma kompleks, dapat menyerap data, daya
yang diproses dapat dikirim ke system file
57. Pernyataan yang benar tentang graph,
➢ Graph terdiri dari simpul dan sisi, semua yang ada di facebook adalah contoh,
edge menunjukan relasi
58. Apa yang menyebabkan spark streaming memiliki toleransi kesalahan,
➢ Kumpulan data input direplikasi dalam memori
59. Operasi jendela membutuhkan parameter
➢ Window length
60. CUDA yang diciptakan Nvidia adalah singkatan dari,
➢ Compute Unifed Device Architecture
61. Tiga tahap alur pemrosesan dalam eksekusi program CUDA,
➢ Langkah ke-1 : Salin input data dari CPU memory ke GPU memory, Langkah 2
: Muat program GPU dan eksekusi caching, Langkah 3 : salin hasil dari GPU
memory ke CPU memory
62. Architecture CUDA menerapkan pendekatan berupa kumpulan streaming multiprocessor
SM yang,
➢ Mengeksekusi sejumlah intruksi yang sama pda beberapa thread pada berbagai
wilayah data, sehingga dikenal dengan istilah single instruction, multiple threads
SIMT
63. Komputasi parallel adalah komputasi yang,
➢ Melibatkan banyak kalkulasi atau pemrosesan yang dilaksanakan secara
serentak simultan, dimana masalah besar dibagi dalam beberapa masalah kecil
yang kemudian diselesaikan dalam waktu yang sama.
64. Tujuan utama dari pemrograman parallel adalah untuk meningkatkan performa
komputasi, performa dalam pemrograman parallel diukur dari,
➢ Berapa banyak peningkatan kecepatan yang diperoleh dalam menggunakan
Teknik parallel.
65. CUDA C++ adalah perluasan C++ sehingga programmer dapat mendefinisikan fungsi
C++, yang Ketika dipanggil akan dieksekusi sebanyak N kali secara parallel oleh N
CUDA thread yang berbeda. Fungsi ini dikenal dengan istilah,
➢ Kernel
66. Kernel pada pemrograman CUDA agar dieksekusi paada device, dideklarasi
menggunakan
➢ _global_
67. Sistem distribusi (distributed computing) adalah Teknik komputasi parallel dimana
➢ Komputer yang digunakan secara bersamaan dalam melakukan komputasi
dilakukan oleh komputer-komputer terpisah yang terhubung
68. Perintah kernel <<N,M>>(..) menunjukan device untuk,
➢ Mempersiapkan block sebanyak N dengan thread sebanyak M ditiap block
69. Istilah thread pada GPU adalah,
➢ Satuan matrik untuk pemrosesan parallel pada GPU
70. Dua kata istilah penting yang digunakan dalam CUDA, yaitu: host, dan device. Istilah
host pada CUDA mengacu pada
➢ CPU
71. Dua kata istilah penting yang digunakan dalam CUDA, yaitu: host, dan device. Istilah
device pada CUDA mengacu pada,
➢ GPU
72. GPU dalam teknologi komputasi adalah singkatan dari,
➢ Graphics processing Unit
73. Pengelolaan memori pada device pada dasarnya menggunakan,
➢ cudaMalloC(), cudaMemcpy(), cudaFree()
74. Pernyataan yang benar mengenai thread block pada GPu,
➢ Thread block terdiri dari beberapa thread, dan beberapa thread block
digabung dalam satu grid
75. CUDA adalah platform komputasi parallel dengan arsitektur komputasi masuk dalam,
➢ Heterogenous karena melibatkan CPU dan GPU
76. Pernyataan yang benar mengenai pemrograman parallel pada GPU,
➢ Adalah salah satu cara untuk mempercepat pemrosesan untuk komputasi yang
besar
77. Pernyataan berikut yang benar mengenai CUda,
➢ Cuda adalah suatu platform untuk komputasi parallel, dan memanfaatkan
GPU untuk komputasi
78. CPU dari suatu unit computer adalah singkatan
➢ Central processing unit
79. Perintah kernel <<N,M>> menunjukan device untuk,
➢ Mempersiapkan block sebanyak N dengan thread sebanyak M di tiap block
80. Bahasa pemrograman phyton tergolong cepat karena,
➢ Bahasa pemrograman tingkat tinggi, dapat diinterpretasikan, dapat dikodekan
secara dinamis
81. Bahasa pemrograman pyhton tergolong lambat untuk eksekusi,
➢ Tugas yang berulang dan tergolong tinggat rendah
82. Modul kompilasi tepat waktu pada Pyhton untuk CPU adalah,
➢ Numba
83. Berikut ini adalah urutan proses yang dijalankan oleh numba,
➢ Rewrite IR, Lowering, LLVM IR, LLVM/NVVM JIT
84. Banyaknya operasi-operasi kecil yang berulang merupakan salah satu penyebab Bahasa
pemrogram python,
➢ Tergolong lambat
85. Berikut ini pernyataan yang tepat tentang python adalah,
➢ Python tergolong cepat untuk pengembangan, Python tergolong lambat untuk
eksekusi
86. Elemen dalam RRD dikelompokan kedalam beberapa partisi dan hanya dapat disimpan
pada sebuah node yang berbeda merupakan konsep RDD dalam hal,
➢ Distributed
87. Numba dapat menangani,
➢ Alokasi data dari dan ke host jika diperlukan, penyalinan data dari dan ke host
88. Komputasi pada GPU cluster dapat menggunakan,
➢ Numba, Pyspark
89. Berikut ini yang salah terkait dengan numba adalah,
➢ Semua Salah, Bersama dengan spark dapat menjalankan kode program pada spark
workers dengan GPU
90. Bahasa pemrograman Python tergolong cepat digunakan untuk,
➢ Menulis, Menguji, Mengembangkan kode program
91. Apache spark bukan merupakan,
➢ (Semua Salah) Suatu mesin untuk mengeksekusi komputasi terdistribusi pada
suatu klaster, suatu application programming interface
92. Spark diimplementasikan dalam,
➢ Scala dan java
93. Berikut ini adalah komputasi primitive yang tersedia pada spark untuk melakukan
paralelisme dan meminimumkan komunikasi antar workers
➢ Map ,Filter, Reduce
94. Berikut ini yang benar terkait dengan numba, kecuali
➢ Open source, kode dapat dibangkkitkan dengan LLVM CPU, dapat
menterjemahkan sintak Piton ke kode mesin, diimplementasikan sebagai suatu
modul
95. Modul kompilasi tepat waktu pada pyhton untuk GPU adalah,
➢ Cuda
96. Api spark memiliki dukungan yang terbatas pada Bahasa pemrograman,
➢ R
97. Permasalahan alokasi memori dalam komputasi pada GPU terdapat pada tugas yang
berskala
➢ Kecil
98. Type interface pada proses numba memerlukan
➢ Functions argument, numba IR
99. Pemrograman terdistribusi dalam python adalah,
➢ Numba atau Pyspark
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 10: Penerapan Big Data di Sektor Perbankan (M12) /
Kuis M12: Penerapan Big Data di Sektor Perbankan
b. Data Identification
Question 2 Proses di mana data mentah dikumpulkan dan diekspresikan dalam bentuk ringkasan untuk analisis statistik.
Correct
b. Data Identification
Question 3 Proses memilih dan mengambil data dari satu atau beberapa sumber:
Correct
b. Data Extraction
d. Data Identification
d. Semua benar
Question 5 Pencarian informasi terkait tipe data, struktur data, bentuk data, dan isi serta sumber data:
Correct
c. Data Identification
b. Business Case Evaluation - Data Identification - Data Extraction - Data Validation & Cleansing - Data
Aggregation & Representation - Data Analysis - Data Visualization - Utilization of Analysis Results
c. Busines Case Evaluation - Data Identification - Data Acquisition & Filtering - Data Extraction - Data Validation
& Cleansing - Data Analysis - Data Visualization - Utilization of Analysis Results
d. Busines Case Evaluation - Data Identification - Data Acquisition & Filtering - Data Extraction - Data Validation
& Cleansing - Data Aggregation & Representation - Data Analysis - Utilization of Analysis Results
c. Di dalamnya tersimpan data nasabah serta semua transaksi sejak nasabah membuka rekening di bank sampai
menutupnya.
Question 8 Perbedaan Data Tradisional dan Big Data pada komponen Data Model:
Incorrect
c. Semua benar
d. Centralized vs Distributed
b. MySQL Server
c. IBM AS-400
d. MS SQL Server
Question 10 Perbedaan Data Tradisional dan Big Data pada komponen Data relationship:
Correct
d. Semua benar
b. Hadoop
c. Tableau
d. Facebook
b. Hadoop
c. Facebook
d. Kafka
d. Kebenaran data
Question 15 Perbedaan Data Tradisional dan Big Data pada komponen Arsitektur:
Correct
d. Centralized vs Distributed
Question 16 Keuntungan Big Data di perbankan:
Correct
b. Menanalisis resiko
c. Mendorong inklusivitas
d. Semua benar
Question 17 Aplikasi Core Banking System untuk memfasilitasi nasabah agar dapat melakukan transaksi sendiri:
Correct
b. Komunikasi
c. Media
d. Sensor
c. Unstructured data
d. Data terstruktur
b. Semua salah
◄ Materi M12: Penerapan Big Data di Kuis M12: Penerapan Big Data di Sektor
Jump to...
Sektor Perbankan Perbankan (Kelas Malam) ►
3/8/2021 Kuis M1 : Big Data Computing Overview: Attempt review
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING / Pertemuan 1 : Big Data Computing Overview
/ Kuis M1 : Big Data Computing Overview
Question 1 Beragamnya jenis data di dalam Big Data yang meliputi data terstruktur, semi terstruktur dan bahkan data tidak
Correct terstruktur, merupakan penjelasan dari dimensi Big Data dalam hal:
Mark 5.00 out of
5.00 Select one:
Velocity
Volume
Variety
Veracity
Semua benar
Deteksi Penipuan
Question 3 Dalam arsitektur Big Data, solusi berupa rekomendasi, berada pada posisi sebagai:
Correct
Data Format
End Result
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2403724&cmid=491419 1/6
3/8/2021 Kuis M1 : Big Data Computing Overview: Attempt review
Question 4 Dalam ekosistem Big Data, proses pre-prosesing data dapat dilakukan menggunakan:
Correct
Sqoop
Tableu
Question 5 Data Warehouse dibuat dengan menerapkan serangkaian langkah pemrosesan terhadap data yang berasal dari beberapa
Incorrect basis data. Berikut ini adalah yang termasuk dalam pemrosesan data tersebut:
Mark 0.00 out of
5.00 Select one:
Pembersihan data
Semua benar
Integrasi data
Transformasi data
The correct answer is: Sekumpulan objek yang memiliki fitur yang sama
Semua benar
Resource Layer
Interface Layer
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2403724&cmid=491419 2/6
3/8/2021 Kuis M1 : Big Data Computing Overview: Attempt review
Question 8 Kumpulan data yang disusun dalam tabel berformat persegi panjang yang terdiri dari baris dan kolom disebut sebagai:
Correct
Data Warehouse
Database
Flat files
The correct answer is: Memperkirakan puncak dari kasus positif Covid-19, adalah contoh analisis prediktif.
Question 10 Model basis data yang berupa deret waktu (time series):
Correct
Text database
Semua salah
Spatial database
Unit
Data points
Record
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2403724&cmid=491419 3/6
3/8/2021 Kuis M1 : Big Data Computing Overview: Attempt review
Semua benar
Question 13 Sekumpulan tabel dimana bentuk setiap tabel analog dengan flat file, disebut:
Correct
Data Warehouse
DBMS
Database
Question 14 Semakin banyak data hingga mencapai ukuran Peta Byte atau bahkan lebih, merupakan penjelasan dari dimensi Big Data
Correct dalam hal:
Mark 5.00 out of
5.00 Select one:
Variety
Volume
Velocity
Veracity
Question 15 Sumber data yang digunakan dalam aplikasi Big Data dapat berupa:
Correct
Data Finansial
Semua benar
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2403724&cmid=491419 4/6
3/8/2021 Kuis M1 : Big Data Computing Overview: Attempt review
Question 16 Tempat penyimpanan data yang dikumpulkan di lokasi berbeda (basis data relasional) dan disimpan menggunakan skema
Correct terpadu:
Mark 5.00 out of
5.00 Select one:
Data Warehouse
Transactional database
Semua benar
Spatial Database
Fitur
Semua salah
Numerik
Dataset
Nilai
Objek
Tabel
Grafik 3D
Plot
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2403724&cmid=491419 5/6
3/8/2021 Kuis M1 : Big Data Computing Overview: Attempt review
Amazon ML
Semua benar
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2403724&cmid=491419 6/6
3/15/2021 1 pesan baru
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING
/ Pertemuan 2 : Big Data Computing, Applications and Technologies / Kuis M2 : Big Data Computing, Applications and Technologies
The correct answer is: Storage layer, Resource Management Layer, Application Layer
Question 2 Berikut ini adalah saran untuk memasuki era Analytic 3.0:
Correct
c. Semua benar
Question 3 Berikut ini yang harus dilakukan oleh perusahaan 1.0, kecuali:
Correct
The correct answer is: Membuat analitik dan keputusan berbasis fakta elemen kunci dari hubungan pelanggan, produk
dan layanan, strategi, dan persaingan
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2476785&cmid=491949 1/6
3/15/2021 1 pesan baru
b. Semua benar
d. Prediksi Cashflow
c. Data pegawai
d. Semua benar
b. Procter & Gamble melakukan Analisis sentimen media sosial real time untuk "Pulsa Konsumen"
c. Semua benar
d. Monsanto membayar hampir $ 1 miliar untuk The Climate Company, yang mengumpulkan dan menganalisis data
cuaca untuk pertanian
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2476785&cmid=491949 2/6
3/15/2021 1 pesan baru
Question 8 Dalam computer vision, contoh penerapan Machine Learning adalah, kecuali:
Correct
b. Pengenalan wajah
d. Pengenalan objek
Question 9 Istilah 'Machine Learning' diciptakan pada tahun <T> oleh <P>:
Correct
b. HDFS
c. Semua benar
d. MapReduce
b. MapReduce
c. YARN
d. HDFS
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2476785&cmid=491949 3/6
3/15/2021 1 pesan baru
d. Sumber data dari internal, relatif kecil dan data terstruktur dari pelanggan
The correct answer is: Perpaduan antara analitik tradisional dengan Big Data
d. Semua benar
The correct answer is: Hadoop merupakan framework untuk bekerja dengan Big Data
b. Semua benar
c. 2.0
d. 3.0
b. Relational vs Non-Relational
c. Semua benar
d. Static vs Dynamic
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2476785&cmid=491949 4/6
3/15/2021 1 pesan baru
b. Mahal vs Terjangkau
d. Semua benar
b. Graph
c. Key-Value
d. Semua benar
Question 18 Salah satu fakta yang menunjukkan aspek Velocity dari Big Data:
Correct
b. Semua benar
c. Mobil modern memiliki 100 sensor yang memantau berbagai item pada mobil
The correct answer is: Mobil modern memiliki 100 sensor yang memantau berbagai item pada mobil
Question 19 Salah satu tonggak penting dalam Big Data Analytic dalam aspek pengadaan infrastruktur:
Correct
b. Dapatkan infrastruktur yang tepat yang dibutuhkan berdasarkan arsitektur solusi Anda termasuk penyimpanan
data dan unit pemrosesan, platform, dan aplikasi
c. Adaptasi dan ubah organisasi Anda menuju teknologi big data dan implementasi analitik baru
d. Kembangkan arsitektur Solusi untuk kasus bisnis Anda termasuk proses pengumpulan data, arsitektur teknologi
dan metode analitik serta visualisasi data
The correct answer is: Dapatkan infrastruktur yang tepat yang dibutuhkan berdasarkan arsitektur solusi Anda termasuk
penyimpanan data dan unit pemrosesan, platform, dan aplikasi
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2476785&cmid=491949 5/6
3/15/2021 1 pesan baru
d. Keduanya salah
The correct answer is: Ketergantungan yang tinggi pada Machine Learning
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2476785&cmid=491949 6/6
3/22/2021 Kuis M3 : Introduction to Hadoop: Attempt review
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING / Pertemuan 3 : Introduction to Apache Hadoop
/ Kuis M3 : Introduction to Hadoop
Question 1 Jenis database NoSQL apa yang membuat dan menjalankan aplikasi yang berjalan dengan dataset yang selalu terhubung
Correct menjadi lebih mudah dan sering digunakan untuk jaringan media sosial.
Mark 5.00 out of
5.00 Select one:
a. Primary key
b. Grafik
c. Dokumen
d. Pencarian
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2564953&cmid=499213 1/6
3/22/2021 Kuis M3 : Introduction to Hadoop: Attempt review
Question 4 Database NoSQL menggunakan beragam model data untuk mengakses dan mengelola data. Jenis database ini
Incorrect dioptimalkan secara khusus untuk aplikasi yang memerlukan…., yang dicapai dengan mengurangi pembatasan konsistensi
Mark 0.00 out of data dari database lainnya.
5.00
Select one:
a. volume data besar, latensi rendah, dan model data fleksibel
The correct answer is: volume data besar, latensi rendah, dan model data fleksibel
Question 5 Type data berikut yang dapat ditangani oleh Hadoop adalah
Correct
b. Semi – terstruktur
c. Terstruktur
d. Semua benar
b. semua benar
d. membagi masalah besar menjadi masalah kecil yang dapat diselesaikan dengan cepat
b. Data disimpan dengan cara menyalin dataset dan meyimpan Salinan tersebut pada beberapa node
c. Penyimpanan dan pengaturan data pada perangkat penyimpanan harddisk atau flashdisk, dan menyediakan logical
view dari data yang disimpan dalam struktur hirakis direktori file.
d. Kumpulan server atau node digabungkan secara erat, dengan spesifikasi perangkat keras yang sama. Serta
terhubung melalui jaringan dan bekerja sebagai satu kesatuan
The correct answer is: Kumpulan server atau node digabungkan secara erat, dengan spesifikasi perangkat keras yang
sama. Serta terhubung melalui jaringan dan bekerja sebagai satu kesatuan
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2564953&cmid=499213 2/6
3/22/2021 Kuis M3 : Introduction to Hadoop: Attempt review
The correct answer is: On Disk Storage Devices dan In Memory Storage Devices
Question 9 Berikut yang dimaksud dengan menganalisa data dalam konteks big data adalah:
Correct
The correct answer is: Descriptive analytics, diagnostic analytics, predictive analytics, dan prescriptive analytics
Question 10 Berikut ini yang bukan merupakan Hadoop operation mode, adalah
Correct
c. Fully-Distributed mode
Question 11 Properti Big data yang penting, salah satunya adalah scalability, yaitu:
Correct
c. Handal
d. Kemampuan untuk terus beroperasi walaupun terjadi kegagalan pada beberapa komponen
The correct answer is: Kemampuan menanganai penambahan bebab yang diberikan tanpa penurunan kinerja
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2564953&cmid=499213 3/6
3/22/2021 Kuis M3 : Introduction to Hadoop: Attempt review
b. Semua benar
Question 13 Hadoop adalah platform pemrosesan big data yaitu data yang mempunyai karakteristik kecuali:
Correct
d. Volume besar, struktur data yang beragam (variety), dan nilai data yang diperlukan (useful value)
Question 14 Properti Big data yang penting, salah satunya adalah reliability, yaitu:
Correct
c. Handal
Question 15 Properti Big data yang penting, salah satunya adalah fault tolerance, yaitu:
Correct
c. Handal
The correct answer is: Kemampuan untuk terus beroperasi walaupun terjadi kegagalan pada beberapa komponen
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2564953&cmid=499213 4/6
3/22/2021 Kuis M3 : Introduction to Hadoop: Attempt review
Question 17 Hadoop adalah framework yang bekerja bersama tools lain yang beragam. Kelompok yang umum bekerja bersama
Correct Hadoop adalah
Mark 5.00 out of
5.00 Select one:
a. MapReduce, Hummer and Iguana
b. yang menerapkan divide and conquer dalam fisik terpisah, namun terhunung Bersama dalam satu cluster
c. yang melibatkan pelaksanaan sub-tugas secara bersamaan secara kolektif membentuk tugas yang besar melalui
beberapa processor
The correct answer is: yang menerapkan divide and conquer dalam fisik terpisah, namun terhunung Bersama dalam satu
cluster
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2564953&cmid=499213 5/6
3/22/2021 Kuis M3 : Introduction to Hadoop: Attempt review
Question 20 Properti Big data yang penting, salah satunya adalah aviability, yaitu:
Correct
b. Handal
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2564953&cmid=499213 6/6
3/29/2021 1 pesan baru
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING / Pertemuan 4 : Data Preprocessing
/ Kuis M4 : Data Preprocessing
Dibiarkan
Record
Instance
Sample
Combined Computer
Ignore
Clustering
Question 4 Data berupa image, video bahkan suara termasuk jenis data
Correct
Ordered
Graf
Multimedia
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2645316&cmid=502729 1/4
3/29/2021 1 pesan baru
Question 6 Data Cleansing merupakan tahapan untuk membersihkan data kotor sehingga menjadi dataset yang siap diolah. Data
Correct kotor tersebut berupa
Mark 5.00 out of
5.00 Select one:
missing value
duplicate data
outlier
A,B,C benar
Question 7 Data-data yang saling berhubungan, yang biasanya ditemukan pada jaringan internet termasuk dalam jenis data
Correct
Graf
Record
Ordered
Question 8 Imputasi nilai secara otomatis saat menangani incomplete data tidak dapat dilakukan menggunakan
Correct
Nilai tertinggi
Rata-rata
Median
Ordinal
Nominal
Rasio
Data objek
Data sample
Atribut
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2645316&cmid=502729 2/4
3/29/2021 1 pesan baru
Question 11 Nilai yang merepresentasikan urutan seperti nilai mata kuliah termasuk dalam atribut data type..
Correct
Ordinal
Numerik
Nominal
data Integration
data cleaning
data reduction
Question 13 Penanganan missing value dapat dilakukan menggunakan nilai estimasi dari probabilitas bersyarat menggunakan metode
Correct
Mean
Bayessian
Regresi
Question 14 Salah satu jenis data record yang diekstrak menjadi kumpulan term dan ditulis berdasarkan frekuensi kemunculan data,
Correct termasuk pada jenis data
Mark 5.00 out of
5.00 Select one:
Dokumen
Matriks
Sosial network
Transaksi
Question 15 Seberapa mudah data dapat dipahami merupakan kualitas data dari..
Correct
Believability
Completeness
Consistency
Question 16 Statistik dasar untuk mengukur sebaran data salah satunya adalah
Correct
Median
Mean
Modus
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2645316&cmid=502729 3/4
3/29/2021 1 pesan baru
Question 17 Studi tentang bagaimana menganalisis data dan membersihkan data merupakan salah satu tujuan dari
Correct
Data cleansing
Data validation
Data training
data transformation
data reduction
data cleaning
Question 19 Tanggal penjualan, nama pelanggan, nama barang, jumlah penjualan merupakan contoh dari
Correct
Dataset penjualan
Question 20 Tinggi badan, berat badan, usia, dan jenis kelamin merupakan contoh representasi karakteristik dari
Correct
Atribut
Dataset
Data objek
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2645316&cmid=502729 4/4
4/5/2021 1 pesan baru
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING / Pertemuan 5 : Introduction to Data Mining
/ Kuis M5 : Introduction Data Mining
Question 1 Metode untuk mempresentasikan hasil yang ditemukan dengan cara yang "bagus" secara visual
Correct
b. Visualisasi
c. Klasterisasi
d. Klasifikasi
Question 2 Untuk menghindari set pengujian yang tumpang tindih, data dibagi menjadi k himpunan bagian dengan ukuran yang
Correct sama kemudiansetiap subset secara bergantian digunakan untuk pengujian dan sisanya untuk pelatihan
Marked out of
5.00 Select one:
a. k-fold cross-validation
Question 3 Metode untuk mengelompokkan secara "alami" dari instance yang diberi data tanpa label
Correct
b. Klasterisasi
c. Klasifikasi
d. Visualisasi
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2763658&cmid=517239 1/5
4/5/2021 1 pesan baru
c. Data pengujian tidak digunakan dengan cara apa pun untuk membuat pengklasifikasi
d. Skema pembelajaran beroperasi dalam dua tahap yaitu membangun struktur dasar dan mengoptimalkan
pengaturan parameter
Question 6 Jenis tugas data mining yang menfasilitasi penerimaan / penelusuran informasi bagi pengguna
Correct
b. Klasterisasi
c. Klasifikasi
d. Visualisasi
Question 7 Karakteristik Big Data yang terus bertambah dengan cepat secara real-time dinamakan
Correct
b. variety
c. Velocity
d. Value
Question 8 Fungsi dari data mining adalah salah satunya dapat mengetahui pola yang sering (atau kumpulan item yang sering)
Correct misalnya item apa yang sering dibeli bersama di Walmart Anda. Ini dikenal dengan istilah
Marked out of
5.00 Select one:
a. Klasterisasi
b. Outlier Analysis
c. Klasifikasi
Question 9 Proses pencarian konten baru dan konten yang perlu diperbaharui dengan mengirimkan crawler ke seluruh konten yang
Correct ditemukan dari tautan halaman merupakan Salah satu konsep data mining pada Search Engine yang dinamakan
Marked out of
5.00 Select one:
a. Index
b. Crawl
c. Rank
d. Searching
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2763658&cmid=517239 2/5
4/5/2021 1 pesan baru
Question 10 Metode untuk memprediksi kelas instance dari instance yang diberi label sebelumnya
Correct
b. Klasterisasi
c. Asosiasi
d. Klasifikasi
Question 11 Melihat suatu objek data yang tidak sesuai dengan perilaku umum data, sering digunakan dalam deteksi penipuan atau
Correct analisis kejadian langka
Marked out of
5.00 Select one:
a. Analisis Outlier
b. Klasifikasi
c. Klasterisasi
Question 12 Seberapa mudah data dapat dipahami merupakan kualitas data dari..
Correct
b. Believability
c. Completeness
d. Interpretability
Question 13 Regression, Decision Trees, Bayesian, Neural Networks, Naïve Bayes Rules, Support Vector Machines, Genetic Algorithms
Correct adalah pendekatan yang digunakan untuk
Marked out of
5.00 Select one:
a. Asosiasi
b. Klasifikasi
c. Visualisasi
d. Klasterisasi
b. Pisahkan data menjadi set pelatihan dan pengujian, Buat model pada set pelatihan, Evaluasi pada set pengujian
c. Buat model pada set pelatihan, pilih secara acak jumlah instance kelas minoritas yang diinginkan, Evaluasi pada set
pengujian
d. Evaluasi pada set pengujian, Buat model pada set pelatihan, Pisahkan data menjadi set pelatihan dan pengujian
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2763658&cmid=517239 3/5
4/5/2021 1 pesan baru
Question 15 Pernyataan yang tepat terkait data mining and knowledge discovery
Correct
c. lebih teori
b. Visualisasi
c. Klasifikasi
d. Asosiasi
Question 17 Pernyataan yang tepat terkait data mining and knowledge discovery
Correct
Question 18 Attributes yang berisi informasi seperti item_ID, name, brand, category, supplier, place_made and price, merupakaan salah
Correct satu contoh jenis database
Marked out of
5.00 Select one:
a. Social media
b. Penjualan
c. Penyewaan
d. Marketing
Question 19 Metode klasifikasi pada fungsi data mining yang menggunakan nilai estimasi dari probabilitas bersyarat dinamakan
Correct metode
Marked out of
5.00 Select one:
a. Naive Bayessian
b. Mean
c. Regresi
d. Eliminasi
b. Decision Tree
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2763658&cmid=517239 4/5
4/5/2021 1 pesan baru
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2763658&cmid=517239 5/5
4/12/2021 1 pesan baru
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING
/ Pertemuan 6 : Introduction to Machine Learning (Supervised) / Kuis M6 : Introduction to Machine Learning (Supervised)
Question 1 Model Pembelajaran yang mempelajari bagaimana sistem dapat menyimpulkan suatu fungsi untuk mendeskripsikan
Correct struktur tersembunyi dari data yang tidak berlabel. Sistem ini tidak memprediksi keluaran yang benar, tetapi
Marked out of mengeksplorasi data dan dapat menarik kesimpulan dari kumpulan data untuk mendeskripsikan struktur tersembunyi dari
5.00 data yang tidak berlabel.
Select one:
a. Reinfocement Learning
b. Supervised Learning
d. Unsupervised Learning
Question 3 Jika variabel keluaran adalah berupa kategori misalnya “apel”, “jeruk” termasuk pada machine learning bertipe
Correct
b. Supervised -Regresion
c. Reinfocement
d. Supervised – Classification
Question 4
Correct
Marked out of
5.00
Gambar pada representasi di atas adalah Pola-pola struktur yang ada pada suatu koleksi data (knowledge) dalam bentuk
Select one:
a. Pohon
b. Aturan
c. Tabel
d. Instance
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2888103&cmid=530886 1/5
4/12/2021 1 pesan baru
Question 5 Saat Anda ingin mengungkap pengelompokan yang melekat dalam data, seperti mengelompokkan hewan berdasarkan
Correct beberapa karakteristik / fitur, mis. jumlah kaki maka model pembelajaran yang sesuai
Marked out of
5.00 Select one:
a. Reinfocement Learning
Question 6 Pola-pola struktur yang ada pada suatu koleksi data (knowledge) dapat direpresentasi dalam bentuk if then rules :
Correct
b. Instance
c. Pohon
d. Aturan
Question 7 Model pembelajaran yang menggunakan data berlabel dan tidak berlabel untuk pelatihan.
Correct
b. Unsupervised Learning
c. Supervised Learning
d. Reinfocement Learning
Question 8 Pembelajaran yang bertujuan memprediksi output dengan akurat untuk data baru dan output ti bernilai kontinu (riil),
Correct contoh untuk Prediksi kinerja CPU
Marked out of
5.00 Select one:
a. Klasifikasi
b. Klasterisasi
c. Generalisasi
d. Regressi
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2888103&cmid=530886 2/5
4/12/2021 1 pesan baru
Question 10 Salah satu teknik yang digunakan untuk mengkontrol fenomena over-fitting adalah dengan cara menambah finalti ke
Correct fungsi error.
Marked out of
5.00 Select one:
a. regularization
b. generalization
c. model selection
d. prediction
Question 11 Tujuan pembelajaran unsupervised adalah membagun model yang dapat menemukan komponen / variabel / fitur
Correct tersembunyi pada data pelatihan, yang dapat digunakan untuk hal berikut, kecuali
Marked out of
5.00 Select one:
a. Reduksi dimensi (dimension reduction)
b. Pengklasifikasian (classification)
c. Pengelompokan (clustering)
d. Rekomendasi
Question 12
Correct
Marked out of
5.00
Gambar pada representasi di atas adalah Pola-pola struktur yang ada pada suatu koleksi data (knowledge) dalam bentuk
Select one:
a. Aturan
b. Instance
c. Pohon
d. Tabel
Question 13 Model ini belajar dari kumpulan data berlabel dan kemudian digunakan untuk memprediksi peristiwa di masa depan.
Correct
b. Reinfocement Learning
c. Unsupervised Learning
d. Supervised Learning
b. Klasterisasi
c. Regressi
d. Klasifikasi
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2888103&cmid=530886 3/5
4/12/2021 1 pesan baru
Question 15 Yang bukan tujuan supervised learning untuk membangun model yang dapat menghasilkan output yang benar untuk
Correct suatu data input dapat digunakan untuk
Marked out of
5.00 Select one:
a. Pengklasifikasian (classification)
b. Ranking
c. Klasterisasi (clustering)
d. Regresi (regression)
b. Linear Model
Question 17
Correct
Marked out of
5.00
Gambar pada representasi di atas adalah Pola-pola struktur yang ada pada suatu koleksi data (knowledge) dalam bentuk
Select one:
a. Aturan
b. Pohon
c. Tabel
d. Instance
Question 18 Kumpulan data yg sudah dipastikan kebenarannya, dr sisi label, data awal, komponen2 data yg akan dijadikan kunci,
Correct
b. Instance
c. Feature/ atribut
d. Training Set
Question 19 Sebuah proses yg mempersiapkan data sehingga data tsb bisa kita extract cirinya menjadi suatu vektor
Correct
b. Instance
c. Feature Extraction
d. Feature/ atribut
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2888103&cmid=530886 4/5
4/12/2021 1 pesan baru
Question 20 Ciri-ciri dari masing-masing sample data misalnya Smartphone. ciri: memiliki ...
Correct
Marked out of
5.00 Select one:
a. Training Set
b. Feature/ atribut
c. Instance
d. Feature Extraction
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2888103&cmid=530886 5/5
4/19/2021 Kuis M7 : Unsupervised Learning: Attempt review
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING
/ Pertemuan 7 : Introduction to Machine Learning (Unsupervised) / Kuis M7 : Unsupervised Learning
Question 1 Pengelompokan yang sebagai "pendekatan bottom-up". Di mana titik datanya diisolasi sebagai pengelompokan terpisah
Correct pada awalnya, dan kemudian digabungkan bersama secara iteratif atas dasar kesamaan hingga satu cluster tercapai.
Marked out of
5.00 Select one:
a. Pendekatan Overlapping
b. Pendekatan Aglomeratif
c. Pendekatan Divisive
d. Pendekatan Probabilistic
Question 2 Teknik yang digunakan ketika jumlah fitur, atau dimensi, dalam kumpulan data tertentu terlalu tinggi. Teknik ini
Correct mengurangi jumlah input data ke ukuran yang dapat dikelola sambil juga menjaga integritas set data sebanyak mungkin,
Marked out of biasanya digunakan dalam tahap data praproses
5.00
Select one:
a. Dimensionality reduction
b. Association
c. clustering
d. Regression
Question 3 Algoritme yang menggunakan pohon hash untuk menghitung kumpulan item, menavigasi kumpulan data dengan cara
Incorrect yang pertama. Algoritma ini telah dipopulerkan melalui analisis keranjang pasar, yang mengarah ke mesin rekomendasi
Marked out of yang berbeda untuk platform musik dan pengecer online.Misalnya, jika saya memutar radio Black Sabbath di Spotify,
5.00 dimulai dengan lagu mereka "Anggrek", salah satu lagu lain di saluran ini kemungkinan besar adalah lagu Led Zeppelin,
seperti "Over the Hills dan Far Away." Ini didasarkan pada kebiasaan mendengarkan saya sebelumnya serta kebiasaan
orang lain.
Select one:
a. Eclat
b. Apriori
c. Apriori
d. FP-Growth
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3027952&cmid=549345 1/5
4/19/2021 Kuis M7 : Unsupervised Learning: Attempt review
Question 4 Algoritme yang menggunakan pohon hash untuk menghitung kumpulan item, menavigasi kumpulan data dengan cara
Correct yang pertama. Algoritma ini telah dipopulerkan melalui analisis keranjang pasar, yang mengarah ke mesin rekomendasi
Marked out of yang berbeda untuk platform musik dan pengecer online.Misalnya, jika saya memutar radio Black Sabbath di Spotify,
5.00 dimulai dengan lagu mereka "Anggrek", salah satu lagu lain di saluran ini kemungkinan besar adalah lagu Led Zeppelin,
seperti "Over the Hills dan Far Away." Ini didasarkan pada kebiasaan mendengarkan saya sebelumnya serta kebiasaan
orang lain. Ini termasuk task
Select one:
a. Dimensionality reduction
b. Regression
c. clustering
d. Association
Question 5 Algoritme yang berusaha menemukan pola tersembunyi atau pengelompokan data tanpa perlu campur tangan manusia.
Correct
b. Deep Learning
c. Unsupervised Learning
Question 6 Metode berbasis aturan untuk menemukan hubungan antara variabel dalam kumpulan data tertentu. Metode ini sering
Correct digunakan untuk analisis keranjang pasar, memungkinkan perusahaan untuk lebih memahami hubungan antara produk
Marked out of yang berbeda. Memahami kebiasaan konsumsi pelanggan memungkinkan bisnis untuk mengembangkan strategi
5.00 penjualan silang dan mesin rekomendasi yang lebih baik.
Select one:
a. Association
b. clustering
c. Regression
d. Dimensionality reduction
Question 7 Jenis algoritme pengurangan dimensi yang digunakan untuk mengurangi redundansi dan mengompresi kumpulan data
Correct melalui ekstraksi fitur. Metode ini menggunakan transformasi linier untuk membuat representasi data baru, menghasilkan
Marked out of sekumpulan "komponen utama". Komponen utama pertama adalah arah yang memaksimalkan varians dari dataset.
5.00 Sementara komponen utama kedua juga menemukan varians maksimum dalam data, itu sama sekali tidak berkorelasi
dengan komponen utama pertama, menghasilkan arah yang tegak lurus, atau ortogonal, ke komponen pertama. Proses
ini berulang berdasarkan jumlah dimensi, dimana komponen utama berikutnya adalah arah ortogonal ke komponen
sebelumnya dengan varians terbanyak.
Select one:
a. Singular value decomposition
b. FP-Growth
c. Autoencoders
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3027952&cmid=549345 2/5
4/19/2021 Kuis M7 : Unsupervised Learning: Attempt review
Question 8 Pendekatan reduksi dimensi lain yang memfaktorkan matriks, A, menjadi tiga matriks peringkat rendah. SVD
Correct dilambangkan dengan rumus, A = USVT, di mana U dan V adalah matriks ortogonal. S adalah matriks diagonal, dan nilai S
Marked out of dianggap sebagai nilai tunggal matriks A. Principal component analysis
5.00
Select one:
a. Singular value decomposition
b. FP-Growth
c. Autoencoders
Question 9 Pengelompokan yang mengambil pendekatan "top-down". Dalam hal ini, satu cluster data dibagi berdasarkan perbedaan
Correct antara titik data. Pengelompokan dengan cara ini tidak umum digunakan, tetapi masih perlu diperhatikan dalam konteks
Marked out of pengelompokan hierarkis. Proses pengelompokan ini biasanya divisualisasikan menggunakan dendrogram, diagram mirip
5.00 pohon yang mendokumentasikan penggabungan atau pemisahan titik data pada setiap iterasi.
Select one:
a. Pendekatan Aglomeratif
b. Pendekatan Probabilistic
c. Pendekatan Overlapping
d. Pendekatan Divisive
Question 10 Algoritma yang paling banyak digunakan untuk task Association rules
Correct
b. Apriori
c. Apriori
d. Eclat
Question 11 Salah satu bentuk pengelompokan yang memungkinkan titik data menjadi bagian dari beberapa kluster dengan derajat
Correct keanggotaan terpisah. Ini disebut juga Pengelompokan "lembut" atau fuzzy k-means
Marked out of
5.00 Select one:
a. Memecah belah (Divisive)
d. Hierarkis ( hierarchical)
b. Dimensionality reduction
c. Regression
d. clustering
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3027952&cmid=549345 3/5
4/19/2021 Kuis M7 : Unsupervised Learning: Attempt review
Question 13 Salah satu bentuk pengelompokan yang menetapkan bahwa suatu titik data hanya dapat ada dalam satu cluster. Ini juga
Correct bisa disebut sebagai pengelompokan "keras". Algoritma yang digunakan salah satunya adalah K-means clustering
Marked out of
5.00 Select one:
a. Memecah belah (Divisive)
c. Hierarkis ( hierarchical)
b. Mempelajari bagaimana cara kerja pembelajaran tanpa pengawasan dan dengan pengawasan
Question 15 Teknik tanpa pengawasan yang membantu menyelesaikan estimasi kepadatan atau masalah pengelompokan "lunak".
Correct Dalam hal ini, titik data dikelompokkan berdasarkan kemungkinannya termasuk dalam distribusi tertentu. Teknik yang
Marked out of paling umum digunakan adalah Gaussian Mixture Model (GMM)
5.00
Select one:
a. Pendekatan Probabilistic
b. Pendekatan Aglomeratif
c. Pendekatan Overlapping
d. Pendekatan Divisive
Question 16 Pembelajaran mesin tanpa pengawasan, menggunakan algoritme pembelajaran mesin untuk menganalisis dan
Correct mengelompokkan set data tak berlabel
Marked out of
5.00 Select one:
a. Supervised Learning
b. Deep Learning
c. Unsupervised Learning
Question 17 Kemampuannya untuk menemukan persamaan dan perbedaan informasi menjadikannya unsupervised learning sebagai
Correct solusi ideal tugas tugas di bawah ini, kecuali
Marked out of
5.00 Select one:
a. strategi penjualan silang
d. Segmentasi pelanggan
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3027952&cmid=549345 4/5
4/19/2021 Kuis M7 : Unsupervised Learning: Attempt review
c. Hierarkis ( hierarchical)
d. Auto Encoder
Question 19 Teknik yang mengelompokkan data yang tidak berlabel berdasarkan persamaan atau perbedaannya. Algoritma ini
Correct digunakan untuk memproses objek data mentah dan tidak terklasifikasi menjadi grup yang diwakili oleh struktur atau
Marked out of pola dalam informasi.
5.00
Select one:
a. Clustering
b. Dimensionality reduction
c. Regression
d. Association
Question 20 Teknik yang memanfaatkan jaringan neural untuk mengompresi data dan kemudian membuat ulang representasi baru
Correct dari input data asli. Terdapat lapisan tersembunyi secara khusus bertindak sebagai penghambat untuk memampatkan
Marked out of lapisan masukan sebelum merekonstruksi di dalam lapisan keluaran.
5.00
Select one:
a. Singular value decomposition
c. Autoencoders
d. FP-Growth
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3027952&cmid=549345 5/5
4/26/2021 Kuis M8 : Reinforcement: Attempt review
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING
/ Pertemuan 8 : Introduction to Machine Learning (Reinforcement) / Kuis M8 : Reinforcement
Question 1 Reinforcement learning tepat digunakan untuk menyelesaikan permasalahan utama dalam:
Correct
b. Permainan catur
c. Peramalan cuaca
d. Pengenalan objek
Question 2 Berikut ini merupakan contoh permasalahan yang dapat diselesaikan dengan reinforcement learning:
Correct
b. Self-driving car
c. Semua benar
d. Bermain Game
Question 3 Markov Decision Process dapat didefinisikan kedalam n-tuple, dimana bernilai:
Correct
b. 3
c. 6
d. 5
Question 4 Efek dari suatu aksi yang dipilih dari suatu state yang bergantung hanya pada state tersebut saja bukan pada state-state
Correct sebelumnya dikenal sebagai sifat:
Marked out of
5.00 Select one:
a. Markov
b. Bellman
c. Transisi
d. Stokastik
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3172841&cmid=564465 1/4
4/26/2021 Kuis M8 : Reinforcement: Attempt review
c. Input yang diterima oleh agen berupa state, action dan reward
b. Reward
c. Model
d. Action
Question 7 Fungsi reward dalam Markov Decision Process dapat bernilai bilangan:
Correct
b. Riil
c. Bulat
d. Asli
Question 8 Sifat Markov dalam Markov Decision Process diperlukan langsung dalam menentukan:
Correct
b. Supervised learning
c. Semua benar
d. Navigasi robot
Question 10 Pemilihan suatu aksi pada suatu state tertentu didalam Markov Decision Process ditentukan oleh:
Correct
b. Reward
c. Value
d. Policy
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3172841&cmid=564465 2/4
4/26/2021 Kuis M8 : Reinforcement: Attempt review
Question 11 Berikut ini merupakan pernyataan yang salah terkait Markov Decision Process:
Correct
c. Semua benar
d. Machine learning
b. State-Action-Reward-State-Action (SARSA)
d. Q-learning
Question 14 Efek dari suatu pilihan aksi pada suatu state ditentukan oleh:
Correct
b. Model transisi
c. Policy
d. Fungsi reward
Question 15 Reward dalam permasalahan shortest path yang dimodelkan dengan Markov Decision Process ditandai dengan:
Correct
d. Semua salah
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3172841&cmid=564465 3/4
4/26/2021 Kuis M8 : Reinforcement: Attempt review
Question 17 Berikut ini merupakan pernyataan yang kurang tepat terkait reinforcement learning (RL):
Correct
b. RL yang diselesaikan dengan Markov Decision Process memerlukan data latih dalam menentukan probabilitas
transisinya
c. RL dapat digunakan dalam menciptakan sistem pelatihan untuk siswa yang bersifat kustom
Question 18 Pada Markov Decision Process, pemilihan ruas jalan dalam permasalahan shortest path merupakan bagian dari:
Correct
b. Reward
c. State
d. Action
Question 19 Dalam memilih aksi pada suatu state perlu diperhatikan hal-hal berikut ini:
Correct
c. Semua benar
Question 20 Sekumpulan token yang mewakili setiap kemungkinan keadaan dari agen disebut sebagai:
Correct
b. Action
c. Semua salah
d. Reward
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3172841&cmid=564465 4/4
M10 Team Teaching
1. Salah satu library data science yang digunakan untuk pemrosesan sinyal, gambar, dan rumus
statistik adalah.. Semua Benar
2. Beragamnya jenis data di dalam Big Data yang meliputi data terstruktur, semi terstruktur
dan tidak terstruktur, merupakan dimensi Big Data dalam hal: Variety
3. Pilihan yang dapat menciptakan hasil yang paling optimal merupakan pendekatan analitik
dari.. Preskriptif
4. Sumber data yang digunakan dalam aplikasi Big Data dapat berupa: Semua Benar
5. Keuntungan menggunakan Mobile Positioning data (MPD) adalah… Semua Benar
6. Metode untuk memprediksi kelas instance dari instance yang diberi label sebelumnya…
Klasifikasi
7. Visualisasi pada hasil analisis Big Data dapat disajikan dalam bentuk.. Semua Benar
8. Data yang dikumpulkan secara aktif dari sensor, misalnya melalui penginderaan jauh dan
gambar satelit merupakan sumber big data dalam hal…. Sensing data
9. Contoh solusi Big Data, kecuali: Semua Benar
10. Contoh Aplikasi Machine Learning dan Analitik Prediktif: Semua Benar
11. Semakin banyak data hingga dapat melebihi terabyte merupakan penjelasan dari dimensi
Big Data dalam hal: Volume
12. Karakteristik Big Data yang cepat sekali berubah baik dari sisi variabel maupun tipe data
dinamakan… Velocity
13. Data Warehouse dibuat dengan menerapkan serangkaian langkah pemrosesan terhadap
data yang berasal dari beberapa basis data. Berikut ini adalah yang termasuk dalam
pemrosesan data tersebut: Semua Benar
14. Manakah yang benar dari pernyataan berikut ini: Deskriptif, perkiraan berdasarkan data
yang tersedia
15. Data Mobile Positioning data (MPD) berupa… Semua Benar
16. Dataset dibentuk dari: Sekumpulan fitur yang memiliki objek yang sama
17. Tools Bahasa Pemograman yang dapat digunakan dalam ilmu data science adalah… Semua
Benar
18. Social Media termasuk dalam sumber data..Digital Content
19. Cara yang dapat dilakukan untuk meningkatkan analisis bigdata genome bioinformatics
adalah.. Semua Benar
20. Proses menganalisis tulisan untuk menentukan nada emosional penulisnya merupakan salah
satu implementasi machine learning dalam… Principal Component Analysis
Team Teaching Big Data M9
1. Berikut ini adalah efek dari mengecilnya nilai stride dalam Algoritma Convolutional Neural Network
2. Hasil dari proses flatten pada Algoritma Convolutional Neural Network menjadi masukan dalam
Fully-connected layer
4. Berikut ini merupakan loss function dalam algoritma berbasis Neural Network
Cross entropy
6. Berikut ini adalah teknik yang dapat digunakan pada pooling layer dalam Algoritma Convolutional
Neural Network
Hidden layer
8. Sebuah citra berdimensi 5x5 dengan filter 3x3 dan stride sebesar 2 akan menghasilkan feature map
berdimensi
4x4
Hidden layer
10. Berikut ini merupakan fungsi aktivasi dalam Algoritma Convolutional Neural Network
11. Tahapan feature extraction pada Algoritma Convolutional Neural Network terdiri dari beberapa
lapisan (layer) berikut ini, kecuali
Fully-connected layer
12. Untuk memperbanyak feature yang berhasil diekstrak dalam Algoritma Convolutional Neural
Network digunakan
Padding
15. Untuk menyelesaikan permasalahan klasifikasi biner menggunakan algoritma berbasis Neural
Network lebih tepat digunakan fungsi aktivasi
ReLU
16. Salah satu ukuran dari confusion matrix yang dapat digunakan dalam mengukur tingkat keberhasilan
sistem dalam menemukan kembali sebuah informasi adalah
Recall
17. Untuk mencegah terjadinya overfitting dalam Algoritma Convolutional Neural Network dilakukan
Dropout regularization
18. Dimensi dari feature map dalam Algoritma Convolutional Neural Network bergantung pada
Semua benar
Stride
Padding
19. Parameter dalam Algoritma Convolutional Neural Network yang menentukan berapa jumlah
pergeseran filter disebut sebagai
Stride
20. Berikut ini merupakan library Python untuk Algoritma Deep Learning
1. Berikut ini yang bukan merupakan karakteristik dari Apache Spark adalah
2. Berapa banyak Spark Context yang dapat aktif per Java Virtual Machine
Hanya 1
3. Berikut ini yang bukan merupakan fungsi dari Spark Context adalah
6. Berikut ini yang bukan operasi transformasi pada Resilient Distributed Data adalah
Flatmap
2010
8. Berikut ini yang bukan operasi action pada Resilient Distributed Data adalah
Top()
9. Berikut ini adalah pernyataan yang salah mengenai Resilient Distributed Data (RDD), kecuali
Scala
Spark SQL
Spark Core
DataFrame
16. Apache Spark berpotensi … lebih cepat untuk menjalankan program pemrosesan batch didalam
memori jika dibandingkan dengan MapReduce
100 kali
17. Komponen berikut ini yang tidak terdapat diatas Spark Core adalah
18. Spark SQL menerjemahkan perintah kedalam bentuk kode yang diproses oleh
19. Pernyataan berikut ini yang salah mengenai Spark dan Hadoop adalah
Satu
Team Teaching Big Data M12
1. Algoritma untuk menentukan jumlah segitia yang melewati setiap simpul dalam graf
Triangle Count
2. Urutan edge yang memungkinkan Anda berpindah dari vertex A ke vertex B disebut
Path
Page Rank
Visualisasi Grafik
5. Manakah urutan yang benar untuk menjelaskan cara kerja Spark Streaming:
2. Batch input data / RDD tersebut diproses oleh Spark Engine menggunakan operasi RDD.,
3. Hasilnya adalah batch data yang telah diproses didorong keluar ke sistem eksternal,
4. Oleh Spark Streaming data dibagi menjadi kumpulan / batch input data (diperlakukan sebagai RDD).
1-4-2-3
1. Pembuatan grafik,
2. Pengolahan pasca,
4. Analisis
3-1-4-2
Connected Components
Neo4j
Netflix
11. Operasi Jendela membutuhkan parameter
window length
12. Framework yang dapat digunakan untuk memproses data grafik dan menjalankan analisis prediktif
pada data
Spark GraphX
Semua Benar (Film baru yang paling direkomendasikan orang-orang 1 minggu terakhir, Orang-orang
yang sama-sama mensitasi suatu artikel, Teman toni di facebook yang paling banyak pengikutnya)
Semua benar (Graph terdiri dari simpul dan sisi, Semua yang ada di Facebook adalah contoh
penggunaan struktur data graph, Edge menunjukan relasi antar simpul)
17. Yang diperlukan untuk menangani data besar dalam bentuk grafik
Semua benar (Analisis Data Grafikm Visualisasi data grafik, Database grafik)
DStream
Abstraksi memori terdistribusi untuk komputasi dalam memori pada klaster besar yang toleran terhadap
kesalahan
Semua benar (Memproses menggunakan algoritma kompleks dengan fungsi seperti map, reduce, join,
window, Dapat menyerap data dari berbagai sumber, Data yang diproses dapat dikirim ke sistem file,
database, dan live dashboard)
Team Teaching Big Data M13
Langkah ke-1 Salin input data dari CPU memory ke GPU memory
Langkah-2 Muat program GPU dan eksekusi, caching (simpan) data pada chip untuk kinerja
3. Arsitektur CUDA menerapkan pendekatan berupa kumpulan streaming multiprocessors (SM) yang
Mengeksekusi sejumlah instruksi yang sama pada beberapa thread pada berbagai wilayah data,
sehingga dikenal dengan istilah single instruction, multiple threads (SIMT)
Melibatkan banyak unit computer untuk memecahkan masalah yang berbeda-beda untuk masing-
masing unit computer, namun dalam waktu yang sama
5. Tujuan utama dari pemrograman paralel adalah untuk meningkatkan performa komputasi. Performa
dalam pemrograman paralel diukur dari
Berapa banyak peningkatan kecepatan (speed up) yang diperoleh dalam menggunakan tehnik paralel
6. CUDA C++ adalah perluasan C++ sehingga programmer dapat mendefinisikan fungsi C++ yang ketika
dipanggil, akan dieksekusi sebanyak N kali secara paralel dan N CUDA thread yang berbeda. Fungsi ini
dikenal dengan istilah
Kernel
7. Kernel pada pemrograman CUDA agar dieksekusi pada device, dideklarasi menggunakan
__global__
Komputer yang digunakan secara bersamaan dalam melakukan komputasi dilakukan oleh computer-
komputer terpisah yang terhubung dalam suatu jaringan komputer
Satuan pemrosesan sekuensial yang dikumpulkan dalam satu grup yang disebut sebagai thread block
11. Dua kata istilah penting yang digunakan dalam CUDA, yaitu: host dan device. Istilah host pada CUDA
mengacu pada
CPU
12. Dua kata istilah penting yang digunakan dalam CUDA, yaitu: host dan device. Istilah device pada
CUDA mengacu
GPU
Beberapa block dihimpun dalam satu thread, yang kemudian beberapa thread dihimpun dalam satu
kesatuan grid
16. CUDA adalah platform komputasi paralel dengan arsitektur komputasi masuk dalam
CUDA adalah suatu platform untuk komputasi paralel, dan memanfaatkan GPU untuk komputasi
20. Perintah kernel < <N, M> >(…) menunjukkan device untuk
Semua benar
Dapat diinterpretasikan
5. Banyaknya operasi-operasi kecil yang berulang merupakan salah satu penyebab bahasa pemrograman
Python
Tergolong lambat
7. Elemen dalam RDD dikelompokkan kedalam beberapa partisi dan hanya dapat disimpan pada sebuah
node yang berbeda merupakan konsep RDD dalam hal
Distributed
Semua jawaban benar (Penyalinan data dari dan ke host jika diperlukan, Alokasi data dari dan ke host
jika diperlukan)
Semua salah
14. Berikut ini adalah komputasi primitive yang tersedia pada Spark untuk melakukan parelelisme dan
meminimumkan komunikasi antar workers
Open-source
16. Modul kompilasi tepat waktu pada Python untuk GPU adalah
17. API Spark memiliki dukungan yang terbatas pada bahasa pemrograman
18. Permasalahan alokasi memori dalam komputasi pada GPU terdapat pada tugas yang berskala
Kecil
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
b. Veracity
c. Volume
d. Variety
b. Semi Terstruktur
c. Terstruktur
Question 3 Pembayaran Kartu prakerja merupakan salah satu proyek yang dikerjakan oleh Link Aja bersama dengan:
Correct
b. BPJS
c. Bank Indonesia
d. Semua salah
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5786711&cmid=867269 1/6
4/4/22, 11:44 AM 1 pesan baru
Question 4 Dalam ekosistem teknologi Data Engineering Link Aja! Apache Airflow berfungsi sebagai:
Incorrect
b. Streaming Infrastructure
c. Monitoring
d. Batching Infratructure
b. Yahoo
c. Facebook
d. Google
b. Nomor KTP
c. Email
d. Nomor telepon
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5786711&cmid=867269 2/6
4/4/22, 11:44 AM 1 pesan baru
Question 8 Berikut ini merupakan komponen-kompone produksi dalam implementasi big data, kecuali:
Correct
b. Presto
c. Spark
d. Kafka
b. Abstrak
c. Semua benar
b. Data Architect
c. Business Analyst
d. Data Manager
Question 11 Menjadi platform teknologi keuangan nasional terdepan dan terpercaya merupakan ... dari Link Aja!:
Incorrect
b. Visi
c. SLogan
d. Tujuan
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5786711&cmid=867269 3/6
4/4/22, 11:44 AM 1 pesan baru
Question 12 Berikut ini urutan proses yang dilakukan dalam Arsitektur Kappa adalah:
Incorrect
b. Data Sources, Analytical Data Store, Streaming/Real-Time Ingestion, Streaming/Real-Time Processing, Analytics
& Reporting
c. Data Sources, Streaming/Real-Time Processing, Streaming/Real-Time Ingestion, Analytical Data Store, Analytics
& Reporting
d. Data Sources, Streaming/Real-Time Ingestion, Analytical Data Store, Streaming/Real-Time Processing, Analytics
& Reporting
The correct answer is: Data Sources, Streaming/Real-Time Ingestion, Streaming/Real-Time Processing, Analytical Data
Store, Analytics & Reporting
Question 13 Salah satu aktivitas yang dilakukan oleh Link Aja! dalam mengadopsi alat-alat bantu untuk pengelolaan data adalah:
Incorrect
Question 14 Berikut ini yang bukan termasuk kedalam peran Tim Data di Link Aja! adalah:
Correct
b. Data Intelligent
c. Data Scientist
d. Data Engineer
Question 15 Berikut ini adalah teknologi yang digunakan oleh Link Aja! pada bagian Persistence Layer, kecuali:
Incorrect
b. Grafana
c. PostgreSQL
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5786711&cmid=867269 4/6
4/4/22, 11:44 AM 1 pesan baru
Question 16 Salah satu teknologi yang dapat digunakan pada bagian Serving Layer dalam Arsitektur lambda adalah:
Incorrect
b. Flume
c. HDFS
d. Hive
b. 2015
c. 2016
d. 2020
b. Beam
c. Hadoop
d. Hive
Question 19 Ukuran kualitas citra merupakan salah satu luaran yang dihasilkan oleh AI/ML Scientist Link Aja! pada proyek:
Incorrect
d. eKYC Improvement
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5786711&cmid=867269 5/6
4/4/22, 11:44 AM 1 pesan baru
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5786711&cmid=867269 6/6
4/11/22, 8:00 PM Kuis M6: BigData di PPATK: Attempt review
Dashboard / My courses /
ATA 2021/2022 | 2-FIKTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 6: Big Data di PPATK
/
Kuis M6: BigData di PPATK
Question 1 Splitting data set dalam pemodelan mesin learning untuk menganalisa data transaksi keuangan adalah
Correct
b. membagi data set menjadi dua bagian, yaitu data training dan data test
The correct answer is: membagi data set menjadi dua bagian, yaitu data training dan data test
Question 2 Agen Kecerdasan Artifisial menerima dan bertindak berdasrkan lingkungan (environment) menggunakan
Correct
b. Sensor
d. Actuator
Question 3 Berikut ini yang merupakan tahapan data engineering dalam big data analytics adalah
Correct
The correct answer is: data architecure, data acquisition, data cleaning, dan cloud computation
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5910173&cmid=881829 1/6
4/11/22, 8:00 PM Kuis M6: BigData di PPATK: Attempt review
c. yang memerlukan contoh masalah, basis pengetahuan, dan memerlukan input, untuk memecahkan masalah
d. yang memerlukan contoh masalah dan basis pengetahuannya dalam memecahkan masalah
The correct answer is: yang dapat memecahkan masalah tanpa intervensi manusia
Question 5 Pusat Pelaporan dan Analisis Transaksi Keuangan (PPATK) merupakan lembaga sentral (focal point) yang
Correct mengkoordinasikan pelaksanaan upaya pencegahan dan pemberantasan tindak pidana pencucian uang di Indonesia.
Mark 5.00 out of PPATK dalam tugasnya menerapkan AI (Artificial Intelligence)
5.00
Select one:
a. di bidang: Kepegawaian, Kepatuhan Pelaporan, Analisis Transaksi, Pelaporan, Sentimen Analisis, dan Keamanan
Data
The correct answer is: di bidang: Kepegawaian, Kepatuhan Pelaporan, Analisis Transaksi, Pelaporan, Sentimen Analisis, dan
Keamanan Data
Question 6 Salah satu agen intelligence yang bertugas saat mengumpulkan data melalui sumber Web seperti HTML dokumen,
Correct gambar, file teksadalah:
Mark 5.00 out of
5.00 Select one:
a. Chat Box
b. Compiler
c. web crawler
d. parser
Question 7 Berikut sistem intelligent yang dapat difungsikan pada bidang Pelaporan pada Pusat Pelaporan dan Analisis Transaksi
Correct Keuangan (PPATK) adalah
Mark 5.00 out of
5.00 Select one:
a. dapat keduanya, chat Box untuk layanan bantuan dan evaluasi laporan
d. evaluasi laporan
The correct answer is: dapat keduanya, chat Box untuk layanan bantuan dan evaluasi laporan
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5910173&cmid=881829 2/6
4/11/22, 8:00 PM Kuis M6: BigData di PPATK: Attempt review
Question 8 Jika dalam memodelkan klasifikasi transaksi keuangan, diperoleh nilai akurasi untuk model logistic regression adalah 0,62,
Correct model K-NN adalah 0,91, dan model random forest adalah 0,98, maka berarti:
Mark 5.00 out of
5.00 Select one:
a. random forest memprediksi transaksi wajar paling banyak dibandingkan model K-NN dan logistic regression, yaitu
sebesar 98%
The correct answer is: random forest lebih akurat dibanding k-NN dan logistic regression
Question 9 Proses rekursif yang meranking fitur berdasarkan tingkat pentingnya terhadap proses prediksi, salah satunya adalah
Correct
Question 10 Salah sata tahapan big data analytics adalah data mining, yang memperkerjakan machine learning, yaitu melakukan
Correct
d. estimasi atau prediksi, atau mengklasifikasi, atau meng-cluter, atau menentukan asosiasi
The correct answer is: estimasi atau prediksi, atau mengklasifikasi, atau meng-cluter, atau menentukan asosiasi
Question 11 Berikut teknik Kecerdasan Artifisial yang membuat komputer dapat memahamai asosiasi dan relasi antara object dan
Correct kejadian adalah
Mark 5.00 out of
5.00 Select one:
a. Cognitive Science
b. Relative Symbolism
c. Heuristic Processing
d. Pattern Matching
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5910173&cmid=881829 3/6
4/11/22, 8:00 PM Kuis M6: BigData di PPATK: Attempt review
Question 12 Bagian dari sistem Kecerdasan Artifisial yang mengolah pengetahuan adalah
Correct
b. Validator
c. Machine Learning
d. Data historis
b. jumlah nilai true positive dan true negative dibagi total data
The correct answer is: jumlah nilai true positive dan true negative dibagi total data
Question 14 Pada saat memodelkan mesin learning dalam menganalisa data transaksi keuangan, melakukan perankingan adalah
Correct tahapan pada
Mark 5.00 out of
5.00 Select one:
a. data engineering
b. data exploration
c. prediction modelling
d. data visualization
Question 15 Membuat grafik box plot adalah salah satu tahapan dalam implementasi mesin learning, yaitu tahap
Correct
b. eksplorasi data
c. modelling
d. validasi model
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5910173&cmid=881829 4/6
4/11/22, 8:00 PM Kuis M6: BigData di PPATK: Attempt review
Question 16 Maksud pernyataan "Pemodelan Machine Learning untuk memprediksi data transaksi keuangan merupakan transaksi
Correct wajar atau mencurigakan", adalah
Mark 5.00 out of
5.00 Select one:
a. memvalidasi data historis agar data baru menjadi data transaksi wajar
b. menentukan statistik data historis, untuk input data baru dalam meprediksinya apakah data tersebut berada pada
nilai transaksi wajar atau transaksi mencurigakan
d. membangun model terbaik, berdasarkan data historis, untuk input data baru dalam meprediksinya apakah data
tersebut suatu transaksi wajar atau transaksi mencurigakan
The correct answer is: membangun model terbaik, berdasarkan data historis, untuk input data baru dalam meprediksinya
apakah data tersebut suatu transaksi wajar atau transaksi mencurigakan
Question 17 Pusat Pelaporan dan Analisis Transaksi Keuangan (PPATK) merupakan lembaga sentral (focal point) yang
Correct mengkoordinasikan pelaksanaan upaya pencegahan dan pemberantasan tindak pidana pencucian uang di Indonesia.
Mark 5.00 out of PPATK dalam tugasnya menerapkan AI (Artificial Intelligence). Pernyataan berikut yang benar mengenai AI adalah
5.00
Select one:
a. cabang ilmu dari machine learning
c. cabang dari ilmu komputer yang menenkankan pada pengembangan mesin cerdas (intelligence), berpikir dan
bekerja seperti manusia
The correct answer is: cabang dari ilmu komputer yang menenkankan pada pengembangan mesin cerdas (intelligence),
berpikir dan bekerja seperti manusia
The correct answer is: Data engineering, data exploration, data mining, data visualization
Question 19 Berikut yang merupakan algoritma yang dapat digunakan untuk model klasifikasi transaksi keuangan adalah
Correct
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5910173&cmid=881829 5/6
4/11/22, 8:00 PM Kuis M6: BigData di PPATK: Attempt review
d. 4 tipe, yaitu: Supervised Learning, Unsupervised Learning, Reinforcement Learning, dan Deep Learning
The correct answer is: 3 tipe: Supervised Learning, Unsupervised Learning, dan Reinforcement Learning
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5910173&cmid=881829 6/6
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 10: Penerapan Big Data di Sektor Perbankan (M12) /
Kuis M12: Penerapan Big Data di Sektor Perbankan
Question 1 Proses di mana data mentah dikumpulkan dan diekspresikan dalam bentuk ringkasan untuk analisis statistik.
Correct
b. Data Extraction
d. Data Identification
b. Di dalamnya tersimpan data nasabah serta semua transaksi sejak nasabah membuka rekening di bank sampai
menutupnya.
Question 3 Proses memilih dan mengambil data dari satu atau beberapa sumber:
Correct
b. Data Identification
d. Data Extraction
d. Semua salah
Question 5 Perbedaan Data Tradisional dan Big Data pada komponen Data Model:
Correct
c. Centralized vs Distributed
d. Semua benar
b. Kafka
c. Hadoop
d. Tableau
Question 7 Aplikasi Core Banking System untuk memfasilitasi nasabah agar dapat melakukan transaksi sendiri:
Correct
b. Busines Case Evaluation - Data Identification - Data Acquisition & Filtering - Data Extraction - Data Validation
& Cleansing - Data Aggregation & Representation - Data Analysis - Utilization of Analysis Results
c. Busines Case Evaluation - Data Identification - Data Acquisition & Filtering - Data Extraction - Data Validation
& Cleansing - Data Aggregation & Representation - Data Analysis - Data Visualization - Utilization of
Analysis Results
d. Business Case Evaluation - Data Identification - Data Extraction - Data Validation & Cleansing - Data
Aggregation & Representation - Data Analysis - Data Visualization - Utilization of Analysis Results
b. Komunikasi
c. Semua benar
d. Media
Question 10 Tipe data dalam Big Data:
Correct
c. Unstructured data
d. Data terstruktur
Question 11 Perbedaan Data Tradisional dan Big Data pada komponen Arsitektur:
Correct
c. Semua benar
d. Centralized vs Distributed
d. Kesamaan data
b. Mendorong inklusivitas
d. Menanalisis resiko
Question 14 Pencarian informasi terkait tipe data, struktur data, bentuk data, dan isi serta sumber data:
Correct
b. Data Identification
d. Data Extraction
b. Semua benar
b. Facebook
c. Kafka
d. Hadoop
b. Data Identification
c. Data Extraction
Question 19 Perbedaan Data Tradisional dan Big Data pada komponen Data relationship:
Correct
c. Semua benar
b. MS SQL Server
c. MySQL Server
d. IBM AS-400
◄ Materi M12: Penerapan Big Data di Kuis M12: Penerapan Big Data di Sektor
Jump to...
Sektor Perbankan Perbankan (Kelas Malam) ►
Started on Monday, 20 June 2022, 11:42 AM
State Finished
Completed on Monday, 20 June 2022, 12:00 PM
Time taken 17 mins 27 secs
Question 1
Correct
Marked out of 5.00
Flag question
Question text
Pengelompokan yang mengambil pendekatan "top-down". Dalam hal ini, satu cluster data
dibagi berdasarkan perbedaan antara titik data. Pengelompokan dengan cara ini tidak
umum digunakan, tetapi masih perlu diperhatikan dalam konteks pengelompokan hierarkis.
Proses pengelompokan ini biasanya divisualisasikan menggunakan dendrogram, diagram
mirip pohon yang mendokumentasikan penggabungan atau pemisahan titik data pada
setiap iterasi.
Select one:
a. Pendekatan Probabilistic
b. Pendekatan Aglomeratif
c. Pendekatan Divisive
d. Pendekatan Overlapping
Question 2
Correct
Marked out of 5.00
Flag question
Question text
Question 3
Incorrect
Marked out of 5.00
Flag question
Question text
Algoritme yang menggunakan pohon hash untuk menghitung kumpulan item, menavigasi
kumpulan data dengan cara yang pertama. Algoritma ini telah dipopulerkan melalui analisis
keranjang pasar, yang mengarah ke mesin rekomendasi yang berbeda untuk platform musik
dan pengecer online.Misalnya, jika saya memutar radio Black Sabbath di Spotify, dimulai
dengan lagu mereka "Anggrek", salah satu lagu lain di saluran ini kemungkinan besar
adalah lagu Led Zeppelin, seperti "Over the Hills dan Far Away." Ini didasarkan pada
kebiasaan mendengarkan saya sebelumnya serta kebiasaan orang lain.
Select one:
a. Eclat
b. FP-Growth
c. Apriori
d. Apriori
Question 4
Correct
Marked out of 5.00
Flag question
Question text
Pendekatan reduksi dimensi lain yang memfaktorkan matriks, A, menjadi tiga matriks
peringkat rendah. SVD dilambangkan dengan rumus, A = USVT, di mana U dan V adalah
matriks ortogonal. S adalah matriks diagonal, dan nilai S dianggap sebagai nilai tunggal
matriks A. Principal component analysis
Select one:
a. FP-Growth
b. Autoencoders
c. Singular value decomposition
Question 5
Correct
Marked out of 5.00
Flag question
Question text
Algoritme yang berusaha menemukan pola tersembunyi atau pengelompokan data tanpa
perlu campur tangan manusia.
Select one:
a. Semi Supervised Learning
b. Deep Learning
c. Supervised Learning
d. Unsupervised Learning
Question 6
Correct
Marked out of 5.00
Flag question
Question text
Select one:
a. Pendekatan Divisive
b. Pendekatan Probabilistic
c. Pendekatan Aglomeratif
d. Pendekatan Overlapping
Question 7
Correct
Marked out of 5.00
Flag question
Question text
Metode berbasis aturan untuk menemukan hubungan antara variabel dalam kumpulan data
tertentu. Metode ini sering digunakan untuk analisis keranjang pasar, memungkinkan
perusahaan untuk lebih memahami hubungan antara produk yang berbeda. Memahami
kebiasaan konsumsi pelanggan memungkinkan bisnis untuk mengembangkan strategi
penjualan silang dan mesin rekomendasi yang lebih baik.
Select one:
a. clustering
b. Dimensionality reduction
c. Regression
d. Association
Question 8
Correct
Marked out of 5.00
Flag question
Question text
Jenis algoritme pengurangan dimensi yang digunakan untuk mengurangi redundansi dan
mengompresi kumpulan data melalui ekstraksi fitur. Metode ini menggunakan transformasi
linier untuk membuat representasi data baru, menghasilkan sekumpulan "komponen
utama". Komponen utama pertama adalah arah yang memaksimalkan varians dari dataset.
Sementara komponen utama kedua juga menemukan varians maksimum dalam data, itu
sama sekali tidak berkorelasi dengan komponen utama pertama, menghasilkan arah yang
tegak lurus, atau ortogonal, ke komponen pertama. Proses ini berulang berdasarkan jumlah
dimensi, dimana komponen utama berikutnya adalah arah ortogonal ke komponen
sebelumnya dengan varians terbanyak.
Select one:
a. Principal component analysis
b. FP-Growth
c. Singular value decomposition
d. Autoencoders
Question 9
Correct
Marked out of 5.00
Flag question
Question text
Select one:
a. Deep Learning
b. Semi Supervised Learning
c. Supervised Learning
d. Unsupervised Learning
Question 10
Correct
Marked out of 5.00
Flag question
Question text
Teknik yang mengelompokkan data yang tidak berlabel berdasarkan persamaan atau
perbedaannya. Algoritma ini digunakan untuk memproses objek data mentah dan tidak
terklasifikasi menjadi grup yang diwakili oleh struktur atau pola dalam informasi.
Select one:
a. Association
b. Clustering
c. Regression
d. Dimensionality reduction
Question 11
Correct
Marked out of 5.00
Flag question
Question text
Salah satu bentuk pengelompokan yang memungkinkan titik data menjadi bagian dari
beberapa kluster dengan derajat keanggotaan terpisah. Ini disebut juga Pengelompokan
"lembut" atau fuzzy k-means
Select one:
a. Tumpang tindih (overlapping)
b. Clustering Eksklusif (specifically exclusive)
c. Memecah belah (Divisive)
d. Hierarkis ( hierarchical)
Question 12
Correct
Marked out of 5.00
Flag question
Question text
Algoritme yang menggunakan pohon hash untuk menghitung kumpulan item, menavigasi
kumpulan data dengan cara yang pertama. Algoritma ini telah dipopulerkan melalui analisis
keranjang pasar, yang mengarah ke mesin rekomendasi yang berbeda untuk platform musik
dan pengecer online.Misalnya, jika saya memutar radio Black Sabbath di Spotify, dimulai
dengan lagu mereka "Anggrek", salah satu lagu lain di saluran ini kemungkinan besar
adalah lagu Led Zeppelin, seperti "Over the Hills dan Far Away." Ini didasarkan pada
kebiasaan mendengarkan saya sebelumnya serta kebiasaan orang lain. Ini termasuk task
Select one:
a. Regression
b. clustering
c. Dimensionality reduction
d. Association
Question 13
Correct
Marked out of 5.00
Flag question
Question text
Teknik tanpa pengawasan yang membantu menyelesaikan estimasi kepadatan atau masalah
pengelompokan "lunak". Dalam hal ini, titik data dikelompokkan berdasarkan
kemungkinannya termasuk dalam distribusi tertentu. Teknik yang paling umum digunakan
adalah Gaussian Mixture Model (GMM)
Select one:
a. Pendekatan Overlapping
b. Pendekatan Probabilistic
c. Pendekatan Aglomeratif
d. Pendekatan Divisive
Question 14
Correct
Marked out of 5.00
Flag question
Question text
Teknik yang digunakan ketika jumlah fitur, atau dimensi, dalam kumpulan data tertentu
terlalu tinggi. Teknik ini mengurangi jumlah input data ke ukuran yang dapat dikelola sambil
juga menjaga integritas set data sebanyak mungkin, biasanya digunakan dalam tahap data
praproses
Select one:
a. Regression
b. clustering
c. Association
d. Dimensionality reduction
Question 15
Correct
Marked out of 5.00
Flag question
Question text
Question 16
Correct
Marked out of 5.00
Flag question
Question text
Select one:
a. Hierarkis ( hierarchical)
b. Clustering ekslusif (specifically exclusive)
c. Tumpang tindih (overlapping)
d. Auto Encoder
Question 17
Correct
Marked out of 5.00
Flag question
Question text
Salah satu bentuk pengelompokan yang menetapkan bahwa suatu titik data hanya dapat
ada dalam satu cluster. Ini juga bisa disebut sebagai pengelompokan "keras". Algoritma
yang digunakan salah satunya adalah K-means clustering
Select one:
a. Memecah belah (Divisive)
b. Tumpang tindih (overlapping)
c. Hierarkis ( hierarchical)
d. Clustering Eksklusif (specifically exclusive)
Question 18
Correct
Marked out of 5.00
Flag question
Question text
Teknik yang memanfaatkan jaringan neural untuk mengompresi data dan kemudian
membuat ulang representasi baru dari input data asli. Terdapat lapisan tersembunyi secara
khusus bertindak sebagai penghambat untuk memampatkan lapisan masukan sebelum
merekonstruksi di dalam lapisan keluaran.
Select one:
a. FP-Growth
b. Singular value decomposition
c. Principal component analysis
d. Autoencoders
Question 19
Correct
Marked out of 5.00
Flag question
Question text
Question 20
Correct
Marked out of 5.00
Flag question
Question text
Select one:
a. Dimensionality reduction
b. Association
c. clustering
d. Regression
M1
1. Jenis database NoSQL apa yang membuat dan menjalankan aplikasi yang berjalan
dengan dataset yang selalu terhubung menjadi lebih mudah dan sering digunakan untuk
jaringan media sosial
Grafik.
2. Property big data yang penting, salah satunya adalah falaut tolerance, yaitu
Kemampuan untuk terus beroperasi walaupun terjadi kegagalan pada beberapa
komponen.
3. Pernyataan yang benar mengenai MapReduce adalah
Memperoses data besar secara parallel dalam cluster commodity hardware,
implementaasi dari framework pemerosesan batch, membagi masalah besar
menjadi masalah kecil yang dapat diselesaikan dengan cepat.
4. Terdapat 2 teknologi penyimpanan big data, yaitu
On disk storage devices dan in memory storage devices.
5. Berikut ini yang bukan merupakan Hadoop operation mode adalah
Globally distributed mode.
6. Sistem penyimpanan data cluster adalah
Kumpulan server atau node digabungkan secara erat dengan spesifikasi
perangkat keras yang sama. Serta terhubung melalui jaringan dan bekerja
sebagai salah satu kesatuan.
7. Hadoop adalah platform pemrosesan big data yaitu data yang mempunyai karakteristik
kecuali
Jumlah fitur yang tertentu.
8. Hadoop adalah framework yang
Melibatkan satu atau lebih cluster computer, memungkinkan pemerosesa secara
terdistribusi terhadap data yang berukuran besar, menerapakan programming
model yang sederhana.
9. Database NoSQL menggunakan beragam model data untuk mengakses dan mengelola
data. Jenis database ini dioptimalkan secara khusus untuk aplikasi yang memerlukan…,
yang dicapai dengan mengurangi pembatasan kositensi data dari database lainnya
Volume data besar, latensi rendah dan model data fleksibel.
10. Komponen layanan inti Hadoop
MapReduce, HDFS dan YARN.
11. Property big data yang penting salah satunya adalah aviability, yaitu
Ketersediaan layanan secara terus menerus.
12. Berikut yang dimaksud dengan menganalisa data dalam konteks big data adalah
Descriptive analytics, diagnostic analytics, predictive analytics dan prescriptive
analytics.
13. Type data berikut yang dapat ditangani oleh Hadoop adalah
Tidak terstruktur, semi-terstruktur, terstruktur.
14. Property big data yang penting salah satunya adalah scalability yaitu
Kemampuan menangani penambahan beban yang diberikan tanpa penurunan
kinerja.
15. Property big data yang penting, salah satunya adalah reliability yaitu
Handal
16. Pemerosesan data terdistribusi adalah pemerosesan
Yang menerapakan divide and conquer dalam fisik terpisah, namun terhubung
bersama dalam satu cluster.
17. Hadoop adalah framework yang bekerja bersama tools lain yang beragam. Kelompok
yang umum bekerja bersama Hadoop adalah
MapReduce, MySQL and google apps.
18. YARN singkatan dari
Yet Another Resource Negotiator.
19. Bagian pekerjaan utama MapReduce adalah
Map dan reduce.
20. NoSQL database adalah singkatan dari
Not-only structured query language database.
M4
M5
21. Pernyataan yang tepat terkait data mining and knowledge discovery,
Mengintegrasikan teori dan heuristik
22. Regression, Decision Trees, Bayesian, Neural Networks, Naive Bayes Rules, Support
Vector machines, genetic algorithms adalah pendekatan yang digunakan untuk,
Klasifikasi
23. Metode untuk mempresentasikan hasil yang ditemukan dengan cara yang “bagus” secara
visual,
Visualisasi
24. Karakteristik Big data yang terus bertambah dengan cepat secara real-time dinamakan,
Volume
25. Attributes yang berisi informasi serperti item_ID, name, brand, category, supplier,
place_made and price, merupakan salah satu contoh jenis database,
Penjualan
26. Fungsi dari data mining adalah salah satunya dapat mengetahui pola yang sering ( atau
kumpulan item yang sering) misalnya item apa yang sering dibeli bersama di Walmart
anda, ini dikenal dengan istilah,
Asosiasi dan Analisis Korelasi
27. Pernyataan yang tepat terkait data minig and knowledge discovery,
Fokus pada seluruh proses penemuan pengetahuan
28. Metode untuk memprediksi kelas instace dari instance yang diberi label sebelumnya,
Klasifikasi
29. Pernyataan yang kurang sesuai dengan metode peringkasan,
Mengelompokan data takberlabel
30. Yang bukan metode clusterisasi,
Decision Tree
31. Untuk menghindari set pengujian yang tumpang tindih, data dibagi menjadi k himpunan
bagian dengan ukuran yang sama kemudian setiap subset secara bergantian digunakan
untuk pengujian dan sisanya untuk pelatihan,
K-fold cross-validation
32. Jenis tugas data mining yang melakukan prediksi kelas,
Klasifikasi
33. Jenis tugas data mining yang memfasilitasi penerimaan / penelusuran informasi bagi
pengguna,
Visualisasi
34. Melihat suatu objek data yang tidak sesuai dengan prilaku umum data, sering digunakan
dalam deteksi penipuan atau analisis kejadian langka,
Analisis Outlier
35. Urutan langkah melakukan klasifikasi,
Pisahkan data menjadi set pelatihan dan pengujian, buat model pada set pelatihan,
evaluasi pada set pengujian
36. Metode untuk mengelompokan secara “alami” dari instance yang diberi data tanpa tabel,
Klasterisasi
37. Proses pencarian konten baru dan konten yang perlu diperbaharui dengan megiriman
crawler keseluruh konten yang ditemukan dari tautan halaman merupakan salah satu
konsep data mining pada searcch engine yang dinamakan
Crawl
38. Metode klasifikasi pada fungsi data mining yang menggunkan nilai estimasi dari
probabilits bersyarat dinamakan metode,
Naive Bayessian
39. Seberapa mudah data dapat dipahami merupakan kualitas data dari,
Interpretabillity
40. Acuan yang tidak tepat ketika melakukan pengaturan parameter,
Data pengujian harus digunakan untuk penyetelan parameter
M6
41. Model pembelajaran yang mempelajari bagaimana sistem dapat menyimpulkan suatu
fungsi untuk mendeskripsikan struktur tersembunyi dari data yang tidak berlabel. Sistem
ini tidak memprediksi keluaran yang benar, tetapi mengeksplorasi data dan dapat menarik
ksimpulan dari kumpulan data untuk mendeskripsikan struktur tersembunyi dari data yang
tidak berlabel,
Unsupervised learning
42. Saat anda ingin mengungkap pengelompokan yang melekat dalam data seperti
mengelompokan hewan berdasarkan beberapa karakteristik/fitur mis jumlah kaki maka
model pembelajaran yang sesuai,
Unsupervised learning-clustering
43. Tahapan yang tepat ketika melakukan training,
Image features-training with labeled data –learned model
44. Gambar pada representasi diatas adala pola-pola struktur yang ada pada suatu koleksi data
(knowledge) dalam bentuk,
Pohon
45. Yang tidak digunakan pada Model Supervised learning,
Latent Simantic analysis
46. Model pembelajaran yang menggunakan data berlabel dan tidak berlabel untuk pelatihan,
Semi suprvised learning
47. Tahapan yang tepat ketika melakukan testing,
Image feature – learned model – prediction
48. Pola-pola struktur yang ada pada suatu koleksi data (knowledge) dapat direpresentasi
dalam bentuk if then rules,
Aturan
49. Yang bukan tujuan supervised learning untuk membangun model yang dapat
menghasilkan output yang benar untuk suatu data input dapat digunakan untuk,
Klaterisasi (Clustering)
50. Gambar pada representasi diatas adala pola-pola struktur yang ada pada suatu koleksi data
(knowledge) dalam bentuk,
Aturan
51. Jika variabel keluaran adalah berupa kategori misalnya apel jeruk termasuk pada machine
learning betipe,
Supervised – classification
52. Kumpulan data yang sudah dipastikan kebenarannya dari sis label, data awal, komponen2
data yang akan dijadikan kunci,
Training set
53. Model ini belajar dar kumpulan data berlabel dan kemudian digunakan untuk
memprediksi peristiwa di masa depan,
Supervised learning
54. Ciri – ciri dari masing-masing sample data misalnya smartphone, ciri memiliki,
Feature/ atribute
55. Salah satu teknik digunakan untuk mengkontrol fenomena over-fitting adalah dengan cara
menambah pinalti ke fungsi error
Regularization
56. Gambar pada representasi diatas adala pola-pola struktur yang ada pada suatu koleksi data
(knowledge) dalam bentuk,
Tabel
57. Sebuah proses yang mempersiapkan data sehingga data tersebut bisa kita extract menjadi
satu vektor,
Feature Extraction
58. Pembelajaran yang bertujuan memprediksi output dengan akurat untuk data baru dan
output ti bernilai kontinu rill, contoh untuk prediksi kerja CPU,
Regresi
59. Pembelajaran yang menghasilkan nilai output ti bernilai diskrit kelas,
Klasifikasi
60. Tujuan pembelajaran unsupervised adalah membangun model yang dapat menemukan
komponen/ variable / fitur tersembunyi pada data pelatihan, yang dapat digunakan untuk
hal berikut, kecuali,
Pengklasifikasian (Clasifcation)
M7
61. Algoritma yang paling banyak digunakan untuk task Association rules,
Apriori
62. Algoritma yang berusaha meemukan pola tersembunyi atau pengelompokan data tanpa
perlu campur tangan manusia,
Unsupervised Learning
63. Pendekatan reduksi dimensi lain yang memfaktorkan matriks A menjadi 3 matriks
perngkat rendah SDV dilambangkan dengan rumus A = USTV,
Autoencoders
64. Pembelajaran mesin tanpa pengawasan menggunakan algoritma pembelajaran mesin
untuk menganalsis dan mengelompokan set data tak berlabel,
Unspervised Learning
65. Yang bukan tugas dari pembelajaran tanpa pengawasan,
Regression
66. Algoritma yang bukan digunakan untuk pengelompokan (clustering),
Auto Encoder
67. Metode berbasis aturan untuk menemukan hubungan antara variabel dalam kumpulan data
tertentu, metode ini sering digunakan untuk nalisisi keranjang pasar, memungkinkan
perusahaan untuk lebih memahami hubungan antara produk yang berbeda,
Association
68. Teknik yang mengelompokan data yang tidak berlabel berdasarkan persamaan atau
perbedaannya. Algoritma ini digunakan untuk memproses objek data mentah dan tidak
terklaifikasi menjadi grup yang diwakili,
Clustering
69. Algoritma yang menggunakan pohon hash untuk menghitung kumpulan item, menavigasi
kumpulan data dengan cara yang pertama. Algorutma ini telah dipopulerkan melalui
analisisi keranjang pasar, yang mengarah ke mesin rekomendasi berbeda .
Apriori
70. Pengelompokan yang sebagai pendekatan bottom up dimana titik datanya diisolasi sebagai
pengelompokan terpisah pada awalnya, dan kemudian digabungkan bersama secara
iteratif atas dasar kesamaan hingga satu cluster tercapai,
Pendekatan Aglomeratif
71. Teknik yang digunakan ketika jumlah fitur, atau dimensi, dalam kumpulan data tertentu
terlalu tinggi. Teknik ini mengurangi jumlah input data ke ukuran yang dapat dikelola
sambil juga menjaga integritas set,
Dimensionality reduction
72. Algoritma yang menggunakan pohon hash untuk menghitung kumpulan item, menavigasi
kumpulan data dengan cara yang pertama. Algorutma ini telah dipopulerkan melalui
analisisi keranjang pasar, yang mengarah ke mesin rekomendasi berbeda, ini termasuk
kedalam task,
Association
73. Kemampuan untuk menemukan persamaan dan perbedaan informasi menjadikan
unsupervised learning sebagai solusi ideal tugas di bawah ini, kecuali.
Klasifikasi buah jeruk dan apel
74. Pendekatan unsupervised learning adalah,
Mempelajari bagaimana cara kerja pembelajaran tanpa pengawasan
75. Pengelompokan yang mengambil pendekatan top down dalam hal ini, satu cluster data
dibagi berdasarkan perbedaan antara titik data. Pengelompokan dengan cara ini tidak
umum digunakan,tetapi masih perlu diperhatikan........pemisahan titik data pada setiap
iterasi,
Pendekatan Divisive
76. Teknik yang memanfaatkan jaringan neural untuk mengompresi data dan kemudian
membuat ulang represetsi baru dari input data asli, terdapat lapisan tersembunyi seacara
khussus bertindak sebagai penghambat......di dalam lapisan keluaran,
Autoencoders
77. Salah satu bentuk pengelompokan yang memungkinkan titik data menjadi bagian dari
beberapa kluster dengan derajat keanggotaan terpisah ini disebut juga pengeompokan
lembut atau fuzzy k means,
Tumpang tindih (overlapping)
78. Salah satu bentuk pengelompokan yang enetapkan bahwa suatu titik data hanya dapat ada
dalam satu cluster. Ini juga bisa disebut sebagai pengelompokan keras . Algoritm yang
digunakan salah satunya adalah k means clustering,
Clustering Eksekutif (Specifically exlusive)
79. Jenis algoritma pengurangan dimensi yang digunakan untuk mrngurangi redundansi dan
mengompresi kumpulan data melalui ekstrasi fitur. Unuk transformasi linier.....arah
ortogonal ke komponen sebelumnya dengan varians terbanyak,
Primcipal component analysis
80. Teknik tanpa pengawasan yang membantu menyelesaikan estimasi kepadatan atau
masalah pengelompokan lunak......teknik yang paling umum digunakan adalah GMM,
Pendekatan Probabilistic
M8
81. Reinforcement learning tepat digunakan untuk menyelesaikan permasalahan utama dalam,
Permainan catur
82. Berikut ini merupakan contoh permasalahan yang dapat diselesaikan dengan
reinforcement learning,
Sistem percakapan, self driving car, bermain game,
83. Markov Decision Process dapat didefinisikan kedalam n tuple, dimana bernilai,
5
84. Efek dari suatu aksi yang dipilih dari suatu state yang bergantung hanya pada state
tersebut saja bukan pada state2 sbelumnya dikenal dengan sifat,
Markov
M9
101. Untuk memperbanyak feature yang berhasil diekstrak dalam alogaritma convolutional
neural network digunakan
Padding
102. Dalam alogaritma convolutional neural network, ReLU seringkali digunakan pada
Hidden layer
103. Berikut ini adalah teknik yang dapat digunakan pada pooling layer dalam alogaritma
convolutional neural network
Max pooling, average pooling, min pooling
104. Untuk menyelesaikan permasalahan klasifikasi biner menggunakan alogaritma berbasis
neural network lebih tepat digunakan fungsi aktivasi
ReLU
105. Sebuah citra berdimensi5x5 dengan filter 3x3 dan stide sebesar 2 akna menghasilkan
feature map berdimensi
4x4
106. Pooling layer pada alogaritma convolutional neural network terdapat pada
Hidden layer
107. Berikut ini merupakan contoh Algoritma Deep Learning,
alogaritma recurrent neural network, Algoritma long short term memory, alogaritma
convolutional neural network
108. Berikut ini adalah efek dari mengecilnya nilai stride dalam alogaritma convolutional
neural network,
Informasi yang diperoleh semakin detail
109. Dimensi dari feature map dalam alogaritma convolutional neural network bergantung
pada,
Padding, stride, dimensi filter dan input
110. Untuk mencegah terjadinya overfitting dalam alogaritma convolutional neural network
dilakukan,
Dropout regulazion
111. Berikut ini merupakan library phyton untuk algoritma deep learning,
Pytorch, keras, tensorflow
112. Pooling layer bertujuan untuk,
Mengurangi dimensi feature map, mempercepat prosess komputasi, mengatasi
overfiting
113. Algoritma deep learning berbasis,
Machine learnng, artificial intelligence, neural network
114. Berikut ini merupakan loss function dalam alogaritma berbasis neural network ,
Cross entropy
115. Parameter dalam alogaritma convolutional neural network yang menentukan berapa
jumlah pergeseran filter disebut sebagai,
Stride
116. Berikut ini merupakan fungsi aktivasi dalam alogaritma convolutional neural network,
Sigmoid, ReLU, tanh
117. Algoritma deep learning dapat menyelesaikan permasalahan berikut ini,
Deteksi objek, natural language processing, pengenalan suara
118. Tahapan feature extraction pada alogaritma convolutional neural network terdiri dari
beberapa lapisan (layer) berikut ini, kecuali,
Fully – connected layer
119. Salah satu ukuran dari confusion matrix yang dapat digunakan dalam mengukur tingkat
keberhasilan sistem dalam mengukur tingkat keberhasilan sistem dalam menemukan
kembali sebuah informasi adalah,
Recall
120. Hasil dari proses flatten pada alogaritma convolutional neural network menjadi masukan
dalam,
Fully – connected layer
1. Semakin banyak data hingga dapat melebihi terabyte merupakan penjelasan dari dimensi
big data dalam hal,
➢ Volume
2. Data Mobile positioning data MPD berupa,
➢ Lokasi, waktu, sumber sinyal
3. Proses menganalisa tulisan untuk menentukan nada emosional penulisnya merupakan
salah satu implementasi machine learning dalam,
➢ Sentiment Analysis
4. Visualisasi pada hasil analisis big data dapat disajikan dalam bentuk,
➢ Plot, Grafik 3D, table
5. Dataset dibentuk dari,
➢ Sekumpulan objek yang memiliki fitur yang sama
6. Contok aplikasi machine learning dan analitik prediktif,
➢ Penetapan harga barang, prediksi cashflow, prediksi harga saham
7. Data wherehouse dibuat dengan menerapkan serangkaian Langkah pemrosesan terhadap
data yang berasal dari beberapa basis data. Berikut ini adalah yang termasuk dalam
pemrosesan data tersebut.
➢ Transformasi data, integrasi data, data preparation
8. Social media termasuk dalam sumber data,
➢ Digital content
9. Keuntungan menggunakan mobile positioning data MDP adalah,
➢ Automatics counting, me-record visitor outsite immigration point, continues
counting
10. Metode untuk memprediksi kelas instance yang diberi label,
➢ Klasifikasi
11. Cara yang dapat dilakukan untuk meningkatkan analisis bigdata gemone bioinformatics
adalah,
➢ Pemanfaatan cloud computing, meningkatkan kecepatan prosesor, penerapan
teknologi GPU
12. Pilihan yang dapat menciptakan hasil yang paling optimal merupakan pendekatan analitik
dari,
➢ Preskriptif
13. Beragamnya jenis data di dalam big data yang meliputi data terstruktur, semi terstruktur
dan tidak terstruktur, merupakan dimensi big data dalam hal,
➢ Variety
14. Manakah yang benar dari pernyataan berikut ini,
➢ Prediktif, memperkirakan kenaikan harga emas
15. Karakteristik big data yang cepat sekali berubah baik dari sisi variable maupun tipe data
dinamakan,
➢ Velocity
16. Contoh solusi big data, kecuali
➢ Deteksi penipuaan, mesin rekomendasi, pendeteksi spam
17. Tools Bahasa pemrograman yang dapat digunakan dalam ilmu data science adalah,
➢ SQL, Python, R
18. Data yang dikumpulkan secara aktif dari sensor, misalnya melalui penginderaan jauh dan
gambar satelit merupakan sumber big data dalam hal,
➢ Sensing data
19. Salah satu library data science yang digunakan untuk pemrosesan sinyal, gambar, dan
rumus statistik, adalah,
➢ Scipy, GPText, OpenNPL
20. Berapa banyak spark context yang dapat aktif per java virtual machine,
➢ Semua salah (hanya 1, Tidak spesifik, lebih dri 1)
21. Berikut ini yang bukan merupakan fungsi dari spark context,
➢ Untuk mengatur konfigurasi
22. Spark dapat menjalankan…tugas pada setiap partisi,
➢ Banyak
23. Toleransi kesalahan pada resillent distributed data RDD dicapai menggunakan,
➢ Direct acyclic graph
24. Berikut ini yang bukan operasi action pada resillent distributed data adalah,
➢ Map
25. Apache spark berpotensi…lebih cepat untuk menjalankan program pemrosesan batch
didalam memori jika dibandingkan dengan Mapreduce,
➢ 100 kali
26. Manajemen memori dalam spark dikerjakan oleh,
➢ Spark core
27. Apache spark pertama kali diluncurkan open source pada tahun,
➢ 2010
28. API Machine Learning yang utama untuk spark saat ini adalah APi berbasis,
➢ Dataframe
29. Komponen berikut ini yang tidak terdapat diatas spark core adalah
➢ Spark RDD
30. Pernyataan berikut ini yang salah mengenai spark dan Hadoop adalah,
➢ Keduanya merupakan mesin komputasi cluster
31. Spark ditulis dalam Bahasa pemrograman,
➢ Scala (R, Python)
32. Berikut ini adalah beberapa manfaat penggunaan spark, kecuali
➢ Otomatis dalam mengoptimalkan kode program
33. Berikut ini yang bukan merupakan karakteristik dari apache spark adalah,
➢ Hanya dapat dijalankan pada hadoop YARN
34. Modul untuk memproses data terstruktur dalam spark adalah,
➢ Spark SQL
35. Berikut ini adalah pernyataan yang salah mengenai resillent distributed data RDD,
kecuali,
➢ RDD dalam apache spark adalah suatu kumpulan objek yang tidak dapat
berubah
36. Spark SQL menerjemahkan perintah kedalam bentuk kode yang diproses oleh,
➢ Executor nodes
37. Berikut ini yang bukan operasi transformasi pada RDD adalah,
➢ Filter
38. Spark lebih cepat dibandingkan dengan mapreduce karena,
➢ Didukung oleh api Bahasa pemrograman yang berbeda-beda
39. Cluster manager yang dapat digunakan pada spark adalah,
➢ Standalone scheduler, YARN, Mesos
40. Algoritma untuk mengukur seberapa pentingnya halaman situs web,
➢ Page rank
41. Fitur spark streaming,
➢ Pemulihan cepat dari kegagalan dan kekeliruan
42. Aliran data yang berkelanjutan dalam spark streaming disebut,
➢ Dstream
43. Alogritma untuk menemukan komponen terhubung dari suatu graf,
➢ Connected components
44. Urutan edge yeng memungkinkan anda berpindah dari vertex A ke vertex B disebut,
➢ Path
45. Yang diperlukan untuk menangani data besar dalam bentuk grafik,
➢ Analisis data grafik, visualisasi data grafik, database grafik
46. Contoh penggunaan spark streaming,
➢ Netflix, deteksi penipuan, uber
47. Manakah urutan yang benar untuk menjelaskan cara kerja spark streaming
1. Input data stream
2. Batch input data
3. Hasilnya adalah batch data yang telah
4. Oleh spark streaming data dibagi menjadi kumpulan
➢ 1-4-2-3
48. Contoh use case penggunaan spark graphx,
➢ Film baru yang paling direkomendasikan orang-orang 1 minggu terakhir,
orang2 mensitasi artikel, teman toni di facebook paling banyak
49. Langkah pipa pemrosesan data grafik
1. Pembuatan grafik
2. Pengolahan pasca
3. Pra pemrosesan data
4. Analisis
➢ 3-1-4-2
50. Pernyataan yang benar tentang apache spark, kecuali,
➢ Abstraksi memori terditribusi untuk komputasi dalam memori pada kluster
51. Contoh data base grafik
➢ Noe4j
52. Untuk menampilkan pola dibalik hubungan antara entitas data,
➢ Visualisasi grafik
53. Fitur spark graphx,
➢ Kecepatan, Pustaka algoritma, fleksibilitas
54. Algoritma untuk menentukan jumlah segitiga yang mewati setiap simpul dalam graf,
➢ Triangle count
55. Framework yang dapat digunakan untuk memproses data grafik dan menjalankan analisis
prediktif pada data,
➢ Spark graphX
56. Pernyataan yang benar spark streaming,
➢ Memproses menggunakan algoritma kompleks, dapat menyerap data, daya
yang diproses dapat dikirim ke system file
57. Pernyataan yang benar tentang graph,
➢ Graph terdiri dari simpul dan sisi, semua yang ada di facebook adalah contoh,
edge menunjukan relasi
58. Apa yang menyebabkan spark streaming memiliki toleransi kesalahan,
➢ Kumpulan data input direplikasi dalam memori
59. Operasi jendela membutuhkan parameter
➢ Window length
60. CUDA yang diciptakan Nvidia adalah singkatan dari,
➢ Compute Unifed Device Architecture
61. Tiga tahap alur pemrosesan dalam eksekusi program CUDA,
➢ Langkah ke-1 : Salin input data dari CPU memory ke GPU memory, Langkah 2
: Muat program GPU dan eksekusi caching, Langkah 3 : salin hasil dari GPU
memory ke CPU memory
62. Architecture CUDA menerapkan pendekatan berupa kumpulan streaming multiprocessor
SM yang,
➢ Mengeksekusi sejumlah intruksi yang sama pda beberapa thread pada berbagai
wilayah data, sehingga dikenal dengan istilah single instruction, multiple threads
SIMT
63. Komputasi parallel adalah komputasi yang,
➢ Melibatkan banyak kalkulasi atau pemrosesan yang dilaksanakan secara
serentak simultan, dimana masalah besar dibagi dalam beberapa masalah kecil
yang kemudian diselesaikan dalam waktu yang sama.
64. Tujuan utama dari pemrograman parallel adalah untuk meningkatkan performa
komputasi, performa dalam pemrograman parallel diukur dari,
➢ Berapa banyak peningkatan kecepatan yang diperoleh dalam menggunakan
Teknik parallel.
65. CUDA C++ adalah perluasan C++ sehingga programmer dapat mendefinisikan fungsi
C++, yang Ketika dipanggil akan dieksekusi sebanyak N kali secara parallel oleh N
CUDA thread yang berbeda. Fungsi ini dikenal dengan istilah,
➢ Kernel
66. Kernel pada pemrograman CUDA agar dieksekusi paada device, dideklarasi
menggunakan
➢ _global_
67. Sistem distribusi (distributed computing) adalah Teknik komputasi parallel dimana
➢ Komputer yang digunakan secara bersamaan dalam melakukan komputasi
dilakukan oleh komputer-komputer terpisah yang terhubung
68. Perintah kernel <<N,M>>(..) menunjukan device untuk,
➢ Mempersiapkan block sebanyak N dengan thread sebanyak M ditiap block
69. Istilah thread pada GPU adalah,
➢ Satuan matrik untuk pemrosesan parallel pada GPU
70. Dua kata istilah penting yang digunakan dalam CUDA, yaitu: host, dan device. Istilah
host pada CUDA mengacu pada
➢ CPU
71. Dua kata istilah penting yang digunakan dalam CUDA, yaitu: host, dan device. Istilah
device pada CUDA mengacu pada,
➢ GPU
72. GPU dalam teknologi komputasi adalah singkatan dari,
➢ Graphics processing Unit
73. Pengelolaan memori pada device pada dasarnya menggunakan,
➢ cudaMalloC(), cudaMemcpy(), cudaFree()
74. Pernyataan yang benar mengenai thread block pada GPu,
➢ Thread block terdiri dari beberapa thread, dan beberapa thread block
digabung dalam satu grid
75. CUDA adalah platform komputasi parallel dengan arsitektur komputasi masuk dalam,
➢ Heterogenous karena melibatkan CPU dan GPU
76. Pernyataan yang benar mengenai pemrograman parallel pada GPU,
➢ Adalah salah satu cara untuk mempercepat pemrosesan untuk komputasi yang
besar
77. Pernyataan berikut yang benar mengenai CUda,
➢ Cuda adalah suatu platform untuk komputasi parallel, dan memanfaatkan
GPU untuk komputasi
78. CPU dari suatu unit computer adalah singkatan
➢ Central processing unit
79. Perintah kernel <<N,M>> menunjukan device untuk,
➢ Mempersiapkan block sebanyak N dengan thread sebanyak M di tiap block
80. Bahasa pemrograman phyton tergolong cepat karena,
➢ Bahasa pemrograman tingkat tinggi, dapat diinterpretasikan, dapat dikodekan
secara dinamis
81. Bahasa pemrograman pyhton tergolong lambat untuk eksekusi,
➢ Tugas yang berulang dan tergolong tinggat rendah
82. Modul kompilasi tepat waktu pada Pyhton untuk CPU adalah,
➢ Numba
83. Berikut ini adalah urutan proses yang dijalankan oleh numba,
➢ Rewrite IR, Lowering, LLVM IR, LLVM/NVVM JIT
84. Banyaknya operasi-operasi kecil yang berulang merupakan salah satu penyebab Bahasa
pemrogram python,
➢ Tergolong lambat
85. Berikut ini pernyataan yang tepat tentang python adalah,
➢ Python tergolong cepat untuk pengembangan, Python tergolong lambat untuk
eksekusi
86. Elemen dalam RRD dikelompokan kedalam beberapa partisi dan hanya dapat disimpan
pada sebuah node yang berbeda merupakan konsep RDD dalam hal,
➢ Distributed
87. Numba dapat menangani,
➢ Alokasi data dari dan ke host jika diperlukan, penyalinan data dari dan ke host
88. Komputasi pada GPU cluster dapat menggunakan,
➢ Numba, Pyspark
89. Berikut ini yang salah terkait dengan numba adalah,
➢ Semua Salah, Bersama dengan spark dapat menjalankan kode program pada spark
workers dengan GPU
90. Bahasa pemrograman Python tergolong cepat digunakan untuk,
➢ Menulis, Menguji, Mengembangkan kode program
91. Apache spark bukan merupakan,
➢ (Semua Salah) Suatu mesin untuk mengeksekusi komputasi terdistribusi pada
suatu klaster, suatu application programming interface
92. Spark diimplementasikan dalam,
➢ Scala dan java
93. Berikut ini adalah komputasi primitive yang tersedia pada spark untuk melakukan
paralelisme dan meminimumkan komunikasi antar workers
➢ Map ,Filter, Reduce
94. Berikut ini yang benar terkait dengan numba, kecuali
➢ Open source, kode dapat dibangkkitkan dengan LLVM CPU, dapat
menterjemahkan sintak Piton ke kode mesin, diimplementasikan sebagai suatu
modul
95. Modul kompilasi tepat waktu pada pyhton untuk GPU adalah,
➢ Cuda
96. Api spark memiliki dukungan yang terbatas pada Bahasa pemrograman,
➢ R
97. Permasalahan alokasi memori dalam komputasi pada GPU terdapat pada tugas yang
berskala
➢ Kecil
98. Type interface pada proses numba memerlukan
➢ Functions argument, numba IR
99. Pemrograman terdistribusi dalam python adalah,
➢ Numba atau Pyspark
3/8/2021 Kuis M1 : Big Data Computing Overview: Attempt review
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING / Pertemuan 1 : Big Data Computing Overview
/ Kuis M1 : Big Data Computing Overview
Question 1 Beragamnya jenis data di dalam Big Data yang meliputi data terstruktur, semi terstruktur dan bahkan data tidak
Correct terstruktur, merupakan penjelasan dari dimensi Big Data dalam hal:
Mark 5.00 out of
5.00 Select one:
Velocity
Volume
Variety
Veracity
Semua benar
Deteksi Penipuan
Question 3 Dalam arsitektur Big Data, solusi berupa rekomendasi, berada pada posisi sebagai:
Correct
Data Format
End Result
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2403724&cmid=491419 1/6
3/8/2021 Kuis M1 : Big Data Computing Overview: Attempt review
Question 4 Dalam ekosistem Big Data, proses pre-prosesing data dapat dilakukan menggunakan:
Correct
Sqoop
Tableu
Question 5 Data Warehouse dibuat dengan menerapkan serangkaian langkah pemrosesan terhadap data yang berasal dari beberapa
Incorrect basis data. Berikut ini adalah yang termasuk dalam pemrosesan data tersebut:
Mark 0.00 out of
5.00 Select one:
Pembersihan data
Semua benar
Integrasi data
Transformasi data
The correct answer is: Sekumpulan objek yang memiliki fitur yang sama
Semua benar
Resource Layer
Interface Layer
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2403724&cmid=491419 2/6
3/8/2021 Kuis M1 : Big Data Computing Overview: Attempt review
Question 8 Kumpulan data yang disusun dalam tabel berformat persegi panjang yang terdiri dari baris dan kolom disebut sebagai:
Correct
Data Warehouse
Database
Flat files
The correct answer is: Memperkirakan puncak dari kasus positif Covid-19, adalah contoh analisis prediktif.
Question 10 Model basis data yang berupa deret waktu (time series):
Correct
Text database
Semua salah
Spatial database
Unit
Data points
Record
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2403724&cmid=491419 3/6
3/8/2021 Kuis M1 : Big Data Computing Overview: Attempt review
Semua benar
Question 13 Sekumpulan tabel dimana bentuk setiap tabel analog dengan flat file, disebut:
Correct
Data Warehouse
DBMS
Database
Question 14 Semakin banyak data hingga mencapai ukuran Peta Byte atau bahkan lebih, merupakan penjelasan dari dimensi Big Data
Correct dalam hal:
Mark 5.00 out of
5.00 Select one:
Variety
Volume
Velocity
Veracity
Question 15 Sumber data yang digunakan dalam aplikasi Big Data dapat berupa:
Correct
Data Finansial
Semua benar
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2403724&cmid=491419 4/6
3/8/2021 Kuis M1 : Big Data Computing Overview: Attempt review
Question 16 Tempat penyimpanan data yang dikumpulkan di lokasi berbeda (basis data relasional) dan disimpan menggunakan skema
Correct terpadu:
Mark 5.00 out of
5.00 Select one:
Data Warehouse
Transactional database
Semua benar
Spatial Database
Fitur
Semua salah
Numerik
Dataset
Nilai
Objek
Tabel
Grafik 3D
Plot
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2403724&cmid=491419 5/6
3/8/2021 Kuis M1 : Big Data Computing Overview: Attempt review
Amazon ML
Semua benar
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2403724&cmid=491419 6/6
3/15/2021 1 pesan baru
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING
/ Pertemuan 2 : Big Data Computing, Applications and Technologies / Kuis M2 : Big Data Computing, Applications and Technologies
The correct answer is: Storage layer, Resource Management Layer, Application Layer
Question 2 Berikut ini adalah saran untuk memasuki era Analytic 3.0:
Correct
c. Semua benar
Question 3 Berikut ini yang harus dilakukan oleh perusahaan 1.0, kecuali:
Correct
The correct answer is: Membuat analitik dan keputusan berbasis fakta elemen kunci dari hubungan pelanggan, produk
dan layanan, strategi, dan persaingan
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2476785&cmid=491949 1/6
3/15/2021 1 pesan baru
b. Semua benar
d. Prediksi Cashflow
c. Data pegawai
d. Semua benar
b. Procter & Gamble melakukan Analisis sentimen media sosial real time untuk "Pulsa Konsumen"
c. Semua benar
d. Monsanto membayar hampir $ 1 miliar untuk The Climate Company, yang mengumpulkan dan menganalisis data
cuaca untuk pertanian
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2476785&cmid=491949 2/6
3/15/2021 1 pesan baru
Question 8 Dalam computer vision, contoh penerapan Machine Learning adalah, kecuali:
Correct
b. Pengenalan wajah
d. Pengenalan objek
Question 9 Istilah 'Machine Learning' diciptakan pada tahun <T> oleh <P>:
Correct
b. HDFS
c. Semua benar
d. MapReduce
b. MapReduce
c. YARN
d. HDFS
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2476785&cmid=491949 3/6
3/15/2021 1 pesan baru
d. Sumber data dari internal, relatif kecil dan data terstruktur dari pelanggan
The correct answer is: Perpaduan antara analitik tradisional dengan Big Data
d. Semua benar
The correct answer is: Hadoop merupakan framework untuk bekerja dengan Big Data
b. Semua benar
c. 2.0
d. 3.0
b. Relational vs Non-Relational
c. Semua benar
d. Static vs Dynamic
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2476785&cmid=491949 4/6
3/15/2021 1 pesan baru
b. Mahal vs Terjangkau
d. Semua benar
b. Graph
c. Key-Value
d. Semua benar
Question 18 Salah satu fakta yang menunjukkan aspek Velocity dari Big Data:
Correct
b. Semua benar
c. Mobil modern memiliki 100 sensor yang memantau berbagai item pada mobil
The correct answer is: Mobil modern memiliki 100 sensor yang memantau berbagai item pada mobil
Question 19 Salah satu tonggak penting dalam Big Data Analytic dalam aspek pengadaan infrastruktur:
Correct
b. Dapatkan infrastruktur yang tepat yang dibutuhkan berdasarkan arsitektur solusi Anda termasuk penyimpanan
data dan unit pemrosesan, platform, dan aplikasi
c. Adaptasi dan ubah organisasi Anda menuju teknologi big data dan implementasi analitik baru
d. Kembangkan arsitektur Solusi untuk kasus bisnis Anda termasuk proses pengumpulan data, arsitektur teknologi
dan metode analitik serta visualisasi data
The correct answer is: Dapatkan infrastruktur yang tepat yang dibutuhkan berdasarkan arsitektur solusi Anda termasuk
penyimpanan data dan unit pemrosesan, platform, dan aplikasi
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2476785&cmid=491949 5/6
3/15/2021 1 pesan baru
d. Keduanya salah
The correct answer is: Ketergantungan yang tinggi pada Machine Learning
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2476785&cmid=491949 6/6
3/22/2021 Kuis M3 : Introduction to Hadoop: Attempt review
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING / Pertemuan 3 : Introduction to Apache Hadoop
/ Kuis M3 : Introduction to Hadoop
Question 1 Jenis database NoSQL apa yang membuat dan menjalankan aplikasi yang berjalan dengan dataset yang selalu terhubung
Correct menjadi lebih mudah dan sering digunakan untuk jaringan media sosial.
Mark 5.00 out of
5.00 Select one:
a. Primary key
b. Grafik
c. Dokumen
d. Pencarian
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2564953&cmid=499213 1/6
3/22/2021 Kuis M3 : Introduction to Hadoop: Attempt review
Question 4 Database NoSQL menggunakan beragam model data untuk mengakses dan mengelola data. Jenis database ini
Incorrect dioptimalkan secara khusus untuk aplikasi yang memerlukan…., yang dicapai dengan mengurangi pembatasan konsistensi
Mark 0.00 out of data dari database lainnya.
5.00
Select one:
a. volume data besar, latensi rendah, dan model data fleksibel
The correct answer is: volume data besar, latensi rendah, dan model data fleksibel
Question 5 Type data berikut yang dapat ditangani oleh Hadoop adalah
Correct
b. Semi – terstruktur
c. Terstruktur
d. Semua benar
b. semua benar
d. membagi masalah besar menjadi masalah kecil yang dapat diselesaikan dengan cepat
b. Data disimpan dengan cara menyalin dataset dan meyimpan Salinan tersebut pada beberapa node
c. Penyimpanan dan pengaturan data pada perangkat penyimpanan harddisk atau flashdisk, dan menyediakan logical
view dari data yang disimpan dalam struktur hirakis direktori file.
d. Kumpulan server atau node digabungkan secara erat, dengan spesifikasi perangkat keras yang sama. Serta
terhubung melalui jaringan dan bekerja sebagai satu kesatuan
The correct answer is: Kumpulan server atau node digabungkan secara erat, dengan spesifikasi perangkat keras yang
sama. Serta terhubung melalui jaringan dan bekerja sebagai satu kesatuan
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2564953&cmid=499213 2/6
3/22/2021 Kuis M3 : Introduction to Hadoop: Attempt review
The correct answer is: On Disk Storage Devices dan In Memory Storage Devices
Question 9 Berikut yang dimaksud dengan menganalisa data dalam konteks big data adalah:
Correct
The correct answer is: Descriptive analytics, diagnostic analytics, predictive analytics, dan prescriptive analytics
Question 10 Berikut ini yang bukan merupakan Hadoop operation mode, adalah
Correct
c. Fully-Distributed mode
Question 11 Properti Big data yang penting, salah satunya adalah scalability, yaitu:
Correct
c. Handal
d. Kemampuan untuk terus beroperasi walaupun terjadi kegagalan pada beberapa komponen
The correct answer is: Kemampuan menanganai penambahan bebab yang diberikan tanpa penurunan kinerja
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2564953&cmid=499213 3/6
3/22/2021 Kuis M3 : Introduction to Hadoop: Attempt review
b. Semua benar
Question 13 Hadoop adalah platform pemrosesan big data yaitu data yang mempunyai karakteristik kecuali:
Correct
d. Volume besar, struktur data yang beragam (variety), dan nilai data yang diperlukan (useful value)
Question 14 Properti Big data yang penting, salah satunya adalah reliability, yaitu:
Correct
c. Handal
Question 15 Properti Big data yang penting, salah satunya adalah fault tolerance, yaitu:
Correct
c. Handal
The correct answer is: Kemampuan untuk terus beroperasi walaupun terjadi kegagalan pada beberapa komponen
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2564953&cmid=499213 4/6
3/22/2021 Kuis M3 : Introduction to Hadoop: Attempt review
Question 17 Hadoop adalah framework yang bekerja bersama tools lain yang beragam. Kelompok yang umum bekerja bersama
Correct Hadoop adalah
Mark 5.00 out of
5.00 Select one:
a. MapReduce, Hummer and Iguana
b. yang menerapkan divide and conquer dalam fisik terpisah, namun terhunung Bersama dalam satu cluster
c. yang melibatkan pelaksanaan sub-tugas secara bersamaan secara kolektif membentuk tugas yang besar melalui
beberapa processor
The correct answer is: yang menerapkan divide and conquer dalam fisik terpisah, namun terhunung Bersama dalam satu
cluster
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2564953&cmid=499213 5/6
3/22/2021 Kuis M3 : Introduction to Hadoop: Attempt review
Question 20 Properti Big data yang penting, salah satunya adalah aviability, yaitu:
Correct
b. Handal
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2564953&cmid=499213 6/6
3/29/2021 1 pesan baru
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING / Pertemuan 4 : Data Preprocessing
/ Kuis M4 : Data Preprocessing
Dibiarkan
Record
Instance
Sample
Combined Computer
Ignore
Clustering
Question 4 Data berupa image, video bahkan suara termasuk jenis data
Correct
Ordered
Graf
Multimedia
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2645316&cmid=502729 1/4
3/29/2021 1 pesan baru
Question 6 Data Cleansing merupakan tahapan untuk membersihkan data kotor sehingga menjadi dataset yang siap diolah. Data
Correct kotor tersebut berupa
Mark 5.00 out of
5.00 Select one:
missing value
duplicate data
outlier
A,B,C benar
Question 7 Data-data yang saling berhubungan, yang biasanya ditemukan pada jaringan internet termasuk dalam jenis data
Correct
Graf
Record
Ordered
Question 8 Imputasi nilai secara otomatis saat menangani incomplete data tidak dapat dilakukan menggunakan
Correct
Nilai tertinggi
Rata-rata
Median
Ordinal
Nominal
Rasio
Data objek
Data sample
Atribut
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2645316&cmid=502729 2/4
3/29/2021 1 pesan baru
Question 11 Nilai yang merepresentasikan urutan seperti nilai mata kuliah termasuk dalam atribut data type..
Correct
Ordinal
Numerik
Nominal
data Integration
data cleaning
data reduction
Question 13 Penanganan missing value dapat dilakukan menggunakan nilai estimasi dari probabilitas bersyarat menggunakan metode
Correct
Mean
Bayessian
Regresi
Question 14 Salah satu jenis data record yang diekstrak menjadi kumpulan term dan ditulis berdasarkan frekuensi kemunculan data,
Correct termasuk pada jenis data
Mark 5.00 out of
5.00 Select one:
Dokumen
Matriks
Sosial network
Transaksi
Question 15 Seberapa mudah data dapat dipahami merupakan kualitas data dari..
Correct
Believability
Completeness
Consistency
Question 16 Statistik dasar untuk mengukur sebaran data salah satunya adalah
Correct
Median
Mean
Modus
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2645316&cmid=502729 3/4
3/29/2021 1 pesan baru
Question 17 Studi tentang bagaimana menganalisis data dan membersihkan data merupakan salah satu tujuan dari
Correct
Data cleansing
Data validation
Data training
data transformation
data reduction
data cleaning
Question 19 Tanggal penjualan, nama pelanggan, nama barang, jumlah penjualan merupakan contoh dari
Correct
Dataset penjualan
Question 20 Tinggi badan, berat badan, usia, dan jenis kelamin merupakan contoh representasi karakteristik dari
Correct
Atribut
Dataset
Data objek
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2645316&cmid=502729 4/4
4/5/2021 1 pesan baru
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING / Pertemuan 5 : Introduction to Data Mining
/ Kuis M5 : Introduction Data Mining
Question 1 Metode untuk mempresentasikan hasil yang ditemukan dengan cara yang "bagus" secara visual
Correct
b. Visualisasi
c. Klasterisasi
d. Klasifikasi
Question 2 Untuk menghindari set pengujian yang tumpang tindih, data dibagi menjadi k himpunan bagian dengan ukuran yang
Correct sama kemudiansetiap subset secara bergantian digunakan untuk pengujian dan sisanya untuk pelatihan
Marked out of
5.00 Select one:
a. k-fold cross-validation
Question 3 Metode untuk mengelompokkan secara "alami" dari instance yang diberi data tanpa label
Correct
b. Klasterisasi
c. Klasifikasi
d. Visualisasi
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2763658&cmid=517239 1/5
4/5/2021 1 pesan baru
c. Data pengujian tidak digunakan dengan cara apa pun untuk membuat pengklasifikasi
d. Skema pembelajaran beroperasi dalam dua tahap yaitu membangun struktur dasar dan mengoptimalkan
pengaturan parameter
Question 6 Jenis tugas data mining yang menfasilitasi penerimaan / penelusuran informasi bagi pengguna
Correct
b. Klasterisasi
c. Klasifikasi
d. Visualisasi
Question 7 Karakteristik Big Data yang terus bertambah dengan cepat secara real-time dinamakan
Correct
b. variety
c. Velocity
d. Value
Question 8 Fungsi dari data mining adalah salah satunya dapat mengetahui pola yang sering (atau kumpulan item yang sering)
Correct misalnya item apa yang sering dibeli bersama di Walmart Anda. Ini dikenal dengan istilah
Marked out of
5.00 Select one:
a. Klasterisasi
b. Outlier Analysis
c. Klasifikasi
Question 9 Proses pencarian konten baru dan konten yang perlu diperbaharui dengan mengirimkan crawler ke seluruh konten yang
Correct ditemukan dari tautan halaman merupakan Salah satu konsep data mining pada Search Engine yang dinamakan
Marked out of
5.00 Select one:
a. Index
b. Crawl
c. Rank
d. Searching
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2763658&cmid=517239 2/5
4/5/2021 1 pesan baru
Question 10 Metode untuk memprediksi kelas instance dari instance yang diberi label sebelumnya
Correct
b. Klasterisasi
c. Asosiasi
d. Klasifikasi
Question 11 Melihat suatu objek data yang tidak sesuai dengan perilaku umum data, sering digunakan dalam deteksi penipuan atau
Correct analisis kejadian langka
Marked out of
5.00 Select one:
a. Analisis Outlier
b. Klasifikasi
c. Klasterisasi
Question 12 Seberapa mudah data dapat dipahami merupakan kualitas data dari..
Correct
b. Believability
c. Completeness
d. Interpretability
Question 13 Regression, Decision Trees, Bayesian, Neural Networks, Naïve Bayes Rules, Support Vector Machines, Genetic Algorithms
Correct adalah pendekatan yang digunakan untuk
Marked out of
5.00 Select one:
a. Asosiasi
b. Klasifikasi
c. Visualisasi
d. Klasterisasi
b. Pisahkan data menjadi set pelatihan dan pengujian, Buat model pada set pelatihan, Evaluasi pada set pengujian
c. Buat model pada set pelatihan, pilih secara acak jumlah instance kelas minoritas yang diinginkan, Evaluasi pada set
pengujian
d. Evaluasi pada set pengujian, Buat model pada set pelatihan, Pisahkan data menjadi set pelatihan dan pengujian
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2763658&cmid=517239 3/5
4/5/2021 1 pesan baru
Question 15 Pernyataan yang tepat terkait data mining and knowledge discovery
Correct
c. lebih teori
b. Visualisasi
c. Klasifikasi
d. Asosiasi
Question 17 Pernyataan yang tepat terkait data mining and knowledge discovery
Correct
Question 18 Attributes yang berisi informasi seperti item_ID, name, brand, category, supplier, place_made and price, merupakaan salah
Correct satu contoh jenis database
Marked out of
5.00 Select one:
a. Social media
b. Penjualan
c. Penyewaan
d. Marketing
Question 19 Metode klasifikasi pada fungsi data mining yang menggunakan nilai estimasi dari probabilitas bersyarat dinamakan
Correct metode
Marked out of
5.00 Select one:
a. Naive Bayessian
b. Mean
c. Regresi
d. Eliminasi
b. Decision Tree
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2763658&cmid=517239 4/5
4/5/2021 1 pesan baru
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2763658&cmid=517239 5/5
4/12/2021 1 pesan baru
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING
/ Pertemuan 6 : Introduction to Machine Learning (Supervised) / Kuis M6 : Introduction to Machine Learning (Supervised)
Question 1 Model Pembelajaran yang mempelajari bagaimana sistem dapat menyimpulkan suatu fungsi untuk mendeskripsikan
Correct struktur tersembunyi dari data yang tidak berlabel. Sistem ini tidak memprediksi keluaran yang benar, tetapi
Marked out of mengeksplorasi data dan dapat menarik kesimpulan dari kumpulan data untuk mendeskripsikan struktur tersembunyi dari
5.00 data yang tidak berlabel.
Select one:
a. Reinfocement Learning
b. Supervised Learning
d. Unsupervised Learning
Question 3 Jika variabel keluaran adalah berupa kategori misalnya “apel”, “jeruk” termasuk pada machine learning bertipe
Correct
b. Supervised -Regresion
c. Reinfocement
d. Supervised – Classification
Question 4
Correct
Marked out of
5.00
Gambar pada representasi di atas adalah Pola-pola struktur yang ada pada suatu koleksi data (knowledge) dalam bentuk
Select one:
a. Pohon
b. Aturan
c. Tabel
d. Instance
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2888103&cmid=530886 1/5
4/12/2021 1 pesan baru
Question 5 Saat Anda ingin mengungkap pengelompokan yang melekat dalam data, seperti mengelompokkan hewan berdasarkan
Correct beberapa karakteristik / fitur, mis. jumlah kaki maka model pembelajaran yang sesuai
Marked out of
5.00 Select one:
a. Reinfocement Learning
Question 6 Pola-pola struktur yang ada pada suatu koleksi data (knowledge) dapat direpresentasi dalam bentuk if then rules :
Correct
b. Instance
c. Pohon
d. Aturan
Question 7 Model pembelajaran yang menggunakan data berlabel dan tidak berlabel untuk pelatihan.
Correct
b. Unsupervised Learning
c. Supervised Learning
d. Reinfocement Learning
Question 8 Pembelajaran yang bertujuan memprediksi output dengan akurat untuk data baru dan output ti bernilai kontinu (riil),
Correct contoh untuk Prediksi kinerja CPU
Marked out of
5.00 Select one:
a. Klasifikasi
b. Klasterisasi
c. Generalisasi
d. Regressi
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2888103&cmid=530886 2/5
4/12/2021 1 pesan baru
Question 10 Salah satu teknik yang digunakan untuk mengkontrol fenomena over-fitting adalah dengan cara menambah finalti ke
Correct fungsi error.
Marked out of
5.00 Select one:
a. regularization
b. generalization
c. model selection
d. prediction
Question 11 Tujuan pembelajaran unsupervised adalah membagun model yang dapat menemukan komponen / variabel / fitur
Correct tersembunyi pada data pelatihan, yang dapat digunakan untuk hal berikut, kecuali
Marked out of
5.00 Select one:
a. Reduksi dimensi (dimension reduction)
b. Pengklasifikasian (classification)
c. Pengelompokan (clustering)
d. Rekomendasi
Question 12
Correct
Marked out of
5.00
Gambar pada representasi di atas adalah Pola-pola struktur yang ada pada suatu koleksi data (knowledge) dalam bentuk
Select one:
a. Aturan
b. Instance
c. Pohon
d. Tabel
Question 13 Model ini belajar dari kumpulan data berlabel dan kemudian digunakan untuk memprediksi peristiwa di masa depan.
Correct
b. Reinfocement Learning
c. Unsupervised Learning
d. Supervised Learning
b. Klasterisasi
c. Regressi
d. Klasifikasi
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2888103&cmid=530886 3/5
4/12/2021 1 pesan baru
Question 15 Yang bukan tujuan supervised learning untuk membangun model yang dapat menghasilkan output yang benar untuk
Correct suatu data input dapat digunakan untuk
Marked out of
5.00 Select one:
a. Pengklasifikasian (classification)
b. Ranking
c. Klasterisasi (clustering)
d. Regresi (regression)
b. Linear Model
Question 17
Correct
Marked out of
5.00
Gambar pada representasi di atas adalah Pola-pola struktur yang ada pada suatu koleksi data (knowledge) dalam bentuk
Select one:
a. Aturan
b. Pohon
c. Tabel
d. Instance
Question 18 Kumpulan data yg sudah dipastikan kebenarannya, dr sisi label, data awal, komponen2 data yg akan dijadikan kunci,
Correct
b. Instance
c. Feature/ atribut
d. Training Set
Question 19 Sebuah proses yg mempersiapkan data sehingga data tsb bisa kita extract cirinya menjadi suatu vektor
Correct
b. Instance
c. Feature Extraction
d. Feature/ atribut
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2888103&cmid=530886 4/5
4/12/2021 1 pesan baru
Question 20 Ciri-ciri dari masing-masing sample data misalnya Smartphone. ciri: memiliki ...
Correct
Marked out of
5.00 Select one:
a. Training Set
b. Feature/ atribut
c. Instance
d. Feature Extraction
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2888103&cmid=530886 5/5
4/19/2021 Kuis M7 : Unsupervised Learning: Attempt review
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING
/ Pertemuan 7 : Introduction to Machine Learning (Unsupervised) / Kuis M7 : Unsupervised Learning
Question 1 Pengelompokan yang sebagai "pendekatan bottom-up". Di mana titik datanya diisolasi sebagai pengelompokan terpisah
Correct pada awalnya, dan kemudian digabungkan bersama secara iteratif atas dasar kesamaan hingga satu cluster tercapai.
Marked out of
5.00 Select one:
a. Pendekatan Overlapping
b. Pendekatan Aglomeratif
c. Pendekatan Divisive
d. Pendekatan Probabilistic
Question 2 Teknik yang digunakan ketika jumlah fitur, atau dimensi, dalam kumpulan data tertentu terlalu tinggi. Teknik ini
Correct mengurangi jumlah input data ke ukuran yang dapat dikelola sambil juga menjaga integritas set data sebanyak mungkin,
Marked out of biasanya digunakan dalam tahap data praproses
5.00
Select one:
a. Dimensionality reduction
b. Association
c. clustering
d. Regression
Question 3 Algoritme yang menggunakan pohon hash untuk menghitung kumpulan item, menavigasi kumpulan data dengan cara
Incorrect yang pertama. Algoritma ini telah dipopulerkan melalui analisis keranjang pasar, yang mengarah ke mesin rekomendasi
Marked out of yang berbeda untuk platform musik dan pengecer online.Misalnya, jika saya memutar radio Black Sabbath di Spotify,
5.00 dimulai dengan lagu mereka "Anggrek", salah satu lagu lain di saluran ini kemungkinan besar adalah lagu Led Zeppelin,
seperti "Over the Hills dan Far Away." Ini didasarkan pada kebiasaan mendengarkan saya sebelumnya serta kebiasaan
orang lain.
Select one:
a. Eclat
b. Apriori
c. Apriori
d. FP-Growth
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3027952&cmid=549345 1/5
4/19/2021 Kuis M7 : Unsupervised Learning: Attempt review
Question 4 Algoritme yang menggunakan pohon hash untuk menghitung kumpulan item, menavigasi kumpulan data dengan cara
Correct yang pertama. Algoritma ini telah dipopulerkan melalui analisis keranjang pasar, yang mengarah ke mesin rekomendasi
Marked out of yang berbeda untuk platform musik dan pengecer online.Misalnya, jika saya memutar radio Black Sabbath di Spotify,
5.00 dimulai dengan lagu mereka "Anggrek", salah satu lagu lain di saluran ini kemungkinan besar adalah lagu Led Zeppelin,
seperti "Over the Hills dan Far Away." Ini didasarkan pada kebiasaan mendengarkan saya sebelumnya serta kebiasaan
orang lain. Ini termasuk task
Select one:
a. Dimensionality reduction
b. Regression
c. clustering
d. Association
Question 5 Algoritme yang berusaha menemukan pola tersembunyi atau pengelompokan data tanpa perlu campur tangan manusia.
Correct
b. Deep Learning
c. Unsupervised Learning
Question 6 Metode berbasis aturan untuk menemukan hubungan antara variabel dalam kumpulan data tertentu. Metode ini sering
Correct digunakan untuk analisis keranjang pasar, memungkinkan perusahaan untuk lebih memahami hubungan antara produk
Marked out of yang berbeda. Memahami kebiasaan konsumsi pelanggan memungkinkan bisnis untuk mengembangkan strategi
5.00 penjualan silang dan mesin rekomendasi yang lebih baik.
Select one:
a. Association
b. clustering
c. Regression
d. Dimensionality reduction
Question 7 Jenis algoritme pengurangan dimensi yang digunakan untuk mengurangi redundansi dan mengompresi kumpulan data
Correct melalui ekstraksi fitur. Metode ini menggunakan transformasi linier untuk membuat representasi data baru, menghasilkan
Marked out of sekumpulan "komponen utama". Komponen utama pertama adalah arah yang memaksimalkan varians dari dataset.
5.00 Sementara komponen utama kedua juga menemukan varians maksimum dalam data, itu sama sekali tidak berkorelasi
dengan komponen utama pertama, menghasilkan arah yang tegak lurus, atau ortogonal, ke komponen pertama. Proses
ini berulang berdasarkan jumlah dimensi, dimana komponen utama berikutnya adalah arah ortogonal ke komponen
sebelumnya dengan varians terbanyak.
Select one:
a. Singular value decomposition
b. FP-Growth
c. Autoencoders
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3027952&cmid=549345 2/5
4/19/2021 Kuis M7 : Unsupervised Learning: Attempt review
Question 8 Pendekatan reduksi dimensi lain yang memfaktorkan matriks, A, menjadi tiga matriks peringkat rendah. SVD
Correct dilambangkan dengan rumus, A = USVT, di mana U dan V adalah matriks ortogonal. S adalah matriks diagonal, dan nilai S
Marked out of dianggap sebagai nilai tunggal matriks A. Principal component analysis
5.00
Select one:
a. Singular value decomposition
b. FP-Growth
c. Autoencoders
Question 9 Pengelompokan yang mengambil pendekatan "top-down". Dalam hal ini, satu cluster data dibagi berdasarkan perbedaan
Correct antara titik data. Pengelompokan dengan cara ini tidak umum digunakan, tetapi masih perlu diperhatikan dalam konteks
Marked out of pengelompokan hierarkis. Proses pengelompokan ini biasanya divisualisasikan menggunakan dendrogram, diagram mirip
5.00 pohon yang mendokumentasikan penggabungan atau pemisahan titik data pada setiap iterasi.
Select one:
a. Pendekatan Aglomeratif
b. Pendekatan Probabilistic
c. Pendekatan Overlapping
d. Pendekatan Divisive
Question 10 Algoritma yang paling banyak digunakan untuk task Association rules
Correct
b. Apriori
c. Apriori
d. Eclat
Question 11 Salah satu bentuk pengelompokan yang memungkinkan titik data menjadi bagian dari beberapa kluster dengan derajat
Correct keanggotaan terpisah. Ini disebut juga Pengelompokan "lembut" atau fuzzy k-means
Marked out of
5.00 Select one:
a. Memecah belah (Divisive)
d. Hierarkis ( hierarchical)
b. Dimensionality reduction
c. Regression
d. clustering
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3027952&cmid=549345 3/5
4/19/2021 Kuis M7 : Unsupervised Learning: Attempt review
Question 13 Salah satu bentuk pengelompokan yang menetapkan bahwa suatu titik data hanya dapat ada dalam satu cluster. Ini juga
Correct bisa disebut sebagai pengelompokan "keras". Algoritma yang digunakan salah satunya adalah K-means clustering
Marked out of
5.00 Select one:
a. Memecah belah (Divisive)
c. Hierarkis ( hierarchical)
b. Mempelajari bagaimana cara kerja pembelajaran tanpa pengawasan dan dengan pengawasan
Question 15 Teknik tanpa pengawasan yang membantu menyelesaikan estimasi kepadatan atau masalah pengelompokan "lunak".
Correct Dalam hal ini, titik data dikelompokkan berdasarkan kemungkinannya termasuk dalam distribusi tertentu. Teknik yang
Marked out of paling umum digunakan adalah Gaussian Mixture Model (GMM)
5.00
Select one:
a. Pendekatan Probabilistic
b. Pendekatan Aglomeratif
c. Pendekatan Overlapping
d. Pendekatan Divisive
Question 16 Pembelajaran mesin tanpa pengawasan, menggunakan algoritme pembelajaran mesin untuk menganalisis dan
Correct mengelompokkan set data tak berlabel
Marked out of
5.00 Select one:
a. Supervised Learning
b. Deep Learning
c. Unsupervised Learning
Question 17 Kemampuannya untuk menemukan persamaan dan perbedaan informasi menjadikannya unsupervised learning sebagai
Correct solusi ideal tugas tugas di bawah ini, kecuali
Marked out of
5.00 Select one:
a. strategi penjualan silang
d. Segmentasi pelanggan
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3027952&cmid=549345 4/5
4/19/2021 Kuis M7 : Unsupervised Learning: Attempt review
c. Hierarkis ( hierarchical)
d. Auto Encoder
Question 19 Teknik yang mengelompokkan data yang tidak berlabel berdasarkan persamaan atau perbedaannya. Algoritma ini
Correct digunakan untuk memproses objek data mentah dan tidak terklasifikasi menjadi grup yang diwakili oleh struktur atau
Marked out of pola dalam informasi.
5.00
Select one:
a. Clustering
b. Dimensionality reduction
c. Regression
d. Association
Question 20 Teknik yang memanfaatkan jaringan neural untuk mengompresi data dan kemudian membuat ulang representasi baru
Correct dari input data asli. Terdapat lapisan tersembunyi secara khusus bertindak sebagai penghambat untuk memampatkan
Marked out of lapisan masukan sebelum merekonstruksi di dalam lapisan keluaran.
5.00
Select one:
a. Singular value decomposition
c. Autoencoders
d. FP-Growth
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3027952&cmid=549345 5/5
4/26/2021 Kuis M8 : Reinforcement: Attempt review
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING
/ Pertemuan 8 : Introduction to Machine Learning (Reinforcement) / Kuis M8 : Reinforcement
Question 1 Reinforcement learning tepat digunakan untuk menyelesaikan permasalahan utama dalam:
Correct
b. Permainan catur
c. Peramalan cuaca
d. Pengenalan objek
Question 2 Berikut ini merupakan contoh permasalahan yang dapat diselesaikan dengan reinforcement learning:
Correct
b. Self-driving car
c. Semua benar
d. Bermain Game
Question 3 Markov Decision Process dapat didefinisikan kedalam n-tuple, dimana bernilai:
Correct
b. 3
c. 6
d. 5
Question 4 Efek dari suatu aksi yang dipilih dari suatu state yang bergantung hanya pada state tersebut saja bukan pada state-state
Correct sebelumnya dikenal sebagai sifat:
Marked out of
5.00 Select one:
a. Markov
b. Bellman
c. Transisi
d. Stokastik
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3172841&cmid=564465 1/4
4/26/2021 Kuis M8 : Reinforcement: Attempt review
c. Input yang diterima oleh agen berupa state, action dan reward
b. Reward
c. Model
d. Action
Question 7 Fungsi reward dalam Markov Decision Process dapat bernilai bilangan:
Correct
b. Riil
c. Bulat
d. Asli
Question 8 Sifat Markov dalam Markov Decision Process diperlukan langsung dalam menentukan:
Correct
b. Supervised learning
c. Semua benar
d. Navigasi robot
Question 10 Pemilihan suatu aksi pada suatu state tertentu didalam Markov Decision Process ditentukan oleh:
Correct
b. Reward
c. Value
d. Policy
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3172841&cmid=564465 2/4
4/26/2021 Kuis M8 : Reinforcement: Attempt review
Question 11 Berikut ini merupakan pernyataan yang salah terkait Markov Decision Process:
Correct
c. Semua benar
d. Machine learning
b. State-Action-Reward-State-Action (SARSA)
d. Q-learning
Question 14 Efek dari suatu pilihan aksi pada suatu state ditentukan oleh:
Correct
b. Model transisi
c. Policy
d. Fungsi reward
Question 15 Reward dalam permasalahan shortest path yang dimodelkan dengan Markov Decision Process ditandai dengan:
Correct
d. Semua salah
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3172841&cmid=564465 3/4
4/26/2021 Kuis M8 : Reinforcement: Attempt review
Question 17 Berikut ini merupakan pernyataan yang kurang tepat terkait reinforcement learning (RL):
Correct
b. RL yang diselesaikan dengan Markov Decision Process memerlukan data latih dalam menentukan probabilitas
transisinya
c. RL dapat digunakan dalam menciptakan sistem pelatihan untuk siswa yang bersifat kustom
Question 18 Pada Markov Decision Process, pemilihan ruas jalan dalam permasalahan shortest path merupakan bagian dari:
Correct
b. Reward
c. State
d. Action
Question 19 Dalam memilih aksi pada suatu state perlu diperhatikan hal-hal berikut ini:
Correct
c. Semua benar
Question 20 Sekumpulan token yang mewakili setiap kemungkinan keadaan dari agen disebut sebagai:
Correct
b. Action
c. Semua salah
d. Reward
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3172841&cmid=564465 4/4
M10 Team Teaching
1. Salah satu library data science yang digunakan untuk pemrosesan sinyal, gambar, dan rumus
statistik adalah.. Semua Benar
2. Beragamnya jenis data di dalam Big Data yang meliputi data terstruktur, semi terstruktur
dan tidak terstruktur, merupakan dimensi Big Data dalam hal: Variety
3. Pilihan yang dapat menciptakan hasil yang paling optimal merupakan pendekatan analitik
dari.. Preskriptif
4. Sumber data yang digunakan dalam aplikasi Big Data dapat berupa: Semua Benar
5. Keuntungan menggunakan Mobile Positioning data (MPD) adalah… Semua Benar
6. Metode untuk memprediksi kelas instance dari instance yang diberi label sebelumnya…
Klasifikasi
7. Visualisasi pada hasil analisis Big Data dapat disajikan dalam bentuk.. Semua Benar
8. Data yang dikumpulkan secara aktif dari sensor, misalnya melalui penginderaan jauh dan
gambar satelit merupakan sumber big data dalam hal…. Sensing data
9. Contoh solusi Big Data, kecuali: Semua Benar
10. Contoh Aplikasi Machine Learning dan Analitik Prediktif: Semua Benar
11. Semakin banyak data hingga dapat melebihi terabyte merupakan penjelasan dari dimensi
Big Data dalam hal: Volume
12. Karakteristik Big Data yang cepat sekali berubah baik dari sisi variabel maupun tipe data
dinamakan… Velocity
13. Data Warehouse dibuat dengan menerapkan serangkaian langkah pemrosesan terhadap
data yang berasal dari beberapa basis data. Berikut ini adalah yang termasuk dalam
pemrosesan data tersebut: Semua Benar
14. Manakah yang benar dari pernyataan berikut ini: Deskriptif, perkiraan berdasarkan data
yang tersedia
15. Data Mobile Positioning data (MPD) berupa… Semua Benar
16. Dataset dibentuk dari: Sekumpulan fitur yang memiliki objek yang sama
17. Tools Bahasa Pemograman yang dapat digunakan dalam ilmu data science adalah… Semua
Benar
18. Social Media termasuk dalam sumber data..Digital Content
19. Cara yang dapat dilakukan untuk meningkatkan analisis bigdata genome bioinformatics
adalah.. Semua Benar
20. Proses menganalisis tulisan untuk menentukan nada emosional penulisnya merupakan salah
satu implementasi machine learning dalam… Principal Component Analysis
Team Teaching Big Data M9
1. Berikut ini adalah efek dari mengecilnya nilai stride dalam Algoritma Convolutional Neural Network
2. Hasil dari proses flatten pada Algoritma Convolutional Neural Network menjadi masukan dalam
Fully-connected layer
4. Berikut ini merupakan loss function dalam algoritma berbasis Neural Network
Cross entropy
6. Berikut ini adalah teknik yang dapat digunakan pada pooling layer dalam Algoritma Convolutional
Neural Network
Hidden layer
8. Sebuah citra berdimensi 5x5 dengan filter 3x3 dan stride sebesar 2 akan menghasilkan feature map
berdimensi
4x4
Hidden layer
10. Berikut ini merupakan fungsi aktivasi dalam Algoritma Convolutional Neural Network
11. Tahapan feature extraction pada Algoritma Convolutional Neural Network terdiri dari beberapa
lapisan (layer) berikut ini, kecuali
Fully-connected layer
12. Untuk memperbanyak feature yang berhasil diekstrak dalam Algoritma Convolutional Neural
Network digunakan
Padding
15. Untuk menyelesaikan permasalahan klasifikasi biner menggunakan algoritma berbasis Neural
Network lebih tepat digunakan fungsi aktivasi
ReLU
16. Salah satu ukuran dari confusion matrix yang dapat digunakan dalam mengukur tingkat keberhasilan
sistem dalam menemukan kembali sebuah informasi adalah
Recall
17. Untuk mencegah terjadinya overfitting dalam Algoritma Convolutional Neural Network dilakukan
Dropout regularization
18. Dimensi dari feature map dalam Algoritma Convolutional Neural Network bergantung pada
Semua benar
Stride
Padding
19. Parameter dalam Algoritma Convolutional Neural Network yang menentukan berapa jumlah
pergeseran filter disebut sebagai
Stride
20. Berikut ini merupakan library Python untuk Algoritma Deep Learning
1. Berikut ini yang bukan merupakan karakteristik dari Apache Spark adalah
2. Berapa banyak Spark Context yang dapat aktif per Java Virtual Machine
Hanya 1
3. Berikut ini yang bukan merupakan fungsi dari Spark Context adalah
6. Berikut ini yang bukan operasi transformasi pada Resilient Distributed Data adalah
Flatmap
2010
8. Berikut ini yang bukan operasi action pada Resilient Distributed Data adalah
Top()
9. Berikut ini adalah pernyataan yang salah mengenai Resilient Distributed Data (RDD), kecuali
Scala
Spark SQL
Spark Core
DataFrame
16. Apache Spark berpotensi … lebih cepat untuk menjalankan program pemrosesan batch didalam
memori jika dibandingkan dengan MapReduce
100 kali
17. Komponen berikut ini yang tidak terdapat diatas Spark Core adalah
18. Spark SQL menerjemahkan perintah kedalam bentuk kode yang diproses oleh
19. Pernyataan berikut ini yang salah mengenai Spark dan Hadoop adalah
Satu
Team Teaching Big Data M12
1. Algoritma untuk menentukan jumlah segitia yang melewati setiap simpul dalam graf
Triangle Count
2. Urutan edge yang memungkinkan Anda berpindah dari vertex A ke vertex B disebut
Path
Page Rank
Visualisasi Grafik
5. Manakah urutan yang benar untuk menjelaskan cara kerja Spark Streaming:
2. Batch input data / RDD tersebut diproses oleh Spark Engine menggunakan operasi RDD.,
3. Hasilnya adalah batch data yang telah diproses didorong keluar ke sistem eksternal,
4. Oleh Spark Streaming data dibagi menjadi kumpulan / batch input data (diperlakukan sebagai RDD).
1-4-2-3
1. Pembuatan grafik,
2. Pengolahan pasca,
4. Analisis
3-1-4-2
Connected Components
Neo4j
Netflix
11. Operasi Jendela membutuhkan parameter
window length
12. Framework yang dapat digunakan untuk memproses data grafik dan menjalankan analisis prediktif
pada data
Spark GraphX
Semua Benar (Film baru yang paling direkomendasikan orang-orang 1 minggu terakhir, Orang-orang
yang sama-sama mensitasi suatu artikel, Teman toni di facebook yang paling banyak pengikutnya)
Semua benar (Graph terdiri dari simpul dan sisi, Semua yang ada di Facebook adalah contoh
penggunaan struktur data graph, Edge menunjukan relasi antar simpul)
17. Yang diperlukan untuk menangani data besar dalam bentuk grafik
Semua benar (Analisis Data Grafikm Visualisasi data grafik, Database grafik)
DStream
Abstraksi memori terdistribusi untuk komputasi dalam memori pada klaster besar yang toleran terhadap
kesalahan
Semua benar (Memproses menggunakan algoritma kompleks dengan fungsi seperti map, reduce, join,
window, Dapat menyerap data dari berbagai sumber, Data yang diproses dapat dikirim ke sistem file,
database, dan live dashboard)
Team Teaching Big Data M13
Langkah ke-1 Salin input data dari CPU memory ke GPU memory
Langkah-2 Muat program GPU dan eksekusi, caching (simpan) data pada chip untuk kinerja
3. Arsitektur CUDA menerapkan pendekatan berupa kumpulan streaming multiprocessors (SM) yang
Mengeksekusi sejumlah instruksi yang sama pada beberapa thread pada berbagai wilayah data,
sehingga dikenal dengan istilah single instruction, multiple threads (SIMT)
Melibatkan banyak unit computer untuk memecahkan masalah yang berbeda-beda untuk masing-
masing unit computer, namun dalam waktu yang sama
5. Tujuan utama dari pemrograman paralel adalah untuk meningkatkan performa komputasi. Performa
dalam pemrograman paralel diukur dari
Berapa banyak peningkatan kecepatan (speed up) yang diperoleh dalam menggunakan tehnik paralel
6. CUDA C++ adalah perluasan C++ sehingga programmer dapat mendefinisikan fungsi C++ yang ketika
dipanggil, akan dieksekusi sebanyak N kali secara paralel dan N CUDA thread yang berbeda. Fungsi ini
dikenal dengan istilah
Kernel
7. Kernel pada pemrograman CUDA agar dieksekusi pada device, dideklarasi menggunakan
__global__
Komputer yang digunakan secara bersamaan dalam melakukan komputasi dilakukan oleh computer-
komputer terpisah yang terhubung dalam suatu jaringan komputer
Satuan pemrosesan sekuensial yang dikumpulkan dalam satu grup yang disebut sebagai thread block
11. Dua kata istilah penting yang digunakan dalam CUDA, yaitu: host dan device. Istilah host pada CUDA
mengacu pada
CPU
12. Dua kata istilah penting yang digunakan dalam CUDA, yaitu: host dan device. Istilah device pada
CUDA mengacu
GPU
Beberapa block dihimpun dalam satu thread, yang kemudian beberapa thread dihimpun dalam satu
kesatuan grid
16. CUDA adalah platform komputasi paralel dengan arsitektur komputasi masuk dalam
CUDA adalah suatu platform untuk komputasi paralel, dan memanfaatkan GPU untuk komputasi
20. Perintah kernel < <N, M> >(…) menunjukkan device untuk
Semua benar
Dapat diinterpretasikan
5. Banyaknya operasi-operasi kecil yang berulang merupakan salah satu penyebab bahasa pemrograman
Python
Tergolong lambat
7. Elemen dalam RDD dikelompokkan kedalam beberapa partisi dan hanya dapat disimpan pada sebuah
node yang berbeda merupakan konsep RDD dalam hal
Distributed
Semua jawaban benar (Penyalinan data dari dan ke host jika diperlukan, Alokasi data dari dan ke host
jika diperlukan)
Semua salah
14. Berikut ini adalah komputasi primitive yang tersedia pada Spark untuk melakukan parelelisme dan
meminimumkan komunikasi antar workers
Open-source
16. Modul kompilasi tepat waktu pada Python untuk GPU adalah
17. API Spark memiliki dukungan yang terbatas pada bahasa pemrograman
18. Permasalahan alokasi memori dalam komputasi pada GPU terdapat pada tugas yang berskala
Kecil
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
b. Veracity
c. Volume
d. Variety
b. Semi Terstruktur
c. Terstruktur
Question 3 Pembayaran Kartu prakerja merupakan salah satu proyek yang dikerjakan oleh Link Aja bersama dengan:
Correct
b. BPJS
c. Bank Indonesia
d. Semua salah
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5786711&cmid=867269 1/6
4/4/22, 11:44 AM 1 pesan baru
Question 4 Dalam ekosistem teknologi Data Engineering Link Aja! Apache Airflow berfungsi sebagai:
Incorrect
b. Streaming Infrastructure
c. Monitoring
d. Batching Infratructure
b. Yahoo
c. Facebook
d. Google
b. Nomor KTP
c. Email
d. Nomor telepon
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5786711&cmid=867269 2/6
4/4/22, 11:44 AM 1 pesan baru
Question 8 Berikut ini merupakan komponen-kompone produksi dalam implementasi big data, kecuali:
Correct
b. Presto
c. Spark
d. Kafka
b. Abstrak
c. Semua benar
b. Data Architect
c. Business Analyst
d. Data Manager
Question 11 Menjadi platform teknologi keuangan nasional terdepan dan terpercaya merupakan ... dari Link Aja!:
Incorrect
b. Visi
c. SLogan
d. Tujuan
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5786711&cmid=867269 3/6
4/4/22, 11:44 AM 1 pesan baru
Question 12 Berikut ini urutan proses yang dilakukan dalam Arsitektur Kappa adalah:
Incorrect
b. Data Sources, Analytical Data Store, Streaming/Real-Time Ingestion, Streaming/Real-Time Processing, Analytics
& Reporting
c. Data Sources, Streaming/Real-Time Processing, Streaming/Real-Time Ingestion, Analytical Data Store, Analytics
& Reporting
d. Data Sources, Streaming/Real-Time Ingestion, Analytical Data Store, Streaming/Real-Time Processing, Analytics
& Reporting
The correct answer is: Data Sources, Streaming/Real-Time Ingestion, Streaming/Real-Time Processing, Analytical Data
Store, Analytics & Reporting
Question 13 Salah satu aktivitas yang dilakukan oleh Link Aja! dalam mengadopsi alat-alat bantu untuk pengelolaan data adalah:
Incorrect
Question 14 Berikut ini yang bukan termasuk kedalam peran Tim Data di Link Aja! adalah:
Correct
b. Data Intelligent
c. Data Scientist
d. Data Engineer
Question 15 Berikut ini adalah teknologi yang digunakan oleh Link Aja! pada bagian Persistence Layer, kecuali:
Incorrect
b. Grafana
c. PostgreSQL
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5786711&cmid=867269 4/6
4/4/22, 11:44 AM 1 pesan baru
Question 16 Salah satu teknologi yang dapat digunakan pada bagian Serving Layer dalam Arsitektur lambda adalah:
Incorrect
b. Flume
c. HDFS
d. Hive
b. 2015
c. 2016
d. 2020
b. Beam
c. Hadoop
d. Hive
Question 19 Ukuran kualitas citra merupakan salah satu luaran yang dihasilkan oleh AI/ML Scientist Link Aja! pada proyek:
Incorrect
d. eKYC Improvement
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5786711&cmid=867269 5/6
4/4/22, 11:44 AM 1 pesan baru
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5786711&cmid=867269 6/6
4/11/22, 8:00 PM Kuis M6: BigData di PPATK: Attempt review
Dashboard / My courses /
ATA 2021/2022 | 2-FIKTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 6: Big Data di PPATK
/
Kuis M6: BigData di PPATK
Question 1 Splitting data set dalam pemodelan mesin learning untuk menganalisa data transaksi keuangan adalah
Correct
b. membagi data set menjadi dua bagian, yaitu data training dan data test
The correct answer is: membagi data set menjadi dua bagian, yaitu data training dan data test
Question 2 Agen Kecerdasan Artifisial menerima dan bertindak berdasrkan lingkungan (environment) menggunakan
Correct
b. Sensor
d. Actuator
Question 3 Berikut ini yang merupakan tahapan data engineering dalam big data analytics adalah
Correct
The correct answer is: data architecure, data acquisition, data cleaning, dan cloud computation
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5910173&cmid=881829 1/6
4/11/22, 8:00 PM Kuis M6: BigData di PPATK: Attempt review
c. yang memerlukan contoh masalah, basis pengetahuan, dan memerlukan input, untuk memecahkan masalah
d. yang memerlukan contoh masalah dan basis pengetahuannya dalam memecahkan masalah
The correct answer is: yang dapat memecahkan masalah tanpa intervensi manusia
Question 5 Pusat Pelaporan dan Analisis Transaksi Keuangan (PPATK) merupakan lembaga sentral (focal point) yang
Correct mengkoordinasikan pelaksanaan upaya pencegahan dan pemberantasan tindak pidana pencucian uang di Indonesia.
Mark 5.00 out of PPATK dalam tugasnya menerapkan AI (Artificial Intelligence)
5.00
Select one:
a. di bidang: Kepegawaian, Kepatuhan Pelaporan, Analisis Transaksi, Pelaporan, Sentimen Analisis, dan Keamanan
Data
The correct answer is: di bidang: Kepegawaian, Kepatuhan Pelaporan, Analisis Transaksi, Pelaporan, Sentimen Analisis, dan
Keamanan Data
Question 6 Salah satu agen intelligence yang bertugas saat mengumpulkan data melalui sumber Web seperti HTML dokumen,
Correct gambar, file teksadalah:
Mark 5.00 out of
5.00 Select one:
a. Chat Box
b. Compiler
c. web crawler
d. parser
Question 7 Berikut sistem intelligent yang dapat difungsikan pada bidang Pelaporan pada Pusat Pelaporan dan Analisis Transaksi
Correct Keuangan (PPATK) adalah
Mark 5.00 out of
5.00 Select one:
a. dapat keduanya, chat Box untuk layanan bantuan dan evaluasi laporan
d. evaluasi laporan
The correct answer is: dapat keduanya, chat Box untuk layanan bantuan dan evaluasi laporan
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5910173&cmid=881829 2/6
4/11/22, 8:00 PM Kuis M6: BigData di PPATK: Attempt review
Question 8 Jika dalam memodelkan klasifikasi transaksi keuangan, diperoleh nilai akurasi untuk model logistic regression adalah 0,62,
Correct model K-NN adalah 0,91, dan model random forest adalah 0,98, maka berarti:
Mark 5.00 out of
5.00 Select one:
a. random forest memprediksi transaksi wajar paling banyak dibandingkan model K-NN dan logistic regression, yaitu
sebesar 98%
The correct answer is: random forest lebih akurat dibanding k-NN dan logistic regression
Question 9 Proses rekursif yang meranking fitur berdasarkan tingkat pentingnya terhadap proses prediksi, salah satunya adalah
Correct
Question 10 Salah sata tahapan big data analytics adalah data mining, yang memperkerjakan machine learning, yaitu melakukan
Correct
d. estimasi atau prediksi, atau mengklasifikasi, atau meng-cluter, atau menentukan asosiasi
The correct answer is: estimasi atau prediksi, atau mengklasifikasi, atau meng-cluter, atau menentukan asosiasi
Question 11 Berikut teknik Kecerdasan Artifisial yang membuat komputer dapat memahamai asosiasi dan relasi antara object dan
Correct kejadian adalah
Mark 5.00 out of
5.00 Select one:
a. Cognitive Science
b. Relative Symbolism
c. Heuristic Processing
d. Pattern Matching
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5910173&cmid=881829 3/6
4/11/22, 8:00 PM Kuis M6: BigData di PPATK: Attempt review
Question 12 Bagian dari sistem Kecerdasan Artifisial yang mengolah pengetahuan adalah
Correct
b. Validator
c. Machine Learning
d. Data historis
b. jumlah nilai true positive dan true negative dibagi total data
The correct answer is: jumlah nilai true positive dan true negative dibagi total data
Question 14 Pada saat memodelkan mesin learning dalam menganalisa data transaksi keuangan, melakukan perankingan adalah
Correct tahapan pada
Mark 5.00 out of
5.00 Select one:
a. data engineering
b. data exploration
c. prediction modelling
d. data visualization
Question 15 Membuat grafik box plot adalah salah satu tahapan dalam implementasi mesin learning, yaitu tahap
Correct
b. eksplorasi data
c. modelling
d. validasi model
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5910173&cmid=881829 4/6
4/11/22, 8:00 PM Kuis M6: BigData di PPATK: Attempt review
Question 16 Maksud pernyataan "Pemodelan Machine Learning untuk memprediksi data transaksi keuangan merupakan transaksi
Correct wajar atau mencurigakan", adalah
Mark 5.00 out of
5.00 Select one:
a. memvalidasi data historis agar data baru menjadi data transaksi wajar
b. menentukan statistik data historis, untuk input data baru dalam meprediksinya apakah data tersebut berada pada
nilai transaksi wajar atau transaksi mencurigakan
d. membangun model terbaik, berdasarkan data historis, untuk input data baru dalam meprediksinya apakah data
tersebut suatu transaksi wajar atau transaksi mencurigakan
The correct answer is: membangun model terbaik, berdasarkan data historis, untuk input data baru dalam meprediksinya
apakah data tersebut suatu transaksi wajar atau transaksi mencurigakan
Question 17 Pusat Pelaporan dan Analisis Transaksi Keuangan (PPATK) merupakan lembaga sentral (focal point) yang
Correct mengkoordinasikan pelaksanaan upaya pencegahan dan pemberantasan tindak pidana pencucian uang di Indonesia.
Mark 5.00 out of PPATK dalam tugasnya menerapkan AI (Artificial Intelligence). Pernyataan berikut yang benar mengenai AI adalah
5.00
Select one:
a. cabang ilmu dari machine learning
c. cabang dari ilmu komputer yang menenkankan pada pengembangan mesin cerdas (intelligence), berpikir dan
bekerja seperti manusia
The correct answer is: cabang dari ilmu komputer yang menenkankan pada pengembangan mesin cerdas (intelligence),
berpikir dan bekerja seperti manusia
The correct answer is: Data engineering, data exploration, data mining, data visualization
Question 19 Berikut yang merupakan algoritma yang dapat digunakan untuk model klasifikasi transaksi keuangan adalah
Correct
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5910173&cmid=881829 5/6
4/11/22, 8:00 PM Kuis M6: BigData di PPATK: Attempt review
d. 4 tipe, yaitu: Supervised Learning, Unsupervised Learning, Reinforcement Learning, dan Deep Learning
The correct answer is: 3 tipe: Supervised Learning, Unsupervised Learning, dan Reinforcement Learning
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=5910173&cmid=881829 6/6
M5
1. Berikut ini adalah teknologi yang digunakan oleh Link Aja! pada bagian Persistence Layer,
kecuali:
• Grafana
2. Salah satu teknologi yang dapat digunakan pada bagian Serving Layer dalam Arsitektur
lambda adalah:
• Hive
3. Peran Data Engineer seringkali juga disebut sebagai:
• Data Architect
4. Berikut ini urutan proses yang dilakukan dalam Arsitektur Kappa adalah:
• Data Sources, Streaming/Real-Time Ingestion, Streaming/Real-Time Processing,
Analytical Data Store, Analytics & Reporting
5. Data terstrutur disimpan kedalam bentuk:
• Baris dan kolom
6. Menjadi platform teknologi keuangan nasional terdepan dan terpercaya merupakan ... dari
Link Aja!:
• Visi
7. Ukuran kualitas citra merupakan salah satu luaran yang dihasilkan oleh AI/ML Scientist Link
Aja! pada proyek:
• eKYC Improvement
8. Berikut ini yang bukan termasuk kedalam peran Tim Data di Link Aja! adalah:
• Data Intelligent
9. Berikut ini yang bukan contoh data terstruktur adalah:
• Email
10. Salah satu karakteristik data tidak terstruktur adalah:
• -
11. Berikut ini merupakan komponen-kompone produksi dalam implementasi big data, kecuali:
• MongoDB
12. Salah satu aktivitas yang dilakukan oleh Link Aja! dalam mengadopsi alat-alat bantu untuk
pengelolaan data adalah:
• Memaksimumkan pemanfaatan platform Google Cloud
13. Nathan Marz adalah orang yang pertama kali mengembangkan:
• Storm
14. Kafka dikembangkan pertama kali oleh:
• LinkedIn
15. Dalam ekosistem teknologi Data Engineering Link Aja! Apache Airflow berfungsi sebagai:
• Batching Infratructure
16. Cloudera merilis Kudu pada tahun:
• 2015
17. Berikut ini yang merupakan arsitektur Big Data adalah:
• Arsitektur Lambda dan Kappa
18. Server logs merupakan salah satu contoh jenis data:
• Semi Terstruktur
19. Berikut ini merupakan karakteristik dari Big Data, kecuali:
• Semua salah
20. Pembayaran Kartu prakerja merupakan salah satu proyek yang dikerjakan oleh Link Aja
bersama dengan:
• Pemerintah
M1
1. Jenis database NoSQL apa yang membuat dan menjalankan aplikasi yang berjalan
dengan dataset yang selalu terhubung menjadi lebih mudah dan sering digunakan untuk
jaringan media sosial
Grafik.
2. Property big data yang penting, salah satunya adalah falaut tolerance, yaitu
Kemampuan untuk terus beroperasi walaupun terjadi kegagalan pada beberapa
komponen.
3. Pernyataan yang benar mengenai MapReduce adalah
Memperoses data besar secara parallel dalam cluster commodity hardware,
implementaasi dari framework pemerosesan batch, membagi masalah besar
menjadi masalah kecil yang dapat diselesaikan dengan cepat.
4. Terdapat 2 teknologi penyimpanan big data, yaitu
On disk storage devices dan in memory storage devices.
5. Berikut ini yang bukan merupakan Hadoop operation mode adalah
Globally distributed mode.
6. Sistem penyimpanan data cluster adalah
Kumpulan server atau node digabungkan secara erat dengan spesifikasi
perangkat keras yang sama. Serta terhubung melalui jaringan dan bekerja
sebagai salah satu kesatuan.
7. Hadoop adalah platform pemrosesan big data yaitu data yang mempunyai karakteristik
kecuali
Jumlah fitur yang tertentu.
8. Hadoop adalah framework yang
Melibatkan satu atau lebih cluster computer, memungkinkan pemerosesa secara
terdistribusi terhadap data yang berukuran besar, menerapakan programming
model yang sederhana.
9. Database NoSQL menggunakan beragam model data untuk mengakses dan mengelola
data. Jenis database ini dioptimalkan secara khusus untuk aplikasi yang memerlukan…,
yang dicapai dengan mengurangi pembatasan kositensi data dari database lainnya
Volume data besar, latensi rendah dan model data fleksibel.
10. Komponen layanan inti Hadoop
MapReduce, HDFS dan YARN.
11. Property big data yang penting salah satunya adalah aviability, yaitu
Ketersediaan layanan secara terus menerus.
12. Berikut yang dimaksud dengan menganalisa data dalam konteks big data adalah
Descriptive analytics, diagnostic analytics, predictive analytics dan prescriptive
analytics.
13. Type data berikut yang dapat ditangani oleh Hadoop adalah
Tidak terstruktur, semi-terstruktur, terstruktur.
14. Property big data yang penting salah satunya adalah scalability yaitu
Kemampuan menangani penambahan beban yang diberikan tanpa penurunan
kinerja.
15. Property big data yang penting, salah satunya adalah reliability yaitu
Handal
16. Pemerosesan data terdistribusi adalah pemerosesan
Yang menerapakan divide and conquer dalam fisik terpisah, namun terhubung
bersama dalam satu cluster.
17. Hadoop adalah framework yang bekerja bersama tools lain yang beragam. Kelompok
yang umum bekerja bersama Hadoop adalah
MapReduce, MySQL and google apps.
18. YARN singkatan dari
Yet Another Resource Negotiator.
19. Bagian pekerjaan utama MapReduce adalah
Map dan reduce.
20. NoSQL database adalah singkatan dari
Not-only structured query language database.
M4
M5
21. Pernyataan yang tepat terkait data mining and knowledge discovery,
Mengintegrasikan teori dan heuristik
22. Regression, Decision Trees, Bayesian, Neural Networks, Naive Bayes Rules, Support
Vector machines, genetic algorithms adalah pendekatan yang digunakan untuk,
Klasifikasi
23. Metode untuk mempresentasikan hasil yang ditemukan dengan cara yang “bagus” secara
visual,
Visualisasi
24. Karakteristik Big data yang terus bertambah dengan cepat secara real-time dinamakan,
Volume
25. Attributes yang berisi informasi serperti item_ID, name, brand, category, supplier,
place_made and price, merupakan salah satu contoh jenis database,
Penjualan
26. Fungsi dari data mining adalah salah satunya dapat mengetahui pola yang sering ( atau
kumpulan item yang sering) misalnya item apa yang sering dibeli bersama di Walmart
anda, ini dikenal dengan istilah,
Asosiasi dan Analisis Korelasi
27. Pernyataan yang tepat terkait data minig and knowledge discovery,
Fokus pada seluruh proses penemuan pengetahuan
28. Metode untuk memprediksi kelas instace dari instance yang diberi label sebelumnya,
Klasifikasi
29. Pernyataan yang kurang sesuai dengan metode peringkasan,
Mengelompokan data takberlabel
30. Yang bukan metode clusterisasi,
Decision Tree
31. Untuk menghindari set pengujian yang tumpang tindih, data dibagi menjadi k himpunan
bagian dengan ukuran yang sama kemudian setiap subset secara bergantian digunakan
untuk pengujian dan sisanya untuk pelatihan,
K-fold cross-validation
32. Jenis tugas data mining yang melakukan prediksi kelas,
Klasifikasi
33. Jenis tugas data mining yang memfasilitasi penerimaan / penelusuran informasi bagi
pengguna,
Visualisasi
34. Melihat suatu objek data yang tidak sesuai dengan prilaku umum data, sering digunakan
dalam deteksi penipuan atau analisis kejadian langka,
Analisis Outlier
35. Urutan langkah melakukan klasifikasi,
Pisahkan data menjadi set pelatihan dan pengujian, buat model pada set pelatihan,
evaluasi pada set pengujian
36. Metode untuk mengelompokan secara “alami” dari instance yang diberi data tanpa tabel,
Klasterisasi
37. Proses pencarian konten baru dan konten yang perlu diperbaharui dengan megiriman
crawler keseluruh konten yang ditemukan dari tautan halaman merupakan salah satu
konsep data mining pada searcch engine yang dinamakan
Crawl
38. Metode klasifikasi pada fungsi data mining yang menggunkan nilai estimasi dari
probabilits bersyarat dinamakan metode,
Naive Bayessian
39. Seberapa mudah data dapat dipahami merupakan kualitas data dari,
Interpretabillity
40. Acuan yang tidak tepat ketika melakukan pengaturan parameter,
Data pengujian harus digunakan untuk penyetelan parameter
M6
41. Model pembelajaran yang mempelajari bagaimana sistem dapat menyimpulkan suatu
fungsi untuk mendeskripsikan struktur tersembunyi dari data yang tidak berlabel. Sistem
ini tidak memprediksi keluaran yang benar, tetapi mengeksplorasi data dan dapat menarik
ksimpulan dari kumpulan data untuk mendeskripsikan struktur tersembunyi dari data yang
tidak berlabel,
Unsupervised learning
42. Saat anda ingin mengungkap pengelompokan yang melekat dalam data seperti
mengelompokan hewan berdasarkan beberapa karakteristik/fitur mis jumlah kaki maka
model pembelajaran yang sesuai,
Unsupervised learning-clustering
43. Tahapan yang tepat ketika melakukan training,
Image features-training with labeled data –learned model
44. Gambar pada representasi diatas adala pola-pola struktur yang ada pada suatu koleksi data
(knowledge) dalam bentuk,
Pohon
45. Yang tidak digunakan pada Model Supervised learning,
Latent Simantic analysis
46. Model pembelajaran yang menggunakan data berlabel dan tidak berlabel untuk pelatihan,
Semi suprvised learning
47. Tahapan yang tepat ketika melakukan testing,
Image feature – learned model – prediction
48. Pola-pola struktur yang ada pada suatu koleksi data (knowledge) dapat direpresentasi
dalam bentuk if then rules,
Aturan
49. Yang bukan tujuan supervised learning untuk membangun model yang dapat
menghasilkan output yang benar untuk suatu data input dapat digunakan untuk,
Klaterisasi (Clustering)
50. Gambar pada representasi diatas adala pola-pola struktur yang ada pada suatu koleksi data
(knowledge) dalam bentuk,
Aturan
51. Jika variabel keluaran adalah berupa kategori misalnya apel jeruk termasuk pada machine
learning betipe,
Supervised – classification
52. Kumpulan data yang sudah dipastikan kebenarannya dari sis label, data awal, komponen2
data yang akan dijadikan kunci,
Training set
53. Model ini belajar dar kumpulan data berlabel dan kemudian digunakan untuk
memprediksi peristiwa di masa depan,
Supervised learning
54. Ciri – ciri dari masing-masing sample data misalnya smartphone, ciri memiliki,
Feature/ atribute
55. Salah satu teknik digunakan untuk mengkontrol fenomena over-fitting adalah dengan cara
menambah pinalti ke fungsi error
Regularization
56. Gambar pada representasi diatas adala pola-pola struktur yang ada pada suatu koleksi data
(knowledge) dalam bentuk,
Tabel
57. Sebuah proses yang mempersiapkan data sehingga data tersebut bisa kita extract menjadi
satu vektor,
Feature Extraction
58. Pembelajaran yang bertujuan memprediksi output dengan akurat untuk data baru dan
output ti bernilai kontinu rill, contoh untuk prediksi kerja CPU,
Regresi
59. Pembelajaran yang menghasilkan nilai output ti bernilai diskrit kelas,
Klasifikasi
60. Tujuan pembelajaran unsupervised adalah membangun model yang dapat menemukan
komponen/ variable / fitur tersembunyi pada data pelatihan, yang dapat digunakan untuk
hal berikut, kecuali,
Pengklasifikasian (Clasifcation)
M7
61. Algoritma yang paling banyak digunakan untuk task Association rules,
Apriori
62. Algoritma yang berusaha meemukan pola tersembunyi atau pengelompokan data tanpa
perlu campur tangan manusia,
Unsupervised Learning
63. Pendekatan reduksi dimensi lain yang memfaktorkan matriks A menjadi 3 matriks
perngkat rendah SDV dilambangkan dengan rumus A = USTV,
Autoencoders
64. Pembelajaran mesin tanpa pengawasan menggunakan algoritma pembelajaran mesin
untuk menganalsis dan mengelompokan set data tak berlabel,
Unspervised Learning
65. Yang bukan tugas dari pembelajaran tanpa pengawasan,
Regression
66. Algoritma yang bukan digunakan untuk pengelompokan (clustering),
Auto Encoder
67. Metode berbasis aturan untuk menemukan hubungan antara variabel dalam kumpulan data
tertentu, metode ini sering digunakan untuk nalisisi keranjang pasar, memungkinkan
perusahaan untuk lebih memahami hubungan antara produk yang berbeda,
Association
68. Teknik yang mengelompokan data yang tidak berlabel berdasarkan persamaan atau
perbedaannya. Algoritma ini digunakan untuk memproses objek data mentah dan tidak
terklaifikasi menjadi grup yang diwakili,
Clustering
69. Algoritma yang menggunakan pohon hash untuk menghitung kumpulan item, menavigasi
kumpulan data dengan cara yang pertama. Algorutma ini telah dipopulerkan melalui
analisisi keranjang pasar, yang mengarah ke mesin rekomendasi berbeda .
Apriori
70. Pengelompokan yang sebagai pendekatan bottom up dimana titik datanya diisolasi sebagai
pengelompokan terpisah pada awalnya, dan kemudian digabungkan bersama secara
iteratif atas dasar kesamaan hingga satu cluster tercapai,
Pendekatan Aglomeratif
71. Teknik yang digunakan ketika jumlah fitur, atau dimensi, dalam kumpulan data tertentu
terlalu tinggi. Teknik ini mengurangi jumlah input data ke ukuran yang dapat dikelola
sambil juga menjaga integritas set,
Dimensionality reduction
72. Algoritma yang menggunakan pohon hash untuk menghitung kumpulan item, menavigasi
kumpulan data dengan cara yang pertama. Algorutma ini telah dipopulerkan melalui
analisisi keranjang pasar, yang mengarah ke mesin rekomendasi berbeda, ini termasuk
kedalam task,
Association
73. Kemampuan untuk menemukan persamaan dan perbedaan informasi menjadikan
unsupervised learning sebagai solusi ideal tugas di bawah ini, kecuali.
Klasifikasi buah jeruk dan apel
74. Pendekatan unsupervised learning adalah,
Mempelajari bagaimana cara kerja pembelajaran tanpa pengawasan
75. Pengelompokan yang mengambil pendekatan top down dalam hal ini, satu cluster data
dibagi berdasarkan perbedaan antara titik data. Pengelompokan dengan cara ini tidak
umum digunakan,tetapi masih perlu diperhatikan........pemisahan titik data pada setiap
iterasi,
Pendekatan Divisive
76. Teknik yang memanfaatkan jaringan neural untuk mengompresi data dan kemudian
membuat ulang represetsi baru dari input data asli, terdapat lapisan tersembunyi seacara
khussus bertindak sebagai penghambat......di dalam lapisan keluaran,
Autoencoders
77. Salah satu bentuk pengelompokan yang memungkinkan titik data menjadi bagian dari
beberapa kluster dengan derajat keanggotaan terpisah ini disebut juga pengeompokan
lembut atau fuzzy k means,
Tumpang tindih (overlapping)
78. Salah satu bentuk pengelompokan yang enetapkan bahwa suatu titik data hanya dapat ada
dalam satu cluster. Ini juga bisa disebut sebagai pengelompokan keras . Algoritm yang
digunakan salah satunya adalah k means clustering,
Clustering Eksekutif (Specifically exlusive)
79. Jenis algoritma pengurangan dimensi yang digunakan untuk mrngurangi redundansi dan
mengompresi kumpulan data melalui ekstrasi fitur. Unuk transformasi linier.....arah
ortogonal ke komponen sebelumnya dengan varians terbanyak,
Primcipal component analysis
80. Teknik tanpa pengawasan yang membantu menyelesaikan estimasi kepadatan atau
masalah pengelompokan lunak......teknik yang paling umum digunakan adalah GMM,
Pendekatan Probabilistic
M8
81. Reinforcement learning tepat digunakan untuk menyelesaikan permasalahan utama dalam,
Permainan catur
82. Berikut ini merupakan contoh permasalahan yang dapat diselesaikan dengan
reinforcement learning,
Sistem percakapan, self driving car, bermain game,
83. Markov Decision Process dapat didefinisikan kedalam n tuple, dimana bernilai,
5
84. Efek dari suatu aksi yang dipilih dari suatu state yang bergantung hanya pada state
tersebut saja bukan pada state2 sbelumnya dikenal dengan sifat,
Markov
M9
101. Untuk memperbanyak feature yang berhasil diekstrak dalam alogaritma convolutional
neural network digunakan
Padding
102. Dalam alogaritma convolutional neural network, ReLU seringkali digunakan pada
Hidden layer
103. Berikut ini adalah teknik yang dapat digunakan pada pooling layer dalam alogaritma
convolutional neural network
Max pooling, average pooling, min pooling
104. Untuk menyelesaikan permasalahan klasifikasi biner menggunakan alogaritma berbasis
neural network lebih tepat digunakan fungsi aktivasi
ReLU
105. Sebuah citra berdimensi5x5 dengan filter 3x3 dan stide sebesar 2 akna menghasilkan
feature map berdimensi
4x4
106. Pooling layer pada alogaritma convolutional neural network terdapat pada
Hidden layer
107. Berikut ini merupakan contoh Algoritma Deep Learning,
alogaritma recurrent neural network, Algoritma long short term memory, alogaritma
convolutional neural network
108. Berikut ini adalah efek dari mengecilnya nilai stride dalam alogaritma convolutional
neural network,
Informasi yang diperoleh semakin detail
109. Dimensi dari feature map dalam alogaritma convolutional neural network bergantung
pada,
Padding, stride, dimensi filter dan input
110. Untuk mencegah terjadinya overfitting dalam alogaritma convolutional neural network
dilakukan,
Dropout regulazion
111. Berikut ini merupakan library phyton untuk algoritma deep learning,
Pytorch, keras, tensorflow
112. Pooling layer bertujuan untuk,
Mengurangi dimensi feature map, mempercepat prosess komputasi, mengatasi
overfiting
113. Algoritma deep learning berbasis,
Machine learnng, artificial intelligence, neural network
114. Berikut ini merupakan loss function dalam alogaritma berbasis neural network ,
Cross entropy
115. Parameter dalam alogaritma convolutional neural network yang menentukan berapa
jumlah pergeseran filter disebut sebagai,
Stride
116. Berikut ini merupakan fungsi aktivasi dalam alogaritma convolutional neural network,
Sigmoid, ReLU, tanh
117. Algoritma deep learning dapat menyelesaikan permasalahan berikut ini,
Deteksi objek, natural language processing, pengenalan suara
118. Tahapan feature extraction pada alogaritma convolutional neural network terdiri dari
beberapa lapisan (layer) berikut ini, kecuali,
Fully – connected layer
119. Salah satu ukuran dari confusion matrix yang dapat digunakan dalam mengukur tingkat
keberhasilan sistem dalam mengukur tingkat keberhasilan sistem dalam menemukan
kembali sebuah informasi adalah,
Recall
120. Hasil dari proses flatten pada alogaritma convolutional neural network menjadi masukan
dalam,
Fully – connected layer
1. Semakin banyak data hingga dapat melebihi terabyte merupakan penjelasan dari dimensi
big data dalam hal,
➢ Volume
2. Data Mobile positioning data MPD berupa,
➢ Lokasi, waktu, sumber sinyal
3. Proses menganalisa tulisan untuk menentukan nada emosional penulisnya merupakan
salah satu implementasi machine learning dalam,
➢ Sentiment Analysis
4. Visualisasi pada hasil analisis big data dapat disajikan dalam bentuk,
➢ Plot, Grafik 3D, table
5. Dataset dibentuk dari,
➢ Sekumpulan objek yang memiliki fitur yang sama
6. Contok aplikasi machine learning dan analitik prediktif,
➢ Penetapan harga barang, prediksi cashflow, prediksi harga saham
7. Data wherehouse dibuat dengan menerapkan serangkaian Langkah pemrosesan terhadap
data yang berasal dari beberapa basis data. Berikut ini adalah yang termasuk dalam
pemrosesan data tersebut.
➢ Transformasi data, integrasi data, data preparation
8. Social media termasuk dalam sumber data,
➢ Digital content
9. Keuntungan menggunakan mobile positioning data MDP adalah,
➢ Automatics counting, me-record visitor outsite immigration point, continues
counting
10. Metode untuk memprediksi kelas instance yang diberi label,
➢ Klasifikasi
11. Cara yang dapat dilakukan untuk meningkatkan analisis bigdata gemone bioinformatics
adalah,
➢ Pemanfaatan cloud computing, meningkatkan kecepatan prosesor, penerapan
teknologi GPU
12. Pilihan yang dapat menciptakan hasil yang paling optimal merupakan pendekatan analitik
dari,
➢ Preskriptif
13. Beragamnya jenis data di dalam big data yang meliputi data terstruktur, semi terstruktur
dan tidak terstruktur, merupakan dimensi big data dalam hal,
➢ Variety
14. Manakah yang benar dari pernyataan berikut ini,
➢ Prediktif, memperkirakan kenaikan harga emas
15. Karakteristik big data yang cepat sekali berubah baik dari sisi variable maupun tipe data
dinamakan,
➢ Velocity
16. Contoh solusi big data, kecuali
➢ Deteksi penipuaan, mesin rekomendasi, pendeteksi spam
17. Tools Bahasa pemrograman yang dapat digunakan dalam ilmu data science adalah,
➢ SQL, Python, R
18. Data yang dikumpulkan secara aktif dari sensor, misalnya melalui penginderaan jauh dan
gambar satelit merupakan sumber big data dalam hal,
➢ Sensing data
19. Salah satu library data science yang digunakan untuk pemrosesan sinyal, gambar, dan
rumus statistik, adalah,
➢ Scipy, GPText, OpenNPL
20. Berapa banyak spark context yang dapat aktif per java virtual machine,
➢ Semua salah (hanya 1, Tidak spesifik, lebih dri 1)
21. Berikut ini yang bukan merupakan fungsi dari spark context,
➢ Untuk mengatur konfigurasi
22. Spark dapat menjalankan…tugas pada setiap partisi,
➢ Banyak
23. Toleransi kesalahan pada resillent distributed data RDD dicapai menggunakan,
➢ Direct acyclic graph
24. Berikut ini yang bukan operasi action pada resillent distributed data adalah,
➢ Map
25. Apache spark berpotensi…lebih cepat untuk menjalankan program pemrosesan batch
didalam memori jika dibandingkan dengan Mapreduce,
➢ 100 kali
26. Manajemen memori dalam spark dikerjakan oleh,
➢ Spark core
27. Apache spark pertama kali diluncurkan open source pada tahun,
➢ 2010
28. API Machine Learning yang utama untuk spark saat ini adalah APi berbasis,
➢ Dataframe
29. Komponen berikut ini yang tidak terdapat diatas spark core adalah
➢ Spark RDD
30. Pernyataan berikut ini yang salah mengenai spark dan Hadoop adalah,
➢ Keduanya merupakan mesin komputasi cluster
31. Spark ditulis dalam Bahasa pemrograman,
➢ Scala (R, Python)
32. Berikut ini adalah beberapa manfaat penggunaan spark, kecuali
➢ Otomatis dalam mengoptimalkan kode program
33. Berikut ini yang bukan merupakan karakteristik dari apache spark adalah,
➢ Hanya dapat dijalankan pada hadoop YARN
34. Modul untuk memproses data terstruktur dalam spark adalah,
➢ Spark SQL
35. Berikut ini adalah pernyataan yang salah mengenai resillent distributed data RDD,
kecuali,
➢ RDD dalam apache spark adalah suatu kumpulan objek yang tidak dapat
berubah
36. Spark SQL menerjemahkan perintah kedalam bentuk kode yang diproses oleh,
➢ Executor nodes
37. Berikut ini yang bukan operasi transformasi pada RDD adalah,
➢ Filter
38. Spark lebih cepat dibandingkan dengan mapreduce karena,
➢ Didukung oleh api Bahasa pemrograman yang berbeda-beda
39. Cluster manager yang dapat digunakan pada spark adalah,
➢ Standalone scheduler, YARN, Mesos
40. Algoritma untuk mengukur seberapa pentingnya halaman situs web,
➢ Page rank
41. Fitur spark streaming,
➢ Pemulihan cepat dari kegagalan dan kekeliruan
42. Aliran data yang berkelanjutan dalam spark streaming disebut,
➢ Dstream
43. Alogritma untuk menemukan komponen terhubung dari suatu graf,
➢ Connected components
44. Urutan edge yeng memungkinkan anda berpindah dari vertex A ke vertex B disebut,
➢ Path
45. Yang diperlukan untuk menangani data besar dalam bentuk grafik,
➢ Analisis data grafik, visualisasi data grafik, database grafik
46. Contoh penggunaan spark streaming,
➢ Netflix, deteksi penipuan, uber
47. Manakah urutan yang benar untuk menjelaskan cara kerja spark streaming
1. Input data stream
2. Batch input data
3. Hasilnya adalah batch data yang telah
4. Oleh spark streaming data dibagi menjadi kumpulan
➢ 1-4-2-3
48. Contoh use case penggunaan spark graphx,
➢ Film baru yang paling direkomendasikan orang-orang 1 minggu terakhir,
orang2 mensitasi artikel, teman toni di facebook paling banyak
49. Langkah pipa pemrosesan data grafik
1. Pembuatan grafik
2. Pengolahan pasca
3. Pra pemrosesan data
4. Analisis
➢ 3-1-4-2
50. Pernyataan yang benar tentang apache spark, kecuali,
➢ Abstraksi memori terditribusi untuk komputasi dalam memori pada kluster
51. Contoh data base grafik
➢ Noe4j
52. Untuk menampilkan pola dibalik hubungan antara entitas data,
➢ Visualisasi grafik
53. Fitur spark graphx,
➢ Kecepatan, Pustaka algoritma, fleksibilitas
54. Algoritma untuk menentukan jumlah segitiga yang mewati setiap simpul dalam graf,
➢ Triangle count
55. Framework yang dapat digunakan untuk memproses data grafik dan menjalankan analisis
prediktif pada data,
➢ Spark graphX
56. Pernyataan yang benar spark streaming,
➢ Memproses menggunakan algoritma kompleks, dapat menyerap data, daya
yang diproses dapat dikirim ke system file
57. Pernyataan yang benar tentang graph,
➢ Graph terdiri dari simpul dan sisi, semua yang ada di facebook adalah contoh,
edge menunjukan relasi
58. Apa yang menyebabkan spark streaming memiliki toleransi kesalahan,
➢ Kumpulan data input direplikasi dalam memori
59. Operasi jendela membutuhkan parameter
➢ Window length
60. CUDA yang diciptakan Nvidia adalah singkatan dari,
➢ Compute Unifed Device Architecture
61. Tiga tahap alur pemrosesan dalam eksekusi program CUDA,
➢ Langkah ke-1 : Salin input data dari CPU memory ke GPU memory, Langkah 2
: Muat program GPU dan eksekusi caching, Langkah 3 : salin hasil dari GPU
memory ke CPU memory
62. Architecture CUDA menerapkan pendekatan berupa kumpulan streaming multiprocessor
SM yang,
➢ Mengeksekusi sejumlah intruksi yang sama pda beberapa thread pada berbagai
wilayah data, sehingga dikenal dengan istilah single instruction, multiple threads
SIMT
63. Komputasi parallel adalah komputasi yang,
➢ Melibatkan banyak kalkulasi atau pemrosesan yang dilaksanakan secara
serentak simultan, dimana masalah besar dibagi dalam beberapa masalah kecil
yang kemudian diselesaikan dalam waktu yang sama.
64. Tujuan utama dari pemrograman parallel adalah untuk meningkatkan performa
komputasi, performa dalam pemrograman parallel diukur dari,
➢ Berapa banyak peningkatan kecepatan yang diperoleh dalam menggunakan
Teknik parallel.
65. CUDA C++ adalah perluasan C++ sehingga programmer dapat mendefinisikan fungsi
C++, yang Ketika dipanggil akan dieksekusi sebanyak N kali secara parallel oleh N
CUDA thread yang berbeda. Fungsi ini dikenal dengan istilah,
➢ Kernel
66. Kernel pada pemrograman CUDA agar dieksekusi paada device, dideklarasi
menggunakan
➢ _global_
67. Sistem distribusi (distributed computing) adalah Teknik komputasi parallel dimana
➢ Komputer yang digunakan secara bersamaan dalam melakukan komputasi
dilakukan oleh komputer-komputer terpisah yang terhubung
68. Perintah kernel <<N,M>>(..) menunjukan device untuk,
➢ Mempersiapkan block sebanyak N dengan thread sebanyak M ditiap block
69. Istilah thread pada GPU adalah,
➢ Satuan matrik untuk pemrosesan parallel pada GPU
70. Dua kata istilah penting yang digunakan dalam CUDA, yaitu: host, dan device. Istilah
host pada CUDA mengacu pada
➢ CPU
71. Dua kata istilah penting yang digunakan dalam CUDA, yaitu: host, dan device. Istilah
device pada CUDA mengacu pada,
➢ GPU
72. GPU dalam teknologi komputasi adalah singkatan dari,
➢ Graphics processing Unit
73. Pengelolaan memori pada device pada dasarnya menggunakan,
➢ cudaMalloC(), cudaMemcpy(), cudaFree()
74. Pernyataan yang benar mengenai thread block pada GPu,
➢ Thread block terdiri dari beberapa thread, dan beberapa thread block
digabung dalam satu grid
75. CUDA adalah platform komputasi parallel dengan arsitektur komputasi masuk dalam,
➢ Heterogenous karena melibatkan CPU dan GPU
76. Pernyataan yang benar mengenai pemrograman parallel pada GPU,
➢ Adalah salah satu cara untuk mempercepat pemrosesan untuk komputasi yang
besar
77. Pernyataan berikut yang benar mengenai CUda,
➢ Cuda adalah suatu platform untuk komputasi parallel, dan memanfaatkan
GPU untuk komputasi
78. CPU dari suatu unit computer adalah singkatan
➢ Central processing unit
79. Perintah kernel <<N,M>> menunjukan device untuk,
➢ Mempersiapkan block sebanyak N dengan thread sebanyak M di tiap block
80. Bahasa pemrograman phyton tergolong cepat karena,
➢ Bahasa pemrograman tingkat tinggi, dapat diinterpretasikan, dapat dikodekan
secara dinamis
81. Bahasa pemrograman pyhton tergolong lambat untuk eksekusi,
➢ Tugas yang berulang dan tergolong tinggat rendah
82. Modul kompilasi tepat waktu pada Pyhton untuk CPU adalah,
➢ Numba
83. Berikut ini adalah urutan proses yang dijalankan oleh numba,
➢ Rewrite IR, Lowering, LLVM IR, LLVM/NVVM JIT
84. Banyaknya operasi-operasi kecil yang berulang merupakan salah satu penyebab Bahasa
pemrogram python,
➢ Tergolong lambat
85. Berikut ini pernyataan yang tepat tentang python adalah,
➢ Python tergolong cepat untuk pengembangan, Python tergolong lambat untuk
eksekusi
86. Elemen dalam RRD dikelompokan kedalam beberapa partisi dan hanya dapat disimpan
pada sebuah node yang berbeda merupakan konsep RDD dalam hal,
➢ Distributed
87. Numba dapat menangani,
➢ Alokasi data dari dan ke host jika diperlukan, penyalinan data dari dan ke host
88. Komputasi pada GPU cluster dapat menggunakan,
➢ Numba, Pyspark
89. Berikut ini yang salah terkait dengan numba adalah,
➢ Semua Salah, Bersama dengan spark dapat menjalankan kode program pada spark
workers dengan GPU
90. Bahasa pemrograman Python tergolong cepat digunakan untuk,
➢ Menulis, Menguji, Mengembangkan kode program
91. Apache spark bukan merupakan,
➢ (Semua Salah) Suatu mesin untuk mengeksekusi komputasi terdistribusi pada
suatu klaster, suatu application programming interface
92. Spark diimplementasikan dalam,
➢ Scala dan java
93. Berikut ini adalah komputasi primitive yang tersedia pada spark untuk melakukan
paralelisme dan meminimumkan komunikasi antar workers
➢ Map ,Filter, Reduce
94. Berikut ini yang benar terkait dengan numba, kecuali
➢ Open source, kode dapat dibangkkitkan dengan LLVM CPU, dapat
menterjemahkan sintak Piton ke kode mesin, diimplementasikan sebagai suatu
modul
95. Modul kompilasi tepat waktu pada pyhton untuk GPU adalah,
➢ Cuda
96. Api spark memiliki dukungan yang terbatas pada Bahasa pemrograman,
➢ R
97. Permasalahan alokasi memori dalam komputasi pada GPU terdapat pada tugas yang
berskala
➢ Kecil
98. Type interface pada proses numba memerlukan
➢ Functions argument, numba IR
99. Pemrograman terdistribusi dalam python adalah,
➢ Numba atau Pyspark
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 1: Big Data Computing Overview
/
Kuis M1: Big Data Computing Overview
Question 1 Semakin banyak data hingga mencapai ukuran Peta Byte atau bahkan lebih, merupakan penjelasan dari dimensi Big Data
Answer saved dalam hal:
Marked out of
1.00 Select one:
a. Volume
b. Velocity
c. Veracity
d. Variety
Clear my choice
◄ Video M1 : Big Data Computing Kuis M1: Big Data Computing Overview
Jump to...
Overview [Khusus Kelas MALAM] ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 1: Big Data Computing Overview
/
Kuis M1: Big Data Computing Overview
Question 2 Sekumpulan tabel dimana bentuk setiap tabel analog dengan flat file, disebut:
Answer saved
b. DBMS
c. Semua salah
d. Data Warehouse
Clear my choice
◄ Video M1 : Big Data Computing Kuis M1: Big Data Computing Overview
Jump to...
Overview [Khusus Kelas MALAM] ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 1: Big Data Computing Overview
/
Kuis M1: Big Data Computing Overview
Question 3 Dalam arsitektur Big Data, solusi berupa rekomendasi, berada pada posisi sebagai:
Answer saved
b. Data Format
Clear my choice
◄ Video M1 : Big Data Computing Kuis M1: Big Data Computing Overview
Jump to...
Overview [Khusus Kelas MALAM] ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 1: Big Data Computing Overview
/
Kuis M1: Big Data Computing Overview
Question 4 Data Warehouse dibuat dengan menerapkan serangkaian langkah pemrosesan terhadap data yang berasal dari beberapa
Answer saved basis data. Berikut ini adalah yang termasuk dalam pemrosesan data tersebut:
Marked out of
1.00 Select one:
a. Pembersihan data
b. Transformasi data
c. Semua benar
d. Integrasi data
Clear my choice
◄ Video M1 : Big Data Computing Kuis M1: Big Data Computing Overview
Jump to...
Overview [Khusus Kelas MALAM] ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 1: Big Data Computing Overview
/
Kuis M1: Big Data Computing Overview
b. Numerik
c. Object
d. Semua salah
Clear my choice
◄ Video M1 : Big Data Computing Kuis M1: Big Data Computing Overview
Jump to...
Overview [Khusus Kelas MALAM] ►
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 1: Big Data Computing Overview
/
Kuis M1: Big Data Computing Overview
Question 6 Sumber data yang digunakan dalam aplikasi Big Data dapat berupa:
Answer saved
b. Data Finansial
c. Semua benar
Clear my choice
◄ Video M1 : Big Data Computing Kuis M1: Big Data Computing Overview
Jump to...
Overview [Khusus Kelas MALAM] ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 1: Big Data Computing Overview
/
Kuis M1: Big Data Computing Overview
b. Mesin rekomendasi
c. Deteksi Penipuan
Clear my choice
◄ Video M1 : Big Data Computing Kuis M1: Big Data Computing Overview
Jump to...
Overview [Khusus Kelas MALAM] ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 1: Big Data Computing Overview
/
Kuis M1: Big Data Computing Overview
b. Objek
c. Fitur/atribut
d. Dataset
Clear my choice
◄ Video M1 : Big Data Computing Kuis M1: Big Data Computing Overview
Jump to...
Overview [Khusus Kelas MALAM] ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 1: Big Data Computing Overview
/
Kuis M1: Big Data Computing Overview
Question 9 Tempat penyimpanan data yang dikumpulkan di lokasi berbeda (basis data relasional) dan disimpan menggunakan skema
Answer saved terpadu:
Marked out of
1.00 Select one:
a. Spatial Database
b. Semua benar
c. Transactional database
d. Data Warehouse
Clear my choice
◄ Video M1 : Big Data Computing Kuis M1: Big Data Computing Overview
Jump to...
Overview [Khusus Kelas MALAM] ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 1: Big Data Computing Overview
/
Kuis M1: Big Data Computing Overview
b. Unit
c. Semua benar
d. Data points
Clear my choice
◄ Video M1 : Big Data Computing Kuis M1: Big Data Computing Overview
Jump to...
Overview [Khusus Kelas MALAM] ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 1: Big Data Computing Overview
/
Kuis M1: Big Data Computing Overview
Question 11 Dalam ekosistem Big Data, proses pre-prosesing data dapat dilakukan menggunakan:
Answer saved
b. Tableu
c. Facebook
d. Sqoop
Clear my choice
◄ Video M1 : Big Data Computing Kuis M1: Big Data Computing Overview
Jump to...
Overview [Khusus Kelas MALAM] ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 1: Big Data Computing Overview
/
Kuis M1: Big Data Computing Overview
b. Interface Layer
c. Resource Layer
d. Semua benar
Clear my choice
◄ Video M1 : Big Data Computing Kuis M1: Big Data Computing Overview
Jump to...
Overview [Khusus Kelas MALAM] ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 1: Big Data Computing Overview
/
Kuis M1: Big Data Computing Overview
Question 13 Kumpulan data yang disusun dalam tabel berformat persegi panjang yang terdiri dari baris dan kolom disebut sebagai:
Answer saved
b. Data Warehouse
c. Flat files
d. Semua salah
Clear my choice
◄ Video M1 : Big Data Computing Kuis M1: Big Data Computing Overview
Jump to...
Overview [Khusus Kelas MALAM] ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 1: Big Data Computing Overview
/
Kuis M1: Big Data Computing Overview
Clear my choice
◄ Video M1 : Big Data Computing Kuis M1: Big Data Computing Overview
Jump to...
Overview [Khusus Kelas MALAM] ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 1: Big Data Computing Overview
/
Kuis M1: Big Data Computing Overview
d. Memperkirakan puncak dari kasus positif Covid-19, adalah contoh analisis prediktif.
Clear my choice
◄ Video M1 : Big Data Computing Kuis M1: Big Data Computing Overview
Jump to...
Overview [Khusus Kelas MALAM] ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 1: Big Data Computing Overview
/
Kuis M1: Big Data Computing Overview
Question 16 Beragamnya jenis data di dalam Big Data yang meliputi data terstruktur, semi terstruktur dan bahkan data tidak
Answer saved terstruktur, merupakan penjelasan dari dimensi Big Data dalam hal:
Marked out of
1.00 Select one:
a. Velocity
b. Volume
c. Variety
d. Veracity
Clear my choice
◄ Video M1 : Big Data Computing Kuis M1: Big Data Computing Overview
Jump to...
Overview [Khusus Kelas MALAM] ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 1: Big Data Computing Overview
/
Kuis M1: Big Data Computing Overview
Question 17 Model basis data yang berupa deret waktu (time series):
Answer saved
b. Spatial database
c. Temporal database
d. Semua salah
Clear my choice
◄ Video M1 : Big Data Computing Kuis M1: Big Data Computing Overview
Jump to...
Overview [Khusus Kelas MALAM] ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 1: Big Data Computing Overview
/
Kuis M1: Big Data Computing Overview
b. Tabel
c. Semua benar
d. Plot
Clear my choice
◄ Video M1 : Big Data Computing Kuis M1: Big Data Computing Overview
Jump to...
Overview [Khusus Kelas MALAM] ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 1: Big Data Computing Overview
/
Kuis M1: Big Data Computing Overview
b. Azure ML
d. Amazon ML
Clear my choice
◄ Video M1 : Big Data Computing Kuis M1: Big Data Computing Overview
Jump to...
Overview [Khusus Kelas MALAM] ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 1: Big Data Computing Overview
/
Kuis M1: Big Data Computing Overview
b. Semua benar
Clear my choice
◄ Video M1 : Big Data Computing Kuis M1: Big Data Computing Overview
Jump to...
Overview [Khusus Kelas MALAM] ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 2 : Big Data Computing, Applications and Technologies
/
Kuis M2 [KELAS PAGI] : Big Data Computing, Applications and Technologies
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 2 : Big Data Computing, Applications and Technologies
/
Kuis M2 [KELAS PAGI] : Big Data Computing, Applications and Technologies
Question 2 Berikut ini adalah saran untuk memasuki era Analytic 3.0:
Answer saved
b. Mulailah dengan kemampuan yang ada untuk manajemen data dan analitik
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 2 : Big Data Computing, Applications and Technologies
/
Kuis M2 [KELAS PAGI] : Big Data Computing, Applications and Technologies
Question 3 Berikut ini yang harus dilakukan oleh perusahaan 1.0, kecuali:
Answer saved
c. Membuat analitik dan keputusan berbasis fakta elemen kunci dari hubungan pelanggan, produk dan layanan,
strategi, dan persaingan
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 2 : Big Data Computing, Applications and Technologies
/
Kuis M2 [KELAS PAGI] : Big Data Computing, Applications and Technologies
b. Semua benar
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 2 : Big Data Computing, Applications and Technologies
/
Kuis M2 [KELAS PAGI] : Big Data Computing, Applications and Technologies
d. Prediksi Cashflow
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 2 : Big Data Computing, Applications and Technologies
/
Kuis M2 [KELAS PAGI] : Big Data Computing, Applications and Technologies
b. Semua benar
d. Data pegawai
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 2 : Big Data Computing, Applications and Technologies
/
Kuis M2 [KELAS PAGI] : Big Data Computing, Applications and Technologies
b. Monsanto membayar hampir $ 1 miliar untuk The Climate Company, yang mengumpulkan dan menganalisis data
cuaca untuk pertanian
c. Semua benar
d. Procter & Gamble melakukan Analisis sentimen media sosial real time untuk "Pulsa Konsumen"
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 2 : Big Data Computing, Applications and Technologies
/
Kuis M2 [KELAS PAGI] : Big Data Computing, Applications and Technologies
Question 8 Dalam computer vision, contoh penerapan Machine Learning adalah, kecuali:
Answer saved
b. Analitik Rute
c. Pengenalan wajah
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 2 : Big Data Computing, Applications and Technologies
/
Kuis M2 [KELAS PAGI] : Big Data Computing, Applications and Technologies
Question 9 Istilah 'Machine Learning' diciptakan pada tahun <T> oleh <P>:
Answer saved
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 2 : Big Data Computing, Applications and Technologies
/
Kuis M2 [KELAS PAGI] : Big Data Computing, Applications and Technologies
b. YARN
c. Semua benar
d. HDFS
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 2 : Big Data Computing, Applications and Technologies
/
Kuis M2 [KELAS PAGI] : Big Data Computing, Applications and Technologies
b. Semua benar
c. HDFS
d. YARN
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 2 : Big Data Computing, Applications and Technologies
/
Kuis M2 [KELAS PAGI] : Big Data Computing, Applications and Technologies
d. Sumber data dari internal, relatif kecil dan data terstruktur dari pelanggan
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 2 : Big Data Computing, Applications and Technologies
/
Kuis M2 [KELAS PAGI] : Big Data Computing, Applications and Technologies
d. Semua benar
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 2 : Big Data Computing, Applications and Technologies
/
Kuis M2 [KELAS PAGI] : Big Data Computing, Applications and Technologies
b. 3.0
c. Semua benar
d. 1.0
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 2 : Big Data Computing, Applications and Technologies
/
Kuis M2 [KELAS PAGI] : Big Data Computing, Applications and Technologies
c. Relational vs Non-Relational
d. Static vs Dynamic
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 2 : Big Data Computing, Applications and Technologies
/
Kuis M2 [KELAS PAGI] : Big Data Computing, Applications and Technologies
d. Mahal vs Terjangkau
Clear my choice
b. Document
c. Key-Value
d. Semua benar
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 2 : Big Data Computing, Applications and Technologies
/
Kuis M2 [KELAS PAGI] : Big Data Computing, Applications and Technologies
Question 18 Salah satu fakta yang menunjukkan aspek Velocity dari Big Data:
Answer saved
b. Mobil modern memiliki 100 sensor yang memantau berbagai item pada mobil
d. Semua benar
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 2 : Big Data Computing, Applications and Technologies
/
Kuis M2 [KELAS PAGI] : Big Data Computing, Applications and Technologies
Question 19 Salah satu tonggak penting dalam Big Data Analytic dalam aspek pengadaan infrastruktur:
Answer saved
b. Adaptasi dan ubah organisasi Anda menuju teknologi big data dan implementasi analitik baru
c. Kembangkan arsitektur Solusi untuk kasus bisnis Anda termasuk proses pengumpulan data, arsitektur teknologi
dan metode analitik serta visualisasi data
d. Analisis data untuk setiap kasus bisnis spesifik Anda dan visualisasikan dengan cara yang bermakna
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 2 : Big Data Computing, Applications and Technologies
/
Kuis M2 [KELAS PAGI] : Big Data Computing, Applications and Technologies
b. Keduanya salah
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 3 : Introduction to Apache Hadoop
/
Kuis M3 : Introduction to Hadoop
Question 1 Database NoSQL menggunakan beragam model data untuk mengakses dan mengelola data. Jenis database ini
Not yet dioptimalkan secara khusus untuk aplikasi yang memerlukan…., yang dicapai dengan mengurangi pembatasan konsistensi
answered
data dari database lainnya.
Marked out of
5.00
Select one:
a. volume data besar, latensi rendah, dan model data fleksibel
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 3 : Introduction to Apache Hadoop
/
Kuis M3 : Introduction to Hadoop
b. yang melibatkan pelaksanaan sub-tugas secara bersamaan secara kolektif membentuk tugas yang besar melalui
beberapa processor
c. yang menerapkan divide and conquer dalam fisik terpisah, namun terhunung Bersama dalam satu cluster
d. yang membagi pemrosesan dalam beberapa batch dan dilakukan secara offline
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 3 : Introduction to Apache Hadoop
/
Kuis M3 : Introduction to Hadoop
b. Penyimpanan dan pengaturan data pada perangkat penyimpanan harddisk atau flashdisk, dan menyediakan logical
view dari data yang disimpan dalam struktur hirakis direktori file.
c. Data disimpan dengan cara menyalin dataset dan meyimpan Salinan tersebut pada beberapa node
d. Kumpulan server atau node digabungkan secara erat, dengan spesifikasi perangkat keras yang sama. Serta
terhubung melalui jaringan dan bekerja sebagai satu kesatuan
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 3 : Introduction to Apache Hadoop
/
Kuis M3 : Introduction to Hadoop
Question 4 Berikut yang dimaksud dengan menganalisa data dalam konteks big data adalah:
Not yet
answered
Select one:
Marked out of
a. Classification analytics, regression analytics, clustering analytics, dan hadooping analytics
5.00
b. Menentukan jumlah data dan atribut data
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 3 : Introduction to Apache Hadoop
/
Kuis M3 : Introduction to Hadoop
c. memproses data besar secara parallel dalam cluster pada commodity hardware
d. semua benar
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 3 : Introduction to Apache Hadoop
/
Kuis M3 : Introduction to Hadoop
Question 6 Jenis database NoSQL apa yang membuat dan menjalankan aplikasi yang berjalan dengan dataset yang selalu terhubung
Not yet menjadi lebih mudah dan sering digunakan untuk jaringan media sosial.
answered
b. Pencarian
c. Dokumen
d. Primary key
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 3 : Introduction to Apache Hadoop
/
Kuis M3 : Introduction to Hadoop
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 3 : Introduction to Apache Hadoop
/
Kuis M3 : Introduction to Hadoop
Question 8 Properti Big data yang penting, salah satunya adalah reliability, yaitu:
Not yet
answered
Select one:
Marked out of
a. Ketersediaan layanan secara terus menerus
5.00
b. Handal
d. Kemampuan untuk terus beroperasi walaupun terjadi kegagalan pada beberapa komponen
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 3 : Introduction to Apache Hadoop
/
Kuis M3 : Introduction to Hadoop
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 3 : Introduction to Apache Hadoop
/
Kuis M3 : Introduction to Hadoop
Question 10 Properti Big data yang penting, salah satunya adalah fault tolerance, yaitu:
Not yet
answered
Select one:
Marked out of
a. Ketersediaan layanan secara terus menerus
5.00
b. Kemampuan untuk terus beroperasi walaupun terjadi kegagalan pada beberapa komponen
d. Handal
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 3 : Introduction to Apache Hadoop
/
Kuis M3 : Introduction to Hadoop
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 3 : Introduction to Apache Hadoop
/
Kuis M3 : Introduction to Hadoop
Question 12 Hadoop adalah platform pemrosesan big data yaitu data yang mempunyai karakteristik kecuali:
Not yet
answered
Select one:
Marked out of
a. Jumlah fitur yang tertentu
5.00
b. Terakumulasi dengan cepat (high speed velocity)
c. Volume besar, struktur data yang beragam (variety), dan nilai data yang diperlukan (useful value)
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 3 : Introduction to Apache Hadoop
/
Kuis M3 : Introduction to Hadoop
Question 13 Hadoop adalah framework yang bekerja bersama tools lain yang beragam. Kelompok yang umum bekerja bersama
Not yet Hadoop adalah
answered
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 3 : Introduction to Apache Hadoop
/
Kuis M3 : Introduction to Hadoop
Question 14 Properti Big data yang penting, salah satunya adalah aviability, yaitu:
Not yet
answered
Select one:
Marked out of
a. Kemampuan untuk terus beroperasi walaupun terjadi kegagalan pada beberapa komponen
5.00
b. Handal
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 3 : Introduction to Apache Hadoop
/
Kuis M3 : Introduction to Hadoop
Question 15 Properti Big data yang penting, salah satunya adalah scalability, yaitu:
Not yet
answered
Select one:
Marked out of
a. Ketersediaan layanan secara terus menerus
5.00
b. Kemampuan menanganai penambahan bebab yang diberikan tanpa penurunan kinerja
c. Handal
d. Kemampuan untuk terus beroperasi walaupun terjadi kegagalan pada beberapa komponen
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 3 : Introduction to Apache Hadoop
/
Kuis M3 : Introduction to Hadoop
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 3 : Introduction to Apache Hadoop
/
Kuis M3 : Introduction to Hadoop
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 3 : Introduction to Apache Hadoop
/
Kuis M3 : Introduction to Hadoop
Question 18 Berikut ini yang bukan merupakan Hadoop operation mode, adalah
Not yet
answered
Select one:
Marked out of
a. Stand alone mode
5.00
b. Globally distributed mode
d. Fully-Distributed mode
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 3 : Introduction to Apache Hadoop
/
Kuis M3 : Introduction to Hadoop
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 3 : Introduction to Apache Hadoop
/
Kuis M3 : Introduction to Hadoop
Question 20 Type data berikut yang dapat ditangani oleh Hadoop adalah
Not yet
answered
Select one:
Marked out of
a. Semi – terstruktur
5.00
b. Tidak terstuktur
c. Terstruktur
d. Semua benar
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 4 : Data Preprocessing
/
Kuis M4 : Data Preprocessing
Dibiarkan
A,B,dan C benar
Atribut
Sample
Record
Regression
Combined Computer
Ignore
Question 4 Data berupa image, video bahkan suara termasuk jenis data
Correct
Ordered
Record
Graf
1
Online
Question 5 data cleaning pada data preprocessing dilakukan..
Correct
Question 6 Data Cleansing merupakan tahapan untuk membersihkan data kotor sehingga menjadi dataset yang siap diolah. Data
Correct kotor tersebut berupa
Mark 5.00 out of
5.00 Select one:
outlier
duplicate data
A,B,C benar
missing value
Question 7 Data-data yang saling berhubungan, yang biasanya ditemukan pada jaringan internet termasuk dalam jenis data
Correct
Multimedia
Graf
Record
Question 8 Imputasi nilai secara otomatis saat menangani incomplete data tidak dapat dilakukan menggunakan
Correct
Rata-rata
interpolasi
Nilai tertinggi
Rasio
Nominal
Numerik
Data sample
Dataset
Atribut
1
Online
Question 11 Nilai yang merepresentasikan urutan seperti nilai mata kuliah termasuk dalam atribut data type..
Correct
Nominal
Ordinal
Rasio
data cleaning
data transformation
data reduction
Question 13 Penanganan missing value dapat dilakukan menggunakan nilai estimasi dari probabilitas bersyarat menggunakan metode
Correct
Regresi
Bayessian
Eliminasi
Question 14 Salah satu jenis data record yang diekstrak menjadi kumpulan term dan ditulis berdasarkan frekuensi kemunculan data,
Correct termasuk pada jenis data
Mark 5.00 out of
5.00 Select one:
Dokumen
Transaksi
Matriks
Sosial network
Question 15 Seberapa mudah data dapat dipahami merupakan kualitas data dari..
Correct
Interpretability
Consistency
Completeness
Question 16 Statistik dasar untuk mengukur sebaran data salah satunya adalah
Correct
Modus
Median
Variance
1
Online
Question 17 Studi tentang bagaimana menganalisis data dan membersihkan data merupakan salah satu tujuan dari
Correct
Data cleansing
Data training
Data testing
data reduction
data transformation
data cleaning
Question 19 Tanggal penjualan, nama pelanggan, nama barang, jumlah penjualan merupakan contoh dari
Correct
Dataset penjualan
Question 20 Tinggi badan, berat badan, usia, dan jenis kelamin merupakan contoh representasi karakteristik dari
Correct
Dataset
Data sample
Atribut
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
1
Online
Started on Monday, 4 April 2022, 11:59 AM
State Finished
Completed on Monday, 4 April 2022, 12:20 PM
Time taken 21 mins 39 secs
Marks 19.00/20.00
Grade 95.00 out of 100.00
Question 1 Ukuran kualitas citra merupakan salah satu luaran yang dihasilkan oleh AI/ML Scientist Link Aja! pada proyek:
Correct
d. eKYC Improvement
b. Semua benar
c. Gambar
b. 2015
c. 2020
d. 2016
c. Berbasis teks
1
d. Sulit untuk dicari Online
b. Veracity
c. Variety
d. Volume
b. Hive
c. Beam
d. Storm
b. Tidak Terstruktur
c. Terstruktur
d. Semi Terstruktur
Question 8 Dalam ekosistem teknologi Data Engineering Link Aja! Apache Airflow berfungsi sebagai:
Correct
b. Monitoring
c. Batching Infratructure
b. Data Manager
c. Data Architect
1
d. Statistician Online
Question 10 Menjadi platform teknologi keuangan nasional terdepan dan terpercaya merupakan ... dari Link Aja!:
Correct
b. Misi
c. SLogan
d. Visi
Question 11 Salah satu teknologi yang dapat digunakan pada bagian Serving Layer dalam Arsitektur lambda adalah:
Correct
b. Hive
c. HDFS
d. Flume
b. Email
c. Nomor KTP
d. Nama pelanggan
b. Data Sources, Streaming/Real-Time Ingestion, Streaming/Real-Time Processing, Analytical Data Store, Analytics
& Reporting 1
Online
c. Data Sources, Streaming/Real-Time Processing, Streaming/Real-Time Ingestion, Analytical Data Store, Analytics
& Reporting
d. Data Sources, Analytical Data Store, Streaming/Real-Time Ingestion, Streaming/Real-Time Processing, Analytics
& Reporting
The correct answer is: Data Sources, Streaming/Real-Time Ingestion, Streaming/Real-Time Processing, Analytical Data
Store, Analytics & Reporting
Question 14 Berikut ini yang bukan termasuk kedalam peran Tim Data di Link Aja! adalah:
Correct
b. Data Scientist
c. Data Intelligent
d. Data Engineer
Question 15 Berikut ini merupakan komponen-kompone produksi dalam implementasi big data, kecuali:
Correct
b. MongoDB
c. Presto
d. Spark
b. Facebook
c. Linkedin
d. Google
b. BPJS
c. Pemerintah
1
d. Bank Indonesia Online
Question 18 Berikut ini adalah teknologi yang digunakan oleh Link Aja! pada bagian Persistence Layer, kecuali:
Correct
c. PostgreSQL
d. Grafana
Question 19 Salah satu aktivitas yang dilakukan oleh Link Aja! dalam mengadopsi alat-alat bantu untuk pengelolaan data adalah:
Correct
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
Question 1 Ukuran kualitas citra merupakan salah satu luaran yang dihasilkan oleh AI/ML Scientist Link Aja! pada proyek:
Answer saved
d. eKYC Improvement
Clear my choice
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
b. Semua benar
c. Gambar
Clear my choice
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
b. 2015
c. 2020
d. 2016
Clear my choice
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
c. Berbasis teks
Clear my choice
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
b. Veracity
c. Variety
d. Volume
Clear my choice
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
b. Hive
c. Beam
d. Storm
Clear my choice
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
b. Tidak Terstruktur
c. Terstruktur
d. Semi Terstruktur
Clear my choice
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
Question 8 Dalam ekosistem teknologi Data Engineering Link Aja! Apache Airflow berfungsi sebagai:
Answer saved
b. Monitoring
c. Batching Infratructure
Clear my choice
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
b. Data Manager
c. Data Architect
d. Statistician
Clear my choice
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
Question 10 Menjadi platform teknologi keuangan nasional terdepan dan terpercaya merupakan ... dari Link Aja!:
Answer saved
b. Misi
c. SLogan
d. Visi
Clear my choice
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
Question 11 Salah satu teknologi yang dapat digunakan pada bagian Serving Layer dalam Arsitektur lambda adalah:
Answer saved
b. Hive
c. HDFS
d. Flume
Clear my choice
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
b. Email
c. Nomor KTP
d. Nama pelanggan
Clear my choice
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
Question 13 Berikut ini urutan proses yang dilakukan dalam Arsitektur Kappa adalah:
Answer saved
b. Data Sources, Streaming/Real-Time Ingestion, Streaming/Real-Time Processing, Analytical Data Store, Analytics
& Reporting
c. Data Sources, Streaming/Real-Time Processing, Streaming/Real-Time Ingestion, Analytical Data Store, Analytics
& Reporting
d. Data Sources, Analytical Data Store, Streaming/Real-Time Ingestion, Streaming/Real-Time Processing, Analytics
& Reporting
Clear my choice
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
Question 14 Berikut ini yang bukan termasuk kedalam peran Tim Data di Link Aja! adalah:
Answer saved
b. Data Scientist
c. Data Intelligent
d. Data Engineer
Clear my choice
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
Question 15 Berikut ini merupakan komponen-kompone produksi dalam implementasi big data, kecuali:
Answer saved
b. MongoDB
c. Presto
d. Spark
Clear my choice
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
b. Facebook
c. Linkedin
d. Google
Clear my choice
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
Question 17 Pembayaran Kartu prakerja merupakan salah satu proyek yang dikerjakan oleh Link Aja bersama dengan:
Answer saved
b. BPJS
c. Pemerintah
d. Bank Indonesia
Clear my choice
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
Question 18 Berikut ini adalah teknologi yang digunakan oleh Link Aja! pada bagian Persistence Layer, kecuali:
Answer saved
c. PostgreSQL
d. Grafana
Clear my choice
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
Question 19 Salah satu aktivitas yang dilakukan oleh Link Aja! dalam mengadopsi alat-alat bantu untuk pengelolaan data adalah:
Answer saved
Clear my choice
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 5: Implementasi Big Data pada Fintech
/
Kuis M5: Implementasi BigData pada Fintech
Clear my choice
◄ Materi M5: Implementasi Big Data Kuis M5: Implementasi BigData pada
Jump to...
pada Fintech Fintech (Khusus KELAS MALAM) ►
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 7: Data Mining
/
Kuis M7 : Introduction to Data Mining
Question 1 Proses pencarian konten baru dan konten yang perlu diperbaharui dengan mengirimkan crawler ke seluruh konten yang
Not yet ditemukan dari tautan halaman merupakan Salah satu konsep data mining pada Search Engine yang dinamakan
answered
b. Index
c. Searching
d. Rank
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 7: Data Mining
/
Kuis M7 : Introduction to Data Mining
Question 2 Metode untuk mempresentasikan hasil yang ditemukan dengan cara yang "bagus" secara visual
Not yet
answered
Select one:
Marked out of
a. Asosiasi
5.00
b. Klasterisasi
c. Visualisasi
d. Klasifikasi
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 7: Data Mining
/
Kuis M7 : Introduction to Data Mining
b. Buat model pada set pelatihan, pilih secara acak jumlah instance kelas minoritas yang diinginkan, Evaluasi pada set
pengujian
c. Pisahkan data menjadi set pelatihan dan pengujian, Buat model pada set pelatihan, Evaluasi pada set pengujian
d. Evaluasi pada set pengujian, Buat model pada set pelatihan, Pisahkan data menjadi set pelatihan dan pengujian
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 7: Data Mining
/
Kuis M7 : Introduction to Data Mining
Question 4 Seberapa mudah data dapat dipahami merupakan kualitas data dari..
Not yet
answered
Select one:
Marked out of
a. Believability
5.00
b. Interpretability
c. Completeness
d. Consistency
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 7: Data Mining
/
Kuis M7 : Introduction to Data Mining
Question 5 Fungsi dari data mining adalah salah satunya dapat mengetahui pola yang sering (atau kumpulan item yang sering)
Not yet misalnya item apa yang sering dibeli bersama di Walmart Anda. Ini dikenal dengan istilah
answered
c. Klasifikasi
d. Outlier Analysis
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 7: Data Mining
/
Kuis M7 : Introduction to Data Mining
Question 6 Pernyataan yang tepat terkait data mining and knowledge discovery
Answer saved
b. lebih heuristik
d. lebih teori
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 7: Data Mining
/
Kuis M7 : Introduction to Data Mining
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 7: Data Mining
/
Kuis M7 : Introduction to Data Mining
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 7: Data Mining
/
Kuis M7 : Introduction to Data Mining
Question 9 Metode untuk memprediksi kelas instance dari instance yang diberi label sebelumnya
Not yet
answered
Select one:
Marked out of
a. Klasifikasi
5.00
b. Asosiasi
c. Klasterisasi
d. Visualisasi
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 7: Data Mining
/
Kuis M7 : Introduction to Data Mining
Question 10 Regression, Decision Trees, Bayesian, Neural Networks, Naïve Bayes Rules, Support Vector Machines, Genetic Algorithms
Not yet adalah pendekatan yang digunakan untuk
answered
b. Klasifikasi
c. Asosiasi
d. Klasterisasi
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 7: Data Mining
/
Kuis M7 : Introduction to Data Mining
Question 11 Attributes yang berisi informasi seperti item_ID, name, brand, category, supplier, place_made and price, merupakaan salah
Not yet satu contoh jenis database
answered
b. Social media
c. Marketing
d. Penjualan
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 7: Data Mining
/
Kuis M7 : Introduction to Data Mining
d. Decision Tree
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 7: Data Mining
/
Kuis M7 : Introduction to Data Mining
Question 13 Pernyataan yang tepat terkait data mining and knowledge discovery
Not yet
answered
Select one:
Marked out of
a. lebih fokus pada pengujian hipotesis
5.00
b. fokus pada seluruh proses penemuan pengetahuan
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 7: Data Mining
/
Kuis M7 : Introduction to Data Mining
c. Visualisasi
d. Asosiasi
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 7: Data Mining
/
Kuis M7 : Introduction to Data Mining
Question 15 Metode klasifikasi pada fungsi data mining yang menggunakan nilai estimasi dari probabilitas bersyarat dinamakan
Not yet metode
answered
b. Eliminasi
c. Mean
d. Naive Bayessian
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 7: Data Mining
/
Kuis M7 : Introduction to Data Mining
Question 16 Karakteristik Big Data yang terus bertambah dengan cepat secara real-time dinamakan
Not yet
answered
Select one:
Marked out of
a. Velocity
5.00
b. variety
c. Value
d. Volume
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 7: Data Mining
/
Kuis M7 : Introduction to Data Mining
Question 17 Melihat suatu objek data yang tidak sesuai dengan perilaku umum data, sering digunakan dalam deteksi penipuan atau
Not yet analisis kejadian langka
answered
b. Klasifikasi
c. Klasterisasi
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 7: Data Mining
/
Kuis M7 : Introduction to Data Mining
Question 18 Jenis tugas data mining yang menfasilitasi penerimaan / penelusuran informasi bagi pengguna
Not yet
answered
Select one:
Marked out of
a. Klasifikasi
5.00
b. Klasterisasi
c. Asosiasi
d. Visualisasi
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 7: Data Mining
/
Kuis M7 : Introduction to Data Mining
Question 19 Metode untuk mengelompokkan secara "alami" dari instance yang diberi data tanpa label
Not yet
answered
Select one:
Marked out of
a. Visualisasi
5.00
b. Klasifikasi
c. Klasterisasi
d. Asosiasi
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING /
Pertemuan 7: Data Mining
/
Kuis M7 : Introduction to Data Mining
Question 20 Untuk menghindari set pengujian yang tumpang tindih, data dibagi menjadi k himpunan bagian dengan ukuran yang
Not yet sama kemudiansetiap subset secara bergantian digunakan untuk pengujian dan sisanya untuk pelatihan
answered
b. k-fold cross-validation
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 8: Introduction to Machine Learning (Supervised) /
Kuis M6 : Introduction to Machine Learning (Supervised)
Question 1 Kumpulan data yg sudah dipastikan kebenarannya, dr sisi label, data awal, komponen2 data yg akan dijadikan kunci,
Answer saved
b. Instance
c. Feature/ atribut
d. Training Set
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 8: Introduction to Machine Learning (Supervised) /
Kuis M6 : Introduction to Machine Learning (Supervised)
Question 2
Answer saved
Marked out of
5.00
Gambar pada representasi di atas adalah Pola-pola struktur yang ada pada suatu koleksi data (knowledge) dalam bentuk
Select one:
a. Pohon
b. Tabel
c. Instance
d. Aturan
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 8: Introduction to Machine Learning (Supervised) /
Kuis M6 : Introduction to Machine Learning (Supervised)
Question 3
Answer saved
Marked out of
5.00
Gambar pada representasi di atas adalah Pola-pola struktur yang ada pada suatu koleksi data (knowledge) dalam bentuk
Select one:
a. Tabel
b. Pohon
c. Instance
d. Aturan
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 8: Introduction to Machine Learning (Supervised) /
Kuis M6 : Introduction to Machine Learning (Supervised)
Question 4 Model Pembelajaran yang mempelajari bagaimana sistem dapat menyimpulkan suatu fungsi untuk mendeskripsikan
Answer saved struktur tersembunyi dari data yang tidak berlabel. Sistem ini tidak memprediksi keluaran yang benar, tetapi
Marked out of mengeksplorasi data dan dapat menarik kesimpulan dari kumpulan data untuk mendeskripsikan struktur tersembunyi dari
5.00 data yang tidak berlabel.
Select one:
a. Semi Supervised Learning
b. Supervised Learning
c. Reinfocement Learning
d. Unsupervised Learning
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 8: Introduction to Machine Learning (Supervised) /
Kuis M6 : Introduction to Machine Learning (Supervised)
Question 5 Tujuan pembelajaran unsupervised adalah membagun model yang dapat menemukan komponen / variabel / fitur
Answer saved tersembunyi pada data pelatihan, yang dapat digunakan untuk hal berikut, kecuali
Marked out of
5.00 Select one:
a. Pengelompokan (clustering)
b. Rekomendasi
d. Pengklasifikasian (classification)
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 8: Introduction to Machine Learning (Supervised) /
Kuis M6 : Introduction to Machine Learning (Supervised)
c. Neural Networks
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 8: Introduction to Machine Learning (Supervised) /
Kuis M6 : Introduction to Machine Learning (Supervised)
Question 7 Model ini belajar dari kumpulan data berlabel dan kemudian digunakan untuk memprediksi peristiwa di masa depan.
Answer saved
b. Reinfocement Learning
d. Supervised Learning
Clear my choice
1
Online
1
Online
Dashboard / My courses /
ATA 2021/2022 | 2-FTI | Kompuasi Big Data | TEAM TEACHING
/
Pertemuan 8: Introduction to Machine Learning (Supervised) /
Kuis M6 : Introduction to Machine Learning (Supervised)
Clear my choice
Question 9
Answer saved
Marked out of
5.00
Gambar pada representasi di atas adalah Pola-pola struktur yang ada pada suatu koleksi data (knowledge) dalam bentuk
Select one:
a. Pohon
b. Instance
c. Aturan
d. Tabel
Clear my choice
Question 10 Pola-pola struktur yang ada pada suatu koleksi data (knowledge) dapat direpresentasi dalam bentuk if then rules :
Answer saved
b. Pohon
c. Instance
d. Aturan
Clear my choice
Question 11 Model pembelajaran yang menggunakan data berlabel dan tidak berlabel untuk pelatihan.
Answer saved
b. Unsupervised Learning
c. Supervised Learning
Clear my choice
b. Klasterisasi
c. Generalisasi
d. Regressi
Clear my choice
Question 13 Ciri-ciri dari masing-masing sample data misalnya Smartphone. ciri: memiliki ...
Answer saved
Marked out of
5.00 Select one:
a. Feature Extraction
b. Training Set
c. Feature/ atribut
d. Instance
Clear my choice
Question 14 Jika variabel keluaran adalah berupa kategori misalnya “apel”, “jeruk” termasuk pada machine learning bertipe
Answer saved
b. Supervised -Regresion
c. Supervised – Classification
d. Unsupervised
Clear my choice
Clear my choice
Question 16 Sebuah proses yg mempersiapkan data sehingga data tsb bisa kita extract cirinya menjadi suatu vektor
Answer saved
b. Training Set
c. Feature/ atribut
d. Feature Extraction
Clear my choice
Question 17 Salah satu teknik yang digunakan untuk mengkontrol fenomena over-fitting adalah dengan cara menambah finalti ke
Answer saved fungsi error.
Marked out of
5.00 Select one:
a. prediction
b. regularization
c. generalization
d. model selection
Clear my choice
Question 18 Pembelajaran yang bertujuan memprediksi output dengan akurat untuk data baru dan output ti bernilai kontinu (riil),
Answer saved contoh untuk Prediksi kinerja CPU
Marked out of
5.00 Select one:
a. Klasifikasi
b. Klasterisasi
c. Regressi
d. Generalisasi
Clear my choice
Question 19 Yang bukan tujuan supervised learning untuk membangun model yang dapat menghasilkan output yang benar untuk
Answer saved suatu data input dapat digunakan untuk
Marked out of
5.00 Select one:
a. Klasterisasi (clustering)
b. Ranking
c. Regresi (regression)
d. Pengklasifikasian (classification)
Clear my choice
Question 20 Saat Anda ingin mengungkap pengelompokan yang melekat dalam data, seperti mengelompokkan hewan berdasarkan
Answer saved beberapa karakteristik / fitur, mis. jumlah kaki maka model pembelajaran yang sesuai
Marked out of
5.00 Select one:
a. Reinfocement Learning
Clear my choice
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING / Pertemuan 1 : Big Data Computing Overview
/ Kuis M1 : Big Data Computing Overview
Question 1 Beragamnya jenis data di dalam Big Data yang meliputi data terstruktur, semi terstruktur dan bahkan data tidak
Correct terstruktur, merupakan penjelasan dari dimensi Big Data dalam hal:
Mark 5.00 out of
5.00 Select one:
Velocity
Volume
Variety
Veracity
Semua benar
Deteksi Penipuan
Question 3 Dalam arsitektur Big Data, solusi berupa rekomendasi, berada pada posisi sebagai:
Correct
Data Format
End Result
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2403724&cmid=491419 1/6
3/8/2021 Kuis M1 : Big Data Computing Overview: Attempt review
Question 4 Dalam ekosistem Big Data, proses pre-prosesing data dapat dilakukan menggunakan:
Correct
Sqoop
Tableu
Question 5 Data Warehouse dibuat dengan menerapkan serangkaian langkah pemrosesan terhadap data yang berasal dari beberapa
Incorrect basis data. Berikut ini adalah yang termasuk dalam pemrosesan data tersebut:
Mark 0.00 out of
5.00 Select one:
Pembersihan data
Semua benar
Integrasi data
Transformasi data
The correct answer is: Sekumpulan objek yang memiliki fitur yang sama
Semua benar
Resource Layer
Interface Layer
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2403724&cmid=491419 2/6
3/8/2021 Kuis M1 : Big Data Computing Overview: Attempt review
Question 8 Kumpulan data yang disusun dalam tabel berformat persegi panjang yang terdiri dari baris dan kolom disebut sebagai:
Correct
Data Warehouse
Database
Flat files
The correct answer is: Memperkirakan puncak dari kasus positif Covid-19, adalah contoh analisis prediktif.
Question 10 Model basis data yang berupa deret waktu (time series):
Correct
Text database
Semua salah
Spatial database
Unit
Data points
Record
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2403724&cmid=491419 3/6
3/8/2021 Kuis M1 : Big Data Computing Overview: Attempt review
Semua benar
Question 13 Sekumpulan tabel dimana bentuk setiap tabel analog dengan flat file, disebut:
Correct
Data Warehouse
DBMS
Database
Question 14 Semakin banyak data hingga mencapai ukuran Peta Byte atau bahkan lebih, merupakan penjelasan dari dimensi Big Data
Correct dalam hal:
Mark 5.00 out of
5.00 Select one:
Variety
Volume
Velocity
Veracity
Question 15 Sumber data yang digunakan dalam aplikasi Big Data dapat berupa:
Correct
Data Finansial
Semua benar
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2403724&cmid=491419 4/6
3/8/2021 Kuis M1 : Big Data Computing Overview: Attempt review
Question 16 Tempat penyimpanan data yang dikumpulkan di lokasi berbeda (basis data relasional) dan disimpan menggunakan skema
Correct terpadu:
Mark 5.00 out of
5.00 Select one:
Data Warehouse
Transactional database
Semua benar
Spatial Database
Fitur
Semua salah
Numerik
Dataset
Nilai
Objek
Tabel
Grafik 3D
Plot
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2403724&cmid=491419 5/6
3/8/2021 Kuis M1 : Big Data Computing Overview: Attempt review
Amazon ML
Semua benar
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2403724&cmid=491419 6/6
3/15/2021 1 pesan baru
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING
/ Pertemuan 2 : Big Data Computing, Applications and Technologies / Kuis M2 : Big Data Computing, Applications and Technologies
The correct answer is: Storage layer, Resource Management Layer, Application Layer
Question 2 Berikut ini adalah saran untuk memasuki era Analytic 3.0:
Correct
c. Semua benar
Question 3 Berikut ini yang harus dilakukan oleh perusahaan 1.0, kecuali:
Correct
The correct answer is: Membuat analitik dan keputusan berbasis fakta elemen kunci dari hubungan pelanggan, produk
dan layanan, strategi, dan persaingan
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2476785&cmid=491949 1/6
3/15/2021 1 pesan baru
b. Semua benar
d. Prediksi Cashflow
c. Data pegawai
d. Semua benar
b. Procter & Gamble melakukan Analisis sentimen media sosial real time untuk "Pulsa Konsumen"
c. Semua benar
d. Monsanto membayar hampir $ 1 miliar untuk The Climate Company, yang mengumpulkan dan menganalisis data
cuaca untuk pertanian
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2476785&cmid=491949 2/6
3/15/2021 1 pesan baru
Question 8 Dalam computer vision, contoh penerapan Machine Learning adalah, kecuali:
Correct
b. Pengenalan wajah
d. Pengenalan objek
Question 9 Istilah 'Machine Learning' diciptakan pada tahun <T> oleh <P>:
Correct
b. HDFS
c. Semua benar
d. MapReduce
b. MapReduce
c. YARN
d. HDFS
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2476785&cmid=491949 3/6
3/15/2021 1 pesan baru
d. Sumber data dari internal, relatif kecil dan data terstruktur dari pelanggan
The correct answer is: Perpaduan antara analitik tradisional dengan Big Data
d. Semua benar
The correct answer is: Hadoop merupakan framework untuk bekerja dengan Big Data
b. Semua benar
c. 2.0
d. 3.0
b. Relational vs Non-Relational
c. Semua benar
d. Static vs Dynamic
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2476785&cmid=491949 4/6
3/15/2021 1 pesan baru
b. Mahal vs Terjangkau
d. Semua benar
b. Graph
c. Key-Value
d. Semua benar
Question 18 Salah satu fakta yang menunjukkan aspek Velocity dari Big Data:
Correct
b. Semua benar
c. Mobil modern memiliki 100 sensor yang memantau berbagai item pada mobil
The correct answer is: Mobil modern memiliki 100 sensor yang memantau berbagai item pada mobil
Question 19 Salah satu tonggak penting dalam Big Data Analytic dalam aspek pengadaan infrastruktur:
Correct
b. Dapatkan infrastruktur yang tepat yang dibutuhkan berdasarkan arsitektur solusi Anda termasuk penyimpanan
data dan unit pemrosesan, platform, dan aplikasi
c. Adaptasi dan ubah organisasi Anda menuju teknologi big data dan implementasi analitik baru
d. Kembangkan arsitektur Solusi untuk kasus bisnis Anda termasuk proses pengumpulan data, arsitektur teknologi
dan metode analitik serta visualisasi data
The correct answer is: Dapatkan infrastruktur yang tepat yang dibutuhkan berdasarkan arsitektur solusi Anda termasuk
penyimpanan data dan unit pemrosesan, platform, dan aplikasi
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2476785&cmid=491949 5/6
3/15/2021 1 pesan baru
d. Keduanya salah
The correct answer is: Ketergantungan yang tinggi pada Machine Learning
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2476785&cmid=491949 6/6
3/22/2021 Kuis M3 : Introduction to Hadoop: Attempt review
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING / Pertemuan 3 : Introduction to Apache Hadoop
/ Kuis M3 : Introduction to Hadoop
Question 1 Jenis database NoSQL apa yang membuat dan menjalankan aplikasi yang berjalan dengan dataset yang selalu terhubung
Correct menjadi lebih mudah dan sering digunakan untuk jaringan media sosial.
Mark 5.00 out of
5.00 Select one:
a. Primary key
b. Grafik
c. Dokumen
d. Pencarian
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2564953&cmid=499213 1/6
3/22/2021 Kuis M3 : Introduction to Hadoop: Attempt review
Question 4 Database NoSQL menggunakan beragam model data untuk mengakses dan mengelola data. Jenis database ini
Incorrect dioptimalkan secara khusus untuk aplikasi yang memerlukan…., yang dicapai dengan mengurangi pembatasan konsistensi
Mark 0.00 out of data dari database lainnya.
5.00
Select one:
a. volume data besar, latensi rendah, dan model data fleksibel
The correct answer is: volume data besar, latensi rendah, dan model data fleksibel
Question 5 Type data berikut yang dapat ditangani oleh Hadoop adalah
Correct
b. Semi – terstruktur
c. Terstruktur
d. Semua benar
b. semua benar
d. membagi masalah besar menjadi masalah kecil yang dapat diselesaikan dengan cepat
b. Data disimpan dengan cara menyalin dataset dan meyimpan Salinan tersebut pada beberapa node
c. Penyimpanan dan pengaturan data pada perangkat penyimpanan harddisk atau flashdisk, dan menyediakan logical
view dari data yang disimpan dalam struktur hirakis direktori file.
d. Kumpulan server atau node digabungkan secara erat, dengan spesifikasi perangkat keras yang sama. Serta
terhubung melalui jaringan dan bekerja sebagai satu kesatuan
The correct answer is: Kumpulan server atau node digabungkan secara erat, dengan spesifikasi perangkat keras yang
sama. Serta terhubung melalui jaringan dan bekerja sebagai satu kesatuan
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2564953&cmid=499213 2/6
3/22/2021 Kuis M3 : Introduction to Hadoop: Attempt review
The correct answer is: On Disk Storage Devices dan In Memory Storage Devices
Question 9 Berikut yang dimaksud dengan menganalisa data dalam konteks big data adalah:
Correct
The correct answer is: Descriptive analytics, diagnostic analytics, predictive analytics, dan prescriptive analytics
Question 10 Berikut ini yang bukan merupakan Hadoop operation mode, adalah
Correct
c. Fully-Distributed mode
Question 11 Properti Big data yang penting, salah satunya adalah scalability, yaitu:
Correct
c. Handal
d. Kemampuan untuk terus beroperasi walaupun terjadi kegagalan pada beberapa komponen
The correct answer is: Kemampuan menanganai penambahan bebab yang diberikan tanpa penurunan kinerja
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2564953&cmid=499213 3/6
3/22/2021 Kuis M3 : Introduction to Hadoop: Attempt review
b. Semua benar
Question 13 Hadoop adalah platform pemrosesan big data yaitu data yang mempunyai karakteristik kecuali:
Correct
d. Volume besar, struktur data yang beragam (variety), dan nilai data yang diperlukan (useful value)
Question 14 Properti Big data yang penting, salah satunya adalah reliability, yaitu:
Correct
c. Handal
Question 15 Properti Big data yang penting, salah satunya adalah fault tolerance, yaitu:
Correct
c. Handal
The correct answer is: Kemampuan untuk terus beroperasi walaupun terjadi kegagalan pada beberapa komponen
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2564953&cmid=499213 4/6
3/22/2021 Kuis M3 : Introduction to Hadoop: Attempt review
Question 17 Hadoop adalah framework yang bekerja bersama tools lain yang beragam. Kelompok yang umum bekerja bersama
Correct Hadoop adalah
Mark 5.00 out of
5.00 Select one:
a. MapReduce, Hummer and Iguana
b. yang menerapkan divide and conquer dalam fisik terpisah, namun terhunung Bersama dalam satu cluster
c. yang melibatkan pelaksanaan sub-tugas secara bersamaan secara kolektif membentuk tugas yang besar melalui
beberapa processor
The correct answer is: yang menerapkan divide and conquer dalam fisik terpisah, namun terhunung Bersama dalam satu
cluster
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2564953&cmid=499213 5/6
3/22/2021 Kuis M3 : Introduction to Hadoop: Attempt review
Question 20 Properti Big data yang penting, salah satunya adalah aviability, yaitu:
Correct
b. Handal
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2564953&cmid=499213 6/6
3/29/2021 1 pesan baru
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING / Pertemuan 4 : Data Preprocessing
/ Kuis M4 : Data Preprocessing
Dibiarkan
Record
Instance
Sample
Combined Computer
Ignore
Clustering
Question 4 Data berupa image, video bahkan suara termasuk jenis data
Correct
Ordered
Graf
Multimedia
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2645316&cmid=502729 1/4
3/29/2021 1 pesan baru
Question 6 Data Cleansing merupakan tahapan untuk membersihkan data kotor sehingga menjadi dataset yang siap diolah. Data
Correct kotor tersebut berupa
Mark 5.00 out of
5.00 Select one:
missing value
duplicate data
outlier
A,B,C benar
Question 7 Data-data yang saling berhubungan, yang biasanya ditemukan pada jaringan internet termasuk dalam jenis data
Correct
Graf
Record
Ordered
Question 8 Imputasi nilai secara otomatis saat menangani incomplete data tidak dapat dilakukan menggunakan
Correct
Nilai tertinggi
Rata-rata
Median
Ordinal
Nominal
Rasio
Data objek
Data sample
Atribut
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2645316&cmid=502729 2/4
3/29/2021 1 pesan baru
Question 11 Nilai yang merepresentasikan urutan seperti nilai mata kuliah termasuk dalam atribut data type..
Correct
Ordinal
Numerik
Nominal
data Integration
data cleaning
data reduction
Question 13 Penanganan missing value dapat dilakukan menggunakan nilai estimasi dari probabilitas bersyarat menggunakan metode
Correct
Mean
Bayessian
Regresi
Question 14 Salah satu jenis data record yang diekstrak menjadi kumpulan term dan ditulis berdasarkan frekuensi kemunculan data,
Correct termasuk pada jenis data
Mark 5.00 out of
5.00 Select one:
Dokumen
Matriks
Sosial network
Transaksi
Question 15 Seberapa mudah data dapat dipahami merupakan kualitas data dari..
Correct
Believability
Completeness
Consistency
Question 16 Statistik dasar untuk mengukur sebaran data salah satunya adalah
Correct
Median
Mean
Modus
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2645316&cmid=502729 3/4
3/29/2021 1 pesan baru
Question 17 Studi tentang bagaimana menganalisis data dan membersihkan data merupakan salah satu tujuan dari
Correct
Data cleansing
Data validation
Data training
data transformation
data reduction
data cleaning
Question 19 Tanggal penjualan, nama pelanggan, nama barang, jumlah penjualan merupakan contoh dari
Correct
Dataset penjualan
Question 20 Tinggi badan, berat badan, usia, dan jenis kelamin merupakan contoh representasi karakteristik dari
Correct
Atribut
Dataset
Data objek
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2645316&cmid=502729 4/4
4/5/2021 1 pesan baru
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING / Pertemuan 5 : Introduction to Data Mining
/ Kuis M5 : Introduction Data Mining
Question 1 Metode untuk mempresentasikan hasil yang ditemukan dengan cara yang "bagus" secara visual
Correct
b. Visualisasi
c. Klasterisasi
d. Klasifikasi
Question 2 Untuk menghindari set pengujian yang tumpang tindih, data dibagi menjadi k himpunan bagian dengan ukuran yang
Correct sama kemudiansetiap subset secara bergantian digunakan untuk pengujian dan sisanya untuk pelatihan
Marked out of
5.00 Select one:
a. k-fold cross-validation
Question 3 Metode untuk mengelompokkan secara "alami" dari instance yang diberi data tanpa label
Correct
b. Klasterisasi
c. Klasifikasi
d. Visualisasi
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2763658&cmid=517239 1/5
4/5/2021 1 pesan baru
c. Data pengujian tidak digunakan dengan cara apa pun untuk membuat pengklasifikasi
d. Skema pembelajaran beroperasi dalam dua tahap yaitu membangun struktur dasar dan mengoptimalkan
pengaturan parameter
Question 6 Jenis tugas data mining yang menfasilitasi penerimaan / penelusuran informasi bagi pengguna
Correct
b. Klasterisasi
c. Klasifikasi
d. Visualisasi
Question 7 Karakteristik Big Data yang terus bertambah dengan cepat secara real-time dinamakan
Correct
b. variety
c. Velocity
d. Value
Question 8 Fungsi dari data mining adalah salah satunya dapat mengetahui pola yang sering (atau kumpulan item yang sering)
Correct misalnya item apa yang sering dibeli bersama di Walmart Anda. Ini dikenal dengan istilah
Marked out of
5.00 Select one:
a. Klasterisasi
b. Outlier Analysis
c. Klasifikasi
Question 9 Proses pencarian konten baru dan konten yang perlu diperbaharui dengan mengirimkan crawler ke seluruh konten yang
Correct ditemukan dari tautan halaman merupakan Salah satu konsep data mining pada Search Engine yang dinamakan
Marked out of
5.00 Select one:
a. Index
b. Crawl
c. Rank
d. Searching
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2763658&cmid=517239 2/5
4/5/2021 1 pesan baru
Question 10 Metode untuk memprediksi kelas instance dari instance yang diberi label sebelumnya
Correct
b. Klasterisasi
c. Asosiasi
d. Klasifikasi
Question 11 Melihat suatu objek data yang tidak sesuai dengan perilaku umum data, sering digunakan dalam deteksi penipuan atau
Correct analisis kejadian langka
Marked out of
5.00 Select one:
a. Analisis Outlier
b. Klasifikasi
c. Klasterisasi
Question 12 Seberapa mudah data dapat dipahami merupakan kualitas data dari..
Correct
b. Believability
c. Completeness
d. Interpretability
Question 13 Regression, Decision Trees, Bayesian, Neural Networks, Naïve Bayes Rules, Support Vector Machines, Genetic Algorithms
Correct adalah pendekatan yang digunakan untuk
Marked out of
5.00 Select one:
a. Asosiasi
b. Klasifikasi
c. Visualisasi
d. Klasterisasi
b. Pisahkan data menjadi set pelatihan dan pengujian, Buat model pada set pelatihan, Evaluasi pada set pengujian
c. Buat model pada set pelatihan, pilih secara acak jumlah instance kelas minoritas yang diinginkan, Evaluasi pada set
pengujian
d. Evaluasi pada set pengujian, Buat model pada set pelatihan, Pisahkan data menjadi set pelatihan dan pengujian
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2763658&cmid=517239 3/5
4/5/2021 1 pesan baru
Question 15 Pernyataan yang tepat terkait data mining and knowledge discovery
Correct
c. lebih teori
b. Visualisasi
c. Klasifikasi
d. Asosiasi
Question 17 Pernyataan yang tepat terkait data mining and knowledge discovery
Correct
Question 18 Attributes yang berisi informasi seperti item_ID, name, brand, category, supplier, place_made and price, merupakaan salah
Correct satu contoh jenis database
Marked out of
5.00 Select one:
a. Social media
b. Penjualan
c. Penyewaan
d. Marketing
Question 19 Metode klasifikasi pada fungsi data mining yang menggunakan nilai estimasi dari probabilitas bersyarat dinamakan
Correct metode
Marked out of
5.00 Select one:
a. Naive Bayessian
b. Mean
c. Regresi
d. Eliminasi
b. Decision Tree
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2763658&cmid=517239 4/5
4/5/2021 1 pesan baru
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2763658&cmid=517239 5/5
4/12/2021 1 pesan baru
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING
/ Pertemuan 6 : Introduction to Machine Learning (Supervised) / Kuis M6 : Introduction to Machine Learning (Supervised)
Question 1 Model Pembelajaran yang mempelajari bagaimana sistem dapat menyimpulkan suatu fungsi untuk mendeskripsikan
Correct struktur tersembunyi dari data yang tidak berlabel. Sistem ini tidak memprediksi keluaran yang benar, tetapi
Marked out of mengeksplorasi data dan dapat menarik kesimpulan dari kumpulan data untuk mendeskripsikan struktur tersembunyi dari
5.00 data yang tidak berlabel.
Select one:
a. Reinfocement Learning
b. Supervised Learning
d. Unsupervised Learning
Question 3 Jika variabel keluaran adalah berupa kategori misalnya “apel”, “jeruk” termasuk pada machine learning bertipe
Correct
b. Supervised -Regresion
c. Reinfocement
d. Supervised – Classification
Question 4
Correct
Marked out of
5.00
Gambar pada representasi di atas adalah Pola-pola struktur yang ada pada suatu koleksi data (knowledge) dalam bentuk
Select one:
a. Pohon
b. Aturan
c. Tabel
d. Instance
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2888103&cmid=530886 1/5
4/12/2021 1 pesan baru
Question 5 Saat Anda ingin mengungkap pengelompokan yang melekat dalam data, seperti mengelompokkan hewan berdasarkan
Correct beberapa karakteristik / fitur, mis. jumlah kaki maka model pembelajaran yang sesuai
Marked out of
5.00 Select one:
a. Reinfocement Learning
Question 6 Pola-pola struktur yang ada pada suatu koleksi data (knowledge) dapat direpresentasi dalam bentuk if then rules :
Correct
b. Instance
c. Pohon
d. Aturan
Question 7 Model pembelajaran yang menggunakan data berlabel dan tidak berlabel untuk pelatihan.
Correct
b. Unsupervised Learning
c. Supervised Learning
d. Reinfocement Learning
Question 8 Pembelajaran yang bertujuan memprediksi output dengan akurat untuk data baru dan output ti bernilai kontinu (riil),
Correct contoh untuk Prediksi kinerja CPU
Marked out of
5.00 Select one:
a. Klasifikasi
b. Klasterisasi
c. Generalisasi
d. Regressi
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2888103&cmid=530886 2/5
4/12/2021 1 pesan baru
Question 10 Salah satu teknik yang digunakan untuk mengkontrol fenomena over-fitting adalah dengan cara menambah finalti ke
Correct fungsi error.
Marked out of
5.00 Select one:
a. regularization
b. generalization
c. model selection
d. prediction
Question 11 Tujuan pembelajaran unsupervised adalah membagun model yang dapat menemukan komponen / variabel / fitur
Correct tersembunyi pada data pelatihan, yang dapat digunakan untuk hal berikut, kecuali
Marked out of
5.00 Select one:
a. Reduksi dimensi (dimension reduction)
b. Pengklasifikasian (classification)
c. Pengelompokan (clustering)
d. Rekomendasi
Question 12
Correct
Marked out of
5.00
Gambar pada representasi di atas adalah Pola-pola struktur yang ada pada suatu koleksi data (knowledge) dalam bentuk
Select one:
a. Aturan
b. Instance
c. Pohon
d. Tabel
Question 13 Model ini belajar dari kumpulan data berlabel dan kemudian digunakan untuk memprediksi peristiwa di masa depan.
Correct
b. Reinfocement Learning
c. Unsupervised Learning
d. Supervised Learning
b. Klasterisasi
c. Regressi
d. Klasifikasi
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2888103&cmid=530886 3/5
4/12/2021 1 pesan baru
Question 15 Yang bukan tujuan supervised learning untuk membangun model yang dapat menghasilkan output yang benar untuk
Correct suatu data input dapat digunakan untuk
Marked out of
5.00 Select one:
a. Pengklasifikasian (classification)
b. Ranking
c. Klasterisasi (clustering)
d. Regresi (regression)
b. Linear Model
Question 17
Correct
Marked out of
5.00
Gambar pada representasi di atas adalah Pola-pola struktur yang ada pada suatu koleksi data (knowledge) dalam bentuk
Select one:
a. Aturan
b. Pohon
c. Tabel
d. Instance
Question 18 Kumpulan data yg sudah dipastikan kebenarannya, dr sisi label, data awal, komponen2 data yg akan dijadikan kunci,
Correct
b. Instance
c. Feature/ atribut
d. Training Set
Question 19 Sebuah proses yg mempersiapkan data sehingga data tsb bisa kita extract cirinya menjadi suatu vektor
Correct
b. Instance
c. Feature Extraction
d. Feature/ atribut
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2888103&cmid=530886 4/5
4/12/2021 1 pesan baru
Question 20 Ciri-ciri dari masing-masing sample data misalnya Smartphone. ciri: memiliki ...
Correct
Marked out of
5.00 Select one:
a. Training Set
b. Feature/ atribut
c. Instance
d. Feature Extraction
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=2888103&cmid=530886 5/5
4/19/2021 Kuis M7 : Unsupervised Learning: Attempt review
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING
/ Pertemuan 7 : Introduction to Machine Learning (Unsupervised) / Kuis M7 : Unsupervised Learning
Question 1 Pengelompokan yang sebagai "pendekatan bottom-up". Di mana titik datanya diisolasi sebagai pengelompokan terpisah
Correct pada awalnya, dan kemudian digabungkan bersama secara iteratif atas dasar kesamaan hingga satu cluster tercapai.
Marked out of
5.00 Select one:
a. Pendekatan Overlapping
b. Pendekatan Aglomeratif
c. Pendekatan Divisive
d. Pendekatan Probabilistic
Question 2 Teknik yang digunakan ketika jumlah fitur, atau dimensi, dalam kumpulan data tertentu terlalu tinggi. Teknik ini
Correct mengurangi jumlah input data ke ukuran yang dapat dikelola sambil juga menjaga integritas set data sebanyak mungkin,
Marked out of biasanya digunakan dalam tahap data praproses
5.00
Select one:
a. Dimensionality reduction
b. Association
c. clustering
d. Regression
Question 3 Algoritme yang menggunakan pohon hash untuk menghitung kumpulan item, menavigasi kumpulan data dengan cara
Incorrect yang pertama. Algoritma ini telah dipopulerkan melalui analisis keranjang pasar, yang mengarah ke mesin rekomendasi
Marked out of yang berbeda untuk platform musik dan pengecer online.Misalnya, jika saya memutar radio Black Sabbath di Spotify,
5.00 dimulai dengan lagu mereka "Anggrek", salah satu lagu lain di saluran ini kemungkinan besar adalah lagu Led Zeppelin,
seperti "Over the Hills dan Far Away." Ini didasarkan pada kebiasaan mendengarkan saya sebelumnya serta kebiasaan
orang lain.
Select one:
a. Eclat
b. Apriori
c. Apriori
d. FP-Growth
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3027952&cmid=549345 1/5
4/19/2021 Kuis M7 : Unsupervised Learning: Attempt review
Question 4 Algoritme yang menggunakan pohon hash untuk menghitung kumpulan item, menavigasi kumpulan data dengan cara
Correct yang pertama. Algoritma ini telah dipopulerkan melalui analisis keranjang pasar, yang mengarah ke mesin rekomendasi
Marked out of yang berbeda untuk platform musik dan pengecer online.Misalnya, jika saya memutar radio Black Sabbath di Spotify,
5.00 dimulai dengan lagu mereka "Anggrek", salah satu lagu lain di saluran ini kemungkinan besar adalah lagu Led Zeppelin,
seperti "Over the Hills dan Far Away." Ini didasarkan pada kebiasaan mendengarkan saya sebelumnya serta kebiasaan
orang lain. Ini termasuk task
Select one:
a. Dimensionality reduction
b. Regression
c. clustering
d. Association
Question 5 Algoritme yang berusaha menemukan pola tersembunyi atau pengelompokan data tanpa perlu campur tangan manusia.
Correct
b. Deep Learning
c. Unsupervised Learning
Question 6 Metode berbasis aturan untuk menemukan hubungan antara variabel dalam kumpulan data tertentu. Metode ini sering
Correct digunakan untuk analisis keranjang pasar, memungkinkan perusahaan untuk lebih memahami hubungan antara produk
Marked out of yang berbeda. Memahami kebiasaan konsumsi pelanggan memungkinkan bisnis untuk mengembangkan strategi
5.00 penjualan silang dan mesin rekomendasi yang lebih baik.
Select one:
a. Association
b. clustering
c. Regression
d. Dimensionality reduction
Question 7 Jenis algoritme pengurangan dimensi yang digunakan untuk mengurangi redundansi dan mengompresi kumpulan data
Correct melalui ekstraksi fitur. Metode ini menggunakan transformasi linier untuk membuat representasi data baru, menghasilkan
Marked out of sekumpulan "komponen utama". Komponen utama pertama adalah arah yang memaksimalkan varians dari dataset.
5.00 Sementara komponen utama kedua juga menemukan varians maksimum dalam data, itu sama sekali tidak berkorelasi
dengan komponen utama pertama, menghasilkan arah yang tegak lurus, atau ortogonal, ke komponen pertama. Proses
ini berulang berdasarkan jumlah dimensi, dimana komponen utama berikutnya adalah arah ortogonal ke komponen
sebelumnya dengan varians terbanyak.
Select one:
a. Singular value decomposition
b. FP-Growth
c. Autoencoders
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3027952&cmid=549345 2/5
4/19/2021 Kuis M7 : Unsupervised Learning: Attempt review
Question 8 Pendekatan reduksi dimensi lain yang memfaktorkan matriks, A, menjadi tiga matriks peringkat rendah. SVD
Correct dilambangkan dengan rumus, A = USVT, di mana U dan V adalah matriks ortogonal. S adalah matriks diagonal, dan nilai S
Marked out of dianggap sebagai nilai tunggal matriks A. Principal component analysis
5.00
Select one:
a. Singular value decomposition
b. FP-Growth
c. Autoencoders
Question 9 Pengelompokan yang mengambil pendekatan "top-down". Dalam hal ini, satu cluster data dibagi berdasarkan perbedaan
Correct antara titik data. Pengelompokan dengan cara ini tidak umum digunakan, tetapi masih perlu diperhatikan dalam konteks
Marked out of pengelompokan hierarkis. Proses pengelompokan ini biasanya divisualisasikan menggunakan dendrogram, diagram mirip
5.00 pohon yang mendokumentasikan penggabungan atau pemisahan titik data pada setiap iterasi.
Select one:
a. Pendekatan Aglomeratif
b. Pendekatan Probabilistic
c. Pendekatan Overlapping
d. Pendekatan Divisive
Question 10 Algoritma yang paling banyak digunakan untuk task Association rules
Correct
b. Apriori
c. Apriori
d. Eclat
Question 11 Salah satu bentuk pengelompokan yang memungkinkan titik data menjadi bagian dari beberapa kluster dengan derajat
Correct keanggotaan terpisah. Ini disebut juga Pengelompokan "lembut" atau fuzzy k-means
Marked out of
5.00 Select one:
a. Memecah belah (Divisive)
d. Hierarkis ( hierarchical)
b. Dimensionality reduction
c. Regression
d. clustering
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3027952&cmid=549345 3/5
4/19/2021 Kuis M7 : Unsupervised Learning: Attempt review
Question 13 Salah satu bentuk pengelompokan yang menetapkan bahwa suatu titik data hanya dapat ada dalam satu cluster. Ini juga
Correct bisa disebut sebagai pengelompokan "keras". Algoritma yang digunakan salah satunya adalah K-means clustering
Marked out of
5.00 Select one:
a. Memecah belah (Divisive)
c. Hierarkis ( hierarchical)
b. Mempelajari bagaimana cara kerja pembelajaran tanpa pengawasan dan dengan pengawasan
Question 15 Teknik tanpa pengawasan yang membantu menyelesaikan estimasi kepadatan atau masalah pengelompokan "lunak".
Correct Dalam hal ini, titik data dikelompokkan berdasarkan kemungkinannya termasuk dalam distribusi tertentu. Teknik yang
Marked out of paling umum digunakan adalah Gaussian Mixture Model (GMM)
5.00
Select one:
a. Pendekatan Probabilistic
b. Pendekatan Aglomeratif
c. Pendekatan Overlapping
d. Pendekatan Divisive
Question 16 Pembelajaran mesin tanpa pengawasan, menggunakan algoritme pembelajaran mesin untuk menganalisis dan
Correct mengelompokkan set data tak berlabel
Marked out of
5.00 Select one:
a. Supervised Learning
b. Deep Learning
c. Unsupervised Learning
Question 17 Kemampuannya untuk menemukan persamaan dan perbedaan informasi menjadikannya unsupervised learning sebagai
Correct solusi ideal tugas tugas di bawah ini, kecuali
Marked out of
5.00 Select one:
a. strategi penjualan silang
d. Segmentasi pelanggan
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3027952&cmid=549345 4/5
4/19/2021 Kuis M7 : Unsupervised Learning: Attempt review
c. Hierarkis ( hierarchical)
d. Auto Encoder
Question 19 Teknik yang mengelompokkan data yang tidak berlabel berdasarkan persamaan atau perbedaannya. Algoritma ini
Correct digunakan untuk memproses objek data mentah dan tidak terklasifikasi menjadi grup yang diwakili oleh struktur atau
Marked out of pola dalam informasi.
5.00
Select one:
a. Clustering
b. Dimensionality reduction
c. Regression
d. Association
Question 20 Teknik yang memanfaatkan jaringan neural untuk mengompresi data dan kemudian membuat ulang representasi baru
Correct dari input data asli. Terdapat lapisan tersembunyi secara khusus bertindak sebagai penghambat untuk memampatkan
Marked out of lapisan masukan sebelum merekonstruksi di dalam lapisan keluaran.
5.00
Select one:
a. Singular value decomposition
c. Autoencoders
d. FP-Growth
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3027952&cmid=549345 5/5
4/26/2021 Kuis M8 : Reinforcement: Attempt review
Dashboard / My courses / ATA 2020/2021 | 2-FIKTI | Komputasi Big Data | TEAM TEACHING
/ Pertemuan 8 : Introduction to Machine Learning (Reinforcement) / Kuis M8 : Reinforcement
Question 1 Reinforcement learning tepat digunakan untuk menyelesaikan permasalahan utama dalam:
Correct
b. Permainan catur
c. Peramalan cuaca
d. Pengenalan objek
Question 2 Berikut ini merupakan contoh permasalahan yang dapat diselesaikan dengan reinforcement learning:
Correct
b. Self-driving car
c. Semua benar
d. Bermain Game
Question 3 Markov Decision Process dapat didefinisikan kedalam n-tuple, dimana bernilai:
Correct
b. 3
c. 6
d. 5
Question 4 Efek dari suatu aksi yang dipilih dari suatu state yang bergantung hanya pada state tersebut saja bukan pada state-state
Correct sebelumnya dikenal sebagai sifat:
Marked out of
5.00 Select one:
a. Markov
b. Bellman
c. Transisi
d. Stokastik
1
Online
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3172841&cmid=564465 1/4
4/26/2021 Kuis M8 : Reinforcement: Attempt review
c. Input yang diterima oleh agen berupa state, action dan reward
b. Reward
c. Model
d. Action
Question 7 Fungsi reward dalam Markov Decision Process dapat bernilai bilangan:
Correct
b. Riil
c. Bulat
d. Asli
Question 8 Sifat Markov dalam Markov Decision Process diperlukan langsung dalam menentukan:
Correct
b. Supervised learning
c. Semua benar
d. Navigasi robot
Question 10 Pemilihan suatu aksi pada suatu state tertentu didalam Markov Decision Process ditentukan oleh:
Correct
b. Reward
c. Value
d. Policy
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3172841&cmid=564465 2/4
4/26/2021 Kuis M8 : Reinforcement: Attempt review
Question 11 Berikut ini merupakan pernyataan yang salah terkait Markov Decision Process:
Correct
c. Semua benar
d. Machine learning
b. State-Action-Reward-State-Action (SARSA)
d. Q-learning
Question 14 Efek dari suatu pilihan aksi pada suatu state ditentukan oleh:
Correct
b. Model transisi
c. Policy
d. Fungsi reward
Question 15 Reward dalam permasalahan shortest path yang dimodelkan dengan Markov Decision Process ditandai dengan:
Correct
d. Semua salah
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3172841&cmid=564465 3/4
4/26/2021 Kuis M8 : Reinforcement: Attempt review
Question 17 Berikut ini merupakan pernyataan yang kurang tepat terkait reinforcement learning (RL):
Correct
b. RL yang diselesaikan dengan Markov Decision Process memerlukan data latih dalam menentukan probabilitas
transisinya
c. RL dapat digunakan dalam menciptakan sistem pelatihan untuk siswa yang bersifat kustom
Question 18 Pada Markov Decision Process, pemilihan ruas jalan dalam permasalahan shortest path merupakan bagian dari:
Correct
b. Reward
c. State
d. Action
Question 19 Dalam memilih aksi pada suatu state perlu diperhatikan hal-hal berikut ini:
Correct
c. Semua benar
Question 20 Sekumpulan token yang mewakili setiap kemungkinan keadaan dari agen disebut sebagai:
Correct
b. Action
c. Semua salah
d. Reward
https://v-class.gunadarma.ac.id/mod/quiz/review.php?attempt=3172841&cmid=564465 4/4
M10 Team Teaching
1. Salah satu library data science yang digunakan untuk pemrosesan sinyal, gambar, dan rumus
statistik adalah.. Semua Benar
2. Beragamnya jenis data di dalam Big Data yang meliputi data terstruktur, semi terstruktur
dan tidak terstruktur, merupakan dimensi Big Data dalam hal: Variety
3. Pilihan yang dapat menciptakan hasil yang paling optimal merupakan pendekatan analitik
dari.. Preskriptif
4. Sumber data yang digunakan dalam aplikasi Big Data dapat berupa: Semua Benar
5. Keuntungan menggunakan Mobile Positioning data (MPD) adalah… Semua Benar
6. Metode untuk memprediksi kelas instance dari instance yang diberi label sebelumnya…
Klasifikasi
7. Visualisasi pada hasil analisis Big Data dapat disajikan dalam bentuk.. Semua Benar
8. Data yang dikumpulkan secara aktif dari sensor, misalnya melalui penginderaan jauh dan
gambar satelit merupakan sumber big data dalam hal…. Sensing data
9. Contoh solusi Big Data, kecuali: Semua Benar
10. Contoh Aplikasi Machine Learning dan Analitik Prediktif: Semua Benar
11. Semakin banyak data hingga dapat melebihi terabyte merupakan penjelasan dari dimensi
Big Data dalam hal: Volume
12. Karakteristik Big Data yang cepat sekali berubah baik dari sisi variabel maupun tipe data
dinamakan… Velocity
13. Data Warehouse dibuat dengan menerapkan serangkaian langkah pemrosesan terhadap
data yang berasal dari beberapa basis data. Berikut ini adalah yang termasuk dalam
pemrosesan data tersebut: Semua Benar
14. Manakah yang benar dari pernyataan berikut ini: Deskriptif, perkiraan berdasarkan data
yang tersedia
15. Data Mobile Positioning data (MPD) berupa… Semua Benar
16. Dataset dibentuk dari: Sekumpulan fitur yang memiliki objek yang sama
17. Tools Bahasa Pemograman yang dapat digunakan dalam ilmu data science adalah… Semua
Benar
18. Social Media termasuk dalam sumber data..Digital Content
19. Cara yang dapat dilakukan untuk meningkatkan analisis bigdata genome bioinformatics
adalah.. Semua Benar
20. Proses menganalisis tulisan untuk menentukan nada emosional penulisnya merupakan salah
satu implementasi machine learning dalam… Principal Component Analysis
Team Teaching Big Data M9
1. Berikut ini adalah efek dari mengecilnya nilai stride dalam Algoritma Convolutional Neural Network
2. Hasil dari proses flatten pada Algoritma Convolutional Neural Network menjadi masukan dalam
Fully-connected layer
4. Berikut ini merupakan loss function dalam algoritma berbasis Neural Network
Cross entropy
6. Berikut ini adalah teknik yang dapat digunakan pada pooling layer dalam Algoritma Convolutional
Neural Network
Hidden layer
8. Sebuah citra berdimensi 5x5 dengan filter 3x3 dan stride sebesar 2 akan menghasilkan feature map
berdimensi
4x4
Hidden layer
10. Berikut ini merupakan fungsi aktivasi dalam Algoritma Convolutional Neural Network
11. Tahapan feature extraction pada Algoritma Convolutional Neural Network terdiri dari beberapa
lapisan (layer) berikut ini, kecuali
Fully-connected layer
12. Untuk memperbanyak feature yang berhasil diekstrak dalam Algoritma Convolutional Neural
Network digunakan
Padding
15. Untuk menyelesaikan permasalahan klasifikasi biner menggunakan algoritma berbasis Neural
Network lebih tepat digunakan fungsi aktivasi
ReLU
16. Salah satu ukuran dari confusion matrix yang dapat digunakan dalam mengukur tingkat keberhasilan
sistem dalam menemukan kembali sebuah informasi adalah
Recall
17. Untuk mencegah terjadinya overfitting dalam Algoritma Convolutional Neural Network dilakukan
Dropout regularization
18. Dimensi dari feature map dalam Algoritma Convolutional Neural Network bergantung pada
Semua benar
Stride
Padding
19. Parameter dalam Algoritma Convolutional Neural Network yang menentukan berapa jumlah
pergeseran filter disebut sebagai
Stride
20. Berikut ini merupakan library Python untuk Algoritma Deep Learning
1. Berikut ini yang bukan merupakan karakteristik dari Apache Spark adalah
2. Berapa banyak Spark Context yang dapat aktif per Java Virtual Machine
Hanya 1
3. Berikut ini yang bukan merupakan fungsi dari Spark Context adalah
6. Berikut ini yang bukan operasi transformasi pada Resilient Distributed Data adalah
Flatmap
2010
8. Berikut ini yang bukan operasi action pada Resilient Distributed Data adalah
Top()
9. Berikut ini adalah pernyataan yang salah mengenai Resilient Distributed Data (RDD), kecuali
Scala
Spark SQL
Spark Core
DataFrame
16. Apache Spark berpotensi … lebih cepat untuk menjalankan program pemrosesan batch didalam
memori jika dibandingkan dengan MapReduce
100 kali
17. Komponen berikut ini yang tidak terdapat diatas Spark Core adalah
18. Spark SQL menerjemahkan perintah kedalam bentuk kode yang diproses oleh
19. Pernyataan berikut ini yang salah mengenai Spark dan Hadoop adalah
Satu
Team Teaching Big Data M12
1. Algoritma untuk menentukan jumlah segitia yang melewati setiap simpul dalam graf
Triangle Count
2. Urutan edge yang memungkinkan Anda berpindah dari vertex A ke vertex B disebut
Path
Page Rank
Visualisasi Grafik
5. Manakah urutan yang benar untuk menjelaskan cara kerja Spark Streaming:
2. Batch input data / RDD tersebut diproses oleh Spark Engine menggunakan operasi RDD.,
3. Hasilnya adalah batch data yang telah diproses didorong keluar ke sistem eksternal,
4. Oleh Spark Streaming data dibagi menjadi kumpulan / batch input data (diperlakukan sebagai RDD).
1-4-2-3
1. Pembuatan grafik,
2. Pengolahan pasca,
4. Analisis
3-1-4-2
Connected Components
Neo4j
Netflix
11. Operasi Jendela membutuhkan parameter
window length
12. Framework yang dapat digunakan untuk memproses data grafik dan menjalankan analisis prediktif
pada data
Spark GraphX
Semua Benar (Film baru yang paling direkomendasikan orang-orang 1 minggu terakhir, Orang-orang
yang sama-sama mensitasi suatu artikel, Teman toni di facebook yang paling banyak pengikutnya)
Semua benar (Graph terdiri dari simpul dan sisi, Semua yang ada di Facebook adalah contoh
penggunaan struktur data graph, Edge menunjukan relasi antar simpul)
17. Yang diperlukan untuk menangani data besar dalam bentuk grafik
Semua benar (Analisis Data Grafikm Visualisasi data grafik, Database grafik)
DStream
Abstraksi memori terdistribusi untuk komputasi dalam memori pada klaster besar yang toleran terhadap
kesalahan
Semua benar (Memproses menggunakan algoritma kompleks dengan fungsi seperti map, reduce, join,
window, Dapat menyerap data dari berbagai sumber, Data yang diproses dapat dikirim ke sistem file,
database, dan live dashboard)
Team Teaching Big Data M13
Langkah ke-1 Salin input data dari CPU memory ke GPU memory
Langkah-2 Muat program GPU dan eksekusi, caching (simpan) data pada chip untuk kinerja
3. Arsitektur CUDA menerapkan pendekatan berupa kumpulan streaming multiprocessors (SM) yang
Mengeksekusi sejumlah instruksi yang sama pada beberapa thread pada berbagai wilayah data,
sehingga dikenal dengan istilah single instruction, multiple threads (SIMT)
Melibatkan banyak unit computer untuk memecahkan masalah yang berbeda-beda untuk masing-
masing unit computer, namun dalam waktu yang sama
5. Tujuan utama dari pemrograman paralel adalah untuk meningkatkan performa komputasi. Performa
dalam pemrograman paralel diukur dari
Berapa banyak peningkatan kecepatan (speed up) yang diperoleh dalam menggunakan tehnik paralel
6. CUDA C++ adalah perluasan C++ sehingga programmer dapat mendefinisikan fungsi C++ yang ketika
dipanggil, akan dieksekusi sebanyak N kali secara paralel dan N CUDA thread yang berbeda. Fungsi ini
dikenal dengan istilah
Kernel
7. Kernel pada pemrograman CUDA agar dieksekusi pada device, dideklarasi menggunakan
__global__
Komputer yang digunakan secara bersamaan dalam melakukan komputasi dilakukan oleh computer-
komputer terpisah yang terhubung dalam suatu jaringan komputer
Satuan pemrosesan sekuensial yang dikumpulkan dalam satu grup yang disebut sebagai thread block
11. Dua kata istilah penting yang digunakan dalam CUDA, yaitu: host dan device. Istilah host pada CUDA
mengacu pada
CPU
12. Dua kata istilah penting yang digunakan dalam CUDA, yaitu: host dan device. Istilah device pada
CUDA mengacu
GPU
Beberapa block dihimpun dalam satu thread, yang kemudian beberapa thread dihimpun dalam satu
kesatuan grid
16. CUDA adalah platform komputasi paralel dengan arsitektur komputasi masuk dalam
CUDA adalah suatu platform untuk komputasi paralel, dan memanfaatkan GPU untuk komputasi
20. Perintah kernel < <N, M> >(…) menunjukkan device untuk
Semua benar
Dapat diinterpretasikan
5. Banyaknya operasi-operasi kecil yang berulang merupakan salah satu penyebab bahasa pemrograman
Python
Tergolong lambat
7. Elemen dalam RDD dikelompokkan kedalam beberapa partisi dan hanya dapat disimpan pada sebuah
node yang berbeda merupakan konsep RDD dalam hal
Distributed
Semua jawaban benar (Penyalinan data dari dan ke host jika diperlukan, Alokasi data dari dan ke host
jika diperlukan)
Semua salah
14. Berikut ini adalah komputasi primitive yang tersedia pada Spark untuk melakukan parelelisme dan
meminimumkan komunikasi antar workers
Open-source
16. Modul kompilasi tepat waktu pada Python untuk GPU adalah
17. API Spark memiliki dukungan yang terbatas pada bahasa pemrograman
18. Permasalahan alokasi memori dalam komputasi pada GPU terdapat pada tugas yang berskala
Kecil
Question 1 Proses di mana data mentah dikumpulkan dan diekspresikan dalam bentuk ringkasan untuk analisis statistik.
Correct
b. Data Extraction
d. Data Identification
b. Di dalamnya tersimpan data nasabah serta semua transaksi sejak nasabah membuka rekening di bank sampai
menutupnya.
Question 3 Proses memilih dan mengambil data dari satu atau beberapa sumber:
Correct
b. Data Identification
d. Data Extraction
d. Semua salah
Question 5 Perbedaan Data Tradisional dan Big Data pada komponen Data Model:
Correct
c. Centralized vs Distributed
d. Semua benar
b. Kafka
c. Hadoop
d. Tableau
Question 7 Aplikasi Core Banking System untuk memfasilitasi nasabah agar dapat melakukan transaksi sendiri:
Correct
b. Busines Case Evaluation - Data Identification - Data Acquisition & Filtering - Data Extraction - Data Validation
& Cleansing - Data Aggregation & Representation - Data Analysis - Utilization of Analysis Results
c. Busines Case Evaluation - Data Identification - Data Acquisition & Filtering - Data Extraction - Data Validation
& Cleansing - Data Aggregation & Representation - Data Analysis - Data Visualization - Utilization of
Analysis Results
d. Business Case Evaluation - Data Identification - Data Extraction - Data Validation & Cleansing - Data
Aggregation & Representation - Data Analysis - Data Visualization - Utilization of Analysis Results
b. Komunikasi
c. Semua benar
d. Media
Question 10 Tipe data dalam Big Data:
Correct
c. Unstructured data
d. Data terstruktur
Question 11 Perbedaan Data Tradisional dan Big Data pada komponen Arsitektur:
Correct
c. Semua benar
d. Centralized vs Distributed
d. Kesamaan data
b. Mendorong inklusivitas
d. Menanalisis resiko
Question 14 Pencarian informasi terkait tipe data, struktur data, bentuk data, dan isi serta sumber data:
Correct
b. Data Identification
d. Data Extraction
b. Semua benar
b. Facebook
c. Kafka
d. Hadoop
b. Data Identification
c. Data Extraction
Question 19 Perbedaan Data Tradisional dan Big Data pada komponen Data relationship:
Correct
c. Semua benar
b. MS SQL Server
c. MySQL Server
d. IBM AS-400
◄ Materi M12: Penerapan Big Data di Kuis M12: Penerapan Big Data di Sektor
Jump to...
Sektor Perbankan Perbankan (Kelas Malam) ►
Started on Monday, 20 June 2022, 11:42 AM
State Finished
Completed on Monday, 20 June 2022, 12:00 PM
Time taken 17 mins 27 secs
Question 1
Correct
Marked out of 5.00
Flag question
Question text
Pengelompokan yang mengambil pendekatan "top-down". Dalam hal ini, satu cluster data
dibagi berdasarkan perbedaan antara titik data. Pengelompokan dengan cara ini tidak
umum digunakan, tetapi masih perlu diperhatikan dalam konteks pengelompokan hierarkis.
Proses pengelompokan ini biasanya divisualisasikan menggunakan dendrogram, diagram
mirip pohon yang mendokumentasikan penggabungan atau pemisahan titik data pada
setiap iterasi.
Select one:
a. Pendekatan Probabilistic
b. Pendekatan Aglomeratif
c. Pendekatan Divisive
d. Pendekatan Overlapping
Question 2
Correct
Marked out of 5.00
Flag question
Question text
Question 3
Incorrect
Marked out of 5.00
Flag question
Question text
Algoritme yang menggunakan pohon hash untuk menghitung kumpulan item, menavigasi
kumpulan data dengan cara yang pertama. Algoritma ini telah dipopulerkan melalui analisis
keranjang pasar, yang mengarah ke mesin rekomendasi yang berbeda untuk platform musik
dan pengecer online.Misalnya, jika saya memutar radio Black Sabbath di Spotify, dimulai
dengan lagu mereka "Anggrek", salah satu lagu lain di saluran ini kemungkinan besar
adalah lagu Led Zeppelin, seperti "Over the Hills dan Far Away." Ini didasarkan pada
kebiasaan mendengarkan saya sebelumnya serta kebiasaan orang lain.
Select one:
a. Eclat
b. FP-Growth
c. Apriori
d. Apriori
Question 4
Correct
Marked out of 5.00
Flag question
Question text
Pendekatan reduksi dimensi lain yang memfaktorkan matriks, A, menjadi tiga matriks
peringkat rendah. SVD dilambangkan dengan rumus, A = USVT, di mana U dan V adalah
matriks ortogonal. S adalah matriks diagonal, dan nilai S dianggap sebagai nilai tunggal
matriks A. Principal component analysis
Select one:
a. FP-Growth
b. Autoencoders
c. Singular value decomposition
Question 5
Correct
Marked out of 5.00
Flag question
Question text
Algoritme yang berusaha menemukan pola tersembunyi atau pengelompokan data tanpa
perlu campur tangan manusia.
Select one:
a. Semi Supervised Learning
b. Deep Learning
c. Supervised Learning
d. Unsupervised Learning
Question 6
Correct
Marked out of 5.00
Flag question
Question text
Select one:
a. Pendekatan Divisive
b. Pendekatan Probabilistic
c. Pendekatan Aglomeratif
d. Pendekatan Overlapping
Question 7
Correct
Marked out of 5.00
Flag question
Question text
Metode berbasis aturan untuk menemukan hubungan antara variabel dalam kumpulan data
tertentu. Metode ini sering digunakan untuk analisis keranjang pasar, memungkinkan
perusahaan untuk lebih memahami hubungan antara produk yang berbeda. Memahami
kebiasaan konsumsi pelanggan memungkinkan bisnis untuk mengembangkan strategi
penjualan silang dan mesin rekomendasi yang lebih baik.
Select one:
a. clustering
b. Dimensionality reduction
c. Regression
d. Association
Question 8
Correct
Marked out of 5.00
Flag question
Question text
Jenis algoritme pengurangan dimensi yang digunakan untuk mengurangi redundansi dan
mengompresi kumpulan data melalui ekstraksi fitur. Metode ini menggunakan transformasi
linier untuk membuat representasi data baru, menghasilkan sekumpulan "komponen
utama". Komponen utama pertama adalah arah yang memaksimalkan varians dari dataset.
Sementara komponen utama kedua juga menemukan varians maksimum dalam data, itu
sama sekali tidak berkorelasi dengan komponen utama pertama, menghasilkan arah yang
tegak lurus, atau ortogonal, ke komponen pertama. Proses ini berulang berdasarkan jumlah
dimensi, dimana komponen utama berikutnya adalah arah ortogonal ke komponen
sebelumnya dengan varians terbanyak.
Select one:
a. Principal component analysis
b. FP-Growth
c. Singular value decomposition
d. Autoencoders
Question 9
Correct
Marked out of 5.00
Flag question
Question text
Select one:
a. Deep Learning
b. Semi Supervised Learning
c. Supervised Learning
d. Unsupervised Learning
Question 10
Correct
Marked out of 5.00
Flag question
Question text
Teknik yang mengelompokkan data yang tidak berlabel berdasarkan persamaan atau
perbedaannya. Algoritma ini digunakan untuk memproses objek data mentah dan tidak
terklasifikasi menjadi grup yang diwakili oleh struktur atau pola dalam informasi.
Select one:
a. Association
b. Clustering
c. Regression
d. Dimensionality reduction
Question 11
Correct
Marked out of 5.00
Flag question
Question text
Salah satu bentuk pengelompokan yang memungkinkan titik data menjadi bagian dari
beberapa kluster dengan derajat keanggotaan terpisah. Ini disebut juga Pengelompokan
"lembut" atau fuzzy k-means
Select one:
a. Tumpang tindih (overlapping)
b. Clustering Eksklusif (specifically exclusive)
c. Memecah belah (Divisive)
d. Hierarkis ( hierarchical)
Question 12
Correct
Marked out of 5.00
Flag question
Question text
Algoritme yang menggunakan pohon hash untuk menghitung kumpulan item, menavigasi
kumpulan data dengan cara yang pertama. Algoritma ini telah dipopulerkan melalui analisis
keranjang pasar, yang mengarah ke mesin rekomendasi yang berbeda untuk platform musik
dan pengecer online.Misalnya, jika saya memutar radio Black Sabbath di Spotify, dimulai
dengan lagu mereka "Anggrek", salah satu lagu lain di saluran ini kemungkinan besar
adalah lagu Led Zeppelin, seperti "Over the Hills dan Far Away." Ini didasarkan pada
kebiasaan mendengarkan saya sebelumnya serta kebiasaan orang lain. Ini termasuk task
Select one:
a. Regression
b. clustering
c. Dimensionality reduction
d. Association
Question 13
Correct
Marked out of 5.00
Flag question
Question text
Teknik tanpa pengawasan yang membantu menyelesaikan estimasi kepadatan atau masalah
pengelompokan "lunak". Dalam hal ini, titik data dikelompokkan berdasarkan
kemungkinannya termasuk dalam distribusi tertentu. Teknik yang paling umum digunakan
adalah Gaussian Mixture Model (GMM)
Select one:
a. Pendekatan Overlapping
b. Pendekatan Probabilistic
c. Pendekatan Aglomeratif
d. Pendekatan Divisive
Question 14
Correct
Marked out of 5.00
Flag question
Question text
Teknik yang digunakan ketika jumlah fitur, atau dimensi, dalam kumpulan data tertentu
terlalu tinggi. Teknik ini mengurangi jumlah input data ke ukuran yang dapat dikelola sambil
juga menjaga integritas set data sebanyak mungkin, biasanya digunakan dalam tahap data
praproses
Select one:
a. Regression
b. clustering
c. Association
d. Dimensionality reduction
Question 15
Correct
Marked out of 5.00
Flag question
Question text
Question 16
Correct
Marked out of 5.00
Flag question
Question text
Select one:
a. Hierarkis ( hierarchical)
b. Clustering ekslusif (specifically exclusive)
c. Tumpang tindih (overlapping)
d. Auto Encoder
Question 17
Correct
Marked out of 5.00
Flag question
Question text
Salah satu bentuk pengelompokan yang menetapkan bahwa suatu titik data hanya dapat
ada dalam satu cluster. Ini juga bisa disebut sebagai pengelompokan "keras". Algoritma
yang digunakan salah satunya adalah K-means clustering
Select one:
a. Memecah belah (Divisive)
b. Tumpang tindih (overlapping)
c. Hierarkis ( hierarchical)
d. Clustering Eksklusif (specifically exclusive)
Question 18
Correct
Marked out of 5.00
Flag question
Question text
Teknik yang memanfaatkan jaringan neural untuk mengompresi data dan kemudian
membuat ulang representasi baru dari input data asli. Terdapat lapisan tersembunyi secara
khusus bertindak sebagai penghambat untuk memampatkan lapisan masukan sebelum
merekonstruksi di dalam lapisan keluaran.
Select one:
a. FP-Growth
b. Singular value decomposition
c. Principal component analysis
d. Autoencoders
Question 19
Correct
Marked out of 5.00
Flag question
Question text
Question 20
Correct
Marked out of 5.00
Flag question
Question text
Select one:
a. Dimensionality reduction
b. Association
c. clustering
d. Regression
M1
1. Jenis database NoSQL apa yang membuat dan menjalankan aplikasi yang berjalan
dengan dataset yang selalu terhubung menjadi lebih mudah dan sering digunakan untuk
jaringan media sosial
Grafik.
2. Property big data yang penting, salah satunya adalah falaut tolerance, yaitu
Kemampuan untuk terus beroperasi walaupun terjadi kegagalan pada beberapa
komponen.
3. Pernyataan yang benar mengenai MapReduce adalah
Memperoses data besar secara parallel dalam cluster commodity hardware,
implementaasi dari framework pemerosesan batch, membagi masalah besar
menjadi masalah kecil yang dapat diselesaikan dengan cepat.
4. Terdapat 2 teknologi penyimpanan big data, yaitu
On disk storage devices dan in memory storage devices.
5. Berikut ini yang bukan merupakan Hadoop operation mode adalah
Globally distributed mode.
6. Sistem penyimpanan data cluster adalah
Kumpulan server atau node digabungkan secara erat dengan spesifikasi
perangkat keras yang sama. Serta terhubung melalui jaringan dan bekerja
sebagai salah satu kesatuan.
7. Hadoop adalah platform pemrosesan big data yaitu data yang mempunyai karakteristik
kecuali
Jumlah fitur yang tertentu.
8. Hadoop adalah framework yang
Melibatkan satu atau lebih cluster computer, memungkinkan pemerosesa secara
terdistribusi terhadap data yang berukuran besar, menerapakan programming
model yang sederhana.
9. Database NoSQL menggunakan beragam model data untuk mengakses dan mengelola
data. Jenis database ini dioptimalkan secara khusus untuk aplikasi yang memerlukan…,
yang dicapai dengan mengurangi pembatasan kositensi data dari database lainnya
Volume data besar, latensi rendah dan model data fleksibel.
10. Komponen layanan inti Hadoop
MapReduce, HDFS dan YARN.
11. Property big data yang penting salah satunya adalah aviability, yaitu
Ketersediaan layanan secara terus menerus.
12. Berikut yang dimaksud dengan menganalisa data dalam konteks big data adalah
Descriptive analytics, diagnostic analytics, predictive analytics dan prescriptive
analytics.
13. Type data berikut yang dapat ditangani oleh Hadoop adalah
Tidak terstruktur, semi-terstruktur, terstruktur.
14. Property big data yang penting salah satunya adalah scalability yaitu
Kemampuan menangani penambahan beban yang diberikan tanpa penurunan
kinerja.
15. Property big data yang penting, salah satunya adalah reliability yaitu
Handal
16. Pemerosesan data terdistribusi adalah pemerosesan
Yang menerapakan divide and conquer dalam fisik terpisah, namun terhubung
bersama dalam satu cluster.
17. Hadoop adalah framework yang bekerja bersama tools lain yang beragam. Kelompok
yang umum bekerja bersama Hadoop adalah
MapReduce, MySQL and google apps.
18. YARN singkatan dari
Yet Another Resource Negotiator.
19. Bagian pekerjaan utama MapReduce adalah
Map dan reduce.
20. NoSQL database adalah singkatan dari
Not-only structured query language database.
M4
M5
21. Pernyataan yang tepat terkait data mining and knowledge discovery,
Mengintegrasikan teori dan heuristik
22. Regression, Decision Trees, Bayesian, Neural Networks, Naive Bayes Rules, Support
Vector machines, genetic algorithms adalah pendekatan yang digunakan untuk,
Klasifikasi
23. Metode untuk mempresentasikan hasil yang ditemukan dengan cara yang “bagus” secara
visual,
Visualisasi
24. Karakteristik Big data yang terus bertambah dengan cepat secara real-time dinamakan,
Volume
25. Attributes yang berisi informasi serperti item_ID, name, brand, category, supplier,
place_made and price, merupakan salah satu contoh jenis database,
Penjualan
26. Fungsi dari data mining adalah salah satunya dapat mengetahui pola yang sering ( atau
kumpulan item yang sering) misalnya item apa yang sering dibeli bersama di Walmart
anda, ini dikenal dengan istilah,
Asosiasi dan Analisis Korelasi
27. Pernyataan yang tepat terkait data minig and knowledge discovery,
Fokus pada seluruh proses penemuan pengetahuan
28. Metode untuk memprediksi kelas instace dari instance yang diberi label sebelumnya,
Klasifikasi
29. Pernyataan yang kurang sesuai dengan metode peringkasan,
Mengelompokan data takberlabel
30. Yang bukan metode clusterisasi,
Decision Tree
31. Untuk menghindari set pengujian yang tumpang tindih, data dibagi menjadi k himpunan
bagian dengan ukuran yang sama kemudian setiap subset secara bergantian digunakan
untuk pengujian dan sisanya untuk pelatihan,
K-fold cross-validation
32. Jenis tugas data mining yang melakukan prediksi kelas,
Klasifikasi
33. Jenis tugas data mining yang memfasilitasi penerimaan / penelusuran informasi bagi
pengguna,
Visualisasi
34. Melihat suatu objek data yang tidak sesuai dengan prilaku umum data, sering digunakan
dalam deteksi penipuan atau analisis kejadian langka,
Analisis Outlier
35. Urutan langkah melakukan klasifikasi,
Pisahkan data menjadi set pelatihan dan pengujian, buat model pada set pelatihan,
evaluasi pada set pengujian
36. Metode untuk mengelompokan secara “alami” dari instance yang diberi data tanpa tabel,
Klasterisasi
37. Proses pencarian konten baru dan konten yang perlu diperbaharui dengan megiriman
crawler keseluruh konten yang ditemukan dari tautan halaman merupakan salah satu
konsep data mining pada searcch engine yang dinamakan
Crawl
38. Metode klasifikasi pada fungsi data mining yang menggunkan nilai estimasi dari
probabilits bersyarat dinamakan metode,
Naive Bayessian
39. Seberapa mudah data dapat dipahami merupakan kualitas data dari,
Interpretabillity
40. Acuan yang tidak tepat ketika melakukan pengaturan parameter,
Data pengujian harus digunakan untuk penyetelan parameter
M6
41. Model pembelajaran yang mempelajari bagaimana sistem dapat menyimpulkan suatu
fungsi untuk mendeskripsikan struktur tersembunyi dari data yang tidak berlabel. Sistem
ini tidak memprediksi keluaran yang benar, tetapi mengeksplorasi data dan dapat menarik
ksimpulan dari kumpulan data untuk mendeskripsikan struktur tersembunyi dari data yang
tidak berlabel,
Unsupervised learning
42. Saat anda ingin mengungkap pengelompokan yang melekat dalam data seperti
mengelompokan hewan berdasarkan beberapa karakteristik/fitur mis jumlah kaki maka
model pembelajaran yang sesuai,
Unsupervised learning-clustering
43. Tahapan yang tepat ketika melakukan training,
Image features-training with labeled data –learned model
44. Gambar pada representasi diatas adala pola-pola struktur yang ada pada suatu koleksi data
(knowledge) dalam bentuk,
Pohon
45. Yang tidak digunakan pada Model Supervised learning,
Latent Simantic analysis
46. Model pembelajaran yang menggunakan data berlabel dan tidak berlabel untuk pelatihan,
Semi suprvised learning
47. Tahapan yang tepat ketika melakukan testing,
Image feature – learned model – prediction
48. Pola-pola struktur yang ada pada suatu koleksi data (knowledge) dapat direpresentasi
dalam bentuk if then rules,
Aturan
49. Yang bukan tujuan supervised learning untuk membangun model yang dapat
menghasilkan output yang benar untuk suatu data input dapat digunakan untuk,
Klaterisasi (Clustering)
50. Gambar pada representasi diatas adala pola-pola struktur yang ada pada suatu koleksi data
(knowledge) dalam bentuk,
Aturan
51. Jika variabel keluaran adalah berupa kategori misalnya apel jeruk termasuk pada machine
learning betipe,
Supervised – classification
52. Kumpulan data yang sudah dipastikan kebenarannya dari sis label, data awal, komponen2
data yang akan dijadikan kunci,
Training set
53. Model ini belajar dar kumpulan data berlabel dan kemudian digunakan untuk
memprediksi peristiwa di masa depan,
Supervised learning
54. Ciri – ciri dari masing-masing sample data misalnya smartphone, ciri memiliki,
Feature/ atribute
55. Salah satu teknik digunakan untuk mengkontrol fenomena over-fitting adalah dengan cara
menambah pinalti ke fungsi error
Regularization
56. Gambar pada representasi diatas adala pola-pola struktur yang ada pada suatu koleksi data
(knowledge) dalam bentuk,
Tabel
57. Sebuah proses yang mempersiapkan data sehingga data tersebut bisa kita extract menjadi
satu vektor,
Feature Extraction
58. Pembelajaran yang bertujuan memprediksi output dengan akurat untuk data baru dan
output ti bernilai kontinu rill, contoh untuk prediksi kerja CPU,
Regresi
59. Pembelajaran yang menghasilkan nilai output ti bernilai diskrit kelas,
Klasifikasi
60. Tujuan pembelajaran unsupervised adalah membangun model yang dapat menemukan
komponen/ variable / fitur tersembunyi pada data pelatihan, yang dapat digunakan untuk
hal berikut, kecuali,
Pengklasifikasian (Clasifcation)
M7
61. Algoritma yang paling banyak digunakan untuk task Association rules,
Apriori
62. Algoritma yang berusaha meemukan pola tersembunyi atau pengelompokan data tanpa
perlu campur tangan manusia,
Unsupervised Learning
63. Pendekatan reduksi dimensi lain yang memfaktorkan matriks A menjadi 3 matriks
perngkat rendah SDV dilambangkan dengan rumus A = USTV,
Autoencoders
64. Pembelajaran mesin tanpa pengawasan menggunakan algoritma pembelajaran mesin
untuk menganalsis dan mengelompokan set data tak berlabel,
Unspervised Learning
65. Yang bukan tugas dari pembelajaran tanpa pengawasan,
Regression
66. Algoritma yang bukan digunakan untuk pengelompokan (clustering),
Auto Encoder
67. Metode berbasis aturan untuk menemukan hubungan antara variabel dalam kumpulan data
tertentu, metode ini sering digunakan untuk nalisisi keranjang pasar, memungkinkan
perusahaan untuk lebih memahami hubungan antara produk yang berbeda,
Association
68. Teknik yang mengelompokan data yang tidak berlabel berdasarkan persamaan atau
perbedaannya. Algoritma ini digunakan untuk memproses objek data mentah dan tidak
terklaifikasi menjadi grup yang diwakili,
Clustering
69. Algoritma yang menggunakan pohon hash untuk menghitung kumpulan item, menavigasi
kumpulan data dengan cara yang pertama. Algorutma ini telah dipopulerkan melalui
analisisi keranjang pasar, yang mengarah ke mesin rekomendasi berbeda .
Apriori
70. Pengelompokan yang sebagai pendekatan bottom up dimana titik datanya diisolasi sebagai
pengelompokan terpisah pada awalnya, dan kemudian digabungkan bersama secara
iteratif atas dasar kesamaan hingga satu cluster tercapai,
Pendekatan Aglomeratif
71. Teknik yang digunakan ketika jumlah fitur, atau dimensi, dalam kumpulan data tertentu
terlalu tinggi. Teknik ini mengurangi jumlah input data ke ukuran yang dapat dikelola
sambil juga menjaga integritas set,
Dimensionality reduction
72. Algoritma yang menggunakan pohon hash untuk menghitung kumpulan item, menavigasi
kumpulan data dengan cara yang pertama. Algorutma ini telah dipopulerkan melalui
analisisi keranjang pasar, yang mengarah ke mesin rekomendasi berbeda, ini termasuk
kedalam task,
Association
73. Kemampuan untuk menemukan persamaan dan perbedaan informasi menjadikan
unsupervised learning sebagai solusi ideal tugas di bawah ini, kecuali.
Klasifikasi buah jeruk dan apel
74. Pendekatan unsupervised learning adalah,
Mempelajari bagaimana cara kerja pembelajaran tanpa pengawasan
75. Pengelompokan yang mengambil pendekatan top down dalam hal ini, satu cluster data
dibagi berdasarkan perbedaan antara titik data. Pengelompokan dengan cara ini tidak
umum digunakan,tetapi masih perlu diperhatikan........pemisahan titik data pada setiap
iterasi,
Pendekatan Divisive
76. Teknik yang memanfaatkan jaringan neural untuk mengompresi data dan kemudian
membuat ulang represetsi baru dari input data asli, terdapat lapisan tersembunyi seacara
khussus bertindak sebagai penghambat......di dalam lapisan keluaran,
Autoencoders
77. Salah satu bentuk pengelompokan yang memungkinkan titik data menjadi bagian dari
beberapa kluster dengan derajat keanggotaan terpisah ini disebut juga pengeompokan
lembut atau fuzzy k means,
Tumpang tindih (overlapping)
78. Salah satu bentuk pengelompokan yang enetapkan bahwa suatu titik data hanya dapat ada
dalam satu cluster. Ini juga bisa disebut sebagai pengelompokan keras . Algoritm yang
digunakan salah satunya adalah k means clustering,
Clustering Eksekutif (Specifically exlusive)
79. Jenis algoritma pengurangan dimensi yang digunakan untuk mrngurangi redundansi dan
mengompresi kumpulan data melalui ekstrasi fitur. Unuk transformasi linier.....arah
ortogonal ke komponen sebelumnya dengan varians terbanyak,
Primcipal component analysis
80. Teknik tanpa pengawasan yang membantu menyelesaikan estimasi kepadatan atau
masalah pengelompokan lunak......teknik yang paling umum digunakan adalah GMM,
Pendekatan Probabilistic
M8
81. Reinforcement learning tepat digunakan untuk menyelesaikan permasalahan utama dalam,
Permainan catur
82. Berikut ini merupakan contoh permasalahan yang dapat diselesaikan dengan
reinforcement learning,
Sistem percakapan, self driving car, bermain game,
83. Markov Decision Process dapat didefinisikan kedalam n tuple, dimana bernilai,
5
84. Efek dari suatu aksi yang dipilih dari suatu state yang bergantung hanya pada state
tersebut saja bukan pada state2 sbelumnya dikenal dengan sifat,
Markov
M9
101. Untuk memperbanyak feature yang berhasil diekstrak dalam alogaritma convolutional
neural network digunakan
Padding
102. Dalam alogaritma convolutional neural network, ReLU seringkali digunakan pada
Hidden layer
103. Berikut ini adalah teknik yang dapat digunakan pada pooling layer dalam alogaritma
convolutional neural network
Max pooling, average pooling, min pooling
104. Untuk menyelesaikan permasalahan klasifikasi biner menggunakan alogaritma berbasis
neural network lebih tepat digunakan fungsi aktivasi
ReLU
105. Sebuah citra berdimensi5x5 dengan filter 3x3 dan stide sebesar 2 akna menghasilkan
feature map berdimensi
4x4
106. Pooling layer pada alogaritma convolutional neural network terdapat pada
Hidden layer
107. Berikut ini merupakan contoh Algoritma Deep Learning,
alogaritma recurrent neural network, Algoritma long short term memory, alogaritma
convolutional neural network
108. Berikut ini adalah efek dari mengecilnya nilai stride dalam alogaritma convolutional
neural network,
Informasi yang diperoleh semakin detail
109. Dimensi dari feature map dalam alogaritma convolutional neural network bergantung
pada,
Padding, stride, dimensi filter dan input
110. Untuk mencegah terjadinya overfitting dalam alogaritma convolutional neural network
dilakukan,
Dropout regulazion
111. Berikut ini merupakan library phyton untuk algoritma deep learning,
Pytorch, keras, tensorflow
112. Pooling layer bertujuan untuk,
Mengurangi dimensi feature map, mempercepat prosess komputasi, mengatasi
overfiting
113. Algoritma deep learning berbasis,
Machine learnng, artificial intelligence, neural network
114. Berikut ini merupakan loss function dalam alogaritma berbasis neural network ,
Cross entropy
115. Parameter dalam alogaritma convolutional neural network yang menentukan berapa
jumlah pergeseran filter disebut sebagai,
Stride
116. Berikut ini merupakan fungsi aktivasi dalam alogaritma convolutional neural network,
Sigmoid, ReLU, tanh
117. Algoritma deep learning dapat menyelesaikan permasalahan berikut ini,
Deteksi objek, natural language processing, pengenalan suara
118. Tahapan feature extraction pada alogaritma convolutional neural network terdiri dari
beberapa lapisan (layer) berikut ini, kecuali,
Fully – connected layer
119. Salah satu ukuran dari confusion matrix yang dapat digunakan dalam mengukur tingkat
keberhasilan sistem dalam mengukur tingkat keberhasilan sistem dalam menemukan
kembali sebuah informasi adalah,
Recall
120. Hasil dari proses flatten pada alogaritma convolutional neural network menjadi masukan
dalam,
Fully – connected layer
1. Semakin banyak data hingga dapat melebihi terabyte merupakan penjelasan dari dimensi
big data dalam hal,
➢ Volume
2. Data Mobile positioning data MPD berupa,
➢ Lokasi, waktu, sumber sinyal
3. Proses menganalisa tulisan untuk menentukan nada emosional penulisnya merupakan
salah satu implementasi machine learning dalam,
➢ Sentiment Analysis
4. Visualisasi pada hasil analisis big data dapat disajikan dalam bentuk,
➢ Plot, Grafik 3D, table
5. Dataset dibentuk dari,
➢ Sekumpulan objek yang memiliki fitur yang sama
6. Contok aplikasi machine learning dan analitik prediktif,
➢ Penetapan harga barang, prediksi cashflow, prediksi harga saham
7. Data wherehouse dibuat dengan menerapkan serangkaian Langkah pemrosesan terhadap
data yang berasal dari beberapa basis data. Berikut ini adalah yang termasuk dalam
pemrosesan data tersebut.
➢ Transformasi data, integrasi data, data preparation
8. Social media termasuk dalam sumber data,
➢ Digital content
9. Keuntungan menggunakan mobile positioning data MDP adalah,
➢ Automatics counting, me-record visitor outsite immigration point, continues
counting
10. Metode untuk memprediksi kelas instance yang diberi label,
➢ Klasifikasi
11. Cara yang dapat dilakukan untuk meningkatkan analisis bigdata gemone bioinformatics
adalah,
➢ Pemanfaatan cloud computing, meningkatkan kecepatan prosesor, penerapan
teknologi GPU
12. Pilihan yang dapat menciptakan hasil yang paling optimal merupakan pendekatan analitik
dari,
➢ Preskriptif
13. Beragamnya jenis data di dalam big data yang meliputi data terstruktur, semi terstruktur
dan tidak terstruktur, merupakan dimensi big data dalam hal,
➢ Variety
14. Manakah yang benar dari pernyataan berikut ini,
➢ Prediktif, memperkirakan kenaikan harga emas
15. Karakteristik big data yang cepat sekali berubah baik dari sisi variable maupun tipe data
dinamakan,
➢ Velocity
16. Contoh solusi big data, kecuali
➢ Deteksi penipuaan, mesin rekomendasi, pendeteksi spam
17. Tools Bahasa pemrograman yang dapat digunakan dalam ilmu data science adalah,
➢ SQL, Python, R
18. Data yang dikumpulkan secara aktif dari sensor, misalnya melalui penginderaan jauh dan
gambar satelit merupakan sumber big data dalam hal,
➢ Sensing data
19. Salah satu library data science yang digunakan untuk pemrosesan sinyal, gambar, dan
rumus statistik, adalah,
➢ Scipy, GPText, OpenNPL
20. Berapa banyak spark context yang dapat aktif per java virtual machine,
➢ Semua salah (hanya 1, Tidak spesifik, lebih dri 1)
21. Berikut ini yang bukan merupakan fungsi dari spark context,
➢ Untuk mengatur konfigurasi
22. Spark dapat menjalankan…tugas pada setiap partisi,
➢ Banyak
23. Toleransi kesalahan pada resillent distributed data RDD dicapai menggunakan,
➢ Direct acyclic graph
24. Berikut ini yang bukan operasi action pada resillent distributed data adalah,
➢ Map
25. Apache spark berpotensi…lebih cepat untuk menjalankan program pemrosesan batch
didalam memori jika dibandingkan dengan Mapreduce,
➢ 100 kali
26. Manajemen memori dalam spark dikerjakan oleh,
➢ Spark core
27. Apache spark pertama kali diluncurkan open source pada tahun,
➢ 2010
28. API Machine Learning yang utama untuk spark saat ini adalah APi berbasis,
➢ Dataframe
29. Komponen berikut ini yang tidak terdapat diatas spark core adalah
➢ Spark RDD
30. Pernyataan berikut ini yang salah mengenai spark dan Hadoop adalah,
➢ Keduanya merupakan mesin komputasi cluster
31. Spark ditulis dalam Bahasa pemrograman,
➢ Scala (R, Python)
32. Berikut ini adalah beberapa manfaat penggunaan spark, kecuali
➢ Otomatis dalam mengoptimalkan kode program
33. Berikut ini yang bukan merupakan karakteristik dari apache spark adalah,
➢ Hanya dapat dijalankan pada hadoop YARN
34. Modul untuk memproses data terstruktur dalam spark adalah,
➢ Spark SQL
35. Berikut ini adalah pernyataan yang salah mengenai resillent distributed data RDD,
kecuali,
➢ RDD dalam apache spark adalah suatu kumpulan objek yang tidak dapat
berubah
36. Spark SQL menerjemahkan perintah kedalam bentuk kode yang diproses oleh,
➢ Executor nodes
37. Berikut ini yang bukan operasi transformasi pada RDD adalah,
➢ Filter
38. Spark lebih cepat dibandingkan dengan mapreduce karena,
➢ Didukung oleh api Bahasa pemrograman yang berbeda-beda
39. Cluster manager yang dapat digunakan pada spark adalah,
➢ Standalone scheduler, YARN, Mesos
40. Algoritma untuk mengukur seberapa pentingnya halaman situs web,
➢ Page rank
41. Fitur spark streaming,
➢ Pemulihan cepat dari kegagalan dan kekeliruan
42. Aliran data yang berkelanjutan dalam spark streaming disebut,
➢ Dstream
43. Alogritma untuk menemukan komponen terhubung dari suatu graf,
➢ Connected components
44. Urutan edge yeng memungkinkan anda berpindah dari vertex A ke vertex B disebut,
➢ Path
45. Yang diperlukan untuk menangani data besar dalam bentuk grafik,
➢ Analisis data grafik, visualisasi data grafik, database grafik
46. Contoh penggunaan spark streaming,
➢ Netflix, deteksi penipuan, uber
47. Manakah urutan yang benar untuk menjelaskan cara kerja spark streaming
1. Input data stream
2. Batch input data
3. Hasilnya adalah batch data yang telah
4. Oleh spark streaming data dibagi menjadi kumpulan
➢ 1-4-2-3
48. Contoh use case penggunaan spark graphx,
➢ Film baru yang paling direkomendasikan orang-orang 1 minggu terakhir,
orang2 mensitasi artikel, teman toni di facebook paling banyak
49. Langkah pipa pemrosesan data grafik
1. Pembuatan grafik
2. Pengolahan pasca
3. Pra pemrosesan data
4. Analisis
➢ 3-1-4-2
50. Pernyataan yang benar tentang apache spark, kecuali,
➢ Abstraksi memori terditribusi untuk komputasi dalam memori pada kluster
51. Contoh data base grafik
➢ Noe4j
52. Untuk menampilkan pola dibalik hubungan antara entitas data,
➢ Visualisasi grafik
53. Fitur spark graphx,
➢ Kecepatan, Pustaka algoritma, fleksibilitas
54. Algoritma untuk menentukan jumlah segitiga yang mewati setiap simpul dalam graf,
➢ Triangle count
55. Framework yang dapat digunakan untuk memproses data grafik dan menjalankan analisis
prediktif pada data,
➢ Spark graphX
56. Pernyataan yang benar spark streaming,
➢ Memproses menggunakan algoritma kompleks, dapat menyerap data, daya
yang diproses dapat dikirim ke system file
57. Pernyataan yang benar tentang graph,
➢ Graph terdiri dari simpul dan sisi, semua yang ada di facebook adalah contoh,
edge menunjukan relasi
58. Apa yang menyebabkan spark streaming memiliki toleransi kesalahan,
➢ Kumpulan data input direplikasi dalam memori
59. Operasi jendela membutuhkan parameter
➢ Window length
60. CUDA yang diciptakan Nvidia adalah singkatan dari,
➢ Compute Unifed Device Architecture
61. Tiga tahap alur pemrosesan dalam eksekusi program CUDA,
➢ Langkah ke-1 : Salin input data dari CPU memory ke GPU memory, Langkah 2
: Muat program GPU dan eksekusi caching, Langkah 3 : salin hasil dari GPU
memory ke CPU memory
62. Architecture CUDA menerapkan pendekatan berupa kumpulan streaming multiprocessor
SM yang,
➢ Mengeksekusi sejumlah intruksi yang sama pda beberapa thread pada berbagai
wilayah data, sehingga dikenal dengan istilah single instruction, multiple threads
SIMT
63. Komputasi parallel adalah komputasi yang,
➢ Melibatkan banyak kalkulasi atau pemrosesan yang dilaksanakan secara
serentak simultan, dimana masalah besar dibagi dalam beberapa masalah kecil
yang kemudian diselesaikan dalam waktu yang sama.
64. Tujuan utama dari pemrograman parallel adalah untuk meningkatkan performa
komputasi, performa dalam pemrograman parallel diukur dari,
➢ Berapa banyak peningkatan kecepatan yang diperoleh dalam menggunakan
Teknik parallel.
65. CUDA C++ adalah perluasan C++ sehingga programmer dapat mendefinisikan fungsi
C++, yang Ketika dipanggil akan dieksekusi sebanyak N kali secara parallel oleh N
CUDA thread yang berbeda. Fungsi ini dikenal dengan istilah,
➢ Kernel
66. Kernel pada pemrograman CUDA agar dieksekusi paada device, dideklarasi
menggunakan
➢ _global_
67. Sistem distribusi (distributed computing) adalah Teknik komputasi parallel dimana
➢ Komputer yang digunakan secara bersamaan dalam melakukan komputasi
dilakukan oleh komputer-komputer terpisah yang terhubung
68. Perintah kernel <<N,M>>(..) menunjukan device untuk,
➢ Mempersiapkan block sebanyak N dengan thread sebanyak M ditiap block
69. Istilah thread pada GPU adalah,
➢ Satuan matrik untuk pemrosesan parallel pada GPU
70. Dua kata istilah penting yang digunakan dalam CUDA, yaitu: host, dan device. Istilah
host pada CUDA mengacu pada
➢ CPU
71. Dua kata istilah penting yang digunakan dalam CUDA, yaitu: host, dan device. Istilah
device pada CUDA mengacu pada,
➢ GPU
72. GPU dalam teknologi komputasi adalah singkatan dari,
➢ Graphics processing Unit
73. Pengelolaan memori pada device pada dasarnya menggunakan,
➢ cudaMalloC(), cudaMemcpy(), cudaFree()
74. Pernyataan yang benar mengenai thread block pada GPu,
➢ Thread block terdiri dari beberapa thread, dan beberapa thread block
digabung dalam satu grid
75. CUDA adalah platform komputasi parallel dengan arsitektur komputasi masuk dalam,
➢ Heterogenous karena melibatkan CPU dan GPU
76. Pernyataan yang benar mengenai pemrograman parallel pada GPU,
➢ Adalah salah satu cara untuk mempercepat pemrosesan untuk komputasi yang
besar
77. Pernyataan berikut yang benar mengenai CUda,
➢ Cuda adalah suatu platform untuk komputasi parallel, dan memanfaatkan
GPU untuk komputasi
78. CPU dari suatu unit computer adalah singkatan
➢ Central processing unit
79. Perintah kernel <<N,M>> menunjukan device untuk,
➢ Mempersiapkan block sebanyak N dengan thread sebanyak M di tiap block
80. Bahasa pemrograman phyton tergolong cepat karena,
➢ Bahasa pemrograman tingkat tinggi, dapat diinterpretasikan, dapat dikodekan
secara dinamis
81. Bahasa pemrograman pyhton tergolong lambat untuk eksekusi,
➢ Tugas yang berulang dan tergolong tinggat rendah
82. Modul kompilasi tepat waktu pada Pyhton untuk CPU adalah,
➢ Numba
83. Berikut ini adalah urutan proses yang dijalankan oleh numba,
➢ Rewrite IR, Lowering, LLVM IR, LLVM/NVVM JIT
84. Banyaknya operasi-operasi kecil yang berulang merupakan salah satu penyebab Bahasa
pemrogram python,
➢ Tergolong lambat
85. Berikut ini pernyataan yang tepat tentang python adalah,
➢ Python tergolong cepat untuk pengembangan, Python tergolong lambat untuk
eksekusi
86. Elemen dalam RRD dikelompokan kedalam beberapa partisi dan hanya dapat disimpan
pada sebuah node yang berbeda merupakan konsep RDD dalam hal,
➢ Distributed
87. Numba dapat menangani,
➢ Alokasi data dari dan ke host jika diperlukan, penyalinan data dari dan ke host
88. Komputasi pada GPU cluster dapat menggunakan,
➢ Numba, Pyspark
89. Berikut ini yang salah terkait dengan numba adalah,
➢ Semua Salah, Bersama dengan spark dapat menjalankan kode program pada spark
workers dengan GPU
90. Bahasa pemrograman Python tergolong cepat digunakan untuk,
➢ Menulis, Menguji, Mengembangkan kode program
91. Apache spark bukan merupakan,
➢ (Semua Salah) Suatu mesin untuk mengeksekusi komputasi terdistribusi pada
suatu klaster, suatu application programming interface
92. Spark diimplementasikan dalam,
➢ Scala dan java
93. Berikut ini adalah komputasi primitive yang tersedia pada spark untuk melakukan
paralelisme dan meminimumkan komunikasi antar workers
➢ Map ,Filter, Reduce
94. Berikut ini yang benar terkait dengan numba, kecuali
➢ Open source, kode dapat dibangkkitkan dengan LLVM CPU, dapat
menterjemahkan sintak Piton ke kode mesin, diimplementasikan sebagai suatu
modul
95. Modul kompilasi tepat waktu pada pyhton untuk GPU adalah,
➢ Cuda
96. Api spark memiliki dukungan yang terbatas pada Bahasa pemrograman,
➢ R
97. Permasalahan alokasi memori dalam komputasi pada GPU terdapat pada tugas yang
berskala
➢ Kecil
98. Type interface pada proses numba memerlukan
➢ Functions argument, numba IR
99. Pemrograman terdistribusi dalam python adalah,
➢ Numba atau Pyspark