1. Persentase proses terbesar sebanyak 60% pada Data Scientist adalah pada proses :
a. Building and training test
b. Cleaning and Organizing Data
c. Collecting data sets
d. Refining Algorithm
2. Penerapan utama data dari data science pada e-commerce adalah melakukan hal-hal
berikut kecuali :
a. Prediction potential problem
b. Recommending Product
c. Identifying Consumers
d. Analyzing Reviews
5. Profil Profesional Sains Data tergolong keluarga pekerjaan (okupasi) terkait data.
Pekerjaan baru yang diusulkan ditemaptkan dalam empat kelompok klasifikasi teratas
adalah manager, professional madya dan kerja pendukung klerikal. Yang termasuk
professional adalah :
a. kurator dan pengurus (stewards) data
b. CEO
c. Operator dan Teknisi
d. Pengembang aplikasi dan insinyur/perekaya infrastuktur
8. Penerapan utama data dari data science pada banking adalah melakukan hal-hal berikut
:
a. Drug Discovery, Bioinfomatics, Maintenance Schedulling
b. Customer Segmentation, identifying
c. Monitoring System, Maintenance System
d. Self Driving Car, Car Monitoring System, Enhanced driving Experience, Enhanced
the safety of Passenger
9. Beda Data Scientist dan Data Analyst adalah bahwa Data Analyst memiliki “has
problem solving skills, knowledge of basic statistic”. Hal tersebut ada pada fitur :
a. Skill
b. Type of Data
c. Background
d. Scope
10. Siklus Hidup Sains Data pada Data Discovery adalah melakukan :
a. Searching for different sources of data and capturing structured and unstructured
data
b. Gathering information and deriving outcomes based on business requirements
c. Converting data into a common format
d. Using variables and equations to establish relationship
12. Dalam membangun Tim Sains Data, personil yang dibutuhkan pada tahap data analysis
adalah, kecuali :
a. Data Analyst/Business Analyst
b. Researcher
c. Data Scientist
d. Data Science Application Developer
13. Task seorang Data Scientist adalah :
a. Interpret and Manage data and solve complex problems using expertise in a variety
of data niches
b. Develop and initiate innovative statistical technique, issues and protocols
c. Analyst data with specific statistical software and developing theory of statistics
d. To provide new insights into business and create solutions that enable enhanced
business performances
15. Penerapan utama data dari data science pada banking adalah melakukan hal-hal berikut
kecuali :
a. DROP
b. Fraud Detection
c. REVOKE
d. Virtual Assitants
18. Siklus Hidup Sains Data pada Mathematical Models adalah melakukan :
a. Converting data into a common format
b. Gathering information and deriving outcomes based on business requirements
c. Searching for different sources of data and capturing structured and unstructured
data
d. Using variables and equations to establish relationship
20. Siklus Hidup Sains Data pada Getting things in action adalah melakukan :
a. Converting data into a common format
b. Gathering information and deriving outcomes based on business requirements
c. Using variables and equations to establish relationship
d. Searching for different sources of data and capturing structured and unstructured
data
M2
21. Apa kepanjangan CEP :
a. Campaign Event Processing
b. Collaboration Event Processing
c. Complex Event Processing
d. Communication Event Processing
28. Pada proses realtime ingestion, tools yang digunakan sebagai message broker dalam
hal ini adalah :
a. Krakend
b. Airflow
c. Zeppelin
d. Kafka
29. Tools yang berfungsi sebagai tempat visualisasi dashboard dari hasil ETL :
a. Hive
b. Superset
c. Kong
d. Zeppelin
31. Deployment dan operation monitoring terdapat pada tahap … pada proses
development:
a. Detailed Requirement Gathering
b. Development
c. Deployment
d. Design
32. Campaign dapat dikirim melalui berbagai channel seperti berikut, kecuali :
a. Notifikasi Apps
b. Ditelphone
c. SMS
d. Email
36. Berikut contoh penggunaan database pada lingkungan big data, kecuali :
a. Postgresql
b. Exel
c. Hdfs
d. Druid
37. Dalam hal evaluasi CEP, tools yang dapat bertindak sebagai API gateway adalah :
a. Hbase
b. Spark
c. Debezium
d. Kong
39. CEP merupakan produk campaign marketing yang mengirim campaign secara :
a. Realtime
b. Scheduling
c. Batch
d. Random
40. Prinsip kerja dari CEP dalam mengirim sebuah campaign adalah secara :
a. Batch dan general
b. Batch dan personalize
c. Realtime dan personalize
d. Random dan general
M3
41. Untuk pengujian model pada Pengujian Model Data Mining adalah :
a. Data validation
b. Data training
c. Data estimation
d. Data testing
48. Linear Regression, Neural Network, Support Vector Machine adalah algoritma pada …
didata mining:
a. Classification
b. Clustering
c. Estimasi
d. Association
49. Pembagian Dataset pada Pengujian Model Data Mining adalah kecuali:
a. Data validation
b. Data estimation
c. Data training
d. Data testing
50. Untuk pembentukan model pada Pengujian Model Data Mining adalah :
a. Data estimation
b. Data training
c. Data validation
d. Data testing
52. Fakta yang terekam dan tidak membawa arti adalah definisi dari:
a. Informasi
b. Sistem
c. Pengetahuan
d. Data
53. Metode data mining yang menggunakan data dengan label dan tidak berlabel sekaligus
dalam proses pembelajarannya adalah :
a. Unsupervised Learning
b. Supervised Learning
c. Type of Data
d. Semi-Supervised Learning
54. Data cleaning, Data Integration, Data Reduction, Data Transformation adalah proses
… pada Data mining :
a. Data Pre-processing
b. Data Scientist
c. Data Analyst/Business Analyst
d. Data Science Application Developer
55. Pola, rumus, aturan atau model yang muncul dari data adalah definisi dari:
a. Data
b. Informasi
c. Pengetahuan
d. Sistem
57. FP-growth, A Priori, Coefficient of Correlation, Chi Square adalah algoritma pada …
didata mining :
a. Association
b. Clustering
c. Classification
d. Estimasi
58. Algoritma association rule (aturan asosiasi) adalah algoritma yang menemukan atribut
yang :
a. Bioinformatics
b. Customer Segmentation
c. Muncul Bersamaan
d. Monitoring System
59. Contoh Penerapan Data Mining adalah sebagai berikut, kecuali :
a. Penetuan pasokan listrik PLN untuk wilayah Jakarta
b. Penjadwalan pemeliharaan
c. Analisis pola belanja pelanggan
d. Deteksi serangan (intrusion) pada suatu jaringan
M4
61. Graf tidak berarah dimana antara dua simpul terhubung oleh hanya satu jalur (tidak
terdapat siklus) adalah:
a. Regular
b. Hutan (Forest)
c. Pohon (Tree)
d. Asiklik (acyclic)
62. Ukuran terkait kekuatan dalam jaringan yang menunjukkan simpul mana yang berperan
dalam sebagai perantara, yaitu seberapa sering sebuah simpul dilalui oleh lintasan
terpendek adalah:
a. Sentralitas Eigenvector
b. Kedekatan sentralitas
c. Derajat sentralitas
d. Sentralitas keantaraan
65. Graf yang tak berarah, tak terhubung atau dengan kata lain kumpulan pohon yang tidak
saling terhubung adalah:
a. Hutan (Forest)
b. Regular
c. Asiklik (acyclic)
d. Pohon (Tree)
67. Graf yang memiliki simpul tetapi tidak memilik ruas disebut:
a. Graf terhubung
b. Graf tidak terhubung
c. Graf hampa
d. Graf semu (trivial)
70. Graf dimana terdapat siklus dari sebuah simpul yang mengunjungi setiap simpul dalam
graf tepat satu kali disebut dengan:
a. Graf Hamilton
b. Graf Euler
c. Graf bipartite
d. Graf plannar
72. Ukuran terkait kekuatan dalam jaringan yang menunjukkan seberapa penting
orang/pihak lain yang mempunyai jaringan dengan actor (simpul) adalah:
a. Kedekatan sentralitas
b. Sentralitas keantaraan
c. Sentralitas Eigenvector
d. Derajat sentralitas
73. Jenis Graf apakah yang antara setiap pasang simpul terdapat minimum satu jalur:
a. Graf semu (trivial)
b. Graf hampa
c. Graf tidak terhubung
d. Graf terhubung
75. Graf yang dapat dibentuk pada sebuah bidang sedemikian sehingga tidak terdapat dua
ruas yang saling bersilangan adalah:
a. Graf bipartite
b. Graf Hamilton
c. Graf Euler
d. Graf plannar
78. Himpunan ruas yang dapat membagi graf G menjadi dua sub-graf S dan T disebut
dengan:
a. cyclic (siklik)
b. Himpunan pemotong (cut set)
c. Lintasa
d. Derajat
79. Siapakah ilmuwan penemu Teori Graf :
a. Blaise Pascal
b. Leonhard Euler
c. Bill Gates
d. Dennis Ritchie
80. Jenis Graf apakah dimana terdapat dua simpul yang tidak memiliki jalur yang
menghubungkan ke dua simpul tersebut:
a. Graf semu (trivial)
b. Graf terhubung
c. Graf tidak terhubung
d. Graf hampa
M5
81. Tahapan Feature Extraction pada NLP adalah:
a. Vector Space Model
b. Text Similarity
c. Tokenization
d. Sequential Labeling
85. Mobil menabrak tiang saat sedang melaju adalah contoh dari ambiguitas:
a. Ambiguitas Leksikal
b. Ambiguitas Sintaksis
c. Ambiguitas Semantik
d. Ambiguitas Anaforis
86. Berikut ini tekhnik pemrosesan bahasa alami umum yang merupakan Grammar
Correction adalah:
a. Meringkas informasi penting dari suatu sumber untuk menghasilkan versi yang
dipersingkat
b. Google, Yahoo, Bing
c. Ketik kata kunci untuk mengajukan pertanyaan
d. Koreksi ejaan dan tata Bahasa
87. Startup NLP di Indonesia yang menjadikan conversational AI dengan chatbot sebagai
produk utama mereka adalah...
a. Kata.ai dan Bahasa.ai
b. Prosa.ai dan Bahasa.ai
c. Prosa.ai
d. Prosa.ai dan Kata.ai
90. Dasar pemrosesan teks dari berbagai NPL task adalah sebagai berikut, kecuali:
a. Pengektraksian Informasi
b. Tokenisasi
c. Mengkategorisasi teks
d. Mengklasifikasi teks
91. Startup NLP di Indonesia yang menyediakan layanan text berupa Prosa Text API
adalah:
a. Kata.ai
b. Veronica
c. Bahasa.ai
d. Prosa.ai
92. Sistem penulisan apakah dimana simbol individu mewakili suku kata:
a. Silabis
b. Abjad
c. Grafik
d. Logografik
95. Perbedaan utama antara Bahasa Alami dan Bahasa Komputer dengan parameter
Literalness adalah:
a. Bahasa alami terbuat dari idiom dan metafora, sedangkan Bahasa Komputer
merupakan bahasa formal memiliki arti yang persis seperti yang ingin mereka
katakana
b. Bahasa Alami bersifat ambigu, sedangkan bahasa komputer dirancang untuk tidak
ambigu
c. Bahasa Alami menggunakan banyak redundansi, sedangkan Bahasa Komputer
adalah Bahasa formal tidak terlalu berlebihan
d. Tidak ada jawaban yang tepat
97. Tahapan NLP apakah dimana tujuan dari tahap ini adalah untuk memecah potongan
input bahasa menjadi kumpulan token yang sesuai dengan paragraf, kalimat, dan kata:
a. Analisis sintaks
b. Analisis pragmatis
c. Pengolahan morfologi
d. Analisis semantic
98. Fase NLP yang merupakan fase akhir tahun 1960-an hingga akhir 1970-an dicirikan
dengan:
a. Pekerjaan yang dilakukan dalam fase ini difokuskan terutama pada Mesin
Penerjemah
b. Mendapat beberapa sumber daya & alat praktis seperti parser, misalnya Alvey
Natural Language Tools bersama dengan sistem yang lebih operasional dan
komersial, misalnya untuk kueri database.
c. Pekerjaan yang dilakukan sebagian besar terkait dengan pengetahuan dunia dan
perannya dalam konstruksi dan manipulasi representasi makna.
d. Pendekatan leksikalisasi tata bahasa dan menjadi pengaruh yang meningkat
99. Sub-bidang Ilmu Komputer khususnya Artificial Intelligence (AI) yang berkepentingan
untuk memungkinkan komputer memahami dan memproses bahasa manusia, adalah:
a. Natural Languange Processing (NLP)
b. Computer Vision
c. Expert System
d. Image Processing
M6
101. Struktur matematika paling dasar dari suatu grafik adalah :
a. Banyaknya Set V
b. Satu set V yang terhubung melalui garis E
c. Banyaknya garis E
d. Banyaknya Network
103. Menurut Halgin & DeJordy, 2008 “If your research question is about different patterns
of interaction within defined groups” adalah :
a. Sociocentric
b. Egocentric
c. Anthropologie
d. Physiocentric
104. Gephi adalah software social network analysis, kecuali :
a. Free
b. Open Source
c. Berbayar
d. Interactive visualization and exploration
108. Beberapa disiplin ilmu dari Social Network Analysis adalah, kecuali :
a. Graf network
b. Transportation network
c. Social network
d. Electrical network
110. Sejarah network analysis pada tahun … New York Times reported on the new science
of “psychological geography” :
a. 1950
b. 1960
c. 1933
d. 1930
111. Social Network Analysis adalah :
a. Studi sociometri
b. Sebuah studi yang mempelajari tentang hubungan manusia dengan
memanfaatkan teori graf
c. Metode yang menghubungkan antar node
d. Peta yang terdiri atas banyak orang dimana di dalamnya terdapat relasi antar
individunya
112. Menurut Halgin & DeJordy, 2008 “If your research question is about phenomena of
or affecting individual entities across different settings” adalah :
a. Egocentric
b. Sociocentric
c. Anthropologie
d. Physiocentric
116. Tipe dari social network analysis yang “Creates many stand alone network”:
a. Anthropologie
b. Physiocentric
c. Egocentric
d. Sociocentric
117. Tipe dari social network analysis yang “Creates one network”:
a. Anthropologie
b. Sociocentric
c. Egocentric
d. Physiocentric
M8
121.is a form of qualitative analysis that is concerned with more than just statistics
and numerical values.
a. Analysis
b. Analysis
c. Analysis
d. Text analysis
122.focuses on the process of turning raw data into useful statistics, information, and
explanations.
a. Information System
b. Information
c. Data
d. Data analysis
126.A powerful analytics and data visualization perform. Connect all your data and
create interactive dashboards that update in real-timey.
a. R
b. Tableau
c. Phyton
d. rapidMiner
130. ….. for data analytics teams that want to tackle challenge tasks and handle large
amounts of data.
a. Microsoft Excel
b. RapidMiner
c. KNIME
d. Phyton
131. Process of cleaning, analyzing, interpreting, and visualizing data to discover valuable
insights that drive smarter and more effectives business decisions is ….. :
a. Data
b. Data analysis
c. Information
d. Information system
133.filter, organize, and visualize quantitative data. The perfect tool for performing
simple data analysis. Explore common functions and formulas for data analysis.
a. KNIME
b. Microsoft Excel
c. Phyton
d. RapidMiner
134. ….. the preferred programming language for machine learning. Use it to build data
analysis solutions for various use cases.
a. Microsoft Excel
b. KNIME
c. RapidMiner
d. Phyton
135. ….. open-source platform for building advanced machine learning solutions, and
visualizing data. :
a. Microsoft Excel
b. Phyton
c. KNIME
d. RapidMiner
M9
141. Berikut ini merupakan toolkit data mining bersifat open source yang dapat digunakan
untuk visualisasi data, machine learning serta memiliki pemrograman visual untuk
analisis data kualitatif yang cepat, eksploratif dan interaktif:
a. Hive
b. Kafka
c. Orange
d. Nifi
142. Program database apakah yang digunakan untuk data & statistic pada knowledge
explorer Indonesia OneSearch (IOS)?
a. API
b. MySQL
c. Apache SOLR
d. MongoDB
143. Text information, segmentation and tokenization, text cleaning, vectorization and
feature engineering, text lemmatization and stemming, machine learning algorithms,
dan result interpretation adalah tahapan dari
a. NLP pipeline
b. Phyton
c. Setiment analysis
d. Big data analysis
144. Big data dapat membantu melakukan predictive maintenance & quality pada industri
a. Automotive
b. Education
c. Banking
d. Agriculuture
145. Sebuah sistem yang berfungsi untuk memonitor serta menganalisa media sosial dan
platform online yang berbasis teknologi big data menggunakan keahlian artificial
intelligence dan natural learning process (NPL) adalah
a. Drone emprit
b. Corpus
c. Data science
d. Social network analysis
146. Bidang yang terkait dengan studi, desain dan pengembangan Teknik untuk
mengesktrak unit leksikal dari teks dan pemfilteran unit leksikal melalui beberapa
skema penilaian dan peringkat, yang digunakan untuk identifikasi istilah disebut
a. Named Entity Recognition (NER)
b. Syntax Analysis (S-P-O)
c. Automatic Term Recognition (ATR)
d. Part-Of-Speech (POS) Tagging
147. Pada grafik perkembangan data dari tahun 2010 hingga 2020, data terbanyak
bersumber dari area berikut kecuali
a. Social media
b. Sensors & Devices
c. Enterprise Data
d. Exabytes Volume
148. Berikut ini adalah sumber data yang digunakan pada knowledge explorer Indonesia
onesearch (IOS), kecuali:
a. Berita online
b. iTunes
c. Blog
d. Jurnal
149. Ilustrasi hubungan subyek dan obyek yang saling berhubungan melalui predikat dapat
dilihat menggunakan
a. Tree-map
b. Directed graph
c. Undirected graph
d. Co-occurance
155. Proses NLP yang mengacu pada pengategorian kata-kata dalam teks (korpus)
tergantung pada definisi kata dan konteksnya disebut sebagai
a. Named Entity Recognition (NER)
b. Syntax Analysis (S-P-O)
c. Automatic Term Recognition (ATR)
d. Part-Of-Speech (POS) Tagging
156. NLP pada sistem factminer mendapatkan masukkan dari hal berikut, kecuali
a. Laporan internal
b. Dokumen
c. Berita online
d. Semantic search engine
158. Selain tokoh dan organisasi, dalam suatu berita FactMiner dapat mengekstrak data
berikut kecuali
a. Peristiwa
b. Komentar
c. Waktu
d. Lokasi
159. Suatu Teknik yang secara otomatis mengidentifikasi entitas tertentu dalam teks dan
mengklasifikasikannya ke dalam kategori yang telah ditentukan sebelumnya disebut
a. Named Entity Recognition (NER)
b. Part-Of-Speech (POS) Tagging
c. Automatic Term Recognition (ATR)
d. Syntax Analysis (S-P-O)
160. Sebuah tree-map dapat digunakan mengidentfikasi untuk hal berikut kecuali:
a. Hubungan antar subjek
b. Aktifitas terkait dengan actor
c. Obyek atau entitas terkait aktivitas subyek
d. Aktor perorangan, organisasi, konsep (subyek)
M10
161. Definisi kampanye menurut rogers dan storey adalah:
a. Penggunaan berbagai metode komunikasi yang berbeda secara terkoordinasi
dalam jangka waktu tertentu yang ditujukan untuk mengarahkan khalayak pada
masalah tertentu dan solusinya
b. Penciptaan Kembali dan pemindahan simbol-simbol penting secara terus
menerus melalui komunikasi
c. Serangkaian Tindakan komunikasi yang direncanakan dengan tujuan
menciptakan efek tertentu pada sejumlah besar khalayak yang dilakukan secara
berkelanjutan selama periode waktu tertentu
d. Proses rangkaian komunikasi politik antara kontestan politik dan pemilih
162. Elemen dibawah ini tidak diperhitungkan dalam metrik GRP sosial:
a. Effective reach
b. Relevant
c. Audience relevance
d. Sentiment
163. Model prediktif kampanye politik menghasilkan tiga kategori “skor prediktif”, kecuali
a. Skor elektabilitas
b. Skor respons
c. Skor dukungan
d. Skor perilaku
164. Pembersihan data ini dimulai dari awal saat data pertama kali diambil dan melibatkan
semua anggota tim yang menyentuh data titik mana pun, merupakan tahapan dalam:
a. Data hygienists
b. Data explorers
c. Business solution architects
d. Data scientists
165. Berikut ini bukan termasuk dalam faktor yang mempengaruhi kampanye politik:
a. Kebijakan politik panitia pemilihan
b. Perkembangan teknologi
c. Perkembangan media cetak
d. Kemunduran partai politik
167. GRP (Gross Rating Point) sosial media digital dibagi menjadi tiga.
a. Data hygienists, data explorers, business solution architects
b. Skor perilaku, skor dukungan, skor respons
c. Milik anda (misalnya situs web anda), berbayar (iklan spanduk yang anda beli
di situs lain), diperoleh (posting atau komentar orang melalui blog atau tweet)
d. Effective reach, audience relevance, sentiment
168. Otomatisasi dilakukan untuk mengubah data menjadi laba, apakah yang dilakukan
pada otomatisasi ini:
a. Membuat replikasi dan perubahan analisis lebih mudah sehingga tidak perlu
selalu memulai dari awal
b. Mengungkapkan apa yang mendorong harga untuk setiap segmen pelanggan
dan produk
c. Mengembangkan seperangkat komunikasi yang jelas untuk memberikan alasan
harga untuk menonjolkan nilai dan menyesuaikan argumen tersebut dengan
pelanggan
d. Mendukung tenaga penjualan dengan target yang bermanfaat
170. Berikut ini adalah keefektifan dari customer lifecycle managemen, kecuali:
a. Dapatkan pelanggan baru
b. Kembangkan pelanggan yang sudah ada
c. Pertahankan pelanggan yang sudah ada dan menangkan Kembali pelanggan
lama
d. Mengubah model menjadi hasil
171. Skor prediktif yang memprediksi bagaimana warga akan menanggapi penjangkauan
kampanye adalah:
a. Skor perilaku
b. Skor dukungan
c. Skor elektabilitas
d. Skor respons
177. Menyusun data untuk memastikannya dapat ditanyakan secara berguna dalam
kerangka waktu yang sesuai oleh semua pengguna adalah tahapan dalam:
a. Data hygienists
b. Data scientists
c. Data explorers
d. Business solution architects
178. Skor prediktif yang menggunakan perilaku masa lalu dan informasi demografis untuk
menghitung probabilitas eksplisit bahwa warga negara akan terlibat dalam bentuk
aktivitas politik tertentu adalah:
a. Skor perilaku
b. Skor elektibilitas
c. Skor dukungan
d. Skor respons
M11
181. Analisa yang berdasarkan pada data-data mengenai harga historis yang terjadi pada
pasar saham, disebut:
a. Analisis fundamental
b. Analisis kredit
c. Analisis keranjang pasar
d. Analisis teknikal
182. Praktik illegal dalam dunia investasi, di mana seorang investor mendapat informasi
yang pasti perihal peluang keuntungan dalam transaksi jual beli saham. Kepastian
informasi tersebut tentu bersumber dari orang dalam di perusahaan terkait, disebut :
a. Bribery
b. Insiden trading
c. Money laundring
d. Sanction breaches
187. Metode ini merupakan metode eksplorasi yang mengubah data yang sangat besar
menjadi pohon keputusan yang mempresentasikan suatu aturan, disebut :
a. Chi-squared automatic interaction detection (CHAID)
b. Classification and regression tree (CART)
c. Neural network
d. Multivariate adaptive regression spline (MARS)
188. Jenis fraud yang korban terbesarnya adalah para pemegang sahan, adalah :
a. Investment scam
b. Customer fraud
c. Management fraud
d. Employee fraud
189. Tools yang dapat digunakan untuk mengolah big data adalah :
a. Excel
b. SPSS
c. Hadroop
d. Integral
190. Penerapan analisis big data dalam konteks penerimaan pajak memiliki banyak potensi,
diantaranya kecuali:
a. Memperkaya profil wajib pajak
b. Dapat melihat relasi antar-wajib pajak
c. Mengurangi risiko biaya
d. Dapat mengidentifikasi risiko ketidakpatuhan setiap wajib pajak
191. Teknik untuk membantu melihat pelanggan mana yang akan meninggalkan layanan
sehingga perusahaan dapat mengembangkan strategi yang tepat untuk
mempertahankan pelanggan, disebut :
a. Segmentasi pelanggan
b. Upselling
c. Churn-prediction
d. Credit scoring
192. Contoh dari direct tax adalah
a. Data wajib pajak penghasilan badan
b. Data PPN
c. Data CSR
d. Data perbankan
193. Rendahnya tingkat tax compliance jika dilihat dari big data adalah:
a. Kualitas data yang tidak mendukung
b. Big data belum di manfaatkan dengan optimal oleh otoritas pajak
c. Perlunya memberikan insentif
d. Rendahnya ketersediaan dana pajak
194. Market basket analysis termasuk kelompok peran sains data pada industri keuangan :
a. Bisnis real estate
b. Bisnis melalui CRM
c. Lainnya
d. Manajemen risiko
195. Tahapan dalam money laundry dimana sudah mulai digunakan mata uang digital,
adalah tahap :
a. Layering
b. Integration
c. Placement
d. Credit scoring
197. Mendorong konsumen untuk membeli model yang lebih mahal dalam brand atau
kategori produk yang sama, atas untuk menambah model asli dengan fitur tambahan,
disebut :
a. Cross-selling
b. Upselling
c. Pre-selling
d. Down-selling
200. Berikut ini yang termasuk klasifikasi variabel segmentasi yang tidak dapat diobservasi
terkait produk-spesifik adalah :
a. Preferensi
b. Loyalitas
c. Psikografik
d. Demografi
M12
201. Apakah yang dimaksud dengan veracity dalam big data:
a. Ukuran data
b. Sebuah aplikasi dapat membuat/mengumpulkan banyak jenis data
c. Data dihasilkan secara cepat, maka dibutuhkan pemrosesan yang cepat juga
d. Akurasi data
203. Apakah yang dimaksud dengan variety dan complexity dalam big data:
a. Ukuran data
b. Sebuah aplikasi dapat membuat/mengumpulkan banyak jenis data
c. Akurasi data
d. Data dihasilkan secara cepat, maka dibutuhkan pemrosesan yang cepat juga
204. Berikut ini adalah penerapan kecerdasan buatan dalam pariwisata, kecuali:
a. Penanganan bagasi
b. Booking perjalanan
c. Smart track system
d. Komparasi tiket termurah
205. Bidang ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang
umumnya terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan
masalah, dan pengenalan pola adalah definisi dari:
a. Sains data
b. Big data
c. Kecerdasan buatan
d. Artificial intelligence
210. Data yang skala, keragaman, dan kompleksitasnya memerlukan arsitektur, Teknik,
algoritma, dan analisis untuk mengelola serta mengekstrak nilai dan pengetahuan yang
tersembunyi adalah definisi dari:
a. Sains data
b. Big data
c. Kecerdasan buatan
d. Artificial intelligence
211. Bidang ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang
umumnya terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan
masalah, dan pengenalan pola adalah definisi dari:
a. Sains data
b. Artificial intelligence
c. Kecerdasan buatan
d. Big data
213. Artificial intelligence pada tahun 2011 – saat ini berfokus pada:
a. Memprediksi sinyal yang dibuat
b. Pembelajaran mendalam
c. Pembelajaran mesin
d. Jaringan neural
216. Berikut ini adalah pernyataan yang benar mengenai last mile delivery:
a. Jawaban tidak ada yang benar
b. Konsep arsitektur yang mengintegrasikan teknologi dan mengumpulkan data
untuk mengoptimalkan efisiensi operasi
c. Cara yang digunakan distributor atau retailer untuk mengirim barang ke
konsumen secara langsung tanpa menggunakan pihak ketiga
d. Senjata tersembunyi yang memungkinkan seorang arsitek untuk mengubah
parameter tertentu untuk membuat berbagai jenis desain
218. Disiplin ilmu yang khusus mempelajari data, khususnya data kuantitatif (data
numerik), baik yang terstruktur maupun tidak terstruktur adalah definisi dari:
a. Kecerdasan buatan
b. Sains data
c. Artificial intelligence
d. Big data
M13
221. Data cleaning, data integration, data reduction, data transformation adalah proses …
pada data mining :
a. Data scientist
b. Data science application developer
c. Data pre-processing
d. Data analyst/business analyst
224. Metode data mining yang menggunakan data dengan label dan tidak berlabel sekaligus
dalam proses pembelajarannya adalah :
a. Semi-Supervised learning
b. Supervised learning
c. Type of data
d. Unsupervised learning
227. Pembagian dataset pada pengujian model data mining adalah kecuali:
a. Data training
b. Data estimation
c. Data validation
d. Data testing
228. FP-growth, A priori, coefficient of correlation, chi square adalah algoritma pada …
didata mining :
a. Classification
b. Clustering
c. Association
d. Estimasi
231. Algoritma association rule (aturan asosiasi) adalah algoritma yang menemukan atribut
yang :
a. Customer segmentation
b. Bioinformatics
c. Muncul bersamaan
d. Monitoring system
232. Pola, rumus, aturan atau model yang muncul dari data adalah definisi dari:
a. Data
b. Informasi
c. Sistem
d. Pengetahuan
233. Fakta yang terekam dan tidak membawa arti adalah definisi dari:
a. Pengetahuan
b. Informasi
c. Sistem
d. Data
235. Untuk pengujian model pada pengujian model data mining adalah :
a. Data testing
b. Data training
c. Data estimation
d. Data validation
237. Linear regression, neural network, support vector machine adalah algoritma pada …
didata mining:
a. Classification
b. Clustering
c. Estimasi
d. Association
239. Untuk pembentukan model pada pengujian model data mining adalah :
a. Data testing
b. Data validation
c. Data estimation
d. Data training
M14
241. Amazon/Alexa, Microsoft/Cortana merupakan contoh pemanfaatan AI di Bahasa
dengan teknologi
a. Drone control
b. Google translate
c. Chat bot Al
d. Smart speaker
242. Apakah yang dimaksud dengan Variety dan Complexity dalam Big Data:
a. Sebuah aplikasi dapat membuat/mengumpulkan banyak jenis data
b. Ukuran data
c. Akurasi data
d. Data dihasilkan secara cepat, maka dibutuhkan pemrosesan yang cepat juga
243. Beda Data Scientist dan Data Analyst adalah bahwa Data Analyst memiliki "has
problem solving skills, knowledge of basic statistic". Hal tersebut ada pada fitur :
a. Skill
b. Background
c. Type of data
d. Scope
244. Berikut contoh penggunaan database pada lingkungan big data, kecuali :
a. Exel
b. Postgresql
c. Hdfs
d. Druid
245. Berikut ini adalah penerapan kecerdasan buatan dalam pariwisata, kecuali:
a. Booking perjalanan
b. Penanganan bagasi
c. Smart track system
d. Komparasi tiket termurah
246. Bidang ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang
umumnya terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan
masalah, dan pengenalan pola merupakan definisis dari
a. Metode numerik
b. Sains data
c. Artificial intelligence
d. Kecerdasan buatan
247. Bidang studi multidisiplin dengan tujuan untuk mengatasi tantangan dalam data besar
adalah
a. Metode numerik
b. Kecerdasan buatan
c. Sains data
d. Artificial intelligence
248. Big data dapat membantu melakukan predictive maintenance & quality pada industry
a. Banking
b. Education
c. Agriculture
d. Automotive
249. Contoh Pemanfaatan AI di Bidang Pariwisata pada evolusi teknologi tahun 2005-2010
dengan menggunakan teknologi Internet adalah
a. Internet informasi travel
b. Blog, SNS two way communication
c. ICT smart tourism
d. Computer reservasi berbasis computer
250. Contoh Platform Online for FIT (Fully Independent Traveler) pada akomodasi adalah
a. Gojek
b. Google
c. Airbnb
d. Maps
252. Disiplin ilmu yang khusus mempelajari data, khususnya data kuantitatif (data
numerik), baik yang terstruktur maupun tidak terstruktur adalah definisi dari:
a. Artificial intelligence
b. Big data
c. Kecerdasan buatan
d. Sains data
254. Pemanfaatan AI di Bidang Pariwisata pada evolusi teknologi tahun 2005-2010 dengan
menggunakan teknologi
a. Computer
b. Internet
c. ICT
d. Blog, SNS
256. Penerapan utama data dari data science pada e-commerce adalah melakukan hal-hal
berikut kecuali :
a. Identifying consumers
b. Prediction potential problem
c. Analyzing reviews
d. Recommending product
258. Sebuah sistem yang berfungsi untuk memonitor serta menganalisa media sosial dan
platform online yang berbasis teknologi big data menggunakan keahlian Artificial
Intelligence dan Natural Learning Process (NLP) adalah
a. Drone emprit
b. Data science
c. Social network analysis
d. Corpus
260. Tujuan Pengunaan robot dan IOT untuk suatu even sebagai salah satu Revolusi
Industri 4.0 dan Pariwisata adalah
a. Mengurangi user
b. Efesiensi biaya operasi
c. Berbagi pengalaman baru
d. Personalisasi pengalaman wisatawan