Anda di halaman 1dari 56

M1

1. Persentase proses terbesar sebanyak 60% pada Data Scientist adalah pada proses :
a. Building and training test
b. Cleaning and Organizing Data
c. Collecting data sets
d. Refining Algorithm

2. Penerapan utama data dari data science pada e-commerce adalah melakukan hal-hal
berikut kecuali :
a. Prediction potential problem
b. Recommending Product
c. Identifying Consumers
d. Analyzing Reviews

3. Peran/deskripsi tugas dari Scientific database operator (D3 – S1) adalah :


a. Manages daily operation of facilities and resources and responds to customer
requests.
b. Manages daily operation of cloud storage, including related to data life cycle, and
responds to requests from storage users
c. Designs and implements or monitors and maintains large-scale cloud databases
d. Manages daily operation of scientific databases, including related to data life cycle,
and responds to requests from database users.

4. Siklus Hidup Sains Data pada Data Preparation adalah melakukan :


a. Searching for different sources of data and capturing structured and unstructured
data
b. Converting data into a common format
c. Gathering information and deriving outcomes based on business requirements
d. Using variables and equations to establish relationship

5. Profil Profesional Sains Data tergolong keluarga pekerjaan (okupasi) terkait data.
Pekerjaan baru yang diusulkan ditemaptkan dalam empat kelompok klasifikasi teratas
adalah manager, professional madya dan kerja pendukung klerikal. Yang termasuk
professional adalah :
a. kurator dan pengurus (stewards) data
b. CEO
c. Operator dan Teknisi
d. Pengembang aplikasi dan insinyur/perekaya infrastuktur

6. Komponen-kompone dari Sains data pada DOMAIN KNOWLEDGE adalah, kecuali :


a. Highlight important criteria
b. Easier Explanation of technical concept
c. Designing Methods
d. Client Requirement
7. Teknik pada Machine Learning adalah, kecuali :
a. Improvenetal Learning
b. Reinforcement Learning
c. Supervised Learning
d. UnSupervised Learning

8. Penerapan utama data dari data science pada banking adalah melakukan hal-hal berikut
:
a. Drug Discovery, Bioinfomatics, Maintenance Schedulling
b. Customer Segmentation, identifying
c. Monitoring System, Maintenance System
d. Self Driving Car, Car Monitoring System, Enhanced driving Experience, Enhanced
the safety of Passenger

9. Beda Data Scientist dan Data Analyst adalah bahwa Data Analyst memiliki “has
problem solving skills, knowledge of basic statistic”. Hal tersebut ada pada fitur :
a. Skill
b. Type of Data
c. Background
d. Scope

10. Siklus Hidup Sains Data pada Data Discovery adalah melakukan :
a. Searching for different sources of data and capturing structured and unstructured
data
b. Gathering information and deriving outcomes based on business requirements
c. Converting data into a common format
d. Using variables and equations to establish relationship

11. Peran/deskripsi tugas dari Business Analyst (S1) adalah :


a. Design and maintains the architecture of data science applications and facilities
b. Analyses a large variety of data information system for improving business
performance.
c. Analyses a large variety of data to extract information about system, service or
organization performance and presents them in usable/actionable form.
d. Design/develops/codes large data analytics applications

12. Dalam membangun Tim Sains Data, personil yang dibutuhkan pada tahap data analysis
adalah, kecuali :
a. Data Analyst/Business Analyst
b. Researcher
c. Data Scientist
d. Data Science Application Developer
13. Task seorang Data Scientist adalah :
a. Interpret and Manage data and solve complex problems using expertise in a variety
of data niches
b. Develop and initiate innovative statistical technique, issues and protocols
c. Analyst data with specific statistical software and developing theory of statistics
d. To provide new insights into business and create solutions that enable enhanced
business performances

14. Alur proses Sains Data adalah :


a. Get Data - Explore – Model Data – Stimulate Results – Visualize Result – Use
Result in business
b. Get Data – model Data – Explore - Visualize Result - Stimulate Results - Use Result
in business
c. Get Data - Explore – Model Data – Visualize Result – Stimulate Results - Use
Result in business
d. Get Data - Explore – Visualize Result – Model Data – Stimulate Results - Use
Result in business

15. Penerapan utama data dari data science pada banking adalah melakukan hal-hal berikut
kecuali :
a. DROP
b. Fraud Detection
c. REVOKE
d. Virtual Assitants

16. Sains data adalah multi disiplin dari:


a. Application web, Application desktop
b. Datawarehouse, Datamining
c. Statistical Model, Statistical Computing
d. Hardware, Software

17. Responsibilities seorang Data Scientist adalah :


a. Analyst data with specific statistical software and developing theory of statistics
b. Interpret and Manage data and solve complex problems using expertise in a variety
of data niches
c. Develop and initiate innovative statistical technique, issues and protocols
d. To provide new insights into business and create solutions that enable enhanced
business performances

18. Siklus Hidup Sains Data pada Mathematical Models adalah melakukan :
a. Converting data into a common format
b. Gathering information and deriving outcomes based on business requirements
c. Searching for different sources of data and capturing structured and unstructured
data
d. Using variables and equations to establish relationship

19. Definisi Data Science dari NIST (2018) :


a. Data science combines the scientific method, math and statistics
b. Data science is an inter-disciplinary field that uses scientific methods,
processes,algorithms … in managing a digital data collection
c. Data science is the field of study that combines domain expertise, programming
skills, and knowledge of mathematics and statistics to extract meaningful insights
from data
d. Data science is the extraction of useful knowledge directly from data through a
process of discovery, or of hypothesis formulation and hypothesis testing

20. Siklus Hidup Sains Data pada Getting things in action adalah melakukan :
a. Converting data into a common format
b. Gathering information and deriving outcomes based on business requirements
c. Using variables and equations to establish relationship
d. Searching for different sources of data and capturing structured and unstructured
data

M2
21. Apa kepanjangan CEP :
a. Campaign Event Processing
b. Collaboration Event Processing
c. Complex Event Processing
d. Communication Event Processing

22. Berikut kepanjangan dari ETL :


a. Example, Transformation, Load
b. Extraction, Transformation, Load
c. Extraction, Transaction, Load
d. Extraction, Transformation, Listen

23. Berikut tahapan layer pada proses ETL :


a. Row Layer, Gold Layer, Business Layer
b. Row Layer, Business Layer, Gold Layer
c. Record Layer, Row Layer, Gold Layer
d. Business Layer, Row Layer, Gold Layer

24. Berikut urutan yang tepat dalam proses dashboard development :


a. UAT and Deployment, Detailed Requirement Gathering, Design, Development
b. Design, Detailed Requirement Gathering, Development, UAT and Deployment
c. Development, Detailed Requirement Gathering, Design, UAT and Deployment
d. Detailed Requirement Gathering, Design, Development, UAT and Deployment
25. Berikut yang merupakan query access :
a. Postgresql dan Hive
b. HDFS dan Hive
c. Hbase dan Postgresql
d. Hive dan Phoenix

26. Berikut tool yang tepat digunakan sebagai api gateway :


a. Hive
b. Kafka
c. Spark
d. Kong

27. Terdapat 3 komponen utama dalam memproses CEP :


a. Rule
b. Data Layer
c. Event
d. Dataset

28. Pada proses realtime ingestion, tools yang digunakan sebagai message broker dalam
hal ini adalah :
a. Krakend
b. Airflow
c. Zeppelin
d. Kafka

29. Tools yang berfungsi sebagai tempat visualisasi dashboard dari hasil ETL :
a. Hive
b. Superset
c. Kong
d. Zeppelin

30. Dalam proses Detail Requirement Gathering terdapat prose :


a. Data Source Identification
b. UAT dengan customer
c. Deployment dan operation monitoring
d. ETL Development

31. Deployment dan operation monitoring terdapat pada tahap … pada proses
development:
a. Detailed Requirement Gathering
b. Development
c. Deployment
d. Design
32. Campaign dapat dikirim melalui berbagai channel seperti berikut, kecuali :
a. Notifikasi Apps
b. Ditelphone
c. SMS
d. Email

33. Apa saja poin penting dalam big data, kecuali :


a. Volume
b. Variety
c. Velocity
d. Vacility

34. Yang bukan termasuk proses dalam tahap development adalah :


a. Dashboard Development
b. System Integration Test (SIT)
c. Data Source Identification
d. ETL Development

35. Dalam proses Cep, Debezium berfungsi sebagai :


a. Tempat penyimpanan setiap event yang masuk
b. Melakukan evaluasi setiap event terhadap rule yang tersedia
c. Mengirim campaign yang telah dievaluasi kepada customer
d. Change Data Capture, atau membaca setiap perubahan yang terjadi pada database

36. Berikut contoh penggunaan database pada lingkungan big data, kecuali :
a. Postgresql
b. Exel
c. Hdfs
d. Druid

37. Dalam hal evaluasi CEP, tools yang dapat bertindak sebagai API gateway adalah :
a. Hbase
b. Spark
c. Debezium
d. Kong

38. Tools yang berfungsi sebagai process scheduler :


a. Hive
b. Kafka
c. Kong
d. Airflow

39. CEP merupakan produk campaign marketing yang mengirim campaign secara :
a. Realtime
b. Scheduling
c. Batch
d. Random

40. Prinsip kerja dari CEP dalam mengirim sebuah campaign adalah secara :
a. Batch dan general
b. Batch dan personalize
c. Realtime dan personalize
d. Random dan general

M3
41. Untuk pengujian model pada Pengujian Model Data Mining adalah :
a. Data validation
b. Data training
c. Data estimation
d. Data testing

42. Beberapa definisi data mining adalah, kecuali :


a. Extraction of interesting (non-trivial, implicit, previously unknown and potentially
useful) patterns or knowledge from huge amount of data
b. Searching for different sources of data and capturing structured and unstructured
data
c. Kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan
keteraturan, pola dan hubungan dalam set data berukuran besar
d. Melakukan esktraksi untuk mendapatkan informasi penting yang sifatnya implisit
dan sebelumnya tidak diketahui, dari suatu data

43. Evolusi Science (Evolution of Sciences) sebelum tahun 1600 adalah :


a. Theoretical science
b. Computational science
c. Empirical science
d. Data science

44. Evolusi Science (Evolution of Science) tahun 1950-1990 adalah :


a. Theoretical science
b. Computational science
c. Empirical science
d. Data science

45. Rapidminer adalah :


a. Designs and implements or monitors and maintains large-scale cloud databases
b. Software data mining dan data analytics
c. Manages daily operation of facilities and resources and responds to customer
requests
d. Manages daily operation of cloud storage, including related to data life cycle, and
responds to requests from storage users

46. Evolusi Science (Evolution of Sciences) tahun 1600-1950 adalah :


a. Theoretical science
b. Empirical science
c. Computational science
d. Data science

47. Peran utama data mining adalah sebagai berikut, kecuali :


a. Penentuan
b. Prediksi
c. Estimasi
d. Klastering

48. Linear Regression, Neural Network, Support Vector Machine adalah algoritma pada …
didata mining:
a. Classification
b. Clustering
c. Estimasi
d. Association

49. Pembagian Dataset pada Pengujian Model Data Mining adalah kecuali:
a. Data validation
b. Data estimation
c. Data training
d. Data testing

50. Untuk pembentukan model pada Pengujian Model Data Mining adalah :
a. Data estimation
b. Data training
c. Data validation
d. Data testing

51. Evolusi Science (Evolution of Sciences) tahun 1990 - now adalah :


a. Theoretical science
b. Computational science
c. Empirical science
d. Data science

52. Fakta yang terekam dan tidak membawa arti adalah definisi dari:
a. Informasi
b. Sistem
c. Pengetahuan
d. Data

53. Metode data mining yang menggunakan data dengan label dan tidak berlabel sekaligus
dalam proses pembelajarannya adalah :
a. Unsupervised Learning
b. Supervised Learning
c. Type of Data
d. Semi-Supervised Learning

54. Data cleaning, Data Integration, Data Reduction, Data Transformation adalah proses
… pada Data mining :
a. Data Pre-processing
b. Data Scientist
c. Data Analyst/Business Analyst
d. Data Science Application Developer

55. Pola, rumus, aturan atau model yang muncul dari data adalah definisi dari:
a. Data
b. Informasi
c. Pengetahuan
d. Sistem

56. Definisi Unsupervised Learning adalah, kecuali :


a. Variable (atribut) yang menjadi target/label/class tidak ditentukan (tidak ada)
b. Algoritma data mining mencari pola dari semua variable (atribut)
c. Algoritma clustering adalah algoritma unsupervised learning
d. Sebagian besar algoritma data mining (estimation, prediction/forecasting,
classification) adalah supervised learning

57. FP-growth, A Priori, Coefficient of Correlation, Chi Square adalah algoritma pada …
didata mining :
a. Association
b. Clustering
c. Classification
d. Estimasi

58. Algoritma association rule (aturan asosiasi) adalah algoritma yang menemukan atribut
yang :
a. Bioinformatics
b. Customer Segmentation
c. Muncul Bersamaan
d. Monitoring System
59. Contoh Penerapan Data Mining adalah sebagai berikut, kecuali :
a. Penetuan pasokan listrik PLN untuk wilayah Jakarta
b. Penjadwalan pemeliharaan
c. Analisis pola belanja pelanggan
d. Deteksi serangan (intrusion) pada suatu jaringan

60. Definisi Supervised Learning adalah, kecuali :


a. Variable (atribut) yang menjadi target/label/class tidak ditentukan (tidak ada)
b. Sebagian besar algoritma data mining (estimation, prediction/forecasting,
classification) adalah supervised learning
c. Algoritma melakukan proses belajar berdasarkan nilai dari variabel target yang
terasosiasi dengan nilai dari variable predictor
d. Pembelajaran dengan guru, data set memiliki target/label/class

M4
61. Graf tidak berarah dimana antara dua simpul terhubung oleh hanya satu jalur (tidak
terdapat siklus) adalah:
a. Regular
b. Hutan (Forest)
c. Pohon (Tree)
d. Asiklik (acyclic)

62. Ukuran terkait kekuatan dalam jaringan yang menunjukkan simpul mana yang berperan
dalam sebagai perantara, yaitu seberapa sering sebuah simpul dilalui oleh lintasan
terpendek adalah:
a. Sentralitas Eigenvector
b. Kedekatan sentralitas
c. Derajat sentralitas
d. Sentralitas keantaraan

63. Pseudo Graf adalah:


a. Graf yang tidak memiliki loop sendiri tetapi terdapat ruas yang parallel
b. Graf yang memiliki loop sendiri tetapi tidak ada ruas yang paralel
c. Graf memiliki derajat yang sama
d. Graf terhubung dimana semua simpul berderajat genap

64. Graf yang hanya memiliki 1 simpul adalah:


a. Graf tidak terhubung
b. Graf semu (trivial)
c. Graf hampa
d. Graf terhubung

65. Graf yang tak berarah, tak terhubung atau dengan kata lain kumpulan pohon yang tidak
saling terhubung adalah:
a. Hutan (Forest)
b. Regular
c. Asiklik (acyclic)
d. Pohon (Tree)

66. Algoritma untuk pohon rentang minimum adalah:


a. Semua jawaban salah
b. Algoritma djikstra
c. Algoritma Kruskal
d. Algoritma perjalanan salesman

67. Graf yang memiliki simpul tetapi tidak memilik ruas disebut:
a. Graf terhubung
b. Graf tidak terhubung
c. Graf hampa
d. Graf semu (trivial)

68. Istilah lain untuk simpul pada graf adalah:


a. Edge
b. Lintasan
c. Ruas
d. Vertex

69. Panjang Lintasan (Path) adalah:


a. Himpunan Simpul
b. Jumlah ruas yang terhubung pada simpul tersebut
c. Penghubung antar simpul
d. Jumlah lintasan dari satu simpul ke simpul lain

70. Graf dimana terdapat siklus dari sebuah simpul yang mengunjungi setiap simpul dalam
graf tepat satu kali disebut dengan:
a. Graf Hamilton
b. Graf Euler
c. Graf bipartite
d. Graf plannar

71. Apakah yang dimaksud dengan Derajat pada graf:


a. Himpunan Simpul
b. Jumlah lintasan dari satu simpul ke simpul lain
c. Jumlah ruas yang terhubung pada simpul tersebut
d. Penghubung antar simpul

72. Ukuran terkait kekuatan dalam jaringan yang menunjukkan seberapa penting
orang/pihak lain yang mempunyai jaringan dengan actor (simpul) adalah:
a. Kedekatan sentralitas
b. Sentralitas keantaraan
c. Sentralitas Eigenvector
d. Derajat sentralitas

73. Jenis Graf apakah yang antara setiap pasang simpul terdapat minimum satu jalur:
a. Graf semu (trivial)
b. Graf hampa
c. Graf tidak terhubung
d. Graf terhubung

74. Apakah yang dimaksud dengan Ruas Paralel dalam graf:


a. Jika terdapat lebih dari satu ruas antara dua simpul yang bersebelahan
b. Sebuah ruas dari dan ke satu simpul
c. Sebuah Graf dengan jumlah simpul dan ruas yang berhingga
d. Graf memiliki derajat yang sama

75. Graf yang dapat dibentuk pada sebuah bidang sedemikian sehingga tidak terdapat dua
ruas yang saling bersilangan adalah:
a. Graf bipartite
b. Graf Hamilton
c. Graf Euler
d. Graf plannar

76. Ruas adalah :


a. Himpunan Simpul
b. Jumlah lintasan dari satu simpul ke simpul lain
c. Jumlah yang terhubung pada simpul tersebut
d. Penghubung antar simpul

77. Multi Graf adalah:


a. Graf memiliki derajat yang sama
b. Graf yang memiliki loop sendiri tetapi tidak ada ruas yang paralel
c. Graf yang tidak memiliki loop sendiri tetapi terdapat ruas yang paralel
d. Graf terhubung dimana semua simpul berderajat genap

78. Himpunan ruas yang dapat membagi graf G menjadi dua sub-graf S dan T disebut
dengan:
a. cyclic (siklik)
b. Himpunan pemotong (cut set)
c. Lintasa
d. Derajat
79. Siapakah ilmuwan penemu Teori Graf :
a. Blaise Pascal
b. Leonhard Euler
c. Bill Gates
d. Dennis Ritchie

80. Jenis Graf apakah dimana terdapat dua simpul yang tidak memiliki jalur yang
menghubungkan ke dua simpul tersebut:
a. Graf semu (trivial)
b. Graf terhubung
c. Graf tidak terhubung
d. Graf hampa

M5
81. Tahapan Feature Extraction pada NLP adalah:
a. Vector Space Model
b. Text Similarity
c. Tokenization
d. Sequential Labeling

82. Disebut apakah jenis ambiguitas dari satu kata:


a. Ambiguitas Semantik
b. Ambiguitas Leksikal
c. Ambiguitas Anaforis
d. Ambiguitas Sintaksis

83. Pernyataan berikut ini adalah keuntungan dari NLP:


a. Sistem NLP terkadang tidak memiliki antarmuka pengguna
b. Akurasi jawaban meningkat dengan jumlah informasi relevan yang diberikan dalam
pertanyaan
c. Tidak dapat beradaptasi dengan domain dan masalah baru karena fungsinya yang
terbatas
d. Bahasa Query Kompleks

84. Masalah yang terdapat pada disiplin Psikolinguis adalah:


a. Bagaimana frase dan kalimat dapat dibentuk dengan kata-kata?
b. Bagaimana manusia dapat mengidentifikasi struktur kalimat?
c. Bagaimana kata dan kalimat mendapatkan maknanya?
d. Bagaimana pengetahuan dan penalaran dapat dimodelkan?

85. Mobil menabrak tiang saat sedang melaju adalah contoh dari ambiguitas:
a. Ambiguitas Leksikal
b. Ambiguitas Sintaksis
c. Ambiguitas Semantik
d. Ambiguitas Anaforis

86. Berikut ini tekhnik pemrosesan bahasa alami umum yang merupakan Grammar
Correction adalah:
a. Meringkas informasi penting dari suatu sumber untuk menghasilkan versi yang
dipersingkat
b. Google, Yahoo, Bing
c. Ketik kata kunci untuk mengajukan pertanyaan
d. Koreksi ejaan dan tata Bahasa

87. Startup NLP di Indonesia yang menjadikan conversational AI dengan chatbot sebagai
produk utama mereka adalah...
a. Kata.ai dan Bahasa.ai
b. Prosa.ai dan Bahasa.ai
c. Prosa.ai
d. Prosa.ai dan Kata.ai

88. Berikut ini adalah contoh dari pengkategorian teks kecuali:


a. Translation
b. Essay Scoring
c. Sentiment Analysis
d. Spam Filtering

89. Berikut ini yang bukan domain Computational Linguistics adalah:


a. Bagaimana mempelajari Bahasa
b. Bagaimana memahami Bahasa
c. Bagaimana menghasilkan Bahasa
d. Menyelesaikan practical problem yang melibatkan Bahasa manusia

90. Dasar pemrosesan teks dari berbagai NPL task adalah sebagai berikut, kecuali:
a. Pengektraksian Informasi
b. Tokenisasi
c. Mengkategorisasi teks
d. Mengklasifikasi teks

91. Startup NLP di Indonesia yang menyediakan layanan text berupa Prosa Text API
adalah:
a. Kata.ai
b. Veronica
c. Bahasa.ai
d. Prosa.ai

92. Sistem penulisan apakah dimana simbol individu mewakili suku kata:
a. Silabis
b. Abjad
c. Grafik
d. Logografik

93. Masalah yang terdapat pada disiplin Ahli bahasa adalah:


a. Bagaimana manusia dapat mengidentifikasi struktur kalimat?
b. Bagaimana kata dan kalimat mendapatkan maknanya?
c. Bagaimana frase dan kalimat dapat dibentuk dengan kata-kata?
d. Bagaimana pengetahuan dan penalaran dapat dimodelkan?

94. Pernyataan berikut ini adalah kerugian dari NLP:


a. Sistem ini dibangun untuk satu tugas dan spesifik saja
b. Sistem NLP memberikan jawaban atas pertanyaan dalam bahasa alami
c. Sistem NLP menawarkan jawaban yang tepat untuk pertanyaan, tidak ada informasi
yang tidak perlu atau tidak diinginkan
d. Pengguna dapat mengajukan pertanyaan tentang subjek apa pun dan mendapatkan
tanggapan langsung dalam hitungan detik

95. Perbedaan utama antara Bahasa Alami dan Bahasa Komputer dengan parameter
Literalness adalah:
a. Bahasa alami terbuat dari idiom dan metafora, sedangkan Bahasa Komputer
merupakan bahasa formal memiliki arti yang persis seperti yang ingin mereka
katakana
b. Bahasa Alami bersifat ambigu, sedangkan bahasa komputer dirancang untuk tidak
ambigu
c. Bahasa Alami menggunakan banyak redundansi, sedangkan Bahasa Komputer
adalah Bahasa formal tidak terlalu berlebihan
d. Tidak ada jawaban yang tepat

96. Pemrosesan Bahasa Alami (NLP)menurut Goldberg adalah:


a. Bidang perancangan metode dan algoritma yang mengambil sebagai masukan atau
menghasilan sebagai keluaran, data bahasa alami tidak terstruktur
b. Metode untuk menyelesaikan prac- tical problem yang melibatkan Bahasa manusia
c. Desain dan analisis algoritma komputasi dan representasi untuk memproses bahasa
alami manusia
d. Bidang yang mempelajari metode, algoritma, representasi yang memproses input
ataupun output yang berupa Bahasa alami, baik berupa teks maupun suara

97. Tahapan NLP apakah dimana tujuan dari tahap ini adalah untuk memecah potongan
input bahasa menjadi kumpulan token yang sesuai dengan paragraf, kalimat, dan kata:
a. Analisis sintaks
b. Analisis pragmatis
c. Pengolahan morfologi
d. Analisis semantic
98. Fase NLP yang merupakan fase akhir tahun 1960-an hingga akhir 1970-an dicirikan
dengan:
a. Pekerjaan yang dilakukan dalam fase ini difokuskan terutama pada Mesin
Penerjemah
b. Mendapat beberapa sumber daya & alat praktis seperti parser, misalnya Alvey
Natural Language Tools bersama dengan sistem yang lebih operasional dan
komersial, misalnya untuk kueri database.
c. Pekerjaan yang dilakukan sebagian besar terkait dengan pengetahuan dunia dan
perannya dalam konstruksi dan manipulasi representasi makna.
d. Pendekatan leksikalisasi tata bahasa dan menjadi pengaruh yang meningkat

99. Sub-bidang Ilmu Komputer khususnya Artificial Intelligence (AI) yang berkepentingan
untuk memungkinkan komputer memahami dan memproses bahasa manusia, adalah:
a. Natural Languange Processing (NLP)
b. Computer Vision
c. Expert System
d. Image Processing

100.Tahapan Preposesing pada NLP adalah:


a. Text Similarity
b. Tokenization
c. Vector Space Model
d. Sequential Labeling

M6
101. Struktur matematika paling dasar dari suatu grafik adalah :
a. Banyaknya Set V
b. Satu set V yang terhubung melalui garis E
c. Banyaknya garis E
d. Banyaknya Network

102. Riset tentang network analisis ditemukan pada bidang ilmu :


a. Data science
b. Computational science
c. Theoretical science
d. Educational psychology

103. Menurut Halgin & DeJordy, 2008 “If your research question is about different patterns
of interaction within defined groups” adalah :
a. Sociocentric
b. Egocentric
c. Anthropologie
d. Physiocentric
104. Gephi adalah software social network analysis, kecuali :
a. Free
b. Open Source
c. Berbayar
d. Interactive visualization and exploration

105. Keuntungan dari social network analysis adalah:


a. Berfokus pada node
b. Berfokus pada jaringan
c. Berfokus pada edge
d. Berfokus pada interaksi

106. Closeness Centrality adalah :


a. Ukuran sentralitas suatu node dalam suatu jaringan berdasarkan jumlah jalur
terdekat yang melewatinya.
b. Ukuran sentralitas suatu node yang dihitung berdasarkan rerata jarak terdekat
antar node
c. Ukuran sentralitas suatu node dalam sebuah jaringan yang diukur dari jumlah
garis penghubung (edge) yang menyambung beberapa node
d. Ukuran terbentuknya jaringan pada grafik

107. Software Social Network Analysis adalah :


a. Twitter
b. RapidMiner
c. NodeXL dan Gephi
d. Linux dan Windows

108. Beberapa disiplin ilmu dari Social Network Analysis adalah, kecuali :
a. Graf network
b. Transportation network
c. Social network
d. Electrical network

109. Tipe dari social network analysis yang “Whole network”


a. Egocentric
b. Anthropologie
c. Physiocentric
d. Sociocentric

110. Sejarah network analysis pada tahun … New York Times reported on the new science
of “psychological geography” :
a. 1950
b. 1960
c. 1933
d. 1930
111. Social Network Analysis adalah :
a. Studi sociometri
b. Sebuah studi yang mempelajari tentang hubungan manusia dengan
memanfaatkan teori graf
c. Metode yang menghubungkan antar node
d. Peta yang terdiri atas banyak orang dimana di dalamnya terdapat relasi antar
individunya

112. Menurut Halgin & DeJordy, 2008 “If your research question is about phenomena of
or affecting individual entities across different settings” adalah :
a. Egocentric
b. Sociocentric
c. Anthropologie
d. Physiocentric

113. Betweenness Centrality adalah :


a. Ukuran sentralitas suatu node dalam sebuah jaringan yang diukur dari jumlah
garis penghubung (edge) yang menyambung beberapa node
b. Ukuran terbentuknya jaringan pada grafik
c. Ukuran sentralitas suatu node yang dihitung berdasarkan rerata jarak terdekat
antar node
d. Ukuran sentralitas suatu node dalam suatu jaringan berdasarkan jumlah jalur
terdekat yang melewatinya.

114. Network analysis dibangun dari :


a. Sociology
b. Political
c. Communication
d. Economy

115. Edge adalah :


a. Koneksi antara banyak node
b. Koneksi antara lebih dari dua buah node
c. Koneksi antara dua buah jaringan
d. Koneksi antara dua buah node

116. Tipe dari social network analysis yang “Creates many stand alone network”:
a. Anthropologie
b. Physiocentric
c. Egocentric
d. Sociocentric

117. Tipe dari social network analysis yang “Creates one network”:
a. Anthropologie
b. Sociocentric
c. Egocentric
d. Physiocentric

118. NodeXL adalah software social network analysis yang, kecuali


a. Menggunakan template excel
b. Open source
c. Menggunakan template word
d. Free

119. Degree Centrality adalah :


a. Ukuran terbentuknya jaringan pada grafik
b. Ukuran sentralitas suatu node dalam suatu jaringan berdasarkan jumlah jalur
terdekat yang melewatinya
c. Ukuran sentralitas suatu node dalam sebuah jaringan yang diukur dari jumlah
garis penghubung (edge) yang menyambung beberapa node
d. Ukuran sentralitas suatu node yang dihitung berdasarkan rerata jarak terdekat
antar node

120. Tipe dari social network analysis yang “Personal network”:


a. Egocentric
b. Sociocentric
c. Physiocentric
d. Anthropologie

M8
121.is a form of qualitative analysis that is concerned with more than just statistics
and numerical values.
a. Analysis
b. Analysis
c. Analysis
d. Text analysis

122.focuses on the process of turning raw data into useful statistics, information, and
explanations.
a. Information System
b. Information
c. Data
d. Data analysis

123. Text analysis tools can sort text by :


a. Read for information
b. Topic
c. Extract information
d. Extract data

124. Sentiment = feelings, kecuali :


a. Emotions
b. Soul
c. Opinions
d. Attitudes

125.recognizing opinion – oriented questions.


a. Information extraction
b. Question answering
c. Bias identifications
d. Summarization

126.A powerful analytics and data visualization perform. Connect all your data and
create interactive dashboards that update in real-timey.
a. R
b. Tableau
c. Phyton
d. rapidMiner

127.discarding subjective information.


a. Question answering
b. Bias identification
c. Summarization
d. Information extraction

128. Application from SA have been useful in other areas, kecuali :


a. Entertainment
b. Law/policy making
c. Politics/political science
d. Sociology

129. Traditional bullying was limited to …. :


a. Floral
b. Schools and youth crowds
c. Animal
d. Staff

130. ….. for data analytics teams that want to tackle challenge tasks and handle large
amounts of data.
a. Microsoft Excel
b. RapidMiner
c. KNIME
d. Phyton

131. Process of cleaning, analyzing, interpreting, and visualizing data to discover valuable
insights that drive smarter and more effectives business decisions is ….. :
a. Data
b. Data analysis
c. Information
d. Information system

132.bullying with the use of digital technology.


a. Cyberbullying
b. Electronicbully
c. Bullying
d. Ebully

133.filter, organize, and visualize quantitative data. The perfect tool for performing
simple data analysis. Explore common functions and formulas for data analysis.
a. KNIME
b. Microsoft Excel
c. Phyton
d. RapidMiner

134. ….. the preferred programming language for machine learning. Use it to build data
analysis solutions for various use cases.
a. Microsoft Excel
b. KNIME
c. RapidMiner
d. Phyton

135. ….. open-source platform for building advanced machine learning solutions, and
visualizing data. :
a. Microsoft Excel
b. Phyton
c. KNIME
d. RapidMiner

136.accounting for multiple viewpoints.


a. Information extraction
b. Question answering
c. Bias identification
d. Summarization
137.used to analyze data and sort it as positive, negative, or neutral to gain in-depth
knowledge about how customers feel towards each aspect.
a. Data analysis
b. System analysis
c. Sentiment analysis
d. Information analysis

138. Sentiment analysis, also called :


a. Opinion Mining
b. Appraisals
c. Sentiment Mining
d. Opinion Data

139. Some sentiment analysis jargon :


a. Collaboration
b. Analysis
c. Semantic orientation
d. Collection

140. Contoh pertanyaan pada sentiment analysis:


a. Is this product review positive or negative?
b. How to produce product ?
c. How many node in graph?
d. Is far or close ?

M9
141. Berikut ini merupakan toolkit data mining bersifat open source yang dapat digunakan
untuk visualisasi data, machine learning serta memiliki pemrograman visual untuk
analisis data kualitatif yang cepat, eksploratif dan interaktif:
a. Hive
b. Kafka
c. Orange
d. Nifi

142. Program database apakah yang digunakan untuk data & statistic pada knowledge
explorer Indonesia OneSearch (IOS)?
a. API
b. MySQL
c. Apache SOLR
d. MongoDB

143. Text information, segmentation and tokenization, text cleaning, vectorization and
feature engineering, text lemmatization and stemming, machine learning algorithms,
dan result interpretation adalah tahapan dari
a. NLP pipeline
b. Phyton
c. Setiment analysis
d. Big data analysis

144. Big data dapat membantu melakukan predictive maintenance & quality pada industri
a. Automotive
b. Education
c. Banking
d. Agriculuture

145. Sebuah sistem yang berfungsi untuk memonitor serta menganalisa media sosial dan
platform online yang berbasis teknologi big data menggunakan keahlian artificial
intelligence dan natural learning process (NPL) adalah
a. Drone emprit
b. Corpus
c. Data science
d. Social network analysis

146. Bidang yang terkait dengan studi, desain dan pengembangan Teknik untuk
mengesktrak unit leksikal dari teks dan pemfilteran unit leksikal melalui beberapa
skema penilaian dan peringkat, yang digunakan untuk identifikasi istilah disebut
a. Named Entity Recognition (NER)
b. Syntax Analysis (S-P-O)
c. Automatic Term Recognition (ATR)
d. Part-Of-Speech (POS) Tagging

147. Pada grafik perkembangan data dari tahun 2010 hingga 2020, data terbanyak
bersumber dari area berikut kecuali
a. Social media
b. Sensors & Devices
c. Enterprise Data
d. Exabytes Volume

148. Berikut ini adalah sumber data yang digunakan pada knowledge explorer Indonesia
onesearch (IOS), kecuali:
a. Berita online
b. iTunes
c. Blog
d. Jurnal

149. Ilustrasi hubungan subyek dan obyek yang saling berhubungan melalui predikat dapat
dilihat menggunakan
a. Tree-map
b. Directed graph
c. Undirected graph
d. Co-occurance

150. Berikut ini adalah 3 kriteria big data sederhana


a. Visibility, value, velocity
b. Volume, veracity, variety
c. Visibility, variety, veracity
d. Volume, velocity, variety

151. NLP digunakan dalam hal-hal berikut kecuali:


a. Trends Analysis
b. Sentiment Analysis
c. Quote extraction
d. Text-to-speech extraction

152. Sebagian besar data yang semakin bertambah berupa


a. Balanced data
b. Unstructured data
c. Enterprise data
d. Structured data

153. Berikut adalah manfaat Co-occurance kecuali


a. Menunjukkan actor yang ada dalam paragraph yang sama
b. Menampilkan actor penting yang sering muncul bersamaan
c. Identifikasi jenis korelasi antar pelaku dan istilah
d. Indikasi adanya korelasi antar pelaku dan istilah

154. SparkNLP dapat melakukan hal berikut kecuali


a. Stemming
b. Actor recognition
c. Sentiment detector
d. Tokenization

155. Proses NLP yang mengacu pada pengategorian kata-kata dalam teks (korpus)
tergantung pada definisi kata dan konteksnya disebut sebagai
a. Named Entity Recognition (NER)
b. Syntax Analysis (S-P-O)
c. Automatic Term Recognition (ATR)
d. Part-Of-Speech (POS) Tagging

156. NLP pada sistem factminer mendapatkan masukkan dari hal berikut, kecuali
a. Laporan internal
b. Dokumen
c. Berita online
d. Semantic search engine

157. Text mining language yang paling popular adalah


a. HTML dan KNIME
b. Phyton dan NLP
c. Phyton dan R
d. NLP dan Java

158. Selain tokoh dan organisasi, dalam suatu berita FactMiner dapat mengekstrak data
berikut kecuali
a. Peristiwa
b. Komentar
c. Waktu
d. Lokasi

159. Suatu Teknik yang secara otomatis mengidentifikasi entitas tertentu dalam teks dan
mengklasifikasikannya ke dalam kategori yang telah ditentukan sebelumnya disebut
a. Named Entity Recognition (NER)
b. Part-Of-Speech (POS) Tagging
c. Automatic Term Recognition (ATR)
d. Syntax Analysis (S-P-O)

160. Sebuah tree-map dapat digunakan mengidentfikasi untuk hal berikut kecuali:
a. Hubungan antar subjek
b. Aktifitas terkait dengan actor
c. Obyek atau entitas terkait aktivitas subyek
d. Aktor perorangan, organisasi, konsep (subyek)

M10
161. Definisi kampanye menurut rogers dan storey adalah:
a. Penggunaan berbagai metode komunikasi yang berbeda secara terkoordinasi
dalam jangka waktu tertentu yang ditujukan untuk mengarahkan khalayak pada
masalah tertentu dan solusinya
b. Penciptaan Kembali dan pemindahan simbol-simbol penting secara terus
menerus melalui komunikasi
c. Serangkaian Tindakan komunikasi yang direncanakan dengan tujuan
menciptakan efek tertentu pada sejumlah besar khalayak yang dilakukan secara
berkelanjutan selama periode waktu tertentu
d. Proses rangkaian komunikasi politik antara kontestan politik dan pemilih

162. Elemen dibawah ini tidak diperhitungkan dalam metrik GRP sosial:
a. Effective reach
b. Relevant
c. Audience relevance
d. Sentiment

163. Model prediktif kampanye politik menghasilkan tiga kategori “skor prediktif”, kecuali
a. Skor elektabilitas
b. Skor respons
c. Skor dukungan
d. Skor perilaku

164. Pembersihan data ini dimulai dari awal saat data pertama kali diambil dan melibatkan
semua anggota tim yang menyentuh data titik mana pun, merupakan tahapan dalam:
a. Data hygienists
b. Data explorers
c. Business solution architects
d. Data scientists

165. Berikut ini bukan termasuk dalam faktor yang mempengaruhi kampanye politik:
a. Kebijakan politik panitia pemilihan
b. Perkembangan teknologi
c. Perkembangan media cetak
d. Kemunduran partai politik

166. Berikut adalah pernyataan yang tidak benar mengenai heatmap:


a. Heatmap dapat digunakan menilai kekuatan dan kelemahannya dalam
menggunakan big data di semua area fungsional
b. Heatmap adalah Teknik visuaalisasi data yang menunjukkan besarnya suatu
fenomena sebagai warna dalam dua dimensi
c. Heatmap membantu perusahaan mengidentifikasi dan memprioritaskan peluang
untuk investasi
d. Heatmap memberikan panduan harga pada tingkat transaksi individual

167. GRP (Gross Rating Point) sosial media digital dibagi menjadi tiga.
a. Data hygienists, data explorers, business solution architects
b. Skor perilaku, skor dukungan, skor respons
c. Milik anda (misalnya situs web anda), berbayar (iklan spanduk yang anda beli
di situs lain), diperoleh (posting atau komentar orang melalui blog atau tweet)
d. Effective reach, audience relevance, sentiment

168. Otomatisasi dilakukan untuk mengubah data menjadi laba, apakah yang dilakukan
pada otomatisasi ini:
a. Membuat replikasi dan perubahan analisis lebih mudah sehingga tidak perlu
selalu memulai dari awal
b. Mengungkapkan apa yang mendorong harga untuk setiap segmen pelanggan
dan produk
c. Mengembangkan seperangkat komunikasi yang jelas untuk memberikan alasan
harga untuk menonjolkan nilai dan menyesuaikan argumen tersebut dengan
pelanggan
d. Mendukung tenaga penjualan dengan target yang bermanfaat

169. Peran data hygienists adalah:


a. Mengambil data terorganisir dan membuat model analitik canggih
b. Mengumpulkan data yang ditemukan dan mengaturnya sehingga siap untuk
dianalisis
c. Memastikan bahwa data yang masuk ke sistem bersih dan akurat, dan tetap
seperti itu selama siklus hidup data
d. Menyaring kumpulan data untuk menemukan data yang sebenarnya dibutuhkan

170. Berikut ini adalah keefektifan dari customer lifecycle managemen, kecuali:
a. Dapatkan pelanggan baru
b. Kembangkan pelanggan yang sudah ada
c. Pertahankan pelanggan yang sudah ada dan menangkan Kembali pelanggan
lama
d. Mengubah model menjadi hasil

171. Skor prediktif yang memprediksi bagaimana warga akan menanggapi penjangkauan
kampanye adalah:
a. Skor perilaku
b. Skor dukungan
c. Skor elektabilitas
d. Skor respons

172. Memprediksi perilaku pelanggan dan memungkinkan segmentasi pelanggan tingkat


lanjut dan pengoptimalan harga adalah tahapan dalam:
a. Data explorers
b. Data scientists
c. Business solution architects
d. Data hygienists

173. Peran data scientist adalah:


a. Memastikan bahwa data yang masuk ke sistem bersih dan akurat, dan tetap
seperti itu selama siklus hidup data
b. Menyaring kumpulan data untuk menemukan data yang sebenarnya dibutuhkan
c. Mengambil data terorganisir dan membuat model analitik canggih
d. Mengumpulkan data yang ditemukan dan mengaturnya sehingga siap untuk
dianalisis
174. Peran business solution architects adalah:
a. Mengumpulkan data yang ditemukan dan mengaturnya sehingga siap untuk
dianalisis
b. Mengambil data terorganisir dan membuat model analitik canggih
c. Menyaring kumpulan data untuk menemukan data yang sebenarnya dibutuhkan
d. Memastikan bahwa data yang masuk ke sistem bersih dan akurat, dan tetap
seperti itu selama siklus hidup data

175. Peran data explorers adalah:


a. Menyaring kumpulan data untuk menemukan data yang sebenarnya dibutuhkan
b. Memastikan bahwa data yang masuk ke sistem bersih dan akurat, dan tetap
seperti itu selama siklus hidup data
c. Mengubah model menjadi hasil
d. Mengumpulkan data yang ditemukan dan mengaturnya sehingga siap untuk
dianalisis

176. Skor prediktif yang memprediksi preferensi politik warga adalah:


a. Skor dukungan
b. Skor respons
c. Skor elektibilitas
d. Skor perilaku

177. Menyusun data untuk memastikannya dapat ditanyakan secara berguna dalam
kerangka waktu yang sesuai oleh semua pengguna adalah tahapan dalam:
a. Data hygienists
b. Data scientists
c. Data explorers
d. Business solution architects

178. Skor prediktif yang menggunakan perilaku masa lalu dan informasi demografis untuk
menghitung probabilitas eksplisit bahwa warga negara akan terlibat dalam bentuk
aktivitas politik tertentu adalah:
a. Skor perilaku
b. Skor elektibilitas
c. Skor dukungan
d. Skor respons

179. Peran campaign experts adalah:


a. Mengumpulkan data yang ditemukan dan mengaturnya sehingga siap untuk
dianalisis
b. Menyaring kumpulan data untuk menemukan data yang sebenarnya dibutuhkan
c. Mengubah model menjadi hasil
d. Memastikan bahwa data yang masuk ke sistem bersih dan akurat, dan tetap
seperti itu selama siklus hidup data
180. Apakah quality function deployment (QFD) itu:
a. Pola dalam analisis menunjukkan peluang untuk penetapan harga yang berbeda
pada tiap tingkat produk per pelanggan berdasarkan kesediaan untuk membayar
b. Teknik visualisasi data yang menunjukkan besarnya suatu fenomena sebagai
warna dalam dua dimensi
c. Teknik dari desain produk yang menerjemahkan kebutuhan pelanggan ke dalam
rekayasa karakteristik
d. Teknik untuk mengatasi kesenjangan komunikasi antara anggota fungsional
yang berbeda dalam suatu tim

M11
181. Analisa yang berdasarkan pada data-data mengenai harga historis yang terjadi pada
pasar saham, disebut:
a. Analisis fundamental
b. Analisis kredit
c. Analisis keranjang pasar
d. Analisis teknikal

182. Praktik illegal dalam dunia investasi, di mana seorang investor mendapat informasi
yang pasti perihal peluang keuntungan dalam transaksi jual beli saham. Kepastian
informasi tersebut tentu bersumber dari orang dalam di perusahaan terkait, disebut :
a. Bribery
b. Insiden trading
c. Money laundring
d. Sanction breaches

183. Data warehouse DJP dapat berupa data-data, kecuali


a. Direct tax
b. Data tradisional
c. Indirect tax
d. Transfer pricing

184. Berikut adalah karakteristik big data, kecuali:


a. Variety
b. Capacity
c. Velocity
d. Volume

185. Berikut merupakan contoh data konvensional


a. Data stocks (saham)
b. Data laporan keuangan perusahaan
c. Data social media (twitter, facebook, youtube, dll)
d. Data transaksi nasabah bank
186. Di dalam perpajakan ada yang disebut dengan self assessment system, apa yang
dimaksud self assessment system
a. Peranan pemerintah sangat aktif dalam menentukan penerimaan pajak
b. Wajib pajak punya otomatis penuh aktif dalam menjalankan kewajiban
perpajakannya
c. Pihak lain yang melakukan semua kewajiban perpajakan
d. Pemerintah Bersama dengan wajib pajak aktif melaksanakan hak dan kewajiban
perpajakan

187. Metode ini merupakan metode eksplorasi yang mengubah data yang sangat besar
menjadi pohon keputusan yang mempresentasikan suatu aturan, disebut :
a. Chi-squared automatic interaction detection (CHAID)
b. Classification and regression tree (CART)
c. Neural network
d. Multivariate adaptive regression spline (MARS)

188. Jenis fraud yang korban terbesarnya adalah para pemegang sahan, adalah :
a. Investment scam
b. Customer fraud
c. Management fraud
d. Employee fraud

189. Tools yang dapat digunakan untuk mengolah big data adalah :
a. Excel
b. SPSS
c. Hadroop
d. Integral

190. Penerapan analisis big data dalam konteks penerimaan pajak memiliki banyak potensi,
diantaranya kecuali:
a. Memperkaya profil wajib pajak
b. Dapat melihat relasi antar-wajib pajak
c. Mengurangi risiko biaya
d. Dapat mengidentifikasi risiko ketidakpatuhan setiap wajib pajak

191. Teknik untuk membantu melihat pelanggan mana yang akan meninggalkan layanan
sehingga perusahaan dapat mengembangkan strategi yang tepat untuk
mempertahankan pelanggan, disebut :
a. Segmentasi pelanggan
b. Upselling
c. Churn-prediction
d. Credit scoring
192. Contoh dari direct tax adalah
a. Data wajib pajak penghasilan badan
b. Data PPN
c. Data CSR
d. Data perbankan

193. Rendahnya tingkat tax compliance jika dilihat dari big data adalah:
a. Kualitas data yang tidak mendukung
b. Big data belum di manfaatkan dengan optimal oleh otoritas pajak
c. Perlunya memberikan insentif
d. Rendahnya ketersediaan dana pajak

194. Market basket analysis termasuk kelompok peran sains data pada industri keuangan :
a. Bisnis real estate
b. Bisnis melalui CRM
c. Lainnya
d. Manajemen risiko

195. Tahapan dalam money laundry dimana sudah mulai digunakan mata uang digital,
adalah tahap :
a. Layering
b. Integration
c. Placement
d. Credit scoring

196. Kegunaan big data bagi pemerintah sangat penting, diantaranya :


a. Menjadi biaya tinggi bagi pemerintah
b. Meningkatkan pendapatan negara
c. Memberikan peluang untuk melakukan rekayasa transaksi
d. Merupakan sarana untuk menyembunyikan transaksi

197. Mendorong konsumen untuk membeli model yang lebih mahal dalam brand atau
kategori produk yang sama, atas untuk menambah model asli dengan fitur tambahan,
disebut :
a. Cross-selling
b. Upselling
c. Pre-selling
d. Down-selling

198. Berikut pemanfaatan data bagi DJP, kecuali:


a. Data eksternal
b. Data warehouse
c. Internal data
d. Data pribadi
199. Tahapan algoritma C4.5 untuk membangun pohon keputusan setelah tahap “bagi
kasus dalam cabang” adalah
a. Membuat aturan asosiasi
b. Pilih atribut sebagai akar
c. Ulangi proses untuk masing-masing cabang sampai semua kasus pada cabang
memiliki kelas yang sama
d. Buat cabang untuk masing-masing nilai

200. Berikut ini yang termasuk klasifikasi variabel segmentasi yang tidak dapat diobservasi
terkait produk-spesifik adalah :
a. Preferensi
b. Loyalitas
c. Psikografik
d. Demografi

M12
201. Apakah yang dimaksud dengan veracity dalam big data:
a. Ukuran data
b. Sebuah aplikasi dapat membuat/mengumpulkan banyak jenis data
c. Data dihasilkan secara cepat, maka dibutuhkan pemrosesan yang cepat juga
d. Akurasi data

202. Artificial intelligence pada tahun 1980 an – 2010 an berfokus pada:


a. Jaringan neural
b. Pembelajaran mesin
c. Pembelajaran mendalam
d. Memprediksi sinyal yang dibuat

203. Apakah yang dimaksud dengan variety dan complexity dalam big data:
a. Ukuran data
b. Sebuah aplikasi dapat membuat/mengumpulkan banyak jenis data
c. Akurasi data
d. Data dihasilkan secara cepat, maka dibutuhkan pemrosesan yang cepat juga

204. Berikut ini adalah penerapan kecerdasan buatan dalam pariwisata, kecuali:
a. Penanganan bagasi
b. Booking perjalanan
c. Smart track system
d. Komparasi tiket termurah

205. Bidang ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang
umumnya terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan
masalah, dan pengenalan pola adalah definisi dari:
a. Sains data
b. Big data
c. Kecerdasan buatan
d. Artificial intelligence

206. Apakah yang dimaksud dengan big data:


a. Disiplin ilmu yang khusus mempelajari data, khususnya data kuantitatif (data
numerik), baik yang terstruktur maupun tidak terstruktur
b. Kecerdasan yang ditampilkan oleh mesin, di mana, pembelajaran dan
kemampuan berbasis tindakan meniru otonomi daripada kecerdasan yang
berorientasi pada proses
c. Bidang ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif
yang umumnya terkait dengan kecerdasan manusia, seperti pembelajaran,
pemecahan masalah, dan pengenalan pola
d. Data yang skala, keragaman, dan kompleksitasnya memerlukan arsitektur,
Teknik, algoritma, dan analisis untuk mengelola serta mengekstrak nilai dan
pengetahuan yang tersembunyi

207. Pendeteksi/pengklasifikasian cyberbullying adalah contoh implementasi artificial


intellingence di bidang:
a. Psikologi
b. SDM
c. Ritail
d. Bahasa dan NLP

208. Apakah yang dimaksud dengan sains data:


a. Disiplin ilmu yang khusus mempelajari data, khususnya data kuantitatif (data
numerik), baik yang terstruktur maupun tidak terstruktur
b. Kecerdasan yang ditampilkan oleh mesin, di mana, pembelajaran dan
kemampuan berbasis tindakan meniru otonomi daripada kecerdasan yang
berorientasi pada proses
c. Data yang skala, keragaman, dan kompleksitasnya memerlukan arsitektur,
Teknik, algoritma, dan analisis untuk mengelola serta mengekstrak nilai dan
pengetahuan yang tersembunyi
d. Bidang ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif
yang umumnya terkait dengan kecerdasan manusia, seperti pembelajaran,
pemecahan masalah, dan pengenalan pola

209. Tujuan utama penggunaan artificial intellingence adalah :


a. Monitoring aktivitas dan kondisi tubuh kita
b. Untuk meningkatkan kemampuan manusia dengan membuat perangkat lebih
mampu dan meningkat UX
c. Menciptakan komputasi yang lebih personal, meningkatkan produktivitas,
menemukan kembali proses bisnis, dan membangun platform cloud yang cerdas
d. Streaming data

210. Data yang skala, keragaman, dan kompleksitasnya memerlukan arsitektur, Teknik,
algoritma, dan analisis untuk mengelola serta mengekstrak nilai dan pengetahuan yang
tersembunyi adalah definisi dari:
a. Sains data
b. Big data
c. Kecerdasan buatan
d. Artificial intelligence

211. Bidang ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang
umumnya terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan
masalah, dan pengenalan pola adalah definisi dari:
a. Sains data
b. Artificial intelligence
c. Kecerdasan buatan
d. Big data

212. Apakah yang dimaksud dengan volume dalam big data:


a. Sebuah aplikasi dapat membuat/mengumpulkan banyak jenis data
b. Ukuran data
c. Akurasi data
d. Data dihasillkan secara cepat, maka dibutuhkan pemrosesan yang cepat juga

213. Artificial intelligence pada tahun 2011 – saat ini berfokus pada:
a. Memprediksi sinyal yang dibuat
b. Pembelajaran mendalam
c. Pembelajaran mesin
d. Jaringan neural

214. Berikut ini adalah definisi artificial intelligence:


a. Data yang skala, keragaman, dan kompleksitasnya memerlukan arsitektur,
Teknik, algoritma, dan analisis untuk mengelola serta mengekstrak nilai dan
pengetahuan yang tersembunyi
b. Bidang ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif
yang umumnya terkait dengan kecerdasan manusia, seperti pembelajaran,
pemecahan masalah, dan pengenalan pola
c. Kecerdasan yang ditampilkan oleh mesin, di mana, pembelajaran dan
kemampuan berbasis tindakan meniru otonomi daripada kecerdasan yang
berorientasi pada proses
d. Disiplin ilmu yang khusus mempelajari data, khususnya data kuantitatif (data
numerik), baik yang terstruktur maupun tidak terstruktur
215. Tool yang digunakan dalam sains data adalah:
a. PyTorch
b. Shogun
c. R
d. Kaffe

216. Berikut ini adalah pernyataan yang benar mengenai last mile delivery:
a. Jawaban tidak ada yang benar
b. Konsep arsitektur yang mengintegrasikan teknologi dan mengumpulkan data
untuk mengoptimalkan efisiensi operasi
c. Cara yang digunakan distributor atau retailer untuk mengirim barang ke
konsumen secara langsung tanpa menggunakan pihak ketiga
d. Senjata tersembunyi yang memungkinkan seorang arsitek untuk mengubah
parameter tertentu untuk membuat berbagai jenis desain

217. Apakah yang dimaksud dengan velocity dalam big data:


a. Data dihasilkan secara cepat, maka dibutuhkan pemrosesan yang cepat juga
b. Sebuah aplikasi dapat membuat/mengumpulkan banyak jenis data
c. Ukuran data
d. Akurasi data

218. Disiplin ilmu yang khusus mempelajari data, khususnya data kuantitatif (data
numerik), baik yang terstruktur maupun tidak terstruktur adalah definisi dari:
a. Kecerdasan buatan
b. Sains data
c. Artificial intelligence
d. Big data

219. Artificial intelligence pada tahun 1950 an – 1970 an berfokus pada:


a. Pembelajaran mesin
b. Jaringan neural
c. Pembelajaran mendalam
d. Memprediksi sinyal yang dibuat

220. Apakah yang dimaksud dengan kecerdasan buatan:


a. Data yang skala, keragaman, dan kompleksitasnya memerlukan arsitektur,
Teknik, algoritma, dan analisis untuk mengelola serta mengekstrak nilai dan
pengetahuan yang tersembunyi
b. Kecerdasan yang ditampilkan oleh mesin, di mana, pembelajaran dan
kemampuan berbasis tindakan meniru otonomi daripada kecerdasan yang
berorientasi pada proses
c. Disiplin ilmu yang khusus mempelajari data, khususnya data kuantitatif (data
numerik), baik yang terstruktur maupun tidak terstruktur
d. Bidang ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif
yang umumnya terkait dengan kecerdasan manusia, seperti pembelajaran,
pemecahan masalah, dan pengenalan pola

M13
221. Data cleaning, data integration, data reduction, data transformation adalah proses …
pada data mining :
a. Data scientist
b. Data science application developer
c. Data pre-processing
d. Data analyst/business analyst

222. Definisi supervised learning adalah, kecuali :


a. Pembelajaran dengan guru, data set memiliki target/label/class
b. Sebagian besar algoritma data mining (estimation, prediction/forecasting,
classification) adalah supervised learning
c. Variable (atribut) yang menjadi target/label/class tidak ditentukan (tidak ada)
d. Algoritma melakukan proses belajar berdasarkan nilai dari variable target yang
terasosiasi dengan nilai dari variable prediktor

223. Evolusi science (evolution of sciences) sebelum tahun 1600 adalah :


a. Data science
b. Theoretical science
c. Computational science
d. Empirical science

224. Metode data mining yang menggunakan data dengan label dan tidak berlabel sekaligus
dalam proses pembelajarannya adalah :
a. Semi-Supervised learning
b. Supervised learning
c. Type of data
d. Unsupervised learning

225. Evolusi science (evolution of sciences) tahun 1600-1950 adalah :


a. Empirical science
b. Theoretical science
c. Data science
d. Computational science

226. Evolusi science (evolution of science) tahun 1950-1990 adalah :


a. Computational science
b. Data science
c. Theoretical science
d. Empirical science

227. Pembagian dataset pada pengujian model data mining adalah kecuali:
a. Data training
b. Data estimation
c. Data validation
d. Data testing

228. FP-growth, A priori, coefficient of correlation, chi square adalah algoritma pada …
didata mining :
a. Classification
b. Clustering
c. Association
d. Estimasi

229. Evolusi science (evolution of science) tahun 1990 – now adalah :


a. Data science
b. Empirical science
c. Computational science
d. Theoretical science

230. Definisi unsupervised learning adalah, kecuali :


a. Sebagian besar algoritma data mining (estimation, prediction/forecasting,
classification) adalah supervised learning
b. Algoritma clustering adalah algoritma unsupervised learning
c. Variable (atribut) yang menjadi target/label/class tidak ditentukan (tidak ada)
d. Algoritma data mining mencari pola dari semua variable (atribut)

231. Algoritma association rule (aturan asosiasi) adalah algoritma yang menemukan atribut
yang :
a. Customer segmentation
b. Bioinformatics
c. Muncul bersamaan
d. Monitoring system

232. Pola, rumus, aturan atau model yang muncul dari data adalah definisi dari:
a. Data
b. Informasi
c. Sistem
d. Pengetahuan

233. Fakta yang terekam dan tidak membawa arti adalah definisi dari:
a. Pengetahuan
b. Informasi
c. Sistem
d. Data

234. Peran utama data mining adalah sebagai berikut, kecuali :


a. Prediksi
b. Klastering
c. Penetuan
d. Estimasi

235. Untuk pengujian model pada pengujian model data mining adalah :
a. Data testing
b. Data training
c. Data estimation
d. Data validation

236. RapidMiner adalah :


a. Manages daily operation of facilities and resources and responds to customer
requests
b. Designs and implements or monitors and maintains large-scale cloud databases
c. Software data mining dan data analytics
d. Manages daily operations of cloud storages, including related to data life cycle,
and responds to requests from storage users

237. Linear regression, neural network, support vector machine adalah algoritma pada …
didata mining:
a. Classification
b. Clustering
c. Estimasi
d. Association

238. Beberapa definisi data mining adalah, kecuali :


a. Kegiatan yang meliputi pengumpulan, pemakaian data historis untuk
menemukan keteraturan, pola dan hubungan dalam set data berukuran besar
b. Extraction of interesting (non-trivial, implicit, previously unknown and
potentially useful) patterns or knowledge from huge amount of data
c. Melakukan esktraksi untuk mendapatkan informasi penting yang sifatnya
implisit dan sebelumnya tidak diketahui, dari suatu data
d. Searching for different sources of data and capturing structured and
unstructured data

239. Untuk pembentukan model pada pengujian model data mining adalah :
a. Data testing
b. Data validation
c. Data estimation
d. Data training

240. Contoh penerapan data mining adalah sebagai berikut, kecuali :


a. Penjadwalan pemeliharaan
b. Analisis pola belanja pelanggan
c. Penentuan pasokan listrik PLN untuk wilayah Jakarta
d. Deteksi serangan (instrusion) pada suatu jaringan

M14
241. Amazon/Alexa, Microsoft/Cortana merupakan contoh pemanfaatan AI di Bahasa
dengan teknologi
a. Drone control
b. Google translate
c. Chat bot Al
d. Smart speaker

242. Apakah yang dimaksud dengan Variety dan Complexity dalam Big Data:
a. Sebuah aplikasi dapat membuat/mengumpulkan banyak jenis data
b. Ukuran data
c. Akurasi data
d. Data dihasilkan secara cepat, maka dibutuhkan pemrosesan yang cepat juga

243. Beda Data Scientist dan Data Analyst adalah bahwa Data Analyst memiliki "has
problem solving skills, knowledge of basic statistic". Hal tersebut ada pada fitur :
a. Skill
b. Background
c. Type of data
d. Scope

244. Berikut contoh penggunaan database pada lingkungan big data, kecuali :
a. Exel
b. Postgresql
c. Hdfs
d. Druid

245. Berikut ini adalah penerapan kecerdasan buatan dalam pariwisata, kecuali:
a. Booking perjalanan
b. Penanganan bagasi
c. Smart track system
d. Komparasi tiket termurah
246. Bidang ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang
umumnya terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan
masalah, dan pengenalan pola merupakan definisis dari
a. Metode numerik
b. Sains data
c. Artificial intelligence
d. Kecerdasan buatan

247. Bidang studi multidisiplin dengan tujuan untuk mengatasi tantangan dalam data besar
adalah
a. Metode numerik
b. Kecerdasan buatan
c. Sains data
d. Artificial intelligence

248. Big data dapat membantu melakukan predictive maintenance & quality pada industry
a. Banking
b. Education
c. Agriculture
d. Automotive

249. Contoh Pemanfaatan AI di Bidang Pariwisata pada evolusi teknologi tahun 2005-2010
dengan menggunakan teknologi Internet adalah
a. Internet informasi travel
b. Blog, SNS two way communication
c. ICT smart tourism
d. Computer reservasi berbasis computer

250. Contoh Platform Online for FIT (Fully Independent Traveler) pada akomodasi adalah
a. Gojek
b. Google
c. Airbnb
d. Maps

251. Definisi Supervised Learning adalah, kecuali :


a. Algoritma melakukan proses belajar berdasarkan nilai dari variable target yang
terasosiasi dengan nilai dari variable predictor
b. Variable (atribut) yang menjadi target/label/class tidak ditentukan (tidak ada)
c. Sebagian besar algoritma data mining (estimation, prediction/forecasting,
classification) adalah supervised learning
d. Pembelajaran dengan guru, data set memiliki target/label/class

252. Disiplin ilmu yang khusus mempelajari data, khususnya data kuantitatif (data
numerik), baik yang terstruktur maupun tidak terstruktur adalah definisi dari:
a. Artificial intelligence
b. Big data
c. Kecerdasan buatan
d. Sains data

253. Jenis Machine Learning berdasarkan campur tangan manusia adalah


a. Reinforcement learning
b. Batch learning
c. Model based learning
d. Instance based learning

254. Pemanfaatan AI di Bidang Pariwisata pada evolusi teknologi tahun 2005-2010 dengan
menggunakan teknologi
a. Computer
b. Internet
c. ICT
d. Blog, SNS

255. Pendeteksi/Pengklasifikasian Cyberbullying adalah contoh implementasi Artificial


Intelligence di bidang:
a. Bahasa dan NLP
b. SDM
c. Ritail
d. Psikologi

256. Penerapan utama data dari data science pada e-commerce adalah melakukan hal-hal
berikut kecuali :
a. Identifying consumers
b. Prediction potential problem
c. Analyzing reviews
d. Recommending product

257. Sains Data adalah multi disiplin dari:


a. Datawarehouse, datamining
b. Statistical model, statistical computing
c. Application web, application desktop
d. Hardware, software

258. Sebuah sistem yang berfungsi untuk memonitor serta menganalisa media sosial dan
platform online yang berbasis teknologi big data menggunakan keahlian Artificial
Intelligence dan Natural Learning Process (NLP) adalah
a. Drone emprit
b. Data science
c. Social network analysis
d. Corpus

259. Teknik pada Machine Learning adalah, kecuali :


a. Unsupervised learning
b. Improvement learning
c. Reinforcement learning
d. Supervised learning

260. Tujuan Pengunaan robot dan IOT untuk suatu even sebagai salah satu Revolusi
Industri 4.0 dan Pariwisata adalah
a. Mengurangi user
b. Efesiensi biaya operasi
c. Berbagi pengalaman baru
d. Personalisasi pengalaman wisatawan
lOMoARcPSD|23633621

Kuiz M11 - Team teaching

Computer grafik (Universitas Gunadarma)

Studocu is not sponsored or endorsed by any college or university


Downloaded by Chintya Kusuma (chintyakusuma74@gmail.com)
lOMoARcPSD|23633621

Berikut ini yang termasuk klasifikasi variabel segmentasi yang tidak dapat diobservasi terkait
produk-spesisik adalah :
Select one:
a. Preferensi
b. Psikografik
c. Loyalitas
d. Demografi

Tahapan Algoritma C4.5 untuk membangun pohon keputusan setelah tahap “Bagi kasus
dalam cabang” adalah
Select one:
a. Membuat aturan asosiasi
b. Ulangi proses untuk masing-masing cabang sampai semua kasus pada cabang memiliki
kelas yang sama
c. Buat cabang untuk masing-masing nilai
d. Pilih atribut sebagai akar

Di dalam perpajakan ada yang disebut dengan Self Assesment System, apa yang dimaksud
Self Assesment System
Select one:
a. Wajib pajak punya otoritas penuh aktif dalam menjalankan kewajiban perpajakannya
b. Pemerintah bersama dengan wajib pajak aktif melaksanakan hak dan kewajiban
perpajakan
c. Peranan pemerintah sangat aktif dalam menentukan penerimaan pajak
d. Pihak lain yang melakukan semuan kewajiba perpajakan

Tahapan dalam money laundry dimana sudah mulai digunakan mata uang digital, adalah
tahap :
Select one:
a. Integration
b. Layering
c. Credit scoring
d. Placement

Berikut pemanfaatan data bagi DJP , kecuali:


Select one:
a. Internal Data
b. Data Pribadi
c. Data Eksternal
d. Data Warehouse

Tools yang dapat digunakan untuk mengolah big data adalah :


Select one:

Downloaded by Chintya Kusuma (chintyakusuma74@gmail.com)


lOMoARcPSD|23633621

a. Excel
b. Hadoop
c. Integral
d. SPSS

Contoh dari Direct Tax Adalah


Select one:
a. Data Wajib pajak Penghasilan Badan
b. Data PPN
c. Data CSR
d. Data Perbankan

Jenis Fraud yang korban terbesarnya adalah para pemegang saham, adalah :
Select one:
a. Management Fraud
b. Customer Fraud
c. Investment Scam
d. Employee Fraud

Mendorong konsumen untuk membeli model yang lebih mahal dalam brand atau kategori
produk yang sama, atau untuk menambah model asli dengan fitur tambahan, disebut :
Select one:
a. Pre-selling
b. Cross-selling
c. Down-selling
d. Upselling

Berikut adalah Karakteristik Big Data, Kecuali:


Select one:
a. Volume
b. Variety
c. Capacity
d. Velocity

Data Warehouse DJP dapat berupa data-data, kecuali


Select one:
a. Inderect Tax
b. Tranfer Pricing
c. Data Tradisonal
d. Direct Tax

Downloaded by Chintya Kusuma (chintyakusuma74@gmail.com)


lOMoARcPSD|23633621

Penerapan analisis big data dalam konteks penerimaan pajak memiliki banyak potensi,
dianataranya kecuali:
Select one:
a. Mengurangi risiko biaya
b. Dapat mengidentifikasi risiko ketidakpatuhan setiap wajib pajak
c. Dapat melihat relasi antar-wajib pajak,
d. Memperkaya profil wajib pajak,

Analisa yang berdasarkan pada data-data mengenai harga historis yang terjadi pada pasar
saham, disebut :
Select one:
a. Analisis fundamental
b. Analisis Keranjang Pasar
c. Analisis kredit
d. Analisis teknikal

Berikut merupakan contoh data konvensional


Select one:
a. Data Transaksi Nasabah Bank
b. Data Stocks (Saham)
c. Data Laporan keuangan Perusahaan
d. Data Sosial Media(Twitter,Facebook,Youtube dll)

Rendahnya tingkat Tax Compliance jika dilihat dari Big Data adalah:
Select one:
a. Big data belum di manfaatkan dengan optimal oleh otoritas pajak
b. Kualitas data yang tidak mendukung
c. Rendahnya ketersediaan dana pajak
d. Perlunya memberikan insentif

Teknik untuk membantu melihat pelanggan mana yang akan meninggalkan layanan sehingga
perusahaan dapat mengembangkan strategi yang tepat untuk mempertahankan pelanggan,
disebut :
Select one:
a. Churn-prediction
b. Segmentasi pelanggan
c. Credit Scoring
d. Upselling

Kegunaan Big Data Bagi pemerintah sangat penting, diantaranya :


Select one:
a. Menjadi biaya tinggi bagi pemerintah

Downloaded by Chintya Kusuma (chintyakusuma74@gmail.com)


lOMoARcPSD|23633621

b. Memberikan peluang untuk melakukan rekayasa transaksi


c. Meningkatkan pendapatan negara
d. Merupakan sarana untuk menyembunyikan transaksi

Market Basket Analysis termasuk kelompok peran sains data pada industri keuangan :
Select one:
a. Manajemen Risiko
b. Lainnya
c. Bisnis real estate
d. Bisnis melalui CRM

Praktik ilegal dalam dunia investasi, di mana seorang investor mendapat informasi yang pasti
perihal peluang keuntungan dalam transaksi jual beli saham. Kepastian informasi tersebut
tentu bersumber dari ‘orang dalam’ di perusahaan terkait, disebut :
Select one:
a. Insider trading
b. Bribery
c. Sanction breaches
d. Money laundring

Metode ini merupakan metode eksplorasi yang mengubah data yang sangat besar menjadi
pohon keputusan yang merepresentasikan suatu aturan, disebut :
Select one:
a. Neural Network
b. Classification and Regression Tree (CART)
c. Multivariate Adaptive Regression Spline (MARS)
d. Chi-squared Automatic Interaction Detection (CHAID)

Downloaded by Chintya Kusuma (chintyakusuma74@gmail.com)


1. Tujuan dari pembuatan hoaks adalah sebagai berikut, kecuali:
a. Keuntungan materil
b. Keuntungan politik
c. Menyebarkan berita
d. Popularitas

2. Bentuk Pendidikan literasi media berikut ini benar, kecuali:


a. Mendorong pembaca untuk memiliki edukasi tinggi
b. Memastikan bahwa isi berita bukan sebagai satir
c. Membaca diluar tajuk utama
d. Mendorong pembaca untuk memeriksa sumbernya

3. Situs verifikasi berita dapat menentukan keasilan suatu fakta dengan bantuan:
a. Pengguna
b. Pakar
c. Bot
d. Sosial media

4. Memberikan pemahaman akan pengaruh dan keuntungan finansial suatu konten salah
satu tujuan:
a. Menganalisis dan membatasi penyebaran
b. Melakukan pemeriksaan manual
c. Mendidik masyarakat
d. Melakukan pemeriksaan fakta dan klasifikasi otomatis

5. Berikut merupakan bahaya hoaks kecuali:


a. Menurunnya kepercayaan terhadap media sosial
b. Kehilangan nyawa
c. Kerugian materil
d. Merusak mental

6. Situs pemeriksaan beritta secara manual memiliki kelemahan yaitu:


a. Memiliki dampak negative
b. Tidak menggunakan keahlian manusia
c. Kurangnya koordinasi antar situs pemeriksa
d. Ketergantungan terhadap bot

7. Informasi yang tidak terbukti kebenarannya dan dengan sengaja disebarkan untuk
mengelabui penerima informasi disebut dengan:
a. Disinformasi
b. Malinformasi
c. Misinformasi
d. Hoaks

8. Penyebaran berita palsu pada media sosial disebabkan oleh alas an berikut, kecuali:
a. Potensi prediktif analitik suatu topik
b. Meningkatkan jumlah pengguna
c. Meningkatkan interaksi antar pengguna
d. Populernya pencarian suatu topik

9. Informasi tidak benar namun menyebar karena penyebar informasi meyakini


kebenarannya disebut dengan:
a. Malinformasi
b. Misinformasi
c. Hoaks
d. Disinformasi

10. Sumber pendapatan merupakan indikator kredibilitas suatu kkonten terpercaya dalam:
a. Teks penerbit
b. Meta data berita
c. Teks berita
d. Meta data penerbit

11. Informasi yang sengaja diisi hal yang salah dan disebarkan secara sengaja disebut
dengan:
a. Malinformasi
b. Misinformasi
c. Hoaks
d. Disinformasi

12. Hoaks umumnya diterima dan disebarkan oleh::


a. Berpendidikan tinggi
b. Semua benar
c. Usia produktif
d. Lansia

13. Pencegahan dari penyebaranhoaks dapat dilakukan dengan:


a. Menganalisis dan membatasi pennyebaran
b. Mendidik masyarakat
c. Melakukan pemeriksaan fakta dan klasifikasi otomatis
d. Melakukan pemeriksaan manual

14. Pilihlah pernyataan yang salah:


a. Misinformasi di media sosail dapat mempengaruhi keadaan politik
b. Misinformasi masyarakat dapat mempengaruhi dan merubah isi berita terpecaya
c. Misinformasi di media sosial dapat menyebar dengan cepat
d. Misinformasi masyarakat dapat mempengaruhi cara penyampaian berita terpacaya

15. Berikut ini merupakan metode-metode yang dapat dikembangkan untuk mendeteksi,
kecuali:
a. Data propagation
b. Natural language processing
c. Neural network
d. Deep learning models

16. Tahapan NLP yang memecah potongan masukan suatu file teks menjadi token
paragraph
a. Analisis sintaks
b. Pengelohan morfologi
c. Analisis pragmatis
d. Analisis semantic
17. Cara mengklasifikasikan teks secara otomatis yaitu dengan memeriksa hal-hal berikut
kecuali
a. Gaya Bahasa yang menimbulkan suatu emosi
b. Gaya Bahasa yang berbeda dengan sumber resmi
c. Klaim yang berlebihan
d. Gaya Bahasa yang mirip sumber resmi

18. Berikut merupakan Tindakan penghentian hoaks, kecuali


a. Mendidik masyarakat
b. Menganalisis dan membatasi penyebaran
c. Melakukan pemeriksaan fakta dan klasifikasi otomatis
d. Melakukan pemeriksaan manual

19. Informasi yang didasari realita dan kemudian secara sengaja digunakan untuk
a. Malinformasi
b. Disinformasi
c. Hoaks
d. Misinformasi

20. Berita palsu dapat menyebar dengan cepat karena:


a. Sudah pernah dilihat sebelumnya
b. Tidak menarik perhatian
c. Memberikan suatu sudut pandang baru bagi pembaca
d. Menimbulkan perasaan akan adanya suatu kebaruan
M14

.......... juga dapat diartikan sebagai kertas yang tercantum dengan jelas nilai nominal,
nama perusahaan dan diikuti dengan hak dan kewajiban yang dijelaskan kepada
setiap pemegangnya.
Select one:
a. Modal
b. Piutang
c. Aset
d. Saham

........adalah tanda bukti penyertaan kepemilikan modal atau dana pada suatu
perusahaan.
Select one:
a. Aset
b. Saham
c. Modal
d. Piutang

Analisis terhadap pergerakan saham melalui data historikal harga saham adalah :

Select one:
a. teknikal
b. balance sheet
c. ROA
d. fundamental

Batch dan streaming data ada pada :

Select one:
a. Volume
b. Velocity
c. Variabilitas
d. Varietas

Big Data ...........diproses dengan metode tradisional :


Select one:
a. Dimungkinkan
b. Dapat
c. Sulit
d. Tidak Pasti

Big data mengacu pada data yang :

Select one:
a. Tidak cepat dan Kompleks
b. Sedikit dan kompleks
c. Sangat besar, cepat atau kompleks
d. Dapat cepat dan kompleks

Big Data merupakan istilah yang berlaku untuk informasi yang ....... atau dianalisis
menggunakan alat tradisioanl

Select one:
a. dapat diproses
b. tidak dapat didata
c. tidak dapat diproses
d. tidak dapat diketahui

Cara berinvestasi dalam bursa saham capital gain adalah :


Select one:
a. Membeli kemudian menyimpan saham tersebut untuk mendapatkan pembagian
keuntungan
b. melakukan transaksi jual-beli saham dengan menggunakan perantara
c. Membeli kemudian menjual kembali saham untuk memperoleh keuntungan dari
selisih nilai jual dan beli
d. tidak melakukan transaksi jual-beli saham dengan menggunakan perantara

Cara berinvestasi dalam bursa saham deviden adalah :


Select one:
a. Membeli kemudian menjual kembali saham untuk memperoleh keuntungan dari
selisih nilai jual dan beli
b. tidak melakukan transaksi jual-beli saham dengan menggunakan perantara
c. melakukan transaksi jual-beli saham dengan menggunakan perantara
d. Membeli kemudian menyimpan saham tersebut untuk mendapatkan pembagian
keuntungan

Doug Laney mengartikulasikan definisi big data yang sekarang-mainstream sebagai


...... V:

Select one:
a. 5
b. 3
c. 1
d. 2

Investor perlu menghubungi broker melalui telepon pada jenis .

Select one:
a. broker realltime
b. broker konvensional
c. broker online
d. broker tradisional

Reference dan Master Data dan Transaction Data ada pada :


Select one:
a. Traditional Information Architecture
b. Big Data Information Architecture
c. Data Warehouse
d. Data Mining

Saham adalah hal yang sangat berpengaruh bagi seorang ........


Select one:
a. Direktur
b. Investor
c. Trader
d. Perusahaan
saham yang memiliki nilai intrinsik adalah termasuk analisis:

Select one:
a. grafik
b. teknikal
c. fundamental
d. historical

Seorang investor dapat melakukan transaksi jual-beli saham dengan menggunakan


perantara yang biasa disebut dengan .....
Select one:
a. broker saham
b. Investor
c. Trading
d. Trader

Tag RFID, sensor, dan smart meter digunakan pada

Select one:
a. Varietas
b. Volume
c. Velocity
d. Variabilitas

Terabytes dan Zettabytes ada pada:

Select one:
a. Volume
b. Velocity
c. Varietas
d. Variabilitas

Terstruktur dan Tidak terstruktur ada pada :


Select one:
a. Velocity
b. Varietas
c. Volume
d. Variabilitas

Text, Image, Audio, Video ada pada

Select one:
a. Traditional Information Architecture
b. Data Warehouse
c. Data Mining
d. Big Data Information Architecture

Volume pada Big Data adalah :

Select one:
a. Data hadir dalam semua jenis format
b. Aliran data tidak dapat diprediksi
c. Organisasi mengumpulkan data dari berbagai sumber
d. Data mengalir ke bisnis dengan kecepatan yang belum pernah terjadi sebelumnya
dan harus ditangani tepat waktu

Anda mungkin juga menyukai