Anda di halaman 1dari 7

PENGANTAR SAINS DATA

1. Data Sains adalah ilmu yang bersifat interdisiplin, dimana berikut adalah yang termasuk di
dalam nya
a. Scientific Methods dan juga Aplikasi Real-World
b. Visualization & Statistical Modeling dan Computing
c. Data technology, konsultasi data dan data research
d. Semua jawaban tersebut benar
2. Suatu dokumen tentang Business Understanding, terdiri dari komponen penyusun sebagai
berikut:
a. Pada bagian awal ada Business Goal yang berisi latar belakang, goal dan kriteria suksesnya
b. Deskripsi kondisi terkini, termasuk daftar sumber data, requirement, asumsi dan
hambatannya, begitu juga resiko dan solusi, dilengkapi dengan terminologi serta
perhitungan Cost dan benefitnya
c. Memahami goal atau tujuan dari Data mining dan penentuan daftar kriteria sukses proses
data mining yang dilakukan. Kemudian diikuti dengan pembuatna Perencanaan Proyek
d. Semua tahapan tersebut harus disusun untuk membentuk dokumen business understanding
3. Berikut adalah tahapan penyusunan dashboard yang ideal …..
a. Ideasi → Pembuatan Storyboard → Pembuatan Navigasi → Pembuatan Design Layout →
Eksekusi Final
b. Ideasi → Pembuatan Storyboard → Pembuatan Mockup → Pembuatan Design Layout →
Eksekusi Final
c. Perancangan → Pembuatan Storyboard → Pembuatan Navigasi → Eksekusi Final
d. Perancangan → Pembuatan Storyboard → Pembuatan Prototype→ Eksekusi Final
4. Landsekap Basis Data saat ini tidak hanya RDBMS saja, telah berkembang menjadi sebagai
berikut
a. RDBMS dan Data Warehouse
b. RDBMS, No SQL, GraphDB, Hadoop, Spark serta OLAP/DW
c. RDBMS, NoSQL, Hadoop dan Olap/DW
d. Keyvalue, Document, OLAP
5. Salah satu implementasi dari data fusion yang datanya diambil dari berbagai sensor adalah
teknologi berikut, kecuali :
a. Sistem Terdisribusi pada portal video
b. Game online
c. Mobil tak berawak
d. bukan salah satu diantaranya
6. Diantara model repository data berikut, yang memiliki ciri : menyimpan data dalam beragam
bentuk aslinya, semua data disimpan dalam penyimpanan utama, database dpt saja disimpan
dalam bentuk relational atau semi terstruktur dan juga databiner -- adalah jenis repositori .........
a. Data Lake
b. Data Mart
c. Data Warehouse
d. Server Data
7. Berikut adalah jenis dashboard berdasarkan tujuan pemanfaatan, kecuali ……
a. Directional Dashboard
b. Operational Dashboard
c. Interactive Analytical Dashboard
d. Decisian Maker Dashboard
8. Berikut adalah yang mendasari lahirnya konsep bigdata?
a. Data yang digunakan semakin lama semakin besar
b. Makin banyak aplikasi yang menyimpan banyak data
c. Data Semakin lama semakin kompleks dan beragam
d. Semua jawaban tersebut benar
9. Terkait dengan karakteristik big data, yang bukan termasuk dari karakteristik utama big data
adalah ?
a. Volume
b. Velocity
c. Vector
d. Variety
10. Berikut merupakan library populer di Python yang digunakan untuk data structure dan data
analusis
a. Numpy
b. Scipy
c. Pandas
d. Matplotlib
11. Berikut adalah jenis pemanfaatan data secara umum, kecuali
a. Descriptive
b. Semantic
c. Diagnostic
d. Predictive dan Prescriptiv
12. Salah satu pemanfaatan Data Sains yang kini banyak diimplementasikan baik pada
pemerintahan maupun industri dalam upaya memudahkan pengguna untuk memahami kondisi
dan situasi yang ada berdasarkan data yang direpresentasikan secara grafis dilengkapi dengan
berbagai fitur bantu analisa, sehingga pada akhirnya akan membantu dalam pengambilan
keputusan dikenal dengan implementasi .......
a. Dashboard
b. System Monitoring Data
c. Portal Satu Data
d. Semua benar
13. Di bawah ini merupakan bagian dari Ekosistem Big Data, Kecuali
a. Sumber Data
b. Data Akuisisi dan Penyimpanan
c. Analisis
d. OOP
14. Business Understanding merupakan bagian penting yang mengawali proses pekerjaan data
sains, dengan tahapan bekerja sebagai berikut:
a. Memahami dan mengidentifikasi Goal dari Bisnis → Melakukan Assesment terhadap
situasi → Menentukan Goal dari kegiatan Data Miningnya → Menyusun Perencanaan
Proyek
b. Memahami latar belakang bisnis → Menghitung cost dan benefit → mendefinisi database
→ mengeksekusi proyek
c. Memahami Administrasi Bisnis → Melakukan Data Analisis → Mengembangkan
Algoritma → Menerapkan pada Machine Learning
d. Memeriksa sumber data → Menentukan asumsi dari permasalahan pada data →
Memahami Resiko dan Alternatif jalan keluarnya → Menhitung keuntungan
15. Manakah dari karakteristik berikut yang BUKAN merupakan karakteristik Data Terstruktur
a. Model Data Terdefinisi sebelumnya dan antar butir datanya dapat dibedakan dengan jelas
b. Format butir data biasanya berbentuk teks, atau number atau string
c. Ektraksi atau kueri data cukup mudah dilakukan serta lebih mudah untuk dikelola
d. Untuk jumlah data yang sama membutuhkan storage (media penyimpan) jauh lebih besar
16. Sedangkan tahapan Data Preparation terdiri dari kegiatan sebagai berikut:
a. Memilih dan Memilah Data → Membersihkan Data → Mengkonstruksi Data → Integrasi
Data
b. Mengumpulkan Data → Menelaah Data → Memvalidasi Data
c. Cost Benefit Analysis → Situation assessment → Project plan
d. Tidak ada yang benar
17. Bila dalam penyelesaian masalah diawali dengan penentuan domain, kemudian ditentukan
masalahnya, kemudian diikuti dengan memilih domain dari spesific language yang kemudian
dituliskan dalam DSL merupakan tahapan dalam pendekatan penyeleisaian masalah
bertipe..........
a. Pendekatan Struktur Data + Algoritma
b. Pendekatan Domain Spesific Language + Script
c. Pendekatan dengan Data Set + Machine Learning
d. Tidak ada yang benar
18. Pada konsep big data, jenis kegiatan atau task yang umumnya dilakukan pada kegiatan analisa
adalah sebagai berikut:
a. Deskriptive
b. Diagnostic
c. Predictive dan Prescriptive
d. Semua jawaban tersebut benar
19. Pada saat pencarian data dari Open Data yang tersedia, khususnya pada tahapan Identifikasi
Data, apa saja yang harus diperhatikan ?
a. Data apa yang diperlukan ?
b. Data apa yang tersedia pada organisasi tersebut(kita)
c. Dimana letak data tersimpan ?
d. Semua hal tersebut pada jawaban A, B dan C harus diperhatikan
20. Jika terdapat list berikut dalam python F = ["ani", 12, "Jerry", 30, "mega", 25] jika pemanggilan
indeks F[3] adalah data:
a. 30
b. "Jerry"
c. Jerry
d. Mega
21. Pada metodologi SEMMA bagian mengeksplorasi data untuk pola dan keanehan yang tidak
diharapkan dengan tujuan untuk mendapatkan pengertian dan ide, disebut…..
a. Modify
b. Explore
c. Model
d. Assess
22. Berikut merupakan urutan pemanfaatan suatu model pada data sains:
a. Input Parameters -- ML Model -- Result
b. ML Model -- Input Parameter -- Result
c. Result -- Input Parameters -- ML Model
d. Input Parameters -- Result -- ML Model
23. Bila melihat dari kategori umum database, bila skema database tidak perlu didefinisikan
terlebih dahulu, properties data bisa berbeda, menggunakan transaksi bertipe ACID dan bahasa
serta interface dari tiap database bisa berbeda-beda, merupakan ciri dari jenis database ……
a. SQL Database
b. Standard Database
c. NoSQL Database
d. RDBMS
24. Berikut adalah perangkat bantu pengolahan data statistik, kecuali:
a. R
b. SPSS
c. MatLab
d. Orange3
25. Proses Data Understanding terdiri dari kegiatan
a. Mengumpulkan Data
b. Menelaah Data
c. Memvalidasi Data
d. Semua harus dilakukan
26. Big Data memiliki beberapa karakterisitik khusus dibanding hanya sekedar data biasa, dan
bukan hanya sekedar dari volume nya saja maka di sebut "BIG", tapi dari beberapa hal lain
sebagai berikut, kecuali:
a. Volume - Velocity - Variety - Veracity - Value
b. Validity - Variability - Venue - Vocabulary - Vagueness
c. Hanya karakteristik pada pilihan A saja
d. Semua karateristik pada piliah A dan B
27. Metode Pengukuran keberhasilan suatu proyek data sains bisa dilakukan dengan matriks
performansi berikut, kecuali
a. RMSE
b. R-Square
c. F1-Score
d. CrispDM
28. Dari sumber Data set yang dipublikasi open berikut, manakah yang menyediakan data set
pemerintah Indonesia:
a. Data Set Jakarta[https://data.jakarta.go.id/dataset]
b. Open Data Indonesia [https://data.go.id]
c. OECD Data Indonesia[https://data.oecd.org/indonesia.htm]
d. Data set Kata Data[https://databoks.katadata.co.id/dataset]
29. Tahapan Proyek pengerjaan terkait Data sains mencakup kegiatan:
a. Penentuan Masalah dilanjutkan dengan Penentuan Tujuan Proyek
b. Pencarian solusi dari Perspektif Bisnis
c. Penentuan dan pengukuran instrumen keberhasilan proyek
d. Semua harus dilalui secara berurutan
30. Sistem yang hanya bisa menemukan jawaban berdasarkan jawaban yang ada di kumpulan fakta
adalah sistem yang bersifat …..
a. Non Intelligence
b. Intelligence
c. Unsupervised
d. Supervised
31. Sedangkan perangkat bantu untuk pemrograman pada data sains adalah berikut, kecuali…
a. Python
b. KNIME
c. Pandas
d. SciPy
32. Pada tahapan pencarian di Open Data, pencarian terhadap hak kepemilikan data, jenis format
data, serta kualitas data, termasuk pada tahapan …….
a. Identifikasi Data
b. Analisa Data
c. Publikasi Data
d. Kurasi Data
33. Tugas Analitik yang umumnya dilakukan pada proyek data sains, diantaranya adalah sebagai
berikut, kecuali :
a. Regresi/Estimasi untuk memprediksi nilai kontinue kasus
b. Klasifikasi yang memprediksi kelas/kategori dari kasus
c. Menyusun dan membuat Database besar
d. Menemukan kasus abnormal/tidak biasa terjadi
34. Kategori Kunci dari Pattern Klasifikasi Database meliputi hal berikut kecuali ….
a. Tipe Analisis - Metodologi Pemrosesan - Frekuensi Data - Tipe Data
b. Format Konten - Sumber data
c. Konsumer dari Data - Hardware
d. Jumlah Tabel Data - Front End Program
35. Yang disebut dengan tahapan Learning pada Sistem bersifat Supervised apabila:
a. Diberikan nilai input
b. Diberikan nilai output yang diharapkan
c. Menggunakan algoritma seerti perceptron, feedforward, back propagation
d. Semua jawaban tersebut benar
36. Metodologi Knowledge Discovery and Data Mining tahapan preprocessing merupakan
tahapan….
a. Membuat sebuah target data, fokus dalam bagian dari variabel atau sampel data yang mana
discovery akan dilakukan
b. Cleaning target data dengan tujuan mendapatkan data yang konsisten
c. Mencari pola menarik di dalam sebuah bentuk tertentu, begantung dari tujuan data mining
(biasanya prediksi)
d. Transformasi data menggunakan reduksi dimensional atau metode transformasi
37. Pada implementasi pengolahan big data dengan Maschine Learning, maka alur pengolahan
data akan terdiri dari tahapan sebagai berikut:
a. Data Collection → Data Gathering → Data Analysis → Visualisation
b. Data Collection → Data Preparation → Exploratory Data Analyzis → Process in Machine
Learning → Visualization
c. Data Sampling → Data Modify → Modeling → Data Mining → Analyzing
d. Tidak ada yang benar
38. Metode CRISP-DM sebagai metode yang sifatnya relatif generik, memiliki tahapan sebagai
berikut:
a. Business Understanding → System Understanding → Modeling → Evaluation →
Execution
b. Business Understanding → Data Understanding → Data Preparation → Modeling →
Evaluation → Deployment
c. Selection → PreProcessing → Transformation → Data Mining → Evaluation
d. Ideation → Data Acquisition & Exploration → Research & Development → Validation →
Delivery → Monitoring
39. Sedangkan pada Domino Datalab methodology, tahapan yang dilakukan terhadap data adalah
sebagai berikut:
a. Sampling → Expanding → Monitoring → Modeling → Audinting
b. Selection → PreProcessing → Transformation → Data Mining → Evaluation
c. Ideation → Data Acquisition & Exploration → Research & Development → Validation →
Delivery → Monitoring
d. Sampling → Data Modify → Modeling → Data Mining → Analyzing
40. Metodologi pengembangan sistem saat ini terbagi menjadi 2 kategori besar yaitu :
a. SDLC & Waterfall
b. Scrum & Agile
c. Heavyweight & Agile
d. Dynamic System Develompent & Non-Dynamic System Development

Anda mungkin juga menyukai