Anda di halaman 1dari 8

Quiz

ANALISIS BIG DATA

Disusun guna memenuhi quiz mata kuliah Analisi Big Data

Dosen Pengampu:
Ultach Enri, M.Kom.

Disusun Oleh :
Reza Zulfiqri
2010631170115
Kelas 6A

PROGRAM STUDI INFORMATIKA


FAKULTAS ILMU KOMPUTER
UNIVERSITAS SINGAPERBANGSA KARAWANG
2023
1. Jelaskan hubungan antara perubahan kultur dan perilaku saat ini dengan pertumbuhan
data!
Jawaban:
Perubahan kultur dan perilaku saat ini terkait erat dengan pertumbuhan data karena
adanya keterkaitan yang kuat antara penggunaan teknologi dan gaya hidup modern
dengan jumlah data yang dihasilkan. Seiring dengan kemajuan teknologi, masyarakat
semakin terhubung dan tergantung pada perangkat digital yang menghasilkan data
secara terus-menerus.
Pertumbuhan data yang cepat dan besar ini memberikan dampak pada perubahan
perilaku dan kultur di masyarakat. Contohnya, kemajuan teknologi dan ketersediaan
informasi yang mudah diakses melalui internet telah mempercepat arus informasi,
memperluas jangkauan dan diversifikasi media sosial, dan memungkinkan terciptanya
banyak bentuk interaksi sosial baru.
Perkembangan teknologi juga telah mengubah cara kerja dan kehidupan manusia secara
fundamental, seperti bekerja jarak jauh, belajar daring, dan berbelanja online, yang
semuanya berkontribusi pada perubahan perilaku dan kultur. Data yang dihasilkan dari
interaksi manusia dengan teknologi ini memberikan wawasan tentang bagaimana
manusia berinteraksi dengan dunia digital dan dapat digunakan untuk mengoptimalkan
pengalaman pengguna dan meningkatkan efisiensi dalam berbagai aspek kehidupan.

2. Apa yang dimaksud dengan data, informasi dan pengetahuan!


Jawaban:
Data, informasi, dan pengetahuan merupakan konsep penting dalam dunia informasi
dan teknologi. Berikut ini adalah ringkasan penjelasan tentang ketiga konsep tersebut
beserta sumbernya:
1. Data
Data adalah kumpulan fakta atau angka mentah yang belum diorganisir atau
dianalisis. Sumber data dapat berasal dari berbagai sumber, seperti survei,
eksperimen, pengukuran, transaksi bisnis, atau sumber-sumber lainnya. Sumber
data juga dapat berasal dari perangkat dan sistem digital seperti sensor, website,
aplikasi, dan database.
2. Informasi
Informasi adalah hasil pengolahan data yang telah diorganisir dan diinterpretasikan
menjadi suatu bentuk yang bermakna. Sumber informasi dapat berasal dari berbagai
sumber seperti buku, jurnal, artikel, laporan, media sosial, website, dan database.
3. Pengetahuan
Pengetahuan adalah hasil dari interpretasi informasi yang telah dipahami dan dapat
diaplikasikan dalam situasi tertentu. Sumber pengetahuan dapat berasal dari
berbagai sumber seperti pengalaman pribadi, pelatihan, pendidikan formal, dan
literatur ilmiah.
Dalam konteks pengolahan informasi, data merupakan bahan mentah yang diperlukan
untuk menghasilkan informasi, sedangkan informasi merupakan hasil pengolahan data
yang diperlukan untuk menghasilkan pengetahuan. Pengetahuan merupakan
penguasaan atas informasi yang dapat diterapkan dalam situasi atau masalah
yang lebih kompleks.

3. Sebutkan dan jelaskan tentang karakteristik Big Data!


Jawaban:
Berikut ini adalah karakteristik Big Data yang umumnya dikenal:
1. Volume: Big Data memiliki volume data yang sangat besar dan kompleks, yang
tidak dapat diolah oleh sistem atau alat tradisional.
2. Variety: Big Data terdiri dari berbagai jenis data seperti data terstruktur, semi-
struktur, dan tidak terstruktur, serta data multimedia seperti gambar, audio, dan
video.
3. Velocity: Big Data dihasilkan dan diproses dalam waktu nyata, sehingga
memerlukan kecepatan yang tinggi dalam pengumpulan, pengolahan, dan analisis
data.
4. Veracity: Big Data cenderung tidak akurat dan tidak konsisten, sehingga perlu
dilakukan verifikasi dan validasi data.
5. Value: Big Data memiliki potensi nilai yang tinggi jika diolah dan dianalisis dengan
benar.
6. Variability: Big Data dapat berubah dengan cepat dan tidak teratur, sehingga
memerlukan sistem yang fleksibel dan dapat beradaptasi dengan cepat.
Karakteristik-karakteristik inilah yang membuat Big Data menjadi berbeda dan
menantang untuk dikelola dan dianalisis.

4. Jelaskan tentang gambar dibawah ini!

Jawaban:
Gambar tersebut menjelaskan mengenai data dimana data adalah fakta mentah yang
belum diproses atau dianalisis. Data bisa berupa angka, teks, gambar, atau suara, lalu
berubah menjadi informasi dimana Informasi adalah data yang telah diolah, diorganisir,
dan dianalisis untuk memberikan arti atau makna yang berguna. Informasi membantu
orang untuk memahami konteks dan keadaan yang diberikan oleh data. Lalu berubah
menjadi knowlage(Pengetahuan) dimana Pengetahuan adalah pemahaman yang lebih
dalam dan lebih kompleks tentang suatu topik atau masalah. Pengetahuan mencakup
konsep, prinsip, dan teori yang dihasilkan dari informasi. Pengetahuan membantu orang
untuk memahami sebab-akibat, hubungan, dan implikasi dari data dan informasi. Lalu
menjadi Insight dimana Insight adalah wawasan atau pengertian baru yang diperoleh
dari data, informasi, dan pengetahuan. Insight membantu orang untuk melihat sesuatu
yang tidak terlihat sebelumnya, menemukan pola atau tren yang tersembunyi, dan
menemukan solusi yang inovatif. Lalu dimana akhirnya menjadi Wisdom(kebijakan)
dimana Kebijaksanaan adalah tingkat pemahaman tertinggi yang mencakup
pengalaman, nilai, dan intuisi yang kompleks. Kebijaksanaan membantu orang untuk
mengambil keputusan yang bijaksana dan membuat keputusan strategis dalam
lingkungan yang kompleks dan berubah-ubah.

5. Jelaskan perbedaan data science, data mining dan machine learning!


Jawaban:
Data Science, Data Mining, dan Machine Learning merupakan konsep-konsep yang
terkait erat dalam pengolahan data dan analisis. Berikut adalah perbedaan antara ketiga
konsep tersebut:
1. Data Science Data Science adalah proses pengumpulan, pembersihan, transformasi,
dan analisis data yang dilakukan dengan menggunakan metode ilmiah. Tujuan
utama Data Science adalah untuk menghasilkan informasi yang bermanfaat dan
dapat diterapkan dalam pengambilan keputusan. Data Science melibatkan berbagai
teknik dan alat analisis, termasuk statistik, visualisasi data, dan pemrosesan bahasa
alami.
2. Data Mining Data Mining adalah proses penggalian dan analisis data besar-besaran
untuk mengidentifikasi pola dan hubungan dalam data yang relevan dan berguna.
Data Mining melibatkan berbagai teknik seperti clustering, klasifikasi, regresi, dan
analisis asosiasi untuk mengidentifikasi pola yang tersembunyi dalam data.
3. Machine Learning Machine Learning adalah sub-bidang dari ilmu komputer yang
berkaitan dengan pengembangan algoritma dan model statistik yang
memungkinkan mesin untuk belajar dari data dan melakukan tugas-tugas tertentu
tanpa instruksi langsung dari manusia. Machine Learning dapat dibagi menjadi
beberapa jenis, seperti supervised learning, unsupervised learning, dan
reinforcement learning.

6. Menurut anda apakah yang menjadi penyebab kegagalan dalam proyek data science,
jelaskan!
Jawaban:
Beberapa faktor kegagalan pada tahapan metodologi data science antara lain:
1. Lingkup Masalah
Masalah yang ingin diselesaikan tidak jelas ataupun masalahnya bukan masalah
yang dapat diselesaikan dengan menggunakan data. Kurangnya pemahaman
tentang masalah yang ingin dipecahkan secara spesifik menjadi salah satu faktor
terjadinya kegagalan dalam tahap metodologi data science.
2. Data
Pengolahan data dapat menjadi salah satu faktor kegagalan pada tahap metodologi
data science jika terjadinya kesalahan. Aktivitas yang berhubungan dengan data
menjadi hal yang harus diperhatikan. Berikut ini kesalahan yang biasa terjadi :
• Data yang diperlukan sering tidak ada, jumlah terbatas atau kualitasnya
buruk (banyak error, tidak lengkap, dan lainnya).
• Pengembang (data scientist) tidak mengerti tentang arti data tersebut
sehingga tidak tepat penggunaannya.
• kesalahan dalam proses pengolahan data, seperti kurangnya validasi atau
pengiriman informasi yang tidak akurat
• Tidak melakukan evaluasi dan validasi secara berkala terhadap hasil analisis
data yang telah dilakukan
• Keterbatasan teknologi atau infrastruktur yang digunakan dalam analisis
data
3. Model
Model yang dihasilkan kurang tepat karena tidak mendapatkan model yang cukup
akurat ataupun model yang dihasilkan tidak dapat dimengerti. Kedua hal ini
meyebabkan model tidak mendapat dukungan untuk dipasang alias projek dianggap
gagal.
4. Algoritma kompleks
Pemilihan algoritma pembelajaran mesin sangat mempengaruhi model yang dapat
dibentuk. Terlalu banyaknya algoritma yang berbeda paradigmanya mempersulit
data scientist. Akibatnya hanya algoritma tertentu yang dikuasai yang
diimplementasikan, padahal model mungkin bisa lebih baik jika algotima lain yang
dipergunakan.
5. Sumber Daya Manusia
Kegiatan data science sering dianggap kegiatan seorang atau beberapa data
scientist, padahal dalam kenyataannya berbagai pihak terlibat dalam pengembangan
sistem intelijen ini

7. Jelaskan tentang methodologi data science!


Jawaban:
Berikut adalah beberapa metodologi pengembangan data science:
1. KDD (Knowledge Discovery in Databases) Merupakan salah satu metodologi awal
dalam pengembangan Data Science. Metodologi ini terdiri dari lima tahap:
• Selection Menciptakan himpunan data target, pemilihan himpunan data,
atau memfokuskan pada subset variabel atau sampel data, dimana penemuan
(discovery) akan dilakukan.
• Pre-processing Tahapan ini terdiri dari pembersihan data target dan
preprocessing untuk memperoleh data yang konsisten.
• Transformation Merupakan proses transformasi pada data yang telah
dipilih, sehingga data tersebut sesuai untuk proses data mining.
• Data Mining Proses data mining yaitu proses mencari pola informasi
menarik dalam data terpilih dengan menggunakan teknik atau metode
tertentu.
• Interpretation/Evaluation Tahap ini merupakan bagian dari proses KDD
yang mencakup pemeriksaan apakah pola atau informasi yang ditemukan
bertentangan dengan fakta atau hipotesa yang ada sebelumnya.
Metodologi ini menekankan pada pentingnya pemahaman bisnis dan
pemahaman data, serta melibatkan banyak iterasi dalam setiap tahap.
2. SEMMA (Sample, Explore, Modify, Model, Assess) Merupakan metodologi
pengembangan data science yang dikembangkan oleh SAS. Metodologi ini terdiri
dari lima tahap yang bertumpu pada pemahaman bisnis dan pemahaman data.
Metodologi SEMMA menekankan pada peran penting dari eksplorasi data dan
modifikasi data sebelum membangun model, serta menekankan pada evaluasi
model secara kritis.
3. CRISP-DM (Cross Industry Standard Process for Data Mining) Adalah salah satu
metodologi yang paling umum digunakan dalam industri. Metodologi ini terdiri dari
enam tahap :
• Business Understanding Pada tahap pertama ini membutuhkan pengetahuan
dari objek bisnis, bagaimana membangun atau mendapatkan data, dan
bagaimana untuk mencocokan tujuan pemodelan untuk tujuan bisnis
sehingga model terbaik dapat dibangun.
• Data Understanding Tahap ini memberikan fondasi analitik untuk sebuah
penelitian dengan membuat ringkasan dan mengidentifikasi potensi masalah
dalam data.
• Data Preparation Tahap ini membutuhkan pemikiran pemikiran yang cukup
matang dan usaha yang cukup tinggi untuk memastikan data tepat untuk
algoritma yang digunakan.
• Modeling Pada tahap ini dilakukan metode statistika dan machine learning
untuk penentuan terhadap teknik data mining, alat bantu data mining, dan
algoritma data mining yang akan diterapkan.
• Evaluation Evaluasi dilakukan terhadap model yang diterapkan pada tahap
sebelumnya dengan tujuan agar model yang ditentukan dapat sesuai dengan
tujuan yang ingin dicapai dalam tahap pertama.
• Deployment Tahap deployment adalah tahap yang paling dihargai dari
proses CRISP-DM. Pada tahap ini, model analisis data dan hasilnya
diterapkan dan diintegrasikan ke dalam sistem bisnis yang relevan.
CRISP-DM menekankan pada iterasi antara tahap-tahap dan penggunaannya
dapat diaplikasikan pada berbagai jenis proyek data science.
4. IBM Data Science Methodology IBM Data Science Methodology adalah suatu
kerangka kerja atau metodologi yang dirancang oleh IBM untuk mengelola proyek
data science secara efektif. Tahapan dalam metodologi data science merupakan
proses berulang, yang dimana apabila dalam suatu tahapan dirasa masih belum
sesuai, bisa kembali ke tahap sebelumnya. Tahapannya sebagai berikut:
• Business Understanding Tahap ini memainkan peranan penting dengan
mendefinisikan masalah, tujuan, dan kebutuhan solusi dari perspektif bisnis.
• Analytic Approach Dalam tahap ini dilakukan pendefinisian masalah dalam
konteks statistic atau machine learning untuk memperoleh hasil yang
diinginkan.
• Data Requirements Pemilihan pendekatan analitik menentukan data
requirements atau data apa saja yang dibutuhkan agar permasalahan dapat
terjawab.
• Data Collection Pada tahap ini data scientist mulai mengidentifikasi dan
mengumpulkan data yang relevan dengan domain masalah.
• Data Understanding Pada tahap ini akan dicek apakah ada missing values,
data yang imbalanced, outlier, salah format, dan sebaagainya yang harus
diperbaiki terlebih dahulu.
• Data Preparation Tahap data preparation terdiri dari semua kegiatan atau
proses yang dilakukan untuk membangun dataset yang akan digunakan
dalam tahap pemodelan, termasuk membersihkan data, menggabungkan
data, dan mengubah data menjadi variabel yang lebih berguna.
• Modeling Modeling atau pemodelan adalah tahap dalam metodologi data
science dimana data scientist membuat model untuk menjawab
permasalahan.
• Evaluation Tahap selanjutnya adalah mengevaluasi kualitas model dan
mengujinya apakah dapat mengatasi permasalahan bisnis dengan tepat.
• Deployment Model tersebut siap di-deploy atau digunakan di lingkungan
bisnis.
• Feedback Perusahaan akan mendapatkan feedback atau umpan balik tentang
kinerja model

8. Apa pendapat anda antara Big Data vs Big Information vs Big Knowledge, manakah
diantara ke-3 haltersebut yang lebih utama?
Jawaban:
Pendapat saya mengenai Big data, Big Information, Big Knowlage sebagai berikut:
1. Big Data adalah kumpulan data yang memiliki volume besar baik terstruktur
maupun tidak terstruktur yang tidak bisaa di proses menggunakan pengelola
database atau aplikasi biasa. Dikatakan big data juga memiliki karakteristik yaitu
Volume, Velocity atau kecepatan data, Variety atau variasi data, Veracity atau
keakuratan data, Value atau nilai atau manfaat bagi pengguna, Visualization atau
penggambaran, Volatility atau perubahan data dari data yang dikumpulkan per hari
atau beberapa hari, Validity Patau data yang dikumpulkan harus valid dan relevan
sehingga bisa digunakan, Vulnerability atau keamanan data, dan Variability ata
perubahan data yang berbeda - beda (misalnya perbedaan kecepatan transfer data).
2. Big information adalah penggambaran, atau pendeskripsian dari big data dan
pengetahuan pada satu waktu tertentu, tetapi big data dan pengetahuan atau
knowledge tersebut sewaktu - waktu dapat berubah.
3. Big knowledge adalah big data, big information yang saling terkoneksi sehingga
mengasilkan suatu gambaran yang kita ketahui atau dapat dikatakan pengetahuan
berasal dari informasi dan data.
Menurut saya dari ketiga hal tersebut “Big Data” lah yang utama karena dilihat dari
pengertiannya sendiri diamana menyebutkan bahwa Big Data adalah kumpulan data
yang memiliki volume besar baik terstruktur maupun tidak terstruktur yang tidak bisaa
di proses menggunakan pengelola database atau aplikasi biasa. Jadi tanpa ada Big Data
maka tidak akan ada Big Information dan Big Knowledge. Jadi Big data Lah komponen
paling utama.

9. Apa yang dimaksud dengan supervised learning dan unsupervised learning, jelaskan
dengan contoh!
Jawaban:
1. Supervised Learning
Supervised learning adalah teknik machine learning yang melibatkan data yang
sudah dilabeli dengan benar. Dalam supervised learning, mesin belajar dari data
yang sudah dilabeli untuk membangun model prediksi yang dapat digunakan untuk
memprediksi hasil pada data baru yang belum pernah dilihat sebelumnya. Contoh
dari supervised learning adalah klasifikasi. Misalnya, jika kita ingin membangun
model untuk memprediksi apakah email tersebut spam atau bukan spam, kita akan
memberikan mesin sejumlah email yang sudah dilabeli sebagai spam atau tidak
spam untuk belajar. Kemudian mesin akan menggunakan informasi ini untuk
membangun model prediksi yang dapat digunakan untuk memprediksi apakah
email baru termasuk dalam kategori spam atau bukan.
2. Unsupervised Learning
Unsupervised learning adalah teknik machine learning yang melibatkan data yang
belum dilabeli dengan benar. Dalam unsupervised learning, mesin belajar dari data
tanpa adanya informasi tentang label atau kategori. Tujuan dari unsupervised
learning adalah untuk menemukan pola atau struktur dalam data. Contoh dari
unsupervised learning adalah clustering. Misalnya, jika kita memiliki data
penjualan produk di suatu toko, kita mungkin ingin menggunakan teknik clustering
untuk mengidentifikasi kelompok produk yang sering dibeli bersama-sama oleh
pelanggan. Mesin akan mengelompokkan produk berdasarkan kemiripan
karakteristik, seperti kategori produk, harga, atau preferensi pelanggan, dan
mengidentifikasi kelompok produk yang sering dibeli bersama-sama.
Jadi bisa dikesimpulkan, Supervised learning dan unsupervised learning adalah dua
teknik machine learning yang berbeda dalam pengolahan data. Supervised learning
digunakan ketika terdapat data yang sudah dilabeli dengan benar, sedangkan
unsupervised learning digunakan ketika data belum memiliki label yang jelas.

10. Berikan contoh tentang pemanfaatan big data analytics, beri penjelasan!
Jawaban:
Big data analytics telah banyak dimanfaatkan di berbagai industri untuk meningkatkan
efisiensi, mengidentifikasi peluang baru, dan mengambil keputusan yang lebih tepat
dan akurat. Berikut adalah beberapa contoh pemanfaatan big data analytics:
1. E-Commerce
Perusahaan e-commerce seperti Amazon dan Alibaba menggunakan big data
analytics untuk menganalisis perilaku belanja pelanggan dan menawarkan
rekomendasi produk yang sesuai dengan preferensi dan kebiasaan belanja
pelanggan. Big data analytics juga digunakan untuk menganalisis dan
mengoptimalkan proses logistik dan rantai pasokan.
2. Kesehatan
Dalam industri kesehatan, big data analytics digunakan untuk mengumpulkan,
menganalisis, dan memprediksi tren kesehatan, serta mengidentifikasi faktor risiko
yang dapat mempengaruhi kesehatan pasien. Misalnya, data kesehatan pasien dapat
digunakan untuk memprediksi kemungkinan terjadinya penyakit tertentu pada
pasien dan menganalisis efektivitas pengobatan.
3. Perbankan dan Keuangan
Perusahaan perbankan dan keuangan menggunakan big data analytics untuk
memprediksi risiko kredit, mengidentifikasi kecurangan, dan menganalisis perilaku
konsumen untuk membuat keputusan investasi yang lebih tepat. Big data analytics
juga digunakan untuk mengoptimalkan strategi pemasaran dan promosi.

Anda mungkin juga menyukai