Dosen Pengampu:
Ultach Enri, M.Kom.
Disusun Oleh :
Reza Zulfiqri
2010631170115
Kelas 6A
Jawaban:
Gambar tersebut menjelaskan mengenai data dimana data adalah fakta mentah yang
belum diproses atau dianalisis. Data bisa berupa angka, teks, gambar, atau suara, lalu
berubah menjadi informasi dimana Informasi adalah data yang telah diolah, diorganisir,
dan dianalisis untuk memberikan arti atau makna yang berguna. Informasi membantu
orang untuk memahami konteks dan keadaan yang diberikan oleh data. Lalu berubah
menjadi knowlage(Pengetahuan) dimana Pengetahuan adalah pemahaman yang lebih
dalam dan lebih kompleks tentang suatu topik atau masalah. Pengetahuan mencakup
konsep, prinsip, dan teori yang dihasilkan dari informasi. Pengetahuan membantu orang
untuk memahami sebab-akibat, hubungan, dan implikasi dari data dan informasi. Lalu
menjadi Insight dimana Insight adalah wawasan atau pengertian baru yang diperoleh
dari data, informasi, dan pengetahuan. Insight membantu orang untuk melihat sesuatu
yang tidak terlihat sebelumnya, menemukan pola atau tren yang tersembunyi, dan
menemukan solusi yang inovatif. Lalu dimana akhirnya menjadi Wisdom(kebijakan)
dimana Kebijaksanaan adalah tingkat pemahaman tertinggi yang mencakup
pengalaman, nilai, dan intuisi yang kompleks. Kebijaksanaan membantu orang untuk
mengambil keputusan yang bijaksana dan membuat keputusan strategis dalam
lingkungan yang kompleks dan berubah-ubah.
6. Menurut anda apakah yang menjadi penyebab kegagalan dalam proyek data science,
jelaskan!
Jawaban:
Beberapa faktor kegagalan pada tahapan metodologi data science antara lain:
1. Lingkup Masalah
Masalah yang ingin diselesaikan tidak jelas ataupun masalahnya bukan masalah
yang dapat diselesaikan dengan menggunakan data. Kurangnya pemahaman
tentang masalah yang ingin dipecahkan secara spesifik menjadi salah satu faktor
terjadinya kegagalan dalam tahap metodologi data science.
2. Data
Pengolahan data dapat menjadi salah satu faktor kegagalan pada tahap metodologi
data science jika terjadinya kesalahan. Aktivitas yang berhubungan dengan data
menjadi hal yang harus diperhatikan. Berikut ini kesalahan yang biasa terjadi :
• Data yang diperlukan sering tidak ada, jumlah terbatas atau kualitasnya
buruk (banyak error, tidak lengkap, dan lainnya).
• Pengembang (data scientist) tidak mengerti tentang arti data tersebut
sehingga tidak tepat penggunaannya.
• kesalahan dalam proses pengolahan data, seperti kurangnya validasi atau
pengiriman informasi yang tidak akurat
• Tidak melakukan evaluasi dan validasi secara berkala terhadap hasil analisis
data yang telah dilakukan
• Keterbatasan teknologi atau infrastruktur yang digunakan dalam analisis
data
3. Model
Model yang dihasilkan kurang tepat karena tidak mendapatkan model yang cukup
akurat ataupun model yang dihasilkan tidak dapat dimengerti. Kedua hal ini
meyebabkan model tidak mendapat dukungan untuk dipasang alias projek dianggap
gagal.
4. Algoritma kompleks
Pemilihan algoritma pembelajaran mesin sangat mempengaruhi model yang dapat
dibentuk. Terlalu banyaknya algoritma yang berbeda paradigmanya mempersulit
data scientist. Akibatnya hanya algoritma tertentu yang dikuasai yang
diimplementasikan, padahal model mungkin bisa lebih baik jika algotima lain yang
dipergunakan.
5. Sumber Daya Manusia
Kegiatan data science sering dianggap kegiatan seorang atau beberapa data
scientist, padahal dalam kenyataannya berbagai pihak terlibat dalam pengembangan
sistem intelijen ini
8. Apa pendapat anda antara Big Data vs Big Information vs Big Knowledge, manakah
diantara ke-3 haltersebut yang lebih utama?
Jawaban:
Pendapat saya mengenai Big data, Big Information, Big Knowlage sebagai berikut:
1. Big Data adalah kumpulan data yang memiliki volume besar baik terstruktur
maupun tidak terstruktur yang tidak bisaa di proses menggunakan pengelola
database atau aplikasi biasa. Dikatakan big data juga memiliki karakteristik yaitu
Volume, Velocity atau kecepatan data, Variety atau variasi data, Veracity atau
keakuratan data, Value atau nilai atau manfaat bagi pengguna, Visualization atau
penggambaran, Volatility atau perubahan data dari data yang dikumpulkan per hari
atau beberapa hari, Validity Patau data yang dikumpulkan harus valid dan relevan
sehingga bisa digunakan, Vulnerability atau keamanan data, dan Variability ata
perubahan data yang berbeda - beda (misalnya perbedaan kecepatan transfer data).
2. Big information adalah penggambaran, atau pendeskripsian dari big data dan
pengetahuan pada satu waktu tertentu, tetapi big data dan pengetahuan atau
knowledge tersebut sewaktu - waktu dapat berubah.
3. Big knowledge adalah big data, big information yang saling terkoneksi sehingga
mengasilkan suatu gambaran yang kita ketahui atau dapat dikatakan pengetahuan
berasal dari informasi dan data.
Menurut saya dari ketiga hal tersebut “Big Data” lah yang utama karena dilihat dari
pengertiannya sendiri diamana menyebutkan bahwa Big Data adalah kumpulan data
yang memiliki volume besar baik terstruktur maupun tidak terstruktur yang tidak bisaa
di proses menggunakan pengelola database atau aplikasi biasa. Jadi tanpa ada Big Data
maka tidak akan ada Big Information dan Big Knowledge. Jadi Big data Lah komponen
paling utama.
9. Apa yang dimaksud dengan supervised learning dan unsupervised learning, jelaskan
dengan contoh!
Jawaban:
1. Supervised Learning
Supervised learning adalah teknik machine learning yang melibatkan data yang
sudah dilabeli dengan benar. Dalam supervised learning, mesin belajar dari data
yang sudah dilabeli untuk membangun model prediksi yang dapat digunakan untuk
memprediksi hasil pada data baru yang belum pernah dilihat sebelumnya. Contoh
dari supervised learning adalah klasifikasi. Misalnya, jika kita ingin membangun
model untuk memprediksi apakah email tersebut spam atau bukan spam, kita akan
memberikan mesin sejumlah email yang sudah dilabeli sebagai spam atau tidak
spam untuk belajar. Kemudian mesin akan menggunakan informasi ini untuk
membangun model prediksi yang dapat digunakan untuk memprediksi apakah
email baru termasuk dalam kategori spam atau bukan.
2. Unsupervised Learning
Unsupervised learning adalah teknik machine learning yang melibatkan data yang
belum dilabeli dengan benar. Dalam unsupervised learning, mesin belajar dari data
tanpa adanya informasi tentang label atau kategori. Tujuan dari unsupervised
learning adalah untuk menemukan pola atau struktur dalam data. Contoh dari
unsupervised learning adalah clustering. Misalnya, jika kita memiliki data
penjualan produk di suatu toko, kita mungkin ingin menggunakan teknik clustering
untuk mengidentifikasi kelompok produk yang sering dibeli bersama-sama oleh
pelanggan. Mesin akan mengelompokkan produk berdasarkan kemiripan
karakteristik, seperti kategori produk, harga, atau preferensi pelanggan, dan
mengidentifikasi kelompok produk yang sering dibeli bersama-sama.
Jadi bisa dikesimpulkan, Supervised learning dan unsupervised learning adalah dua
teknik machine learning yang berbeda dalam pengolahan data. Supervised learning
digunakan ketika terdapat data yang sudah dilabeli dengan benar, sedangkan
unsupervised learning digunakan ketika data belum memiliki label yang jelas.
10. Berikan contoh tentang pemanfaatan big data analytics, beri penjelasan!
Jawaban:
Big data analytics telah banyak dimanfaatkan di berbagai industri untuk meningkatkan
efisiensi, mengidentifikasi peluang baru, dan mengambil keputusan yang lebih tepat
dan akurat. Berikut adalah beberapa contoh pemanfaatan big data analytics:
1. E-Commerce
Perusahaan e-commerce seperti Amazon dan Alibaba menggunakan big data
analytics untuk menganalisis perilaku belanja pelanggan dan menawarkan
rekomendasi produk yang sesuai dengan preferensi dan kebiasaan belanja
pelanggan. Big data analytics juga digunakan untuk menganalisis dan
mengoptimalkan proses logistik dan rantai pasokan.
2. Kesehatan
Dalam industri kesehatan, big data analytics digunakan untuk mengumpulkan,
menganalisis, dan memprediksi tren kesehatan, serta mengidentifikasi faktor risiko
yang dapat mempengaruhi kesehatan pasien. Misalnya, data kesehatan pasien dapat
digunakan untuk memprediksi kemungkinan terjadinya penyakit tertentu pada
pasien dan menganalisis efektivitas pengobatan.
3. Perbankan dan Keuangan
Perusahaan perbankan dan keuangan menggunakan big data analytics untuk
memprediksi risiko kredit, mengidentifikasi kecurangan, dan menganalisis perilaku
konsumen untuk membuat keputusan investasi yang lebih tepat. Big data analytics
juga digunakan untuk mengoptimalkan strategi pemasaran dan promosi.