Korelasi adalah sebuah teknik dalam statistika untuk menentukan kuat pengaruh 4. Mengunakan bahasa kalian sendiri, jelaskan kaitan antara data science,
satu variabel dengan variabel lain. Korelasi antara dua variabel semakin machine learning dan deep learning.
berbanding lurus secara linear (semakin besar variabel A, semakin besar variabel
Artificial Intelligence adalah kemampuan program untuk belajar dan
B) bila nilai korelasi mendekati satu. Bila nilai korelasi semakin mendekati negatif
berpikir seperti manusia sehingga dapat menyelesaikan suatu
satu, maka hubungan antara dua variabel akan semakin berbanding terbalik
permasalahan tertentu.
secara linear (semakin besar variabel A, semakin kecil variabel B).
Machine Learning adalah sebuah algoritma yang memiliki kemampuan
Korelasi memang menggambarkan hubungan antara satu variabel dengan untuk belajar tanpa perlu di program secara eksplisit dengan cara dilatih
variabel lain, namun tidak selalu menggambarkan hubungan yang terjadi karena menggunakan data yang bersangkutan dengan permasalahan yang ingin
keterkaitan suatu hal atau kausalitas. Semisal bila dilihat dari korelasi, kenaikan diselesaikan.
kasus kulit terbakar (sunburn) berbanding lurus dengan penjualan es krim. Deep Learning adalah bagian dari machine learning yang dimana
Semakin banyak es krim yang terjual, maka semakin tinggi juga kasus kulit algoritma ini berbentuk seperti jaringan syaraf tiruan yang dapat
terbakar. Namun dibalik korelasi tersebut ada variabel lain yang juga berperan beradaptasi dan belajar dari data dalam jumlah yang besar
penting yaitu suhu dan tingkat konsentrasi sinar UV. Semakin tinggi suhu harian,
5. Apakah yang kalian ketahui mengenai interpretasi data? Bagaimana
semakin tinggi juga penjualan es krim. Hal itu dapat kita logikakan dengan
signiikansi dan tantangannya? Bagaimana kaitan interpretasi data dengan data
sederhana. Begitu juga dengan konsentrasi sinar UV harian, semakin tinggi suhu
story telling dan decission making?
pada hari tersebut, konsentrasi sinar UV akan semakin tinggi dan dapat
menyebabkan sunburn (Sulistya, 2020).
Interpretasi data adalah suatu metode yang digunakan untuk menyampaikan arti Data kuantitaif adalah data yang memiliki nilai numerik sehingga dapat
atau temuan yang terdapat pada data, pada umumnya seorang data analyst akan dihitung langsung dengan matematik, contohnya seperti: Berat badan, umur,
melakukan interpretasi data dengan cara visualisasi sehingga data dapat dengan pendapatan gaji, angka kelahiran, dll.
lebih mudah untuk dipahami oleh stakeholder. Proses visualisasi ini sangatlah
8. Suatu apotik yang sudah memiliki banyak cabang, ingin menghabiskan stok
penting dikarenakan kita sebagai manusia akan lebih mudah untuk memahami
produk OTC-nya yang sudah mendekati expired. Sarankan promosi apa yang
sesuatu berdasarkan visual.
sesuai, dengan menggunakan analisis data science kepada apotik tersebut dan
Kaitan interpretasi data dengan data story telling adalah dalam melakukan data bagaimana tahapannya.
storytelling, dibutuhkan informasi yang bermanfaat, memiliki tujuan dan cerita
yang jelas, dan juga terdapat visualisasi yang menarik sehingga orang yang
melihat akan dengan cepat memahami data yang ada. Sedangkan kaitan dari A. Penentuan metode
interpretasi data dengan decision making adalah dengan adanya interpretasi data metode klasifikasi mampu menemukan model yang membedakan konsep
yang informatif dan mencantumkan juga rekomendasi aksi selanjutnya yang atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu
dapat diambil, orang yang melihat interpretasi data tersebut dapat dengan yakin objek yang labelnya tidak diketahui. Oleh sebab itu, algoritma naive bayes
mengambil keputusan dikarenakan telah melihat situasi yang ada dari data dan dapat memprediksi peluang di masa depan berdasarkan pengalaman
rekomendasi keputusan yang perlu diambil. dimasa sebelumnya. Sehingga dapat mengetahui minat masyarakat pada
produk apotek.
6. Dalam proses analisis data terdapat teknik Klustering dan Klasifikasi.
B. Penentuan variable
Jelaskan perbedaan keduanya, dan berikan contoh pertanyaan yang sesuai
Tentukan variable-variable yang memengaruhi suatu penjualan produk
dengan masing-masing.
C. Perhitungan
Clustering adalah pengelompokkan data yang sedemikian rupa sehingga Perhitungan dengan naïve bayes dapat dilakukan untuk menentukan
objek-objek pada suatu cluster similar (serupa) satu sama lain dan objek peluang yang dihasilkan ketika produk tersebut ketika di asosiasikan atau
antar cluster berbeda dan menggunakan pendekatan unsupervised learning disandingkan atau bahkan tanpa disandingkan.
sehingga algoritma yang digunakan tidak menggunakan data training dan D. Jenis Promosi
algoritmanya belajar sendiri. Berapakah perkiraan harga bitcoin pada tahun Sehingga pemberian suatu promosi yang paling tepat adalah diskon
2024? disesuaikan dengan data Analisa produk terjual.
Sedangkan Klasifikasi adalah permasalahan meng-kategorisasikan
9. Apa perbedaan supervised dan unsupervised learning?
sekelompok observasi baru ke sekumpulan kategori (kelas) yang ada
sebelumnya dan menggunakan pendekatan supervised learning sehingga Supervised Learning adalah jenis algoritma Machine Learning yang
algoritma yang digunakan membutuhkan data training dan algoritmanya menggunakan kumpulan data yang diketahui (disebut kumpulan data
tidak bisa belajar sendiri. Bagaimana cara kerja suatu kernel? pelatihan) untuk membuat prediksi. Dataset pelatihan mencakup data input
dan nilai respons. Dari itu, algoritma pembelajaran yang diawasi berusaha
7. Jelaskan perbedaan antara data kuantitatif dan kualitatif, berikan
membangun model yang dapat membuat prediksi nilai respons untuk
contohnya.
kumpulan data baru.
Data kualitatif adalah data yang tidak memiliki nilai kuantitas hanya bersifat Sedangkan Unsupervised Learning adalah jenis algoritma Machine Learning
pembeda dan non-numerik perlu dikonversi menjadi data kuantitatif jika yang digunakan untuk menarik kesimpulan dari kumpulan data yang terdiri
ingin dihitung, contohnya seperti: Jenis Kelamin, agama, negara, dll. dari data input tanpa tanggapan berlabel.
10. Apa itu data cleansing, apa saja yang harus di bersihkan? Jelaskan Jika alur kerja sudah dilaksanakan, maka langkah selanjutnya adalah
tahapannya! mengendalikan pasca eksekusinya. Tujuannya adalah untuk mengevaluasi
rangkaian dari proses yang sudah dilakukan tersebut. Jika data yang ditemukan
Data cleansing atau yang disebut juga dengan data scrubbing merupakan suatu
tersebut tidak bisa diperbaiki bahkan selama eksekusi dilakukan, maka akan
proses analisa mengenai kualitas dari data dengan mengubah. Bisa juga
dikoreksi secara manual.
pengelola mengoreksi ataupun menghapus data tersebut. Data yang dibersihkan
tersebut adalah data yang salah, rusak, tidak akurat, tidak lengkap dan salah 11. Apa yang harus dilakukan jika ada data yang hilang atau mencurigakan?
format.
Menyiapkan laporan yang berisi seluruh data yang dicurigai. Laporan ini
harus berisi validation criteria yang menyatakan bahwa data hilang
beserta tanggal dan waktu kejadian.
Memeriksa data yang mencurigakan untuk menentukan langkah
perbaikan.
Data yang tidak sah tersebut perlu diganti dengan sebuah validation code.
Tahapan : Gunakan strategi terbaik untuk menganalisis missing data, seperti
1. Audit Data Cleansing deletion method atau single imputation methods.
Lakukan backup utility, berfungsi buat mencegah kehilangan data dengan
Sebelum Anda melakukan data cleansing maka Anda harus melakukan audit data.
cara membuat salinannya.
Tujuannya adalah agar anomaly serta kontradiksi yang ada di dalam basis data
tersebut bisa terdeteksi dengan baik. Ini disebabkan karena proses ini sangat 12. Saat ini investasi menjadi bahan penting dengan maraknya instrumen
mendasar. Jika salah mengaudit data, tentunya proses selanjutnya tidak akan investasi baru dan peluang munculnya kebohongan melalui kampanye investasi.
bisa maksimal. Untuk meminimalisir hal tersebut, maka Anda harus Jelaskan bagaimana kiranya analisis data dapat berperan disini untuk
menggunakan software dan algoritma yang tepat. menciptakan iklim investasi yang baik?
14. Selain data tabular, jenis data apa saja yang biasa diproses oleh data jadi data diolah menjadi informasi, lalu informasi dikumpulkan akan menjadi
scientist? suatu pengetahuan.
Data merupakan sebuah fakta mentah tentang orang, tempat, kejadian, dan
apapun yang penting bagi sebuah perusahaan yang harus dikontrol dan dikelola 17. Apa perbedaan antara data terstruktur, semi terstruktur, dan tidak
terstruktur?
Data terstruktur adalah data yang disimpan dalam baris dan kolom, rata-rata
numerik, dan setiap item data ditentukan. 10% dari total data saat ini adalah data
terstruktur dan dapat diakses melalui sistem pengelolaan database.
Data tidak terstruktur merupakan data yang bentuknya lebih beragam. Data tidak
terstruktur tidak dapat disimpan menggunakan database relasional tradisional.