Anda di halaman 1dari 4

Nama : Mashuril Agil

Nim : 0702173157

Kelas/sem : SI2/semester 7

Ujian Tengah Semester

Data Sains

Waktu : 10.15-11.45

Email : triase@uinsu.ac.id

1.  Ilmu data atau data science adalah salah profesi paling hot yang banyak dibutuhkan
oleh dunia industri akhir-akhir ini. Pekerjaan ini juga menjanjikan penghasilan yang
cukup besar. Jelaskan  beberapa alasan lain yang bisa membuat kamu semakin tertarik
dengan data science

Jawab

Data science sangat berguna dibidang bisnis pada perusahaan besar di era sekarang.
Banyaknya perusahaan-perusahaan yang bergerak dibidang pemberi jasa, uang
elektronik, dan ecommerce menerapkan data science. Seperti kebanyakan ecommerce
dan pelayanan jasa yang sering merekomendasikan jasa dan produk yg dijual kepada
kita. Dari data science itulah mereka bisa mengetahui hal apa yang cocok untuk
direkomendasikan. Maka dari itu menjadi data scientist sangatlah menarik untuk
bekerja di perusahaan besar atau membangun bisnis dan usaha sendiri.

2. Bagaimana langkah awal untuk memulai belajar data science dan menjadi seorang
data analyst atau data scientist?

Jawab
 Menerapkan Learn to Code, yaitu mempelajari dasar ilmu komputer maupun
pembuatan code, seperti R, SAS, Python, dan lain sebagainya.
 Memahami databases yang harus dimiliki setiap seseorang dalam belajar data
scientist. Misalnya MySQL, Netezza, Teradata, dan lainnya.
 Belajar data munging yang dilakukan dari transformasi terhadap Raw Data
menjadi format lain untuk digunakan. Sedangkan Visualization and Reporting
yang mencakup pembelajaran representasi visual data maupun analisis laporan.
 Belajar data munging yang dilakukan dari transformasi terhadap Raw Data
menjadi format lain untuk digunakan. Sedangkan Visualization and Reporting
yang mencakup pembelajaran representasi visual data maupun analisis laporan.
 Mengplikasikan sistem tingkatan dengan data besar, karena data scientist akan
bekerja dalam satu mesin saja.

3. Salah satu hal yang perlu kamu pelajari dalam Data Science ialah mengenal machine
learning. Machine Learning sendiri merupakan salah satu kecerdasan buatan yang
berfokus pada pengembangan suatu sistem yang mampu belajar ‘sendiri’. Dengan
machine learning, pola dari berbagai data bisnis dapat didapatkan dan dimanfaatkan
untuk mencari tahu tren dari suatu bisnis atau faktor tertentu lainnya, Jelaskan type/
teknik mechine learning dan berikan contohnya

Jawab
• Supervised Learning
Pembelajaran pada tipe ini telah diketahui apa yang akan diprediksi atau target
variablenya. Sehingga tujuan membangun algoritma sudah jelas hal apa yang akan
diprediksi. Oleh karena itu model yang dihasilkan dari tipe ini adalah model prediksi.
Model prediksi digunakan untuk melakukan proses prediksi target variable (target
feature) berdasarkan feature-feature lain pada suatu dataset. Algoritma pembelajaran
yang dibangun mencoba untuk menemukan dan memodelkan hubungan antara target
variable (target feature) tersebut dengan feature-feature lainnya.
Klasifikasi adalah contoh task mechine learning tipe supervised untuk melakukan
prediksi. Beberapa contoh penerapan klasifikasi adalah sebagai berikut:
1. Penentuan email adalah email spam.
2. Penentuan seseorang mengidap kanker
3. Penentuan kemenangan suatu tim sepakbola.

• Unsupervised Learning
Unsupervised learning merupakan kebalikan dari tipe sebelumnya dimana tidak
terdapat target variable (target feature) pada dataset. Model yang dihasilkan dari tipe
ini adalah descriptive model.
Salah satu task descriptive model untuk menemukan pola yang bisa mengidentifikasi
asosiasi pada dataset. Contoh implementasinya dapat dilakukan pada menemukan
pola pada proses analisis barang yang dibeli oleh pembeli pada suatu super market
atau mini market. Tujuan dari analisis ini adalah untuk mengetahui barang-barang
yang sering dibeli bersama-sama. Sebagai contoh jika pembeli membeli roti maka
otomatis juga membeli keju dan susu kental manis. Atau jika pembeli membeli sabun
cuci maka juga membeli pengharum pakaian. Dengan informasi pola tersebut maka
pemilik super market dapat menggunakannya untuk membuat iklan diskon untuk
kelompok barang tersebut, atau pemilik juga dapat membuat agar tata letak barang-
barang tersebut dibuat berdekatan.
Task descriptive model yang lain adalah mengelompokkan dataset ke dalam
kelompok-kelompok yang homogen yang disebut dengan istilah clustering.
Kelompok-kelompok homogen yang dihasilkan dari clustering perlu bantuan manusia
untuk melakukan intepretasi hasil tersebut untuk menentukan atau mendeskripsikan
apa isi dari kelompok-kelompok tersebut.
Contoh unsupervised learning adalah:
1.Association rule.
2.K-Mean clustering.

4. Jelaskan tahapan data preprocessing pada python, dan selesaikan tahapan data
preprocessing dengan membuat studi case sendiri

Jawab

5. Sebutkan algoritma yang digunakan untuk menyelesaikan permasalahan data sainces.


Jawab
 K-Nearest Neighbors.
 Naïve Bayes.
 Suport Vector Machine.
 Decision Trees.
 Linear Regression.
 Neural Network.

Anda mungkin juga menyukai