Anda di halaman 1dari 3

1. Apa itu Data Science ?

Menurut (Loukides, 2011) “A data application acquires its value from the data itself, and
creates more data as a result. It’s not just an application with data; it’s a data product. Data
science enables the creation of data products.” Sedangkan menurut (DQLab, 2019) Data
Science merupakan keilmuan terkait mengolah dan melakukan analisa data yang
menggabungkan kemampuan programming, statistika, serta pemahaman bisnis.

Apa perbedaan antara supervised dengan unsupervised learning ?

Menurut (JagoanHosting, 2017) Supervised learning membutuhkan data training (harus


dilatih terlebih dahulu) sedangkan unsupervised learning tidak membutuhkan data training
(tidak perlu dilatih terlebih dahulu).

2. Menurutmu, keterampilan apa yang perlu dimiliki saat menggunakan Python untuk
menganalisis data?

Menurut pengalaman saya, dari kegiatan sertifikasi Artifical Intelligence yang diadakan
oleh Kominfo, salah satu materinya mempelajari mengenai Python Fundamental, ketrampilan
yang perlu dipelajari menurut saya adalah memaksimalkan penguasaan library seperti
Pandas,Numpy dan juga memahami built in data seperti list,dictionaries,tupples dan set.

3. Apa perbedaan dari format data “long” dan “wide”?


Menurut (Dewi, 2019) perbedaan dari format data “long” dan “wide” yaknid
dalam format “wide”, respon berulang subjek akan berada dalam satu baris,dan setiap
respon berada dalam kolom terpisah. Sedangkan dalam format “long”, setiap baris adalah
titik satu kali per subjek. Artinya kita dapat mengenali data dalam format wide
berdasarkan kolom yang umumnya mewakili grup.

4. Bagaimana cara kamu menjelaskan regresi linier kepada Business Executive?


Menurut (Cyntara, 2019) Regresi adalah suatu metode analisis statistik yang digunakan
untuk melihat pengaruh antara dua atau lebih banyak variabel, Kegunaan analisis regresi
di antaranya untuk mengetahui variabel-variabel kunci yang memiliki pengaruh terhadap
suatu variabel bergantung, pemodelan, serta pendugaan (estimation) atau peramalan
(forecasting). Jadi Business Executive dapat mengastraksikan dan mendapat gambaran
fungsi dari regresi secara sederhana.

5. Apa saja model alternatif untuk regresi linier? Apa yang membuat alternative tersebut
lebih baik atau lebih buruk?
Ada beberapa salah satunya adalah model Random Forests, Menurut (Breiman,
2001) Dalam penelitiannya menunjukkan kelebihan random forest antara lain dapat
menghasilkan error yang lebih rendah, memberikan hasil yang bagus dalam klasifikasi,
dapat mengatasi data training dalam jumlah sangat besar secara efisien, dan metode yang
efektif untuk mengestimasi missing data.
Breiman, L. (2001). Random Forests (p. 33). University of California.

Cyntara, R. (2019, November 23). Pengertian Regresi dan Penerapannya Secara Nyata

[Commercial]. Pengertian Regresi dan Penerapannya. lifepal.co.id/blog/regresi

Dewi, N. R. (2019, October 31). 5 Pertanyaan interview Data Scientist ini penting kamu pelajari

[Commercial]. 5 Pertanyaan interview Data Scientist ini penting kamu pelajari.

https://www.ekrut.com/media/pertanyaan-interview-data-scientist

DQLab. (2019). Data Science di Indonesia. Data Science | DQLab. https://www.dqlab.id/data-

science/

JagoanHosting. (2017, October 10). Cari Tahu Apa Bedanya Supervised vs Unsupervised

Learning. https://www.jagoanhosting.com/blog/cari-tahu-apa-bedanya-supervised-vs-

unsupervised-learning/

Loukides, M. (2011). What Is Data Science. O’Reilly Media, Inc.

Anda mungkin juga menyukai