0% menganggap dokumen ini bermanfaat (0 suara)
2K tayangan5 halaman

Soal Esai

Dokumen tersebut membahas berbagai konsep dasar dalam data science seperti bias dan varian, jenis data (terstruktur dan tidak terstruktur), skala data (ordinal dan interval), tipe data dan bahasa pemrograman (Python), serta jenis-jenis pembelajaran mesin.

Diunggah oleh

Wildan Attariq
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
2K tayangan5 halaman

Soal Esai

Dokumen tersebut membahas berbagai konsep dasar dalam data science seperti bias dan varian, jenis data (terstruktur dan tidak terstruktur), skala data (ordinal dan interval), tipe data dan bahasa pemrograman (Python), serta jenis-jenis pembelajaran mesin.

Diunggah oleh

Wildan Attariq
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd

1. Apa perbedaan dari bias dan varian dalam data science?

Jawaban :
Bias
Bias adalah perbedaan antara rata rata hasil prediksi dari model ML yang kita develop
dengan data nilai yang sebenarnya. Bias yang tinggi dikarenakan dalam pembangunan
model ML, dilakukan terlalu sederhan (oversimplified). Faktor penyebab lain
dikarenakan model ML yang di develop terlalu tidak terlalu berinteraksi dengan training
data. Bias seringkali terjadi dalam development sistem machine learning.

Variance
Variance adalah variabel dari prediksi model untuk data tertentu dimana memberikan
kita informasi perserbaran data kita. Model yang memiliki variance tinggi sangat
memperhatikan hanya pada train data. High variance model, perform baik di train data.
Tetapi jika disuguhkan data baru yang belum pernah ditemukan di train data. Model
tersebut tidak dapat mengeneralisasikan secara baik dari identifikasi data baru tersebut.
Alhasil model memprediksi dengan keliru.

2. Jelaskan dan berikan contoh structured data dan unstructured data yang biasa kalian temui!
Jawaban :
Data terstruktur adalah data yang berada dalam satu tempat baik berbetuk
sebuah file termasuk data yang berada dalam database ataupun spreadsheet. Data
terstruktur adalah yang membuat model data. Contohnya adalah data CRM, Industry
Research Data dan lain sebagainya. Data terstruktur biasanya dijalankan untuk
mengakses database yang disebut dengan Structured Query Languange atau yang lebih
dikenal dengan SQL.

Sedangkan Data tidak terstruktur adalah data yang tidak mudah diklasifikasi dan
dimasukan kedalam sebuah kotak dengan rapi. Contohnya adalah foto, gambar grafis,
streaming instrument data, webpages, pdf, PowerPointpresentations, konten blog dan
lain sebagainya.

3. Apa yang dimaksud dengan data ordinal dan data interval?


Jawaban :
DATA ORDINAL
Data berskala ordinal adalah data yang diperoleh dengan cara kategorisasi atau
klasifikasi, tetapi diantara data tersebut terdapat hubungan.
Contoh:
Kepuasan pelanggan, diklasifikasikan sebagai:
Sangat puas, diberi tanda 1,
Puas, diberi tanda 2,
Cukup puas, diberi tanda 3,
Tidak puas diberi tanda 4,
Sangat tidak puas diberi tanda 5
Ciri Data Ordinal:
posisi data tidak setara. Dalam kasus di atas, sikap pelanggan yang sangat puas, lebih
tinggi dari yang puas. Sikap pelanggan yang puas, lebih tinggi dari yang cukup puas, dst.
Angka/tanda bisa dibalik dari 5 hingga 1, tergantung kesepakatan. Tidak bisa dilakukan
operasi matematika. Tidak mungkin 1+2=3 (yang berarti sangat puas ditambah puas =
cukup puas)

DATA INTERVAL

Data interval adalah data yang diperoleh dengan cara pengukuran, dimana jarak antar
dua titik pada skala, sudah diketahui. Berbeda dengan skala ordinal, dimana jarak dua
titik tidak diperhatikan (seperti berapa jarak antara puas dan tidak puas, yang
sebenarnya menyangkut perasaan orang saja)

Contoh:
Temperatur ruangan. Bisa diukur dalam Celsius, atau Fahrenheit, dengan masing-masing
punya skala sendiri. Untuk air membeku dan mendidih:

Celcius pada 0° C sampai 100° C. Sakala ini jelas jaraknya, bahwa 100-0=100
Fahreinheit pada 32° F sampai 212°F. Skala ini jelas jaraknya, 212-32=180

Ciri Data Interval:


Tidak ada kategorisasi atau pemberian kode seperti terjadi pada data nominal dan
ordinal. Bisa dilakukan operasi matematika. (panas 40 derajad adalah dua kali panas
disbanding 20 derajat)

4. Apa yang dimaksud dengan data types, compiler, dan interpreter?


Jawaban :
Data types atau tipe data adalah sebuah pengklasifikasian data berdasarkan jenis data
tersebut. Tipe data dibutuhkan agar kompiler dapat mengetahui bagaimana sebuah
data akan digunakan. Untuk mengembangkan sebuah program, ada beberapa tipe data
yang akan kita pelajari. Di antaranya adalah Character, String, Array, Numbers dan
Booleans.

Compiler adalah sebuah program yang digunakan untuk mengonversi kode yang ditulis
dalam natural language processing agar dapat dipahami oleh komputer. Pada proses ini,
compiler mengeksekusi kode yang menunjukkan kapan sinyal tinggi dan rendah biner
diperlukan dalam unit logika aritmatika prosesor.

Interpreter adalah Perangkat lunak yang mampu mengeksekusi code program (yang
ditulis oleh programmer) lalu menterjemahkannya ke dalam bahasa mesin, sehingga
mesin melakukan instruksi yang diminta oleh programmer tersebut. Perintah-perintah
yang dibuat oleh programmer tersebut dieksekusi baris demi baris, sambil mengikuti
logika yang terdapat di dalam kode tersebut.

5. Apa perbedaan dari low-level-programming dan high-level-programming? Berikan contoh


masing-masing!
Jawaban :
High Level Language adalah bahasa yang ramah bagi programmer yang menyediakan
abstraksi tingkat tinggi dari perangkat keras. Low Level Language adalah bahasa yang
ramah mesin dan memberikan abstraksi tidak kurang dari perangkat keras. Bahasa
Tingkat Tinggi lebih lambat daripada Bahasa Tingkat Rendah.

6. Sebutkan macam-macam data type yang ada di python dan contohnya!


Jawaban :
Jenis-jenis Tipe Data dalam Bahasa Python Dalam bahasa pemrograman Python,
terdapat 9 tipe data dasar:
1. String
2. Integer
3. Float
4. Complex Number
5. Boolean
6. List
7. Tuple
8. Set
9. Dictionary

Namun saya akan tampilkan kode program singkat dari penggunaan ke 9 jenis tipe data
ini:
#Tipe Data String
foo = "Belajar Python di Duniailkom"
print(foo)

#Tipe Data Integer


foo = 1500
print(foo)

#Tipe Data Float


foo = 99.123
print(foo)

#Tipe Data Complex Number


foo = 4j
print(foo)

#Tipe Data Boolean


foo = True
print(foo)

#Tipe Data List


foo = ["satu","dua","tiga","satu"]
print(foo)

#Tipe Data Tuple


foo = ("satu","dua","tiga","satu")
print(foo)

#Tipe Data Set


foo = {"satu","dua","tiga","empat"}
print(foo)

#Tipe Data Dictionary


foo = {"satu":1, "dua":2.13, "tiga":"a", "empat": True}
print(foo)

7. Menurut kalian, mengapa data kualitatif diperlukan dalam pengolahan di data science?
Bagaimana cara yang tepat untuk mengolahnya?
Jawaban :
Ilmu yang penting, karena bisnis kecil maupun besar sangat bergantung pada data. Jika
perusahaan tidak mampu mengolah data, bisnis tidak akan memiliki pedoman untuk
strategi operasi yang efektif dan efisien untuk mendapat keuntungan.

8. Apa perbedaan dari function dan procedure dalam pemrograman?

Jawaban :

Karena keduanya memiliki kesamaan yang cukup besar yaitu sebagai subprogram, maka
banyak dari kita masih sulit membedakan antara prosedur dan fungsi. Berikut
perbedaan keduanya:

1. Prosedur dideklarasikan menggunakan sintaks procedure, sedangkan fungsi


dideklarasikan menggunakan sintaks function.
2. Prosedur bisa dibentuk dengan parameter maupun tanpa parameter, sedangka
fungsi harus dibentuk menggunakan parameter.
3. Nilai yang dihasilkan fungsi akan disimpan pada nama fungsi itu sendiri dan dapat
dipindah alihkan kedalam variabel, sedangkan prosedur tidak bisa.

9. Apa perbedaan dari supervised learning, unsupervised learning, dan self supervised learning?
Jawaban :
Supervised learning adalah sebuah pendekatan dimana sudah terdapat data yang
dilatih, dan terdapat variable yang ditargetkan sehingga tujuan dari pendekatan ini
adalah mengkelompokan suatu data ke data yang sudah ada, lain halnya dengan
unsupervised learning, unsupervised learning tidak memiliki data latih, sehingga dari
data yang ada, kita mengelompokan data tersebut menjadi 2 bagian atau 3 bagian dan
seterusnya.

10. Jelaskan dengan bahasa kalian sendiri, bagaimana cara kerja neuron yang terdapat dalam neural
network!
Jawaban :
Neuron (jaras) adalah jenis tertentu dari sel yang khusus untuk menyimpan dan
mengirimkan informasi. Neuron berfungsi untuk menerima, meneruskan, dan memproses
stimulus; memicu aktivitas sel tertentu dan pelepasan neurotransmiter dan molekul
informasi lainnya Sel saraf atau yang biasa kita sebut neuron adalah sel yang merupakan
satuan kerja utama dalam sistem saraf manusia. Sel Saraf berfungsi untuk
menghantarkan impuls listrik dari suatu rangsangan (Stimulus). 

Anda mungkin juga menyukai