0% menganggap dokumen ini bermanfaat (0 suara)
160 tayangan4 halaman

Tugas Individu Data Sains

Diunggah oleh

wanilam04study
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
160 tayangan4 halaman

Tugas Individu Data Sains

Diunggah oleh

wanilam04study
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd

TUGAS INDIVIDU

DATA SAINS

Disusun Oleh:
NAMA : FIKA ARIANTI
NIM : (22650185)

PROGRAM STUDI TEKNIK INFORMATIKA


FAKULTAS TEKNIK
UNIVERSITAS DAYANU IKHSANUDDIN PASARWAJO
2024
1. Data sains itu apa? – hubungannya dengan data mining dan machine
learning
 Data sains atau data science adalah fokus studi yang berhubungan
dengan besarnya volume data menggunakan teknik modern demi
menemukan pola-pola tak terlihat, mendapat informasi bermakna, serta
membuat keputusan bisnis dengan informasi tersebut. Data sains atau
Data science termasuk topik diskusi yang benar-benar luas dan dengan
subjektivitas yang kental. Data science sendiri, menurut definisinya,
bukanlah suatu ilmu yang berdiri sendiri. Ia merupakan kombinasi dari
berbagai bidang, khususnya matematika, ilmu komputer, strategi
bisnis, sampai statistik. Data sains atau data science memiliki
keterkaitan atau hubungan dengan data mining dan machine learning
karena kedua hal tersebut merupakan alat – alat yang digunakan dalam
data sains atau data science. Data Mining sebagai salah satu alat yang
merupakan penerapan algoritma khusus untuk mengekstraksi pola
suatu kumpulan data. Data Mining ini erat hubungannya
dengan Machine Learning dalam hal mengekstrak pola informatif yang
tersimpan dalam kumpulan data. Machine Learning adalah alat kedua.
Alat ini punya sifat interdisipliner serta menggunakan teknik dari
bidang statistik, ilmu komputer, serta Artificial Intelligence.
Komponen utama dari Machine Learning adalah algoritma yang
secara otomatis bisa belajar dari pengalaman untuk memperbaiki
kinerjanya. Dalam berbagai bidang, algoritma sendiri memang
digunakan.
2. Perbedaan data scientist, data analyst, dan data engineer? Skills yang
dibutuhkan masing – masing?
 a) Perbedaannya yaitu :
- Data Scientist adalah orang yang mengambil atau mengumpulkan
data yang besar, kemudian mengolah data tersebut serta menggali
sebuah insight baru yang akan berguna di masa depan terutama dalam
membantu perusahaan untuk proses pengambilan keputusan.
- Secara umum, seorang Data Analyst akan mengambil atau
mengumpulkan data, mengaturnya dan menggunakannya untuk
mendapatkan suatu kesimpulan sesuai dengan proyek yang sedang
diamati, seperti penjualan, inventaris, atau media sosial.
- Data Engineer adalah orang akan mengembangkan platform untuk
data-data yang telah diolah dan ditafsirkan oleh seorang Data Analyst
dan juga Data Scientist. Mulai dari merancang arsitektur database serta
memelihara infrastruktur data di suatu perusahaan.
b) Skill yang dibutuhkan :
- Data scientist : matematika, analisis statistika, machine learning,
big data, data visualization, programming, software engineering,
communication skill, critical thingking dan business acumen.
- Data analyst : menguasai Bahasa pemrograman (SQL, Python dan
oracle), bisa MS. Excel, statistik dan matematika, visualisasi data dan
kemampuan presentasi.
- Data engineer : menguasai Bahasa pemrograman (SQL dan
Python), teknologi cloud platforms, pengetahuan di bidang system
scripting, pemahaman operating system, analisis data, pemahaman data
warehousing, berpikir kritis, memahami dasar – dasar machine
learning, kemampuan komunikasi dan kemampuan public speaking.
3. Sebutkan dan jelaskan tentang pipeline data?
 Definisi pipeline data seperti yang terlihat pada artikel lain adalah
serangkaian langkah yang memindahkan data dari sumber ke
tujuan. Namun sebagai permulaan, hal ini dapat menimbulkan
kebingungan. Meskipun minyak di kilang minyak menggerakkan
minyak, data tidak bergerak. Perpindahan memerlukan perubahan
posisi dari titik A ke titik B. Bayangkan betapa buruknya hal ini
jika data hilang dari sumbernya setelah dipindahkan ke database
lain untuk dianalisis. Data tidak berpindah dari sumbernya.
Sebagai gantinya, salinan dibuat. Dan dari sana, diproses dalam
serangkaian tugas. Bisa dibilang salinannyalah yang
bergerak. Pada dasarnya ada 3 komponen pipeline data yaitu
tujuan, sumber atau asal data dan Langkah – Langkah pemrosesan.
DAFTAR PUSTAKA

 Gramedia Blog : https://www.gramedia.com/literasi/data-


science-adalah/#google_vignette
 https://dqlab.id/3-perbedaan-data-analyst-data-scientist-dan-
data-engineer?
utm_source=google&utm_medium=cpc&utm_campaign=dqlab
-id-register-dsa-
s_dsa&utm_term=dqlabref=google&dqlabref=google&gad_so
urce=1&gclid=Cj0KCQjwlZixBhCoARIsAIC745CKZkci_iQK
MfIQwrxW-
SqiXbSe8mdDGY2j47zllTNveRoox7MNhm8aArtKEALw_wc
B
https://kelas.work/blogs/hard-skill-dan-soft-skill-yang-harus-
dimiliki-data-scientist-profesional#:~:text=Seorang%20Data
%20Scientist%20mengerjakan%20tugas,data%20secara
%20objektif%20dan%20akurat
https://futureskills.id/blog/5-skills-yang-harus-dimiliki-oleh-
data-analyst/
https://glints.com/id/lowongan/karier-data-engineer-adalah/
 https://blog.skyvia.com/what-is-data-pipeline/

Anda mungkin juga menyukai