Anda di halaman 1dari 14

Data Science

081221444011
Pembahasan
• Pengertian Data Science
• Alat yang Digunakan
• Siklus Hidup Data Science
• Persyaratan dalam Data Science
• Contoh Penerapan Data Science
• Apa yang Dilakukan Data Scientist?
• Pengawasan Data Science
Pengertian Data Science
• Data science merupakan fokus studi yang berhubungan dengan besarnya volume data
menggunakan teknik modern demi menemukan pola-pola tak terlihat, mendapat
informasi bermakna, serta membuat keputusan bisnis dengan informasi tersebut.
• Algoritma pembelajaran mesin yang kompleks digunakan dalam data science untuk
membangun model yang prediktif.
• Merupakan kombinasi dari berbagai bidang, khususnya matematika, ilmu komputer,
strategi bisnis, sampai statistik.
Alat yang digunakan
Alat-alat yang digunakan dalam data science secara umum ialah
1. Big Data
2. Machine Learning
3. Data Mining
4. Deep Learning
5. Artificial Intelligence
Big Data
Big data adalah sekumpulan data yang memiliki volume atau ukuran yang sangat besar yang
terdiri dari data yang terstruktur (structured), semi-terstruktur (semi structured), dan tidak
terstruktur (unstructured) yang dapat berkembang seiring waktu berjalan.
Machine Learning
Machine learning (ML) adalah mesin yang dikembangkan untuk bisa belajar dengan
sendirinya tanpa arahan dari penggunanya. Pembelajaran mesin dikembangkan
berdasarkan disiplin ilmu lainnya seperti statistika, matematika dan data mining sehingga
mesin dapat belajar dengan menganalisa data tanpa perlu di program ulang atau
diperintah.
Dalam hal ini machine learning memiliki kemampuan untuk memperoleh data yang ada
dengan perintah ia sendiri. ML juga dapat mempelajari data yang ada dan data yang ia
peroleh sehingga bisa melakukan tugas tertentu. Tugas yang dapat dilakukan oleh ML pun
sangat beragam, tergantung dari apa yang ia pelajari.
Data Mining
Secara teknis, data minig adalah proses yang memanfaatkan teknik-teknik statistik,
matematika, dan kecerdasan buatan untuk mengekstrak dan mengidentifikasi informasi dan
knowledge selanjutnya (atau pola-pola) yang berasal dari sekumpulan data yang sangat
besar.
Deep Learning
Deep learning adalah metode dalam kecerdasan buatan (AI) yang mengajarkan komputer
untuk memproses data dengan cara yang terinspirasi otak manusia. Model deep learning
dapat mengenali pola kompleks dalam gambar, teks, suara, dan data lain untuk
menghasilkan wawasan dan prediksi yang akurat. Anda dapat menggunakan metode deep
learning untuk mengotomatiskan tugas yang biasanya membutuhkan kecerdasan manusia,
seperti mendeskripsikan citra atau menyalin file suara ke dalam teks..
Artificial Intelligence
Alat data science yang terakhir ialah Artificial Intelligence. Istilah yang umum disebut AI itu
merupakan bidang ilmu komputer yang menekankan penciptaan mesin cerdas yang dapat
bereaksi dan bekerja layaknya manusia. Adapun, AI punya komponen inti berupa
pemrograman komputer untuk sifat tertentu, misalnya penalaran, pengetahuan, persepsi,
pemecahan masalah, pembelajaran, perencanaan, dan lain sebagainya.
Siklus Hidup Data Science
Setelah akhirnya mengetahui alat-alat yang umum dipakai dalam data science, mari kita
fokus terhadap siklus hidup dari ilmu data itu sendiri. Siklus ini terdiri atas lima tahap
berbeda yang masing-masing punya tugas tersendiri.
1. Tangkap
2. Memelihara
3. Proses
4. Analisis
5. Visualisasi
Persyaratan dalam Data Science
1. Pembelajaran Mesin
Machine Learning pemahaman yang kuat tentang bidang ini, pengetahuan dasar statistik.
2. Pemodelan
Identifikasi algoritma yang paling cocok demi memecahkan masalah yang ada dan melatih model itu sendiri.
3. Statistik
Inti dari data science ialah statistik.
4. Pemrograman
Diperlukan beberapa tingkat pemrograman demi menjalankan proyek data science yang berhasil. bahasa
pemrograman ialah Python, dan ia sangat populer karena mudah dipelajari dan mendukung banyak literatur
data science dan Machine Learning.
5. Database
Perlu memahami cara kerja database, pengelolaan, dan cara mengekstrak data dari database untuk menjadi
seorang data scientist yang cakap.
Contoh Penerapan Data Science
1. Froud Detection
Transaksi di Financial seperti Bank, Efek, dll.
2. E-Commerce
Promosi produk berdasarkan profile pembeli
3. Transportasi
Maps traffic yang digunakan oleh Google, waze, dll.
Apa yang Dilakukan Data Scientist?
1. Menentukan masalahnya dengan mengajukan pertanyaan dan memperoleh
pemahaman.
2. Menentukan kumpulan variabel dan kumpulan data yang benar.
3. Mereka mengumpulkan data terstruktur dan tidak terstruktur dari banyak sumber
4. Memproses data mentah dan mengubahnya menjadi format yang sesuai untuk analisis
5. Memasukkan ke dalam sistem analitik: algoritma Machine Learning atau model statistik.
para data scientist menganalisis dan mengidentifikasi pola dan tren.
6. Menginterpretasikan data untuk menemukan peluang dan solusi.
7. Menyiapkan hasil dan wawasan untuk dibagikan dengan pemangku kepentingan yang
sesuai dan mengkomunikasikan hasilnya.
Pengawasan Data Science
1. Manajer Bisnis
Manajer bisnis adalah orang yang bertugas mengawasi metode pelatihan data science. berkolaborasi dengan tim data
science untuk mengkarakterisasi masalah dan menetapkan metode analitis. Tujuan mereka adalah untuk memastikan
proyek selesai tepat waktu dengan berkolaborasi erat dengan data scientist dan manajer TI.
2. Manajer TI
Bertanggung jawab untuk mengembangkan infrastruktur dan arsitektur untuk memungkinkan kegiatan data science.
3. Manajer Data Science
Melacak dan mengawasi prosedur kerja semua anggota tim. Mereka juga mengelola dan melacak aktivitas sehari-hari
dari tiga tim data science. Membangun tim yang dapat memadukan perencanaan dan pemantauan proyek dengan
pertumbuhan tim.

Anda mungkin juga menyukai