Anda di halaman 1dari 3

DATA SCIENCE

Data Science adalah topik diskusi yang sangat luas dan subyektif. Menurut definisinya, Data
Science bukanlah sebuah ilmu yang berdiri sendiri. Melainkan merupakan kombinasi dari
berbagai bidang termasuk Ilmu Komputer, Matematika, Statistik, dan Strategi Bisnis. Tiga
komponen yang terlibat dalam Data Science yaitu Organising, Packaging, dan Delivering
Data (The OPD of Data). Organising data adalah proses penyimpanan data yang digabungkan
dengan manajemen data. Packaging data merupakan proses manipulasi dan penggabungan
data mentah yang akan direpresentasikan. Delivering data merupakan proses untuk
memastikan bahwa pesan data telah diakses oleh mereka yang memerlukannya. Menurut
penelitian tahun 2011, diperkirakan pada tahun 2020 dunia akan menghasilkan 50 kali lipat
data dibandingkan tahun 2011. 

Jadi dengan peningkatan aliran data yang drastis tersebut, akan muncul alat-alat baru yang
dapat digunakan untuk memanfaatkan data mentah dengan tepat. Data Science mencakup
semua alat, teknik, dan teknologi yang akan membantu kita menangani peningkatan aliran
data tersebut. Data Science merupakan perpaduan interdisipliner dari penurunan data,
pengembangan algoritma, dan teknologi untuk memecahkan masalah analitik yang kompleks.

Alhasil saat ini, Data Science telah banyak dibicarakan di berbagai kegiatan baik diskusi
kelompok, seminar, pelatihan, dan acara lain. Namun apakah kamu tahu apa itu Data
Science sebenarnya? Apa yang dilakukan oleh Data Science? Dan apa contoh nyatanya? Kali
ini DQLab akan menjawab pertanyaan tersebut. Penasaran? baca artikelnya sampai selesai
ya!

1. Apa Sih Data Science Itu?

Menurut Urban Institute, Data Science merupakan keterampilan yang membutuhkan ilmu
komputer, pemrograman, teknologi, dan statistik yang berada di luar rangkaian pelatihan
standar bagi peneliti ilmu sosial. Keterampilan ini mencakup teknologi dan teknik seperti
memanfaatkan komputasi Cloud, analisis Big Data, pemrosesan Natural Language,
pembelajaran tanpa pengawasan (Unsupervised Learning) seperti analisis Cluster, Web
Scraping, teknik Fuzzy, Machine Learning, dan lain sebagainya. 

Data Science dapat membantu peneliti agar dapat bekerja lebih efektif untuk menghasilkan
informasi baru yang tepat waktu, menjelajahi kumpulan data yang benar-benar baru dengan
cara baru, mengubah pemodelan simulasi, dan lain sebagainya dengan tujuan untuk
meningkatkan kuantitas dan kualitas bukti yang diperlukan untuk membuat kebijakan yang
lebih baik, memperkuat komunitas, dan meningkatkan kehidupan masyarakat. 
 

Seseorang yang memahami Data Science disebut Data Scientist. Seorang Data Scientist tidak
harus memahami semua kemampuan yang dibutuhkan karena biasanya Data Scientist bekerja
pada tim yang memiliki kemampuan dan keterampilan yang berbeda-beda sehingga dapat
saling melengkapi. Secara umum, keterampilan dasar terpenting untuk Data Scientist adalah
kemampuan untuk membuat kode dalam setidaknya dua bahasa pemrograman yaitu Python
dan R. Keterampilan umum lainnya yang diperlukan oleh seorang Data Scientist adalah
keterampilan organisasi yang baik, komunikasi yang jelas, dan kemampuan untuk menguasai
konsep dan teknik baru dengan cepat.

Baca juga: Memahami Keunggulan dan Manfaat Data Science dalam Dunia Bisnis

2. Alat yang Digunakan Data Science

Setelah memahami pengertian Data Science, kita wajib memahami alat yang umum
digunakan dalam Data Science. Alat tersebut antara lain Big Data, Machine Learning, Data
Mining, Deep Learning, dan Artificial Intelligence. Kali ini kita akan membahasnya satu
persatu.

 Alat pertama yang akan kita bahas adalah Big Data. Dengan menggunakan Big Data,
Data Scientist dapat membantu perusahaan untuk memprediksi produk apa yang akan
dijual, membantu perusahaan telekomunikasi untuk memprediksi kapan dan mengapa
pelanggan mengganti operator, dan membantu perusahaan asuransi mobil untuk
memahami seberapa baik pelanggan mereka mengemudi, memprediksi penyebaran
dan lain sebagainya.

 Alat yang kedua adalah Machine Learning. Machine Learning bersifat interdisipliner
dan menggunakan teknik dari bidang ilmu komputer, statistik, dan Artificial
Intelligence. Komponen utama Machine Learning adalah algoritma yang dapat belajar
secara otomatis dari pengalaman untuk memperbaiki kinerjanya. Algoritma ini dapat
diterapkan di berbagai bidang.

 Alat selanjutnya adalah Data Mining. Data Mining adalah penerapan algoritma
khusus untuk mengekstraksi pola pada sebuah kumpulan data. Data mining
berhubungan erat dengan Machine Learning. Data Mining adalah sebuah proses yang
menggunakan algoritma Machine Learning untuk mengekstrak pola-pola informatif
yang disimpan dalam kumpulan data.
 Alat berikutnya adalah Deep Learning. Deep Learning adalah istilah yang relatif baru
yang sedang banyak dibicarakan belakangan ini. Deep Learning adalah proses
penerapan teknologi Deep Neural Network. Deep Neural Network adalah arsitektur
jaringan saraf dengan beberapa lapisan tersembunyi untuk memecahkan masalah. 

 Alat terakhir untuk Data Science adalah Artificial Intelligence. Artificial Intelligence
atau biasa disebut AI adalah bidang ilmu komputer yang menekankan pada
penciptaan mesin cerdas yang bekerja dan bereaksi seperti manusia. Komponen inti
dari AI adalah pemrograman komputer untuk sifat-sifat tertentu seperti pengetahuan,
penalaran, pemecahan masalah, persepsi, pembelajaran, perencanaan, dan lain
sebagainya.

  

3. Contoh Implementasi Data Science

Setelah memahami definisi dan alat yang digunakan dalam Data Science, saatnya kita
mengenal lebih jauh ilmu data ini. Data Science dapat diterapkan di semua bidang mulai dari
bidang jurnalisme, sosial, finansial, dan lain sebagainya. Contoh penerapan Data Science di
dunia nyata adalah menggunakan pemrosesan Natural Language dan Machine Learning pada
artikel berita untuk mengidentifikasi reformasi zonasi. Data Scientist di Pusat Kebijakan
Perumahan dan Komunitas Metropolitan Urban ingin memperkirakan dampak reformasi
zonasi pada pasokan perumahan di sejumlah wilayah metropolitan di Amerika Serikat. Data
Scientist tidak mungkin mendapatkan data historis dari ribuan kotamadya di area metro ini,
sehingga mereka menggunakan data dari lebih dari 2.000 sumber berita lokal untuk
mengidentifikasi reformasi lokal. Dengan menerapkan pemrosesan Natural Language dan
Machine Learning, mereka dapat menandai artikel yang menyebutkan reformasi besar dan
menambahkan metadata yang relevan seperti apakah artikel tersebut menyebutkan parkir,
batas ketinggian, atau karakteristik lainnya. Dengan menggunakan metode ini, Data Scientist
dapat mengumpulkan kumpulan data berdasarkan jenisnya. 

Contoh implementasi lainnya yaitu ketika menyalin catatan pengadilan untuk


menginformasikan kebijakan pemeriksaan latar belakang kriminal. Para Data Scientist di
Pusat Kebijakan Kehakiman ingin membuat perkiraan jumlah orang di Washington DC yang
mungkin memiliki catatan kriminal. Tim Data Scientist bekerja sama dengan tim Researcher
untuk mengumpulkan data dari alat penelusuran online Pengadilan Tinggi Washington yang
digunakan oleh para Data Scientist untuk membuat statistik mengenai latar belakang kriminal
masyarakat di Washington DC.

Anda mungkin juga menyukai