Anda di halaman 1dari 5

Data Scientist

Profesi Paling Seksi di Abad ke 21


Keterampilan yang dibutuhkan & Besar Gaji seorang Data Scientist
Data Scientist di Abad ke 21
Data scientist mulai dianggap pekerjaan paling keren di bidang Information Technology (IT) saat
ini. Profesi baru ini muncul seiring dengan perkembangan Big Data, yang merupakan hal baru di
abad ke-21 dan sudah cukup matang untuk dieskplor sampai sekarang. Sedangkan, data science
melingkupi proses memperoleh data, menganalisanya, sampai melaporkan hasil data yang dapat
berupa metrik bisnis sampai perilaku pengguna dalam perusahaan. Beberapa dari kalian
mungkin telah mengetahui sedikit banyak tentang data science jika belajar statistik, bahasa
pemrograman Python atau SQL, dan pemecahan masalah berbasis data.

Tahukah kalian bahwa setiap


peristiwa di kehidupan kita juga
dapat dijadikan data? Oleh karena
itulah, pekerjaan data scientist
sangat melimpah, menguntungkan,
dan memuaskan secara intelektual.
(Beberapa perusahaan
menyamakan pengertian "data
scientist" dan "data analyst.
Dalam artikel ini, penulis
menyebutkan data scientist yang
merujuk pada data scientist dan
data analyst, meskipun ada
beberapa perbedaan di antara
keduanya.)

Perusahaan saat ini memiliki data yang sungguh berlimpah dan bervariasi. Data petabyte
bisa memaparkan rincian detail mengenai kapan, seberapa sering, dan dimana para
pelanggan menggunakan suatu produk. Tetapi semua data itu tidak akan menyumbangkan
keuntungan bagi perusahaan jika seseorang tidak dapat mengaturnya, mengevaluasi,
mencari insight yang dapat ditindaklanjuti, dan menyampaikan hasil data tersebut secara
visual, verbal, atau keduanya. Gary King, seorang political sicientist dari Amerika Serikat,
pernah menyampaikan ke Harvard Magazine bahwa, Sedang terjadi revolusi data yang
besar. Revolusi data yang besar adalah ketika kita bisa melakukan sesuatu dengan data.

2
Apa Yang Dikerjakan Data Scientist ?
Penemuan informasi secara otomatis tidak ada gunanya jika
melewatkan fakta-fakta penting. Dalam penemuan informasi, ada
Rumitnya model analisa data dan
tahapan yang harus dilakukan secara individu, ad hoc, maupun
beberapa kemungkinan penyimpangan bertujuan sementara. Sedangkan penemuan informasi otomatis
perhitungan data merupakan tantangan hanya bisa fokus pada hal-hal utama, padahal banyak hal-hal
pendukung dalam data yang juga dibutuhkan.
tersendiri dalam bidang data science.
Penemuan hal-hal utama dalam data, misalnya harga saham
Penyulingan informasi dari data yang dari layanan pasar saham atau data cuaca dari lembaga ramalan
tidak terstruktur adalah salah satunya, cuaca. Proses mengidentifikasi, mengekstrak, dan memvisualisasikan
terutama bila fakta disembunyikan data ini sebenarnya dapat digunakan kembali oleh pengguna yang
lain. Hal ini tentu juga berguna untuk mendapatkan hasil-hasil
dalam teks. Tidak ada pendekatan
penemuan lanjutan dari data yang sama.
umum terhadap penemuan informasi Jika dibandingkan dengan penemuan utama, penemuan
dari data tidak terstruktur. Penemuan lanjutan hanya dibutuhkan oleh sekelompok kecil atau beberapa
individu. Data scientist mungkin harus melakukan analisa dari waktu
informasi ini sifatnya sangat individual,
ke waktu jika ingin mengetahui keluhan pelanggan dalam satu
spesifik sesuai tema, dan terbuka pada periode atau kegagalan produk tertentu. Informasi yang sesuai
perubahan konstan. Sifat-sifat ini mungkin terdapat pada file teks atau email. Permintaan skala kecil
menuntut keterlibatan aktif data yang berubah secara dinamis akan berdampak pada adaptasi sistem
permanen, yang mana terlalu rumit dan mahal dalam sebagian kasus.
scientist. Seorang data scientist mungkin
Dengan solusi self-service yang fleksibel, data scientist bisa
mengaplikasikan beberapa subproses ke memperoleh manfaat penemuan informasi otomatis. Integrasi
mesin, namun penemuan secara harmonis antara domain dan pengetahuan akan tool tertentu
merupakan sebutan untuk solusi self-service bagi para data scentist.
keseluruhan tidak dapat ditemukan oleh
Oleh karena itu, data scientist diharapkan menguasai beberapa alat
mesin. bantu yang sering digunakan dalam pengolahan data, seperti R, SQL,
Phyton, Hadoop, SAS, Java, Hive, Matlab, dan lain-lain.

3
R bagi Data Scientist
R adalah bahasa pemrograman dan perangkat lunak untuk
analisa statistika dan grafik. R dibuat oleh Ross Ihaka dan Robert
Gentleman di Universitas Auckland, Selandia Baru, dan kini
dikembangkan oleh R Development Core Team, dimana Chambers
merupakan anggotanya. R dinamakan sebagian setelah nama dua
pembuatnya (Robert Gentleman dan Ross Ihaka), dan sebagian
sebagian dari nama S.

Bahasa R kini menjadi standar de facto di antara statistikawan Ross Ihaka, Associate Professor of
untuk pengembangan perangkat lunak statistika, serta digunakan Statistics at the University of Auckland.
secara luas untuk pengembangan perangkat lunak statistika dan Originator R Open Source Programming
language
analisa data.

R merupakan bagian dari proyek GNU. Kode sumbernya


tersedia secara bebas di bawah Lisensi Publik Umum GNU, dan versi
biner prekompilasinya tersedia untuk berbagai sistem operasi. R
menggunakan antarmuka baris perintah, meski beberapa antarmuka
pengguna grafik juga tersedia.

R menyediakan berbagai teknik statistika (permodelan linier


dan nonlinier, uji statistik klasik, analisa deret waktu, klasifikasi,
klasterisasi, dan sebagainya) serta grafik. R, sebagaimana S, dirancang
sebagai bahasa komputer sebenarnya, dan mengizinkan
penggunanya untuk menambah fungsi tambahan dengan
mendefinisikan fungsi baru. Kekuatan besar dari R yang lain adalah
fasilitas grafiknya, yang menghasilkan grafik dengan kualitas publikasi
yang dapat memuat simbol matematika. R memiliki format
dokumentasi seperti LaTeX, yang digunakan untuk menyediakan Robert Clifford Gentleman,
dokumentasi yang lengkap, baik secara daring (dalam berbagai Statistician. Along with Ros Ihaka
format) maupun secara cetakan. Originate R Programming Language

Fakta Menarik Mengenai R :

R adalah perangkat lunak analisa data: data scientist, ahli statistik, dan analis - siapa saja yang perlu
memahami data, benar-benar dapat menggunakan R untuk analisa statistik, visualisasi data, dan pemodelan
prediktif.

R adalah bahasa pemrograman: Bahasa berorientasi pada objek yang dibuat oleh ahli statistik. R
menyediakan objek, operator, dan fungsi yang memungkinkan pengguna untuk mengeksplorasi,
memodelkan, dan memvisualisasikan data.

R adalah lingkungan untuk analisa statistik: Metode statistik standar mudah diterapkan di R. Lalu, karena
sebagian besar penelitian mutakhir dalam statistik dan pemodelan prediktif dilakukan di R, teknik yang baru
dikembangkan seringkali tersedia di R lebih dahulu.

R adalah proyek perangkat lunak sumber terbuka: R gratis. Berkat pengawasan serta pengeditan bertahun-
tahun oleh pengguna dan pengembang, R memiliki standar kualitas dan ketepatan numerik yang tinggi.
Pintu R yang terbuka memungkinkannya untuk berintegrasi dengan aplikasi dan sistem lainnya.

R adalah sebuah komunitas: Sebuah proyek R telah berkembang dan mencakup lebih dari 20 statistisi dan
ilmuwan komputer dari seluruh dunia, serta ribuan kontributor telah menciptakan paket tambahan. Dengan
dua juta pengguna, R menawarkan komunitas online yang dinamis.
4
Kebutuhan Data Scientist di Indonesia
Tingginya Minat Korporasi Terhadap
Data Scientist Bukan hanya di Amerika, data scientist juga sedang
menjadi pekerjaan yang sangat menjanjikan di
Pekerjaan data scientist berada dalam posisi yang sangat Indonesia. Semakin banyak korporasi yang tidak
dibutuhkan saat ini. Banyak perusahaan yang berani segan-segan memberikan gaji yang sangat besar
membayar tinggi para professional data scientist. Keahlian untuk mengisi posisi ini.
yang dibutuhkan merupakan perpaduan statistik, bisnis
intelijen, sosilogi, ilmu komputer, dan komunikasi.
Bersumber dari Techinasia, salah satu perusahaan
Selain menguasai angka dan hitungan, seorang data
scientist harus juga piawai berkomunikasi; ahli secara penyedia transportasi online di Indonesia, menghargai
analitik dan dapat berpikir imajinatif. Untuk menjadi seorang data scientist yang berpengalaman 1-4 tahun
data scientist yang sukses, kalian harus familiar dengan 5 hingga Rp 30juta per bulannya.
kompetensi dasar: programming, statistics, machine
learning, data mining, dan visualisasi data. Perusahaan telekomunikasi di Indonesia seperti PT
Telkom Indonesia, Indosat Ooredoo, dan lainnya telah
"Data scientist tentu butuh keterampilan teknis untuk menerapkan data science dalam proses bisnisnya.
mengekstrak data dan menjalankan analisa statistik, Misalnya, dengan menganalisa perilaku pelanggan
namun harus juga mampu menemukan pola atau
IndiHome, PT Telkom Indonesia berhasil menurunkan
penyimpangan yang harus dilaporkan," kata Erik
Berger, seorang Senior Web Technology Manager yang tingkat churn rate (persentase pelanggan yang
telah bekerja sebagai data scientist selama 14 tahun. berhenti berlangganan) pelanggan broadband, dari
"Untuk menjadi ahli dalam hal ini, kamu perlu lima persen menjadi tiga persen pada tahun 2015. Ini
memahami sepenuhnya bisnis yang sedang dianalisa- bisa meningkatkan migrasi rasio pelanggan dari free
kalau hanya melihat jumlah angka yang ada, itu masih ke berbayar untuk layanan Flashzone, dari 11 persen
setengah jalan. melonjak ke 20 persen. Pencapaian ini tentu sangat
menguntungkan perusahaan.
Jika kamu punya apa yang saat ini diperlukan oleh data
scientist, akan ada banyak sekali perusahaan yang
Jakarta merupakan kota yang paling banyak
membutuhkan kamu. McKinsey Global Institute telah
memprediksi bahwa pada tahun 2018, Amerika Serikat membutuhkan data scientist karena banyaknya
mungkin akan kekurangan 140.000 hingga 190.000 perusahaan yang berkembang di kota ini. Munculnya
karyawan dengan kemampuan analisa mendalam, serta banyak perusahaan startup, seperti Bukalapak,
kekurangan 1,5 juta manajer dan analis yang mampu Salestock, Traveloka, Blibli, Kudo, dan lainnya juga
menganalisa data sampai menghasilkan keputusan dari bisa menjadi kesempatan emas bagi para data
data tersebut. scientist untuk mengembangkan karir di bidang ini.
Sayangnya, pasokan data scientist yang masih kurang
Dalam sebuah survei yang dilakukan oleh Robert Half menjadi masalah bagi sebagian perusahaan. Mereka
Technology terhadap 1.400 Chief Innovation Officer
berani merogoh kocek untuk membiayai mahal
(CIO) di Amerika Serikat, sebanyak 53% responden
menyatakan bahwa perusahaan mereka kekurangan staf seseorang menjadi data scientist di perusahaannya.
yang mampu mengakses data dan menghasilkan insight
dari data tersebut. Ini artinya, data scientist sangat Melihat gambaran ini, Algorit.ma berinsiatif untuk
dibutuhkan. menjadikan para calon data scientist muda Indonesia
mendapatkan pelatihan yang sesuai dengan
kebutuhan profesi. Info selengkapnya mengenai
pelatihan menjadi data scientist dapat diakses melalui
www.algorit.ma

Adapted from:
Englmeier, K., & Murtagh, F. (2017, January). What Can We Expect
from Data Scientists? Journal of Theoritical and Applied Electronic
Commerce Research, VOL 12.
Stadd, A. (2014, November). Udacity. Retrieved from
http://blog.udacity.com/2014/11/data-analysts-what-youll-make.html
Techinasia. (2016, November). Retrieved from
https://id.techinasia.com/talk/profesi-data-scientist-menjanjikan
Using R for Data Science. (n.d.). Retrieved from Master's in Data
Science: http://www.mastersindatascience.org/data-scientist-skills/r/
Wikipedia. (n.d.). Retrieved from R (Bahasa Pemrograman):
https://id.wikipedia.org/wiki/R_(bahasa_pemrograman)
5

Anda mungkin juga menyukai