Anda di halaman 1dari 22

Profesi Pengolahan Data

Pengolahan Data
Profesi Pengelola Data akan semakin banyak dicari, karena perkembangan bisnis yang berbasis data,
dan berkembangnya big data.

Data secara umum menggambarkan fakta-fakta yang ada di dunia. Khusus dalam bidang teknologi
informasi, data adalah informasi yang telah diterjemahkan ke dalam bentuk digital biner. Data dapat
diterima untuk digunakan sebagai subjek tunggal atau subjek jamak.

Big data adalah istilah yang menggambarkan volume data yang besar, baik data yang terstruktur
maupun data yang tidak terstruktur. Big data telah digunakan dalam banyak bisnis. Tidak hanya besar
datayang menjadi poin utama tetapi apa yang harus dilakukan organisasi dengan data tersebut.

Data terstruktur (structured data) terdiri dari tipe data yang jelas yang polanya membuatnya
mudah dicari. Data terstruktur biasanya berada di Relational Database Management System (RDBMS).
Fields menyimpan nomor telepon data yang panjangnya digambarkan, nomor jaminan sosial, atau kode
zip. Bahkan string teks dengan panjang variabel seperti nama terdapat dalam catatan, membuatnya
menjadi hal yang mudah untuk dicari. Data dapat dihasilkan oleh manusia atau mesin selama data
tersebut dibuat dalam struktur RDBMS. Format ini sangat dicari baik dengan kueri yang dihasilkan
manusia maupun melalui algoritma menggunakan tipe data dan nama bidang, seperti abjad atau
numerik, mata uang, atau tanggal. Aplikasi basis data relasional umum dengan data terstruktur
termasuk sistem reservasi penerbangan, kontrol inventaris, transaksi penjualan, dan aktivitas Anjungan
Tunai Mandiri (ATM). Structured Query Language (SQL) memungkinkan kueri pada tipe data terstruktur
ini dalam database relasional.

Data yang tidak terstruktur (unstructured data) pada dasarnya adalah segalanya. Data yang tidak
terstruktur memiliki struktur internal tetapi tidak terstruktur melalui model atau skema data yang
ditentukan sebelumnya. Ini mungkin tekstual atau non tekstual, dan dihasilkan manusia atau mesin. Itu
juga dapat disimpan dalam database non-relasional seperti Non Structured Query Language (NSQL). data
tidak terstruktur terdiri dari data yang biasanya tidak mudah dicari, termasuk format seperti audio,

video, dan posting media sosial.

01
Data tidak terstruktur yang dihasilkan manusia, meliputi:

 File teks: Pemrosesan kata, spreadsheet, presentasi, e-mail, log.

 E-mail: E-mail memiliki beberapa struktur internal berkat metadata-nya, dan kami
terkadang menyebutnya sebagai semiterstruktur. Namun, bidang pesannya tidak
terstruktur dan alat analisis tradisional tidak dapat menguraikannya.

 Media sosial: data dari facebook, twitter, linkedin.

 Situs web: youtube, instagram, situs berbagi foto.

 Data seluler: pesan teks, lokasi.

 Komunikasi: obrolan percakapan, Instant Messaging (IM), rekaman telepon, perangkat


lunakkolaborasi.

 Media: mp3, foto digital, file audio dan video.

 Aplikasi bisnis: dokumen ms office, aplikasi produktivitas.

Profesi di Bidang Teknologi Big Data

1. Data Engineer

Pada Big Data, terdapat jumlah data yang ada sangat besar. Seorang Data Engineer akan
membangun sistem atau infrastruktur yang berkaitan dengan volume data dalam jumlah besar.
Infrastruktur ini bisa berupa database, pipeline, data warehouse, maupun sistem lainnya yang
dirancang untuk memproses data berskala besar. Data Engineer akan mengumpulkan dan
mengelompokkan data secara efisien agar mudah dianalisa. Selain itu, data engineer juga
bertanggungjawab memastikan data telah benar, yang akan digunakan untuk keperluan bisnis.
Kemampuan yang harus dimiliki:
 Menguasai SQL, Python, dan Java/Scala
 Cloud Platform
 Data Pipelines
 Mempunyai Pemahaman dalam Merancang System Scripting.

02
2. Data Analyst

Selain Data Engineer, seorang Data Analyst juga memiliki tugas menganalisa data-data yang
berasal dari Big Data dan menerjemahkannya menjadi sebuah informasi. Data Analyst dapat
dikatakan sebagai tim yang bertugas untuk meningkatkan keuntungan, dan kredibilitas suatu
perusahaan, karena akan bersinggungan langsung dengan tim penjualan, pemasaran dan tim
strategis pada perusahaan. Data yang telah mereka analisa akan dipresentasikan dalam
bentuk tabel atau kurva yang menghasilkan pemahaman tentang tren, pola, dan wawasan
bisnis,. Hingga akhirnya parapemimpin maupun tim pemasaran dapat mengambil langkah apa yang
tepat ke depannya. Kemampuanyang harus dimiliki:
 Data Mining.
 Pemrograman seperti R ,Python, C, C++ atau SQL.
 Pemahaman Statistik yang Kuat.
 Visualisasi Data dan Komunikasi.
 Perhatian yang kuat terhadap detail.

3. Security Engineer

Bertugas merancang keamanan data yang dimiliki untuk tetap kebal terhadap beberapa risiko
seperti adanya bencana, virus, dan masalah keamanan sistem lainnya sehingga dapat menghindari
kebocoran data perusahaan.

Kemampuan yang harus dimiliki:


 Memahami dasar coding seperti HTML, CSS, dan lain-lain.
 Pengetahuan tentang berbagai perangkat keras komputer, seperti cara kerjanya, cara
pemasangan dan konfigurasi perangkat keras.
 Memahami routing, baik dari segi teori dan praktek.
 Dibutuhkan sertifikasi pada CISSP, GSEC, CEH dan CISM.
 Mengetahui sistem keamanan komputer yang berkaitan dengan network security.

4. Database Administrator
Tugas utama seorang Database Administrator adalah melakukan evaluasi dan pengawasan
seluruh perangkat yang memiliki hubungannya dengan data. Selain itu, seorang Database
Administrator jugamengkoordinasi perubahan pada database komputer, juga dapat merencanakan,
mengkoordinasi, sertamenjaga keamanan database komputer.

03
Kemampuan yang harus dimiliki:
 Administratif.
 Bahasa pemrograman SQL/XML, OQL dan XQuerty.
 Keselamatan dan Keamanan Publik.
 Layanan Pelanggan dan Personal.
 Punya pengetahuan yang mumpuni di bidang database dan design database.
 DBA juga harus memahami seputar sistem operasi seperti Linux dan juga Windows.
 Memiliki pemahaman untuk merawat, menangani dan juga memulihkan failover database.

5. Data Science
Bertanggung jawab dalam mengumpulkan mengolah dan menganalisis data dalam jumlah
besar sehingga menghasilkan informasi-informasi yang menjadi bahan pertimbangan stakeholder
dalam mengambil keputusan.
Kemampuan yang harus dimiliki:
 Pemrograman seperti R, Python, C, C++, dan SQL.
 Penggunaan software seperti SPSS, Microsoft Excel, dan SAS.
 Statistika Dasar.
 Aljabar.
 Visualisasi Data.
 Software engineering.

6. Database Manajer
Database Manajer mempunyai tugas merencanakan, mengarahkan dan mengendalikan
kegiatan pengolahan data perusahan yang akan diproses di komputer serta output data komputer
yang telah diproses berdasarkan pedoman pengisian dalam rangka komputerisasi.
Kemampuan yang harus dimiliki:
 Komunikasi verbal dan tertulis.
 Keterampilan analitis.
 Problem solving.
 Berorientasi pada detail.
 Manajemen waktu.
 Kepemimpinan.
 Menilai kebutuhan penyimpanan dan akses data.
 Membuat dan memelihara database.

04
 Penggunaan aplikasi database seperti Oracle, Microsoft SQL Server, dan IBM Db2.
 Meningkatkan sistem database dan perangkat lunak sesuai kebutuhan.
 Mengembangkan penyimpanan data darurat dan rencana pengambilan.
 Mengelola operasi pencadangan data.

Merintis Karier sebagai Data Scientist

Setiap pekerjaan memiliki peran dan tanggung jawab masing-masing untuk menjaga agar
tugasnya dilakukan dengan baik dan tepat. Data Scientist bertanggung jawab terhadap
pengumpulan dan pengolahan data agar data dapat digunakan untuk mengambil keputusan.
Pada dokumen ini, Anda akan mempelajari apa saja yang dibutuhkan dan dapat dilatih jika
ingin menekuni profesi Data Scientist sehingga Anda diharapkan mampu menerapkan
langkah-langkah dan tips berkarier sebagai Data Scientist.
Terdapat lima hal yang perlu dipersiapkan dan dilatih untuk menjadi seorang Data Scientist.
1. Komponen dasar

- Kemampuan

- Pengalaman proyek

- Portofolio

2. Pahami deskripsi kerja Data Scientist

3. Pahami software yang akan digunakan

4. Riset perusahaan yang akan dituju

5. Career Journey Data Scientist

Komponen Dasar

Kemampuan

Ada dua jenis kemampuan yang perlu dimiliki oleh seorang Data Scientist agar bisa
mengerjakan tugas-tugasnya dengan baik, yaitu hard skill dan soft skill.

05
- Hard Skill Data Scientist

Kemampuan dasar yang harus dimiliki data scientist dapat dipelajari di bangku kuliah,
khususnya pada jurusan lmu Komputer, Matematika, Teknik Informatika, Statistika, Ekonomi,
Pemasaran, Industri, serta Finansial dan Bisnis. Meskipun kata scientist erat kaitannya
dengan ilmu pengetahuan alam, namun untuk bisa mempelajari kemampuan seorang data
scientist, seseorang tidak harus berasal dari jurusan IPA saat di bangku Sekolah Menengah
Atas. Hal ini dikarenakan, pengetahuan esensial data scientist adalah kemampuan di bidang
komputer dan elektronik, statistik, manajemen, dan ekonomi yang dapat dipelajari di
universitas. Bagi lulusan sarjana juga dapat meneruskan S2 di bidang data science jika ingin
menekuni profesi Data Scientist.
Berikut ini adalah pengetahuan dan kemampuan spesifik yang harus dimiliki seorang Data
Scientist.
 Statistika Dasar

Statistika adalah cabang ilmu matematika terapan mengenai bagaimana cara


mengumpulkan, mengklasifikasi, mengolah, menganalisis,
menyimpulkan, menafsirkan, dan menyajikan data yang diperoleh secara sistematis.

Cakupan materi statistika dasar diantaranya

a. kecenderungan pemusatan data,

b. cara mencari nilai rata-rata, median, modus,

c. cara mencari lokasi data,

d. cara mengukur penyimpangan data, dan

e. pengukuran distribusi data.

06
 Aljabar

Pengetahuan mengenai aljabar berguna untuk mengenali berbagai permasalahan,


memahami solusi, dan menuangkan solusi dalam algoritma. Algoritma ini kemudian
dikembangkan ke dalam program komputer.

 Bahasa Pemrograman

Kegiatan mengolah data memerlukan perangkat lunak untuk menganalisis dan


memanipulasi data. Perangkat lunak ini disertai dengan bahasa pemrograman.
Beberapa bahasa pemrograman yang sering digunakan adalah bahasa
pemrograman R, Python, C, C++, dan SQL.

a. R adalah bahasa pemrograman untuk analisis statistika dan grafik yang bersifat
open source, yaitu gratis digunakan dan dapat dimodifikasi oleh siapapun
sehingga banyak digunakan di seluruh dunia. R dapat diinstal pada sistem
operasi Windows, Mac OS dan Linux. Salah satu keunggulan R adalah sangat
memperhatikan proses input huruf besar dan huruf kecil.
b. Python adalah bahasa pemrograman yang digunakan untuk mengembangkan
situs web, algoritma, menghasilkan kode sederhana untuk berbagai keperluan,
penambangan data, pengembangan machine learning, penyederhanaan proses
otomatisasi, dan masih banyak lagi. Bahasa pemrograman Python populer
karena salah satu keunggulannya adalah mudah dipelajari, bahkan oleh pemula
sekalipun.
c. C adalah bahasa pemrograman untuk membuat berbagai program aplikasi pada
OS atau operation system Windows maupun Linux. Bahasa pemrograman C
sangat sesuai digunakan untuk merancang berbagai aplikasi yang berhubungan
langsung dengan sistem perangkat keras dan sistem operasi lainnya, seperti
aplikasi antivirus dan aplikasi pengolah gambar.

07
d. C++ adalah bahasa pemrograman C yang dikembangkan lebih lanjut oleh
penggunanya. Kemampuan tambahan pada C++ lebih canggih dan mampu
memberi programmer banyak kendali atas sumber daya dan memori sistem.
Sehingga C++ dapat digunakan untuk mengembangkan aplikasi yang berjalan di
berbagai platform seperti server, komputer pribadi, sistem berbasis cloud, dan
perangkat seluler. Keunggulan C++ adalah cepat dan kuat untuk membuat
beberapa jenis program hingga membuat GUI (Graphical User Interface).
Sehingga, C++ mirip dengan bahasa pemrograman lain seperti C, C#, dan Java
sehingga mudah dipelajari.
e. SQL adalah singkatan dari Structured Query Language. Bahasa pemrograman
SQL adalah salah satu sistem yang membantu para pekerja di bidang IT untuk
bisa memahami seluk-beluk database. Kegunaan dasar SQL adalah untuk
menghapus, mengelola, mengembangkan, memperbarui, dan menyisipkan data.
Pengguna SQL juga dapat membuat drop database dan tabel.
Keunggulan SQL adalah menerapkan sistem terpusat yang berguna untuk
meminimalisir terjadinya eror. Sehingga Data Scientist akan mengetahui lebih
cepat jika terjadi masalah pada data. Selain itu, sistem keamanan SQL lebih
tinggi dengan Data Control Language yang bertugas untuk memerintahkan
sistem SQL sesuai kehendak pengguna. SQL juga memiliki fitur pengembalian
data jika tidak sengaja terhapus atau hilang.

08
 Visualisasi Data

Gambar 1. Ilustrasi Visualisasi Data

Visualisasi data adalah komunikasi dalam bentuk visual untuk menyajikan suatu data
dan informasi agar data yang diperoleh, diolah, dan dianalisis dapat mudah dipahami
dan digunakan untuk mengetahui fakta serta membuat keputusan.
Data scientist perlu menguasai kemampuan ini karena data lebih cepat dipahami jika
disajikan secara visual. Menemukan kesimpulan atau inti data dari kalimat panjang
bukanlah hal mudah.
 Menggunakan Software Pengolah Data

Hardskill yang juga perlu dimiliki seorang Data Scientist adalah kemampuan dalam
menggunakan aplikasi pengolah data untuk memanfaatkan alat, fitur, dan bagian-
bagian dari software sesuai tujuan dan fungsi yang ingin digunakan terhadap data.
Beberapa software atau perangkat lunak pengolah data yang umum digunakan ialah
Microsoft Excel, SPSS, dan SAS.

09
Penyajian dalam bentuk bagan dan grafik bisa mempersingkat waktu pencarianterhadap
inti data dan memahaminya.

Ada lima prinsip dalam membuat visualisasi data yang dapat dijadikan acuanoleh
seorang data scientist.

a. Jujur

Penyaji data harus jujur dalam menampilkan data yang diperoleh. Jangan sampai
data dimanipulasi sesuai kebutuhan atau keinginan pribadi.

b. Kenali Pembaca

Data yang selesai dianalisis dan disimpulkan akan sulit untuk dipahami pembaca jika
tampilannya tidak mudah dimengerti. Perhatikan bahasa, susunan kata, warna,
poin-poin yang di highlight, dan istilah yang digunakan. Penting bagi seorang data
scientist untuk mengenali pekerjaan, latar belakang pendidikan, faktor budaya dan
etnis, serta pengetahuan mengenai istilah-istilah dalam data agar informasi yang
disajikan lebih mudah dipahamipembaca.

c. Gunakan Fungsi Visual dengan Baik

Unsur-unsur visual yang digunakan dalam menyajikan data umumnya adalah garis,
bentuk, kombinasi warna, gambar/foto/ilustrasi, dan tulisan.Keindahan desain dan
kombinasi warna dapat digunakan untuk menarik pembaca agar membaca
keseluruhan informasi yang disajikan. Namun harus dipastikan bahwa unsur-unsur
yang disertakan berguna untuk memperjelas data, bukan membuat pembaca
kesulitan memahami isi data. Apalagi jika unsur-unsur tersebut terlalu ramai atau
ditempatkan dengan tidak sesuai, sehingga poin penting data tidak tersampaikan
dengan baik.

10
d. Pilih Grafik yang Tepat
Angka yang didapat dari perolehan data akan ditampilkan dalam tabel atau grafik.
Jenis grafik ada banyak, misalnya grafik batang, garis, lingkaran, XY, area, dan vektor.
Data scientist sebaiknya memilih grafik berdasarkan jenis data dan pesan yang ingin
disampaikan. Tidak perlu menggunakan terlalu banyak grafik jika data sudah jelas
ditampilkan dengan angka dalam satu kalimat atau tabel sederhana.

e. Beri Highlight pada Fakta/Poin Penting

Dalam penyajian data, biasanya Data Scientist menyampaikan berbagai macam data
dan ada beberapa poin yang ingin ditekankan agar pembaca dapat menangkap
poin-poin tersebut. Penekanan dapat dilakukan dengan pengaturan ukuran,
penggunaan warna, pemanfaatan bold dan underline, serta highlight angka, data,
dan informasi.

 Software engineering

Hard skill selanjutnya yang perlu dimiliki Data Scientist adalah mengetahui software
engineering, yaitu ilmu komputer mengenai sistem, program, dan perangkat lunak. Ilmu
ini dimanfaatkan Data Scientist untuk mengetahui kesalahan dalam perangkat lunak
pengolah data yang digunakan. Sehingga jika terjadi eror, Data Scientist dapat mencari
tau letak kesalahannya. Apalagi, perangkat lunak tidak memiliki wujud fisik seperti
perangkat keras yang bisa diidentifikasi dengan mudah jika terjadi kerusakan. Selain itu,
sebuah perangkat lunak memiliki risiko kerusakan lebih besar daripada perangkat keras.
Maka dari itu Data Scientist perlu menguasai kemampuan ini.

11
 Analisis Data

Kemampuan spesifik selanjutnya yang penting dimiliki adalah kemampuan dalam


menganalisis data. Data yang dikumpulkan oleh Data Scientist akan diuji untuk tujuan
tertentu yang telah ditetapkan, kemudian data diberikan saran berdasarkan temuan
yang telah diuji. Sehingga, klien akan memahami hasil data dan menyimpulkan
keputusan yang perlu diambil. Data-data yang dioleh Data Scientist dengan
kemampuan analisis yang baik, dapat digunakan untuk pengembangan machine
learning yang cerdas. Sehingga keputusan yang diambil bisa menjadi lebih baik.

- Soft Skill Data Scientist

Selain kemampuan spesifik, beberapa kemampuan dasar yang juga diterapkan oleh banyak
profesi lain juga perlu dimiliki oleh seorang data scientist. Kemampuan- kemampuan
tersebut ialah teliti, kritis, analisis, komunikasi, dan bekerja dalam tim. Hal ini sangat
diperlukan agar seorang Data Scientist dapat menyelesaikan tugas- tugasnya.

Gambar 2. Ilustrasi Soft Skill Data Scientist

12
1. Teliti

Pekerjaan apapun yang berkaitan dengan data mengharuskan seseorang untuk hati-hati
dan teliti saat mengumpulkan, menghitung, menyimpulkan, mengolah, dan
menyampaikannya. Data yang baik dan berkualitas bersifat objektif, relevan, tepat
waktu, representatif, dan memiliki tingkat kesalahan baku yang kecil. Berdasarkan sifat
data yang baik itu, maka seorang data scientist harus teliti. Hal ini dapat dibiasakan
dengan mengecek ulang jumlah dan perhitungan data, membaca hasil data dengan baik
dan tidak terburu-buru, serta menuliskan data sesuai dengan keadaan yang sebenarnya.

Data yang tidak diperiksa dengan teliti dapat berakibat fatal. Pada proses pengolahan
bisa terjadi eror dan hasilnya pun tidak akan valid. Maka dari itu ketelitian sangat
diperlukan oleh Data Scientist.

Teliti dapat dilatih pada kegiatan sehari-hari agar terbiasa menerapkannya dalam
pekerjaan. Seperti saat berbelanja, pastikan menghitung uang yang diberikan maupun
uang kembalian dengan benar, mengecek tanggal kadaluarsa barang dan makanan yang
dibeli, serta mengecek kualitas kemasan, pilihan rasa, harga dan kondisi barang yang
dibeli.

Saat mengemudi, pastikan kendaraan dalam kondisi baik, bahan bakar cukup, dan
kendaraan bersih. Pada tugas membersihkan rumah, dapat dilakukan dengan teliti
memilah warna dan jenis pakaian yang akan dicuci, mengecek sudut-sudut ruangan saat
menyapu dan mengepel, memastikan cucian piring tidak berminyak dan berbau setelah
dibilas dengan air.

2. Kritis

Kemampuan kritis berguna untuk memastikan jika ada data yang aneh, data error, data
anomali atau data yang tidak valid. Jika menemukan data seperti ini, seorang Data
Scientist akan langsung bergerak untuk mencari tau apa penyebabnya serta memastikan
apakah data tersebut benar dan bisa digunakan,atau ada kesalahan.

13
3. Komunikasi

Seorang Data Scientist akan menjadi seorang yang lebih mengenal data dibandingkan
tim lain. Karena keahlian tersebut, Data Scientist perlu memiliki kemampuan
komunikasi yang baik untuk menyampaikan hasil penemuannya dengan jelas kepada
pihak lain, bahkan pada seseorang yang tidak memahami data dengan baik.
Kemampuan komunikasi ini dilakukan dalam bentuk lisan, tulisan, dan visual.

4. Bekerjasama dalam tim

Data Scientist merupakan pihak pertama yang bersinggungan dengan data untuk
nantinya diolah menjadi suatu kesimpulan. Namun untuk bisa mengerjakan tugasnya, ia
juga harus bekerja sama dengan tim dari divisi lain untuk mengetahui kebutuhan tim
terhadap data dan tujuan pengumpulan data. Kemampuan bekerja sama dalam tim baik
itu tim sendiri maupun antar tim akan menghindarkan dari kesalahan interpretasi hasil
data yang dikerjakan.

PENGUASAAN PROYEK

Penguasaan terhadap kemampuan hard skill dan soft skill dapat


dilatih melalui penerapan sebuah proyek. Untuk itu, Data Scientist
perlu mencari dan mengerjakan sebuah proyek yang berhubungan
dengan data science. Mulailah dari proyek kecil yang bisa dicari di
Google atau website tertentu yang akan mengarahkan Anda pada
berbagai contoh proyekdengan menggunakan software dan bahasa
pemrograman tertentu.
Gambar 3. Ilustrasi
Mengerjakan Proyek

Proyek data science juga dapat ditemukan pada penyelenggara pembelajaran terkait data.
Keunggulan belajar mengerjakan proyek di sini adalah mendapat materi belajar,bimbingan,
pembekalan untuk menjadi Data Scientist dalam jangka waktu tertentu, dan mendapat
sertifikat.

14
Pengalaman menerapkan kemampuan yang dimiliki dalam proyek akan menambah nilai
seseorang saat melamar kerja di perusahaan. Pilih proyek yang bisa menunjukkan
kemampuan Anda dan sesuai dengan kebutuhan perusahaan.

PORTOFOLIO
Jika ingin diterima bekerja sebagai Data Scientist di perusahaan besar, Anda perlu
membangun portofolio untuk menjelaskan kemampuan dalam diri Anda dan proyek yang
mampu Anda kerjakan. Cantumkan juga hal-hal yang pernah diraih dan pengalaman kerja
terkait data science. Untuk menunjukkan karya, portofolio dapat dibangun melalui website.
Keunggulan portofolio website adalah tidak ada batasan ukuran file saat mencantumkan
hasil karya serta bisa membangun citra diri sesuai dengan karakter perusahaan.

Pahami Deskripsi Kerja Data Scientist


Pekerjaan Data Scientist sebenarnya sudah ada sejak dulu, namun lebih sering

disebut dengan statistikawan yang bertugas mengolah atau mengumpulkan data secara
manual. Sementara Data Scientist saat ini, lebih banyak berurusan dengan big data dalam
program komputer dan menciptakan algoritam-algroitma yang memungkinkan data
langsung diolah dalam program komputer.

Perusahaan yang membutuhkan Data Scientist memiliki tujuan dan kriteria kemampuan
yang berbeda-beda untuk bisa mengerjakan tugas di perusahaan tersebut. Maka dari itu,
penting sekali untuk memahami deskripsi lowongan pekerjaan Data Scientist agar Anda
dapat menyiapkan diri dan menyesuaikan kemampuan yang dimiliki dengan kebutuhan
perusahaan.
Jika telah memahami hal ini, Anda dapat menuangkan poin-poin penting terkait keunggulan
Anda di portoflio dan memperbesar kemungkinan perusahaan memanggil Anda.

15
Pahami Software yang Digunakan

Kebutuhan Data Scientist pada perusahaan bergantung juga pada program, perangkat lunak,
dan bahasa pemrograman yang digunakan suatu perusahaan. Hal ini karena perusahaan
biasanya menggunakan perangkat lunak dan bahasa pemrograman tertentu yang sesuai
dengan produk atau program perusahaan tersebut. Namun, agar memperluas cakupan
pekerjaan yang bisa Anda lakukan, baiknya Anda menguasai beberapa perangkat lunak dan
bahasa pemrograman.

Riset Perusahaan yang Akan Dituju

Setiap perusahaan memiliki kebutuhan yang berbeda terhadap data karena berkaitan
dengan jenis dan tujuan perusahaan. Perusahaan keuangan membutuhkan data mengenai
kemampuan finansial seseorang terhadap daya beli suatu objek atau barang tertentu, serta
rekam jejak pembayaran tagihannya. Data ini digunakan untuk menilai pinjaman yang
dapat diberikan dan ditawarkan perusahaan.
Perusahaan di bidang pemasaran digital menggunakan data untuk mengetahui hasil
pencarian, riwayat belanja, dan ketertarikan seseorang terhadap suatu objek atau barang.
Data-data ini selanjutnya digunakan untuk keperluan pemasaran kebutuhan klien.
Kebutuhan-kebutuhan ini akan berpengaruh terhadap produk yang dibuat perusahaan serta
perangkat lunak yang dikembangkan dan bahasa pemrograman yang digunakan. Maka itu,
Data Scientist perlu melakukan riset dan penelusuran terhadap perusahaan yang dituju agar
sesuai dengan kemampuan dan kebutuhan kariernya.

Jenjang Karier Data Scientist

Seiring perkembangan zaman, Data Scientist tidak hanya diperlukan oleh perusahaan
teknologi. Berbagai jenis perusahaan di sektor pendidikan, perbankan, transportasi,
kesehatan, media, dan lainnya, juga membutuhkan profesi tersebut untuk membantu
perusahaan mencapai tujuannya. Kemampuan seorang Data Scientistjuga bisa ditingkatkan,
maka dari itu ada jenjang karier yang bisa dijalani. Tingkatan profesi Data Scientist adalah

16
 Data Scientist,

 Senior Data Scientist, dan

 Chief Data Scientist.

Tingkatan ini dapat menjadi motivasi agar Data Scientist terus meningkatkan kemampuan
hard skill dan soft skillnya, serta menambah pengalaman untuk menyelesaikan proyek-
proyek besar.

Mengemban sebuah tugas dalam suatu pekerjaan perlu konsistensi dan keinginan untuk
memperbaiki diri dan menambah kemampuan agar terus berkembang. Semua persiapan
yang telah disebutkan perlu dilatih dalam keseharian maupun pekerjaan dan diperbarui
dengan perkembangan zaman serta kebutuhan perusahaan. Baik itu dari perkembangan
teknologi perangkat lunaknya maupun kemampuan menggunakannya. Sehingga, keahlian
sebagai seorang Data Scientist terus meningkat.
Selanjutnya, Anda akan mempelajari secara lebih spesifik mengenai bahasa pemrograman
yang digunakan oleh Data Scientist.

Pentingnya Belajar Python bagi Data Scientist

Data Scientist mengolah data menggunakan perangkat lunak yang disertai dengan bahasa
pemrograman. Bahasa pemrograman Python mudah dipelajari sehingga banyak yang memilih
Python dibanding bahasa pemrograman lainnya. Maka dari itu, Python menjadi bahasa
pemrograman yang wajib dikuasai oleh Data Scientist.
Pada dokumen ini, Anda akan mempelajari kegunaan Python, macam-macam kegunaannya,
serta keunggulan dan kekurangan Python. Setelah selesai membaca ini, diharapkan Anda
semakin memahami pentingnya belajar Python hingga termotivasi untuk menguasainya.

17
Gambar 4. Ilustrasi Data Scientist Menggunakan
Bahasa Pemrograman

1. Pengertian Python
Python adalah bahasa pemrograman yang sudah dikembangkan oleh Guido van Rossum sejak
tahun 1991. Python banyak digunakan untuk mengembangkan situs web, algoritma,
pengembangan machine learning, penyederhanaan prosesotomatisasi, dan tujuan lainnya.

2. Kegunaan Python

Ada enam kegunaan Python yang sering dimanfaatkan pengguna dan perlu Anda ketahui.
a) Pengembangan Website
Website adalah salah satu aset perusahaan dalam membangun bisnis. Adanya website resmi
perusahaan dapat menandakan keseriusan perusahaan terhadap bisnisnya. Perusahaan atau
bisnis yang memiliki website, memberikan kemudahan bagi pelanggan untuk mengkonfirmasi
informasi yang valid dari perusahaan tersebut, seperti informasi diskon, harga, pemesanan,
keluhan, dan testimoni pelanggan. Hal ini menjadi salah satu alasan Programmer banyak
mengembangkan website dan memilih Python agar lebih menarik serta memudahkan proses
pengembangannya.
b) Penambangan Data
Penambangan data disebut juga dengan data mining, yaitu proses pengumpulan informasi
penting dari suatu data yang besar. Proses data mining seringkali menggunakan metode
statistika, matematika, hingga artificial intelligence atau AI. Data mining memiliki dua fungsi
utama, deskriptif dan prediktif.

18
Secara deskriptif, data mining berfungsi untuk memahami lebih jauh tentang data yang
diamati dengan menemukan pola tertentu yang tersembunyi dalam sebuah data. Pola
tersebut dianalisis sehingga menghasilkan karakteristik tertentu.
Secara prediktif, proses data mining akan menghasilkan pola tertentu dari suatu data untuk
mengetahui berbagai variabel-variabel yang ada pada data. Pola ini dapat digunakan untuk
memprediksi variabel lain yang belum diketahui nilai maupun jenisnya. Hal ini bermanfaat
untuk mempermudah sesorang membuat prediksi yang lebih akurat.
Python dianggap sebagai salah satu bahasa pemrograman terbaik untuk mengatur dan
membersihkan data untuk sampai ke proses data mining.

c) Pengembangan Machine Learning


Machine learning adalah salah satu perkembangan dari teknologi AI yang berguna untuk
memungkinkan komputer belajar dengan sendirinya tanpa arahan dari manusia atau user.
Komputer akan diprogram untuk bisa belajar menganalisa data tanpa perlu diperintah.

Ia akan secara mandiri memperoleh data dan mempelajarinya hingga mampu melakukan
tugas tertentu. Machine learning dikembangkan dari banyak disiplin ilmu, seperti matematika,
statistika, dan data mining.
Contoh perkembangan machine learning adalah fitur face unlock pada perangkat smartphone,
serta iklan-iklan yang muncul di media sosial sesuai riwayat pencarian berdasarkan pribadi
seseorang. Anda dapat membuat model machine learning menggunakan bahasa
pemrograman Python.
d) Pengembangan Game
Dalam Python terdapat program bernama GUI atau Graphical User Interface. Teknologi GUI
dalam game dimanfaatkan untuk memungkinkan pemain berinteraksi lebih atraktif dengan
komputer menggunakan elemen visual. Dalam bahasa Indonesia, GUI disebut dengan APG
yang merupakan singkatan dari Antarmuka Pengguna Grafis.
Contoh GUI pada OS Windows adalah di Taskbar, Start, dan Notification Area. Dalam Python
terdapat modul bernama Tkinter yang dapat dipakai untuk menciptakan program-program
GUI sederhana.

19
e) Pengembangan IoT
IoT (Internet of Things) adalah sebuah sistem atau program yang dibuat sebagai tempat
berbagai benda dan peralatan saling berkomunikasi melalui jaringan internet dan wireless.
Komunikasi di sini maksudnya adalah transfer dan transmisi data tanpa menggunakan
bantuan perangkat komputer dan manusia. Contohnya adalah QRCode yang sering digunakan
untuk bertransaksi. Selain itu perkembangan IoT terbaru adalah Smart City yang
memungkinkan segala bentuk aktivitas penduduk suatu kota dapat dimonitor dengan baik
oleh sistem dengan jaringan database berskala besar.
f) Fintech
Fintech (financial technology) adalah inovasi pada industri teknologi keuangan agar proses
transaksi bisa dilakukan dengan praktis, mudah, dan efektif. Perkembangan fintech di
Indonesia semakin pesat, khususnya sejak berdirinya Asosiasi Fintech Indonesia pada tahun
2015. Pada tahun 2017 dikembangkan juga fintech syariahyang bergerak atas dasar prinsip
Islam.
Contoh penerapan teknologi pada industri fintech ialah memungkinkan nasabah mengajukan
kredit melalui sistem elektronik yang terintegrasi dengan internet. Sehingga tidak perlu
melakukan pengajuan kredit dengan mendatangi bank atau penyedia jasa keuangan lain.

Python dikenal dengan sintaksnya yang mudah dan lebih cepat diprogram sehingga industri
fintech banyak menggunakannya karena memerlukan bahasa pemrograman dengan tingkat
kesalahan yang lebih rendah. Python membantu pengembang perusahaan fintech menguji
alogritma kompleks dengan waktu yang lebih cepat. Zopa dan Robinhood adalah dua contoh
perusahaan fintech yang menggunakanPython sebagai bahasa pemrograman utama mereka.

3. Keunggulan Python
Kemudahan yang menjadi keunggulan Python bukan menjadi satu-satunya alasan bahasa
pemrograman ini banyak digunakan. Keunggulan Python yang lain, diantaranya:

 Memiliki sejumlah perpustakaan keuangan terbuka

Perpustakaan ini merupakan sebutan untuk kode program tambahan yang dikembangkan
melalui open source project dan dapat digunakan secara gratis. Python dianggap sebagai
bahasa kunci pemrograman matematika yang cocok untuk lembaga keuangan dan industri
yang membutuhkan perhitungan, data, serta urutan angka.

20
Python memiliki lebih dari 140.000 perpustakaan, tiga terbesarnya adalah NumPy, Pandas,
dan Matplotlib.

a) NumPy, paket penting untuk komputasi ilmiah.


b) Pandas, alat analisis dan manipulasi data yang fleksibel dan mudah digunakan.
c) Matplotlib, alat bantu menampilkan hasil analisis berupa grafik berwarna denganrapi dan
menarik.
 Gratis dan open source

Python bebas digunakan, dikembangkan, dan distribusikan untuk berbagai tujuan serta di
bawah lisensi open source yang disetujui oleh OSI (Open System Interconnection).

 Fleksibel

Program yang ditulis menggunakan Python dapat dijalankan di berbagai sistem operasi
seperti Windows, Mac OS X, Unix, dan perangkat-perangkat seluler. Selain itu, Python dapat
diintegrasikan dengan bahasa pemrograman lain.

4. Kekurangan Python

Meski memiliki banyak keunggulan, ada kekurangan yang harus diketahui untuk pertimbangan
penggunaan Python dalam proyek Anda.

 Lebih sedikit developers berpengalaman


Dibandingkan Java, tidak banyak ahli Programmer yang menggunakan Python.

 Kurang populer untuk mobile app development


Hanya sedikit perusahaan yang menggunakan Python untuk aplikasi mobile, hal ini berkaitan
juga dengan sedikitnya developer ahli dan berpengalaman dalam mobile development yang
menggunakan Python.

 Kurang dukungan multiprosesor


Multiprocessing adalah kemampuan komputer dalam memproses perintah secara
berbarengan atau bersamaan. Ini adalah bagian penting dalam penulisan aplikasi. Python
tidak sefleksibel dan senyaman bahasa pemrograman lain. Hal ini menjadi batasan saat
menulis kode.

21
Penting bagi seorang Data Scientist mengetahui kegunaan, keunggulan, dan kekurangan bahasa
pemrograman yang hendak dipelajari. Mengetahui hal tersebut bukan berarti membuat Anda
mengurungkan niat untuk mempelajari Python. Namun semakin membuat Anda menyesuaikan
dengan kebutuhan Anda serta mempersiapkan kemungkinan yang bisa terjadi jika menggunakan
Python.

22

Anda mungkin juga menyukai