Data science adalah sebuah bidang studi yang sedang naik daun saat ini yang dibangun
berdasarkan disiplin ilmu matematika, statistik, dan komputer. Kombinasi disiplin ilmu tersebut
membuat data science menjadi sangat kuat untuk mengolah big data. Data science dapat membantu
proses pengolahan data yang meliputi pengumpulan data, manipulasi data, hingga analisis data
dengan melakukan pemodelan pada kumpulan data untuk menghasilkan informasi berupa insight yang
berguna dan bisa bisa dijadikan pedoman dalam pengambilan keputusan di masa depan. Data science
mengolah big data dimana berisi data terstruktur maupun tidak terstruktur. Hal ini berguna dalam
mengolah teks, gambar, video, audio, dan lain-lain untuk menghasilkan sistem kecerdasan buatan.
Sistem kecerdasan buatan ini dapat dirancang untuk melakukan berbagai tugas yang terlalu sulit untuk
kecerdasan manusia. Hasil data yang diolah sistem kecerdasan buatan akan dapat dimanfaatkan oleh
analis dan pengguna dalam bisnis untuk merancang strategi yang tepat untuk menyelesaikan suatu
masalah atau mencapai sebuah tujuan.
Kelebihan
1. SAS
Mempermudah Perhitungan Statistik dari Suatu Instansi
Bagi anda yang membutuhkan bantuan untuk melakukan analisa dan juga
penghitungan statistik, maka sudah pasti software ini merupakan salah satu software
yang patut anda gunakan. Selain dapat digunakan secara personal, software SAS ini
juga merupakan salah satu software yang sering digunakan oleh perusahaan dan juga
instansi tertentu, yang pastinya akan membuat perhitungan statistik menjadi lebih
mudah
2. R
Bersifat open source sehingga bisa dinikmati oleh siapa saja secara gratis tanpa harus
membayar lisensi.
Banyak package dan function di R yang dapat mempermudah pekerjaan praktisi data.
Bisa digunakan untuk banyak hal seperti proses cleansing dan manipulasi data,
analisis data dan pembuatan model, analisis spasial, data visualisasi, analisis teks
dengan Natural Language Processing, dll.
Script yang ada bisa disimpan sehingga bisa digunakan jika ada kasus yang sama.
Adanya komunitas R di Indonesia, sehingga dapat membantu proses belajar bahasa R
menjadi lebih mudah.
3. Python
Memiliki library yang luas dan banyak
Bahasa pemrograman python memiliki banyak library yang siap anda
gunakan yang berisi berbagai modul. Didalamnya terdapat berbagai macam kode
untuk digunakan seperti regulas expressions, documentation-generation, unit testing,
database, CGI, email, dan masih banyak lagi. Sehingga dengan adanya library ini,
anda tidak perlu menulis lagi secara manual.
Fleksibel
Kode program yang ditulis menggunakan bahasa python dapat dijalankan di
hampir semua sistem operasi seperti Windows, Mac, maupun Linux, termasuk
beberapa perangkat-perangkat seluler. Kode python dapat di integrasikan dengan
aplikasi yang ditulis dalam bahasa pemrograman lain dengan mekanisme tertentu.
Misal, kode python dapat dipanggil dari kode C/C++, dan sama halnya dengan
perkembangan .NET Framework.
Kekurangan
1. SAS
Terbatas Untuk Konsep Statistika Sosial
Kekurangan pertama dari software ini adalah keterbatasannya yang hanya
pada kepentingan bisnis, sehingga banyak memiliki fitur bisnis. Sedangkan untuk
statistika sosial, mungkin masih bisa menggunakan software SAS ini, namun fiturnya
belum lengkap untuk kepentingan statistik ilmu sosial.
Eksekusi coding di R terbilang cukup lama, apalagi data yang kamu miliki adalah
data yang berukuran besar
3. Python
Tidak cocok untuk aplikasi mobile
Python merupakan bahasa pemrograman yang sangat baik digunakan untuk
platform dekstop dan server namun tidak dalam urusan komputasi aplikasi mobile.
Pengembangan aplikasi dan game kurang cocok jika menggunakan python. Bahkan
banyak yang mengatakan bahwa mustahil membuat game dalam bentuk tiga dimensi
dengan grafis tinggi menggunakan python.
Machine learning adalah ilmu pengembangan algoritme dan model secara statistik yang
digunakan sistem komputer untuk menjalankan tugas tanpa instruksi eksplisit, mengandalkan pola dan
inferensi sebagai gantinya. Sistem komputer menggunakan algoritme machine learning untuk
memproses data historis berjumlah besar dan mengidentifikasi pola data. Hal ini memungkinkannya
untuk memprediksi hasil yang lebih akurat dari set data input yang diberikan. Misalnya, ilmuwan data
dapat melatih aplikasi medis untuk mendiagnosis kanker dari citra sinar-x dengan cara menyimpan
jutaan citra pindaian dan diagnosis yang sesuai.
Machine learning membantu bisnis dengan cara mendorong pertumbuhan, membuka aliran
pendapatan baru, dan menyelesaikan masalah-masalah yang menantang. Data adalah penggerak yang
penting di balik pengambilan keputusan bisnis, tetapi secara tradisional, perusahaan telah
menggunakan data dari berbagai sumber, seperti umpan balik pelanggan, karyawan, dan keuangan.
Penelitian machine learning mengotomatiskan dan mengoptimalkan proses ini. Dengan menggunakan
perangkat lunak yang menganalisis data bervolume besar dengan kecepatan tinggi, bisnis akan dapat
mencapai hasil secara lebih cepat.
1. Supervised Learning
Supervised learning menggunakan infromasi sebagai input dan data berlabel sebagai
output. Metode ini memasukkan input dengan output yang sudah diketahui. Di sini mesin
akan mempelajari hubungan dan ketergantungan antar data, kemudian membandingkan
output sebenarnya dengan output yang diprediksi, dan melakukan modifikasi jika ada
ketidakcocokkan. Metode ini memungkinkan mesin melihat akurasi kerjanya.
2. Unsupervised Learning
Selain metode supervised learning dan unsupervised learning, ada juga metode semi-
supervised learning yang posisinya berada di tengah 2 metode sebelumnya. Pada semi-
supervised learning data yang digunakan adalah data tidak berlabel (mayoritas) dan beberapa
data berlabel dengan keperluan khusus.
3. Reinforcement Learning
Reinforcement learning mengolah data dengan pembelajaran trial and error. Mesin
melakukan percobaan berulang-ulang untuk menemukan aksi terbaik untuk memaksimalkan
hasil/output. 3 komponen utama dalam reinforcement learning meliputi:
Perbaikan cara bermain AlphaGo dilakukan oleh dirinya sendiri berdasarkan pengalamannya
saat ia bermain melawan dirinya sendiri atau melawan orang lain. AlphaGo juga bisa mensimulasikan
beberapa pertandingan pada satu waktu secara bersamaan. Artinya dalam satu waktu ia bisa
melakukan beberapa pertandingan Go sekaligus untuk dipelajari. Sehingga proses belajar dan
pengalamannya bermain Go juga bisa lebih banyak dibanding manusia. Hal ini terbukti ketika
AlphaGo bermain dengan juara dunia Go pada tahun 2016 dan ia bisa menjadi pemenangnya.
Dari penerapan machine learning pada AlphaGo, kita bisa memahami bahwa machine
learning akan terus belajar selama ia digunakan. Sama halnya seperti fitur deteksi wajah di foto yang
dimiliki Facebook ia akan belajar mengenal pola wajah kamu berdasarkan tanda yang kamu
masukkan saat memposting sebuah foto. Dari orang yang kamu tandai pada foto tersebut ML akan
menjadikan informasi tersebut sebagai media untuk belajar.
Jadi tidak heran apabila machine learning sering digunakan, maka tingkat akurasinya semakin
baik dibanding di awal-awal. Hal ini dikarenakan machine learning telah banyak belajar seiring waktu
dari pemakaian machine learning oleh pengguna. Seperti pada fitur deteksi wajah milik Facebook
semakin banyak orang yang menggunakan fitur tersebut dan menandai orang-orang yang ada di foto
maka tingkat akurasi orang yang dideteksi pun semakin baik.