Anda di halaman 1dari 9

Pengertian Data Science

Data science adalah sebuah bidang studi yang sedang naik daun saat ini yang dibangun
berdasarkan disiplin ilmu matematika, statistik, dan komputer. Kombinasi disiplin ilmu tersebut
membuat data science menjadi sangat kuat untuk mengolah big data. Data science dapat membantu
proses pengolahan data yang meliputi pengumpulan data, manipulasi data, hingga analisis data
dengan melakukan pemodelan pada kumpulan data untuk menghasilkan informasi berupa insight yang
berguna dan bisa bisa dijadikan pedoman dalam pengambilan keputusan di masa depan. Data science
mengolah big data dimana berisi data terstruktur maupun tidak terstruktur. Hal ini berguna dalam
mengolah teks, gambar, video, audio, dan lain-lain untuk menghasilkan sistem kecerdasan buatan.
Sistem kecerdasan buatan ini dapat dirancang untuk melakukan berbagai tugas yang terlalu sulit untuk
kecerdasan manusia. Hasil data yang diolah sistem kecerdasan buatan akan dapat dimanfaatkan oleh
analis dan pengguna dalam bisnis untuk merancang strategi yang tepat untuk menyelesaikan suatu
masalah atau mencapai sebuah tujuan.

Kelebihan

1. SAS
 Mempermudah Perhitungan Statistik dari Suatu Instansi
Bagi anda yang membutuhkan bantuan untuk melakukan analisa dan juga
penghitungan statistik, maka sudah pasti software ini merupakan salah satu software
yang patut anda gunakan. Selain dapat digunakan secara personal, software SAS ini
juga merupakan salah satu software yang sering digunakan oleh perusahaan dan juga
instansi tertentu, yang pastinya akan membuat perhitungan statistik menjadi lebih
mudah

 Mempersingkat Waktu Dalam Melakukan Penghitungan


Penghitungan statistik juga akan menjadi lebih mudah dan juga cepat. Selain
itu, dari segi efisiensi waktu, penggunaan software SAS ini juga akan membantu
mempersingkat waktu, Anda tidak perlu menggunakan teknik statistik dengan
perhitungan manual, yang pastinya akan menghambat waktu dan juga dapat memiliki
tingkat akurasi yang kurang apabila tidak teliti.

 Tidak Membutuhkan Spesifikasi Komputer yang Tinggi


Spesifikasi komputer yang dibutuhkan untuk dapat menjalankan software
SAS ini juga tidak terlalu tinggi. Sebuah komputer atau laptop dengan spek standar
pun sudah bisa menjalankan prgram SAS ini, sehingga SAS sangat universal dan bisa
digunakan dimana saja. Terlebih menggunakan kapasitas RAM terbesar saat ini,
sehingga software SAS ini dapat di di jalankan dengan sangat sempurna tanpa
merusak hardware yang ada pada komputer.

 Memberikan Solusi Bagi Kepentingan Bisnis


Bagi kepentingan bisnis, terutama untuk penghitungan analisa statistik
perusahaan, tentu saja software SAS ini sanga baik untuk digunakan dalam keperluan
bisnis anda.

 Hasil Lebih Akurat dan Reliabel


Hasil dari penghitungan statistik yang dilakukan dengan menggunakan
software SAS ini akan menjadi lebih valid dan juga reliabel, alias dapat dipercaya,
karena menggunakan komputasi, sehingga dapat memperkecil resiko terjadinya
kesalahan penghitungan pada analisa statistik suatu perusahaan atau perseorangan.

 Cocok Untuk Membantu Riset Pasar dari Suatu Bisnis


Riset pasar juga merupakan salah satu hal yang sangat diperlukan oleh suatu
perusahaan. Riset pasar digunakan untuk melihat keinginan dan juga kemampuan
pasar serta respon pasar terhadap produk perusahaan. Hal ini tentu saja menjadi suatu
keunggulan bagi SAS, karena dapat membantu menganalisa riset pasar bagi suatu
perusahaan.

2. R
 Bersifat open source sehingga bisa dinikmati oleh siapa saja secara gratis tanpa harus
membayar lisensi.

 Banyak package dan function di R yang dapat mempermudah pekerjaan praktisi data.

 Bisa digunakan untuk banyak hal seperti proses cleansing dan manipulasi data,
analisis data dan pembuatan model, analisis spasial, data visualisasi, analisis teks
dengan Natural Language Processing, dll.

 Populer dan digunakan oleh perusahaan besar seperti Facebook.

 Script yang ada bisa disimpan sehingga bisa digunakan jika ada kasus yang sama.
 Adanya komunitas R di Indonesia, sehingga dapat membantu proses belajar bahasa R
menjadi lebih mudah.

 Dapat terintegrasi dengan bahasa pemrograman lainnya, seperti SQL.

3. Python
 Memiliki library yang luas dan banyak
Bahasa pemrograman python memiliki banyak library yang siap anda
gunakan yang berisi berbagai modul. Didalamnya terdapat berbagai macam kode
untuk digunakan seperti regulas expressions, documentation-generation, unit testing,
database, CGI, email, dan masih banyak lagi. Sehingga dengan adanya library ini,
anda tidak perlu menulis lagi secara manual.

 Open Source atau gratis


Python merupakan bahasa pemrograman open source atau dapat anda unduh
secara gratis. Bahasa satu ini dikembangkan dibawah lisensi open source yang
disetujui oleh OSI dimana bahasa pemrograman ini bebas digunakan, dikembangkan,
dan di distribusikan, bahkan termasuk tujuan komersial.

 Mampu meningkatkan produktifitas developer


Sebagai bahasa yang mudah digunakan dan dipelajari membuat developer
menjadi lebih produktif, apa lagi disertai dengan library yang luas. Selain itu dengan
bahasa python, anda hanya perlu menulis kode lebih sedikit sehingga anda
mempunyai banyak waktu untuk bisa mengerjakan yang lain.

 Mendukung Internet Of Things (IoT) yang baik


Manfaat yang bisa anda dapatkan ketika menggunakan bahasa pemrograman
python salah satunya yaitu mampu mendukung ekosistem Internet Of Things (IoT)
dengan sangat baik, dimana python mampu menghubungkan benda-benda disekitar
lingkungan kita kedalam sebuah jaring-jaring (internet) yang menghubungkan satu
sama lain.
 Bahasa yang mudah dipelajari dan mudah digunakan
Python merupakan bahasa yang mudah dipelajari bahkan untuk pengembang
pemula. Kode bahasa python ini mudah dibaca dan bisa menjalankan banyak fungsi
kompleks dengan mudah, karena banyaknya library.
Selain itu, proses pengembangan bahasa python bisa dilakukan dengan cepat
menggunakan kode yang lebih sedikit. Bahkan tim kecil pun bisa menangani bahasa
python secara efektif. Python merupakan bahasa yang sangat dinamis dimana
dibangun berdasarkan tingkat keterbacaan kode yang tinggi. Sehingga kode tersebut
mudah dipahami dan dicerna. Berbagai macam jenis library memuat banyak
perlengkapan dan fungsionalitas yang sangat luar biasa, sehingga kemudahan dalam
membangun program menjadi salah satu yang ditawarkan oleh bahasa pemrograman
satu ini.

 Fleksibel
Kode program yang ditulis menggunakan bahasa python dapat dijalankan di
hampir semua sistem operasi seperti Windows, Mac, maupun Linux, termasuk
beberapa perangkat-perangkat seluler. Kode python dapat di integrasikan dengan
aplikasi yang ditulis dalam bahasa pemrograman lain dengan mekanisme tertentu.
Misal, kode python dapat dipanggil dari kode C/C++, dan sama halnya dengan
perkembangan .NET Framework.

Kekurangan

1. SAS
 Terbatas Untuk Konsep Statistika Sosial
Kekurangan pertama dari software ini adalah keterbatasannya yang hanya
pada kepentingan bisnis, sehingga banyak memiliki fitur bisnis. Sedangkan untuk
statistika sosial, mungkin masih bisa menggunakan software SAS ini, namun fiturnya
belum lengkap untuk kepentingan statistik ilmu sosial.

 Belum Terintegrasi dengan Program Database


Kekurangan lainnya dari software SAS ini adalah kurangnya integrasi
terhadap software database dan spreadseheet, seperti Ms.Excel. Anda bisa melakukan
proses copy-paste data – data anda ke dalam software SAS ini, yang mana akan
mengurangi efisiensi waktu anda, dan kemungkinan bisa saja mengalami masalah
dalam melakukan proses copy – paste.
2. R
 Sulit untuk dipelajari, terlebih jika kamu bukanlah mahasiswa statistika

 Setiap menjalankan perintah harus menggunakan script

 Terlalu banyak command

 Data dalam R disimpan di memori fisik

 Eksekusi coding di R terbilang cukup lama, apalagi data yang kamu miliki adalah
data yang berukuran besar

 Terlalu kompleks bagi pemula

3. Python
 Tidak cocok untuk aplikasi mobile
Python merupakan bahasa pemrograman yang sangat baik digunakan untuk
platform dekstop dan server namun tidak dalam urusan komputasi aplikasi mobile.
Pengembangan aplikasi dan game kurang cocok jika menggunakan python. Bahkan
banyak yang mengatakan bahwa mustahil membuat game dalam bentuk tiga dimensi
dengan grafis tinggi menggunakan python.

 Eksekusi relatif lambat


Python merupakan bahasa interpreter yang bekerja dengan menggunakan
kompiler. Dimana ketika dijalankan, python akan bekerja lebih lambat jika
dibandingkan dengan bahasa lain. Tetapi hal ini juga bergantung dari besar dan
kecilnya program yang akan kita buat. Python tidak baik jika diperuntukkan dalam
pekerjaan multi-processor atau multi-core.
Python dinilai memiliki performa yang relatif lambat jika dibandingkan dengan
bahasa pemrograman lainnya. Bahkan beberapa penugasan terdapat diluar dari
jangkauan python, serupa bahasa pemrograman dinamis lainnya, python tidak secepat
atau efisien sebagai statis, tidak seperti bahasa pemrograman compilasi serupa bahasa
C.
 Kesulitan jika beralih ke bahasa pemrograman lain
Python memiliki banyak library yang luas sehingga pengguna python terbiasa
dengan fitur yang ada pada library tersebut. Hal ini tentu saja dapat menimbulkan
masalah seperti pengguna mengalami kesulitan ketika belajar maupun beralih ke
bahasa pemrograman yang lain. Karena kebiasaan menggunakan library tersebut
membuat pengguna tidak mengetahui bagaimana asal pembuatan source code library
tersebut.

 Kesalahan saat runtime


Python merupakan bahasa pemrograman yang dinamis, dimana anda tidak
perlu mendeklarasikan tipe variabel saat menulis kode. Meskipun ini memudahkan
developer selama pengkodean, namun pastinya dapat meningkatkan terjadinya
kesalahan saat run-time.

 Efisiensi dan fleksibilitas tradeoff by


Python memberikan flesibilitas tradeoff by dengan tidak diberikan secara
meluas. Python menyiapkan bahasa pemrograman optimasi untuk kegunaan bersama
dengan perangkat bantu yang dibutuhkan untuk di integrasikan dengan bahasa
pemrograman lain.

Pengertian Machine Learning

Machine learning adalah ilmu pengembangan algoritme dan model secara statistik yang
digunakan sistem komputer untuk menjalankan tugas tanpa instruksi eksplisit, mengandalkan pola dan
inferensi sebagai gantinya. Sistem komputer menggunakan algoritme machine learning untuk
memproses data historis berjumlah besar dan mengidentifikasi pola data. Hal ini memungkinkannya
untuk memprediksi hasil yang lebih akurat dari set data input yang diberikan. Misalnya, ilmuwan data
dapat melatih aplikasi medis untuk mendiagnosis kanker dari citra sinar-x dengan cara menyimpan
jutaan citra pindaian dan diagnosis yang sesuai.

Machine learning membantu bisnis dengan cara mendorong pertumbuhan, membuka aliran
pendapatan baru, dan menyelesaikan masalah-masalah yang menantang. Data adalah penggerak yang
penting di balik pengambilan keputusan bisnis, tetapi secara tradisional, perusahaan telah
menggunakan data dari berbagai sumber, seperti umpan balik pelanggan, karyawan, dan keuangan.
Penelitian machine learning mengotomatiskan dan mengoptimalkan proses ini. Dengan menggunakan
perangkat lunak yang menganalisis data bervolume besar dengan kecepatan tinggi, bisnis akan dapat
mencapai hasil secara lebih cepat.

Jenis Machine Learning

1. Supervised Learning

Supervised learning menggunakan infromasi sebagai input dan data berlabel sebagai
output. Metode ini memasukkan input dengan output yang sudah diketahui. Di sini mesin
akan mempelajari hubungan dan ketergantungan antar data, kemudian membandingkan
output sebenarnya dengan output yang diprediksi, dan melakukan modifikasi jika ada
ketidakcocokkan. Metode ini memungkinkan mesin melihat akurasi kerjanya.

2. Unsupervised Learning

Unsupervised learning menggunakan data tidak berlebel, sehingga tidak diketahui


jawaban/output yang benar. Di sini mesin perlu mengeksplorasi data dan menemukan struktur
kemudian memberi label, mengurutkan dan mengklasifikasi data sendiri.

Selain metode supervised learning dan unsupervised learning, ada juga metode semi-
supervised learning yang posisinya berada di tengah 2 metode sebelumnya. Pada semi-
supervised learning data yang digunakan adalah data tidak berlabel (mayoritas) dan beberapa
data berlabel dengan keperluan khusus.

3. Reinforcement Learning

Reinforcement learning mengolah data dengan pembelajaran trial and error. Mesin
melakukan percobaan berulang-ulang untuk menemukan aksi terbaik untuk memaksimalkan
hasil/output. 3 komponen utama dalam reinforcement learning meliputi:

 Agen: pembuat keputusan (mesin)


 Lingkungan: apa saja yang berinteraksi dengan agen (kegiatan/instruksi tertentu,
perilaku pengguna, dsb) yang dijadikan sebagai input
 Aksi: apa yang bisa dilakukan agen (output)

Reinforcement learning menggunakan sistem rewards/punishment berupa penambahan


poin jika model yang dibuat semakin baik, dan pengurangan poin jika model yang dibuat
semakin buruk.

Contoh Cara Kerja/Teori Machine Learning


AlphaGo merupakan machine learning yang dikembangkan oleh Google. Saat awal
dikembangkan AlphaGO akan dilatih dengan memberikan 100 ribu data pertandingan Go untuk ia
pelajari. Setelah AlphaGo mempunyai bekal dan pengetahuan cara dan strategi bermain game Go dari
mempelajari 100 ribu data pertandingan Go tersebut. AlphaGo akan belajar kembali dengan bermain
Go bersama dengan dirinya sendiri dan setiap kali ia kalah ia akan memperbaiki cara ia bermain dan
proses bermain ini akan diulang sampai jutaan kali.

Perbaikan cara bermain AlphaGo dilakukan oleh dirinya sendiri berdasarkan pengalamannya
saat ia bermain melawan dirinya sendiri atau melawan orang lain. AlphaGo juga bisa mensimulasikan
beberapa pertandingan pada satu waktu secara bersamaan. Artinya dalam satu waktu ia bisa
melakukan beberapa pertandingan Go sekaligus untuk dipelajari. Sehingga proses belajar dan
pengalamannya bermain Go juga bisa lebih banyak dibanding manusia. Hal ini terbukti ketika
AlphaGo bermain dengan juara dunia Go pada tahun 2016 dan ia bisa menjadi pemenangnya.

Dari penerapan machine learning pada AlphaGo, kita bisa memahami bahwa machine
learning akan terus belajar selama ia digunakan. Sama halnya seperti fitur deteksi wajah di foto yang
dimiliki Facebook ia akan belajar mengenal pola wajah kamu berdasarkan tanda yang kamu
masukkan saat memposting sebuah foto. Dari orang yang kamu tandai pada foto tersebut ML akan
menjadikan informasi tersebut sebagai media untuk belajar.

Jadi tidak heran apabila machine learning sering digunakan, maka tingkat akurasinya semakin
baik dibanding di awal-awal. Hal ini dikarenakan machine learning telah banyak belajar seiring waktu
dari pemakaian machine learning oleh pengguna. Seperti pada fitur deteksi wajah milik Facebook
semakin banyak orang yang menggunakan fitur tersebut dan menandai orang-orang yang ada di foto
maka tingkat akurasi orang yang dideteksi pun semakin baik.

Penerapan Machine Learning Pada Era Digital

1. Google search autosuggest


2. Rekomendasi video Youtube, Netflix, dan Spotify.
3. Fitur Home di Facebook, Instagram, dan Twitter.
4. Chatbot
5. Produk rekomendasi
6. Facebook dan IG ads: iklan produk yang sesuai
7. Penyaring email spam.
8. Kategorisasi email
9. Quick reply
10. Speech to text
11. Speech recognition
12. Face detection
13. Asisten virtual: Cortana, Siri, Google Now
14. Self-driving car

Anda mungkin juga menyukai