Sebelum Data Science, populer terlebih dahulu istilah data mining dalam sebuah
artikel yang disebut from data mining to knowledge discovery in databases pada
tahun 1996 yang merujuk pada keseluruhan proses menemukan informasi yang
berguna dari data.
Pada tahun 2001, William S. Cleveland ingin membawa data mining ke level yang
lebih tinggi. Dia melakukannya dengan menggabungkan computer
science dengan data mining. Pada dasarnya dia membuat statistik lebih teknis, yang
dia percaya akan memperluas kemungkinan data mining dapat menghasilkan
kekuatan yang kuat untuk inovasi.
Sekarang Anda dapat memanfaatkan kekuatan komputasi untuk statistik dan dia
menyebutnya kombo data science. Pada saat ini, bermula ketika web 2.0 muncul di
mana situs web tidak lagi hanya pamflet digital, tetapi sarana untuk pengalaman
bersama di antara jutaan pengguna Ini adalah situs web seperti MySpace pada tahun
2003, Facebook pada tahun 2004 dan Youtube pada tahun 2005.
Sekarang kita dapat berinteraksi dengan situs web ini, artinya kita dapat
memberikan kontribusi untuk memberikan komentar, like, upload, dan share,
meninggalkan jejak kita di lanskap digital. Internet membantu menciptakan dan
membentuk ekosistem yang sekarang kita kenal dan cintai.
Dan coba tebak? Itu banyak sekali data, begitu banyak data. Itu menjadi terlalu
banyak untuk ditangani dengan penggunaan teknologi tradisional. Jadi biasa
disebut Big Data. Hal itu membuka banyak kemungkinan dalam menemukan
wawasan menggunakan data.
Dalam data science, biasanya membutuhkan komputasi paralel seperti MapReduce,
Hadoop, dan Spark. Jadi, kebangkitan big data pada tahun 2010 memicu munculnya
ilmu data untuk mendukung kebutuhan bisnis untuk mendapatkan wawasan dari
kumpulan data tak terstruktur mereka yang sangat besar.
Para praktisinya seringkali disebut dengan ilmuwan atau data scientist, dan mereka
menggabungkan berbagai keterampilan untuk menganalisis data yang dikumpulkan
dari web, ponsel cerdas atau smartphone, pelanggan, sensor, dan sumber lain untuk
mendapatkan wawasan yang dapat ditindaklanjuti.
Tujuan utama dari Data Science adalah data mining atau menggali data untuk menemukan data
yang paling akurat dari jutaan data yang tersedia.
Data Science juga bertujuan untuk memberikan informasi yang benar, yang mana dapat
dimanfaatkan untuk :
Deskripsi, yaitu menampilkan pola data dengan tujuan untuk dianalisa sehingga masalah-
masalah yang ada dapat diketahui
Prediksi, yaitu untuk memprediksi berdasarkan nilai, probabilitas dan data untuk
selanjutnya dijadikan rekomendasi. Rekomendasi tersebut bisa dijadikan dasar untuk
mengambil keputusan yang tepat atau digunakan otomatis oleh sistem yang digunakan.
Menganalisa Data
Jelas, fungsi dari Data Science adalah untuk menganalisa data secara tepat dan
akurat yang nantinya bisa dijadikan dasar untuk mengambil keputusan yang minim
risiko atau kesalahan. Analisa data ini bisa dilakukan dengan bantuan tool dan
penguasaan bahasa pemograman, misalnya saja query SQL, Excel, tool visualisasi
data serta bahasa pemograman R, MATLAB atau Phyton.
Meneliti Data
Untuk jasa platfrorm analisis data semisal Google Analytic, Data Science juga
berfungsi sebagai peneliti terkait dengan data yang dihasilkan di platform tersebut.
Makanya, Data Scientist dalam platform ini harus cakap dalam ilmu matematika,
fisika dan statistika. Orang-orang dengan latar belakang tersebut akan mudah
diterima dalam platform ini.