Anda di halaman 1dari 4

Shingai Manjengwa, CEO Fireside Analytics, menyatakan bahwa :

 Sains Data adalah proses bukan event/kejadian. Proses yg menggunakan data utk
memahami sesuatu dgn cara yg berbeda
 Untuk memahami kehidupan melalui data
Rafael B.Da Silva menyatakan :
 Sains data adalah ketika kalian memiliki sebuah model atau hipotesis masalah dan kamu
mencari jawaban masalah tsb dan memvalidasi hipotesis tsb menggunakan data.
Diana Zarate Diaz menyatakan :
 Sains Data adalah seni untuk mengungkapkan informasi/trend/model yg tersembunyi di
balik data
Luis O Martins menyatakan :
 Sains data adalah ketika km menerjemahkan data menjadi sebuah cerita untuk
memunculkan insight2 dari data sehingga dari insight tsb akan digunakan sebagai dasar
penentuan kebijakan2 strategis bagi institusi
Mandeep Kaur :
Sains data adalah bidang ttg proses dan sistem utk mengekstrak dan mengeksplor data dari
berbagai macam bentuk baik struktur dan nonstruktur
Stephen Sherman :
Sains data adalah studi tentang data, suatu hal yang nyata. Data juga memiliki properti atau
atribut
Akademia :
 Sains data melibatkan data dan beberapa ilmu. Dia melihat data adalah suatu usaha untuk
mengolah data untuk mencari jawaban atas pertanyaan2 yang bisa dieksplor
 Lebih pada data daripada sciencenya karena yang dieksplor adalah datanya
 Ketika kalian memiliki data dan penasaran terhadap data itu maka kita akan mencoba
mengotak-atik data tsb utk menjawab penasaran tsb
Sains data merupakan sebuah ilmu yang sangat relevan dalam kondisi saat ini.
 Di masa lalu khawatir akan kekurangan data utk menganalisis fenomena, saat ini kita
kebanjiran data bahkan harus menemukan metode mengolah data sebanyak itu
 Tools dan software di masa lalu mahal, kalau sekarang open source dan gratis
 Kita dulu tidak bisa menyimpan data banyak, maksimal 50 GB. Hari ini sudah tidak
khawatir lagi
Sains data adalah komponen yg signifikan berkaitan dengan analisis data.
Kuantitas dan ketersediaan data dalam jumlah yg sangat besar adalah hal baru
Computing power sangat berperan dalam mengolah data
Sains data membantu organisasi :
1. Memahami lingkungan mereka
2. Menganalisis isu2 yg terjadi saat ini
3. Mengungkapkan peluang2 / kesempatan yg tersembunyi di masa lalu
Data scientist menggunakan data analysis untuk menambahkan beberapa pengetahuan dengan
cara menyelidiki data yg ada kemudian mengeksplor dengan cara yg terbaik kemudian
menghasilkan value utk kebutuhan bisnis
Data sains fokus ke masalah2 yg spesifik kemudian mengklarifikasikan dengan pertanyaan2
untuk dijawab sesuai kebutuhan organisasi.
Data saintis yg baik adalah yg punya penasaran tinggi sehingga mengklarifikasikan pertanyaan2
utk kebutuhan bisnis. Pertanyaan2 tsb :
1. Data yg kita butuhkan kaya gimana
2. Di mana memperoleh data tsb
Data scientist bisa menganalisis data terstruktur dan tidak terstruktur dari berbagai sumber
tergantung dari permasalahannya. Bisa jadi masalahnya udah lama ada atau pengetahuan baru
utk organisasi.
Data scientist menjadi storyteller, mengkomunikasikan hasil kepada stakeholder projek
Pendekatannya macam macam :
1. Visualisasi yang powerful
2. Membuat stakeholder paham dengan hasil yg dia peroleh
3. Mendapatkan rekomendasi aksi yg bisa dilakukan stakeholder
Sains data mengubah :
1. Cara kita bekerja
2. Cara menggunakan data
3. Pendekatan kita dalam menyelesaikan masalah yg ada di dunia

Tujuan organisasi menggunakan data sains :


1. Mengungkapkan fenomena yg terjadi
2. Mendiscover sebuah solusi yg optimum bagi problem yg dihadapi
3 contoh penggunaan data sains :
1. Uber menggunakan pendekatan solusi dgn mengoleksi real-time user data untuk menemukan
jumlah driver yg tersedia, berapa biaya yg cocok utk perjalanan yg dilakukan
2. Toronto Transportation Comission untuk menyelesaikan permasalahan kemacetan di
daerahnya. Perusahaan tsb mengumpulkan data complain pelanggan, penggunaan kendaraan
umum, performa lalu lintas, membangun tim yg terdiri dari data scientist utk mendapatkan solusi
dari problem. 2010-2014 mengalami penurunan kemacetan
3. Permasalahan lingkungan di mana danau tsb terdapat bakteri2 yg mengganggu kesehatan.
Mereka menggunakan tools untuk menggali data dari danau itu. Informasi2 yg didapat
menimbulkan prediksi2 yang tepat tentang bakteri tsb mulai dari lokasi, seberapa banyak
berkembang, seberapa cepat berkembang akhirnya bisa dilakukan kegiatan preventif.

Bagaimana mendapatkan solusi yang efisien?


1. Mengidentifikasi masalah
2. Meningkatkan pemahaman terhadap masalah
3. Mendapatkan data yg arahnya untuk dilakukan analisis
4. Mengidentifikasikan tools yg berguna dalam proses pengolahannya
Seorang data saintis harus punya :
1. Rasa penasaran tinggi
2. Extremely argumentative (Bisa memulai dari mana saja, asumsi, memodifikasi asumsi,
memberikan hipotesis)
3. Mampu memberikan justifikasi terhadap hal2 yg bertentangan atau tidak sesuai dengan asumsi
di awal
4. Mampu menceritakan hasilnya kepada orang lain
5. Lihat sisi kompetitifmu
6. Menguasai tools untuk mengolah data
Pendekatan data saintis
1. Algoritma
 Regresi : membantu kita dalam memahami data
 Data visualisasi : komponen utama dalam sains data karena kita bisa
menyampaikan hasil ke orang lain
 ANN (Artificial Neural Networks) yang cukup membantu berkaitan dgn sains
data
 Nearest neighbor : algoritma ini sederhana tapi bisa mendapatkan hasil yg terbaik
2. Cloud
 Cloud adalah pusat penyimpanan
 Cloud memungkinkan kita utk melalukan analisis dan menyimpan data lebih dari
penyimpanan personal
 Cloud menyediakan beberapa perhitungan komputasi dan levelnya sudah high
performance computing
 Cloud memungkinkanmu untuk mendapatkan akses instan ke open source
 Cloud memberikanmu akses ke most up-to-date tools dan libraries
 Cloud memungkinkan kita bekerja secara tim
 Bisa diakses di mana pun tablet hp laptop dll
 IBM menawarkan IBM cloud, amazon menawarkan amazon web service, google
menawarkan google cloud platform

Anda mungkin juga menyukai