Sadasa Academy
NIM : 20/464408/SV/18727
Judul : Mengenal Penerapan Data Arsitektur untuk Data Science pada Industru di PT.
Sadasa Academy
Speaker : Krisostomus Nova R., S.Kom. (Co-Founder dan CEO di PT. Sadasa Academy
Indonesia)
Sadasa adalah startup yang menyediakan pelatihan dengan spesialisasi analisis data. Data science
adalah bidang keilmuan pengolahan data dalam jumlah besar menggunakan algoritma untuk
menentukan strategi bisnis. Big data adalah sekumpulan data yang sangat besar. Artificial
intelligence adalah sistem yang dapat meniru kecerdasan manusia.
Sebuah data dianggap sebagai aliran data pada sebuah perusahaan. Sekumpulan data yang besar
dianalogikan sebagai data lake. Kemudian data dibersihkan karena data yang ada biasanya
mentah sehingga perlu dibersihkan dahulu. Data yang sudah dibersihkan kemudian diangkut ke
data warehouse yang nantinya akan didistribusikan untuk setiap kebutuhan seperti data
visualization, data service, dan lain-lain.
● Architecture Vision
● Business Architecture
● Data : berasal dari application, document, dan sensor. Dianalogikan sebagai bahan
makanan yang akan dimasak
● Talent : education dan community. Dianalogikan sebagai bakat dan skill untuk memasak.
● Objek berarti data science merupakan kegiatan untuk melakukan analisa data yang
membutuhkan keahlian software engineering.
● Subjek berupa seorang data scientist adalah seseorang yang lebih baik dalam statistika
dari para software engineer dan lebih baik dalam software engineer dari para ahli
statistika.
● Seorang data scientist yang baik hebat dalam menulis kode dan juga dalam matematika
serta statistika dan juga baik dalam memahami permasalahan bisnis.
Adapun tiga skill utama dalam memulai data science yakni computer science, matematika dan
statistika, business. Irisan antara computer science dengan matematika serta adalah machine
learning, Irisan dari computer science dengan business adalah traditional software, sedangkan
irisan matematika serta statistika dengan business adalah data analysis. Irisan antara ketiganya
itulah yang menjadi skill data science.
Data lifecycle merupakan sebuah proses panjang pengolahan data, dimulai dari pengumpulan
data hingga penyajian data. Untuk menguasai data science juga dibutuhkan kemampuan dalam
data lifecycle. Terdapat empat tahapan yakni yang pertama data acquisiton di mana informasi
dikumpulkan untuk dianalisa. Yang kedua, data storage and management di mana semua sumber
daya informasi dimanage untuk memastikan keakuratannya. Yang ketiga, data analytics yakni
proses menganalisa data untuk membuat kesimpulan atau keputusan mengenai informasi
tersebut. Dan yang terakhir data visualization and communication di mana data disajikan dalam
bentuk yang mudah dipahami melalui bentuk visual.
● Data collection : mengcompile data dari sumber yang berbeda-beda dan menyimpannya
untuk akses yang lebih efisien
● Temukan permasalahannya
● Pahami datanya
● Mengekstraksi fitur-fiturnya
● Membuat pemodelan dan analisa untuk dipresentasikan hasilnya dan dideploy kodenya
Cross industry standard process for data mining bukanlah sebuah proses linier yang dimulai dari
sebuah fase dan bekerja melalui setiap langkah sesuai urutan yang ketat. Fase-fase ini merupakan
bagian-bagian dari siklus yang sedang berjalan dari aktivitas analisis dan tim analisis dapat
bekerja bolak-balik pada fase-fase tersebut sesering mungkin. Singkatnya, proses dimulai dengan
masalah bisnis yang spesifik dan menyebabkan pemodelannya.
● Business analyst bertugas untuk memahami permasalahan dari sisi bisnis dan juga
memahami data
● Data engineer bertugas untuk melakukan penyiapan data dengan cara memilih data,
membersihkan data, mengkonstruksi data, mengintregasikan data, dan memformat data.
Hal yang paling susah tentang kecerdasan buatan bukanlah kecerdasan buatan itu sendiri.
Kecerdasan buatan hanyalah bagian kecil yang perlu didukung dengan adanya konfigurasi, data
collection, data verification, proses management tools, analysis tools dan lain-lain.
● AI deep learning
Jika dianalogikan dalam industri minyak dan gas, data engineer adalah orang yang membuat pipa
agar minyak mengalir dengan sebagaimana mestinya. Data scientist adalah orang yang mengolah
minyak tersebut. Data analyst adalah orang yang menyajikan minyak ke pelanggan. Berdasarkan
jenjang karir data science, dapat diketahui bahwa setelah mempelajari data science kita dapat
mempelajari tentang data engineering dan big data engineering atau machine learning yang
kemudian dilanjutkan ke deep learning.