Anda di halaman 1dari 5

Resume : Mengenal Penerapan Data Arsitektur untuk Data Science pada Industru di PT.

Sadasa Academy

Nama : Zahwa Neysa A

NIM : 20/464408/SV/18727

Prodi : Teknologi Rekayasa Perangkat Lunak

Tanggal : Rabu, 7 September 14.00-16.00

Judul : Mengenal Penerapan Data Arsitektur untuk Data Science pada Industru di PT.
Sadasa Academy

Speaker : Krisostomus Nova R., S.Kom. (Co-Founder dan CEO di PT. Sadasa Academy
Indonesia)

Moderator : Anni Karimatul Fauziah, S.Kom., M.Eng.

Sadasa adalah startup yang menyediakan pelatihan dengan spesialisasi analisis data. Data science
adalah bidang keilmuan pengolahan data dalam jumlah besar menggunakan algoritma untuk
menentukan strategi bisnis. Big data adalah sekumpulan data yang sangat besar. Artificial
intelligence adalah sistem yang dapat meniru kecerdasan manusia.

Analogi arsitektur data :

Sebuah data dianggap sebagai aliran data pada sebuah perusahaan. Sekumpulan data yang besar
dianalogikan sebagai data lake. Kemudian data dibersihkan karena data yang ada biasanya
mentah sehingga perlu dibersihkan dahulu. Data yang sudah dibersihkan kemudian diangkut ke
data warehouse yang nantinya akan didistribusikan untuk setiap kebutuhan seperti data
visualization, data service, dan lain-lain.

Langkah ke data architecture :


● Preliminary

● Architecture Vision

● Business Architecture

● Data/Information System Architecture

Ekosistem big data :

● Data : berasal dari application, document, dan sensor. Dianalogikan sebagai bahan
makanan yang akan dimasak

● Compute engine : terdiri dari software, hardware, community. Dianalogikan sebagai


peralatan masak yang digunakan untuk kegiatan memasak.

● Talent : education dan community. Dianalogikan sebagai bakat dan skill untuk memasak.

Definisi data science :

● Objek berarti data science merupakan kegiatan untuk melakukan analisa data yang
membutuhkan keahlian software engineering.

● Subjek berupa seorang data scientist adalah seseorang yang lebih baik dalam statistika
dari para software engineer dan lebih baik dalam software engineer dari para ahli
statistika.

● Seorang data scientist yang baik hebat dalam menulis kode dan juga dalam matematika
serta statistika dan juga baik dalam memahami permasalahan bisnis.

Adapun tiga skill utama dalam memulai data science yakni computer science, matematika dan
statistika, business. Irisan antara computer science dengan matematika serta adalah machine
learning, Irisan dari computer science dengan business adalah traditional software, sedangkan
irisan matematika serta statistika dengan business adalah data analysis. Irisan antara ketiganya
itulah yang menjadi skill data science.

Data lifecycle merupakan sebuah proses panjang pengolahan data, dimulai dari pengumpulan
data hingga penyajian data. Untuk menguasai data science juga dibutuhkan kemampuan dalam
data lifecycle. Terdapat empat tahapan yakni yang pertama data acquisiton di mana informasi
dikumpulkan untuk dianalisa. Yang kedua, data storage and management di mana semua sumber
daya informasi dimanage untuk memastikan keakuratannya. Yang ketiga, data analytics yakni
proses menganalisa data untuk membuat kesimpulan atau keputusan mengenai informasi
tersebut. Dan yang terakhir data visualization and communication di mana data disajikan dalam
bentuk yang mudah dipahami melalui bentuk visual.

The Analytic Continuum :

● Descriptive analytics : “Apa yang telah terjadi?”

● Diagnostic analytics : “Mengapa hal itu terjadi?”

● Predictive analytics : “Apa yang akan terjadi?”

● Prescriptive analytics : “Bagaimana kita dapat membuat hal itu terjadi?”

Standard data science workflow :

● Data collection : mengcompile data dari sumber yang berbeda-beda dan menyimpannya
untuk akses yang lebih efisien

● Exploration and visualization : eksplorasi dan visualisasi data melalui dashboard

● Experimentation and prediction : bereksperimen dan melakukan prediksi data.

Data science roadmap :

● Temukan permasalahannya

● Pahami datanya

● Mengekstraksi fitur-fiturnya

● Membuat pemodelan dan analisa untuk dipresentasikan hasilnya dan dideploy kodenya

Cross industry standard process for data mining bukanlah sebuah proses linier yang dimulai dari
sebuah fase dan bekerja melalui setiap langkah sesuai urutan yang ketat. Fase-fase ini merupakan
bagian-bagian dari siklus yang sedang berjalan dari aktivitas analisis dan tim analisis dapat
bekerja bolak-balik pada fase-fase tersebut sesering mungkin. Singkatnya, proses dimulai dengan
masalah bisnis yang spesifik dan menyebabkan pemodelannya.

Team beserta tugasnya :

● Business analyst bertugas untuk memahami permasalahan dari sisi bisnis dan juga
memahami data

● Data engineer bertugas untuk melakukan penyiapan data dengan cara memilih data,
membersihkan data, mengkonstruksi data, mengintregasikan data, dan memformat data.

● Data scientist bertugas untuk melakukan modelling data

● AI/ML engineer bertugas untuk melakukan evaluasi data

● UI/UX Designer dan Web Developer bertugas untuk mendeploynya

Hal yang paling susah tentang kecerdasan buatan bukanlah kecerdasan buatan itu sendiri.
Kecerdasan buatan hanyalah bagian kecil yang perlu didukung dengan adanya konfigurasi, data
collection, data verification, proses management tools, analysis tools dan lain-lain.

Hierarki data science :

● Collect : mengumpulkan data

● Move and store : memindahkan dan menyimpan data

● Explore and transform : mengeksplorasi dan mentransformasikan data

● Aggregate or label : mengagregasi dan melabeli data

● Learn or optimise : mempelejari serta mengoptimasi data

● AI deep learning

Jenjang karir data scientist :

● Trainee data scientist

● Junior data scientist


● Data scientist

● Senior data scientist

● Head of data scientist

Jika dianalogikan dalam industri minyak dan gas, data engineer adalah orang yang membuat pipa
agar minyak mengalir dengan sebagaimana mestinya. Data scientist adalah orang yang mengolah
minyak tersebut. Data analyst adalah orang yang menyajikan minyak ke pelanggan. Berdasarkan
jenjang karir data science, dapat diketahui bahwa setelah mempelajari data science kita dapat
mempelajari tentang data engineering dan big data engineering atau machine learning yang
kemudian dilanjutkan ke deep learning.

Anda mungkin juga menyukai