TANTANGAN, SOLUSI,
DAN LANGKAH UNTUK MULAI
MENGGUNAKANNYA SEKARANG
www.dataiku.com
©2019 Dataiku, Inc. | www.dataiku.com | contact@dataiku.com | @dataiku 1
PENGANTAR
Selama ini data selalu menjadi fondasi di industri perbankan. Dalam beberapa tahun terakhir, yang
berubah tentu saja adalah jumlah data yang tersedia dan kecepatan pemrosesannya, serta kebutuhan
untuk merespons perubahan pasar dengan cepat. Teknologi baru memberikan kemampuan kepada
bank untuk mengumpulkan, menyimpan, dan menganalisis lebih banyak informasi secara eksponensial
daripada yang dapat dibayangkan belum lama ini. Setelah kebangkitan Fintech, bank sudah mengetahui
bahwa agar berhasil di dalam ekosistem saat ini, mereka harus menggunakan data kekayaan ini dalam
skala besar untuk dapat terus berinovasi.
Penyedia informasi bisnis global IHS Markit memprediksi2 bahwa nilai bisnis
kecerdasan buatan (AI) di perbankan akan mencapai 300 miliar USD pada tahun 2030.
Namun, sebagian besar bank tengah berjuang di tengah kompleksitas data itu sendiri, regulasi, dan lebih
banyak lagi, untuk memulai inisiatif AI. Namun, mereka tidak perlu melakukannya. Saat ini, bank sedang
meraih kesuksesan dengan inisiatif AI:
1. Dengan membawakan gagasan berupa “menjalankan AI” dari dasar, lalu menguraikannya menjadi
apa yang sebenarnya berarti bagi mereka (yang tidak selalu berupa aplikasi yang seksi atau chatbot
yang ramping).
2. Menyadari bahwa AI Perusahaan adalah sebuah perjalanan, yaitu serangkaian langkah dan
kompetensi bertahap yang perlu dibangun selama beberapa tahun ke depan. Salah satu dari
langkah-langkah tersebut adalah peningkatan bertahap pada proses internal yang berantakan
sehingga seluruh tim atau divisi dapat mengambil langkah untuk menggunakan data dan AI agar
dapat bekerja dengan cerdas, efisien, dan sesuai standar regulasi.
3. Mulailah dari sekarang, karena jika Anda menunggu beberapa tahun lagi untuk menyelaminya akan
berarti Anda menunda jadwal perjalanan AI Perusahaan lebih lama lagi, sementara persaingan dari
perusahaan lain yang lebih tangkas (baik fintech, GAFA - Google, Apple, Facebook, Amazon - atau
pemain tradisional) akan masuk.
1
https://technology.ihs.com/612413/artificial-intelligence-in-banking-report-2019
Pada akhirnya, AI Perusahaan untuk bank berarti mengubah data dari pusat biaya yang ada saat ini menjadi
aliran pendapatan - yaitu sumber efisiensi dan kekayaan informasi yang dapat digunakan untuk memberikan
nilai fundamental bagi bisnis. Selain itu, dengan pendekatan yang tepat, semua ini dapat dicapai dengan
memanfaatkan kerja keras yang telah dilakukan.
2
https://www.gartner.com/en/documents/3894386
Jason Moolenaar | Jason memiliki pengalaman lebih dari 20 tahun di bidang jasa keuangan
dan teknologi. Setelah memulai kariernya sebagai pedagang penjualan ekuitas dengan
Deutsche Bank yang berfokus pada dana lindung nilai, Jason melanjutkan kariernya
sebagai Junior Portfolio Manager untuk sebuah perusahaan manajemen aset butik di
Sydney, Australia. Dia kemudian menghabiskan sebagian besar kariernya selama hampir
sembilan tahun di Bloomberg, yaitu di grup perdagangan elektronik yang berfokus pada
pengembangan dan penjualan teknologi untuk konektivitas, eksekusi, pemrosesan peristiwa
kompleks, analisis eksekusi pra/pascaperdagangan, dan perdagangan otomatis. Jason juga
memimpin penjualan jasa keuangan di berbagai startup yang berada di tahap awal yang
berfokus pada penerapan AI dan pembelajaran mesin hingga beragam kasus penggunaan,
baik untuk lembaga pembelian dan penjualan. Saat ini, dia memimpin penjualan jasa
keuangan di seluruh Amerika Serikat Bagian Timur dan Kanada di Dataiku.
Hursh Rughani | Hursh memegang gelar sarjana dan pascasarjana manajemen informasi
dan memiliki pengalaman bekerja di bidang analitik data selama lebih dari sembilan
tahun, termasuk memberikan kuliah tamu tentang analitik di perusahaan di University
of Sheffield. Memulai kariernya di bidang konsultan yang berfokus pada jasa keuangan,
Hursh menghabiskan sebagian besar waktunya untuk bekerja sama dengan perusahaan
manajemen investasi. Di M&G Investments (Prudential), dia bekerja sama secara erat
dengan Analytics Centre of Excellence perusahaan dan proyek dalam bidang risiko,
keuangan (analisis AUM dan FUM), serta operasi. Di Tableau, Hursh mengelola sebanyak
15 klien perusahaan yang strategis dalam bidang jasa keuangan. Saat ini, dia memimpin
penjualan jasa keuangan Inggris dan Irlandia di Dataiku untuk mempersembahkan strategi
AI Perusahaan kepada pelanggan dan prospek perbankan perusahaan.
Berikut adalah lima tantangan terbesar yang dihadapi bank dalam mengimplementasikan AI Perusahaan serta saran
untuk menangani, atau setidaknya memberikan pendekatan secara cerdas pada setiap tantangan.
Kabar baiknya, ini bukanlah masalah yang unik - karena survei lintas industri mengungkapkan1 bahwa apa pun
bisnisnya, hal-hal dasar seperti pembersihan dan penataan data serta penghubungan ke sumber data selalu menjadi
tantangan utama bagi para peserta. Dan sebagai catatan, ini adalah kabar yang baik karena ini adalah masalah yang
telah diatasi oleh banyak orang sebelumnya, yang artinya bank tidak perlu memulai dari awal lagi untuk menemukan
solusi cepat.
Secara umum, jawabannya terletak pada peralatan - yaitu dengan memiliki tempat yang terpusat (belum terkontrol)
dengan data yang dapat diakses dan digunakan, semua terdapat dalam sebuah antarmuka yang ramah pengguna
dan tidak hanya ditujukan untuk para ilmuwan data, analisis kuantitatif, atau profil teknis lainnya. Yang paling penting,
sistem untuk mengakses dan membersihkan data tidak boleh bergantung pada arsitektur yang mendasarinya. Artinya,
tidak peduli berapa banyak data yang saat ini disimpan - atau akan disimpan pada masa mendatang - staf tidak perlu
terus-menerus mengubah proses atau alat sehari-hari mereka agar dapat beradaptasi.
Idealnya, akses dan penataan data tidak hanya terjadi di alat ETL (extract, transform, load/ekstrak, ubah, muat) sekali
pakai,baik itu; data harus dimasukkan ke dalam sistem hilir sehingga, ketika relevan dan sesuai, tim teknis dapat
mengambil alih pekerjaan analis dan dengan mudah menerapkan teknik prediktif atau pembelajaran mesin untuk
memberikan nilai lebih.
2. LINGKUNGAN PERATURAN
Permasalahan besar ketika berbicara tentang AI di perbankan, tentu saja, adalah lingkungan peraturan. Peraturan
Perlindungan Data Umum Uni Eropa (GDPR), Undang-undang Privasi Konsumen California (CCPA), Peraturan Keamanan
Siber Departemen Keuangan New York, ekpektasi manajemen risiko pihak ketiga (TPRM), panduan pengungkapan
SEC - berbagai tren pada peraturan kepatuhan perbankan dalam hal data sangatlah kompleks, dan semakin meningkat
setiap tahunnya.
1
https://pages.dataiku.com/top-challenges-data-professionals
“Terlepas dari perubahan definitif yang mungkin dibuat oleh pembuat undang-undang dan
pembuat peraturan, organisasi perbankan harus terus mendorong efektivitas dan efisiensi
di seluruh risiko dan program kepatuhan mereka sehingga mereka dapat memenuhi
undang-undang, peraturan, dan ekspektasi pengawasan yang berlaku.”
Deloitte, 2019 Banking Regulatory Outlook2
Dan itu hanya mencakup regulasi yang menyentuh masalah keamanan siber dan privasi. Setelah digabungkan dengan
peraturan tambahan seputar perlindungan terhadap kejahatan keuangan, standar Dewan Standar Akuntansi Keuangan
(FASB), dan banyak lainnya, pandangannya secara cepat menjadi kompleks.
Memang, lebih dari industri lainnya, bank harus mengedepankan transparansi dan reproduktifitas. Faktanya, tantangan
ini sendiri juga membawa konsekuensi yang berat sehingga bank sering (salah) berasumsi bahwa mereka tidak akan
dapat menerapkan proses AI sama sekali.
Dan untuk memastikannya, pembelajaran mesin kotak hitam (yaitu, model yang hanya mengeluarkan prediksi atau
hasil tanpa visibilitas sama sekali tentang cara pengambilan keputusan) merupakan ketidakmungkinan bagi bank.
Model yang tidak dapat dijelaskan secara sederhana tidak memiliki tingkat reproduktifitas hasil yang diminta oleh
standar peraturan.
Penting untuk disadari bahwa hal yang membuat model pembelajaran mesin akurat seringkali juga merupakan hal yang
membuat prediksi mereka sulit dipahami: mereka sangatlah kompleks. Namun tidak mustahil untuk membuat model
kotak putih yang sangat bagus. Jadi untuk mematuhi kebutuhan pertaturan, bank hampir selalu perlu membangun
model yang pada dasarnya mudah ditafsirkan.
2
https://www2.deloitte.com/us/en/pages/regulatory/articles/banking-regulatory-outlook.html
Selain pembangunan model itu sendiri agar mudah ditafsirkan, ada pertanyaan yang lebih besar mengenai tata kelola
itu sendiri. Dalam lanskap terkini dengan undang-undang privasi data yang bermunculan di seluruh dunia, tidak jarang
tim data atau analitik di bank menjadi lumpuh karena ketidakpastian dalam bagaimana cara menavigasi dunia baru ini.
Di bawah peraturan privasi data, sangat jelas, bahwa bekerja secara langsung dengan data pribadi sangatlah terbatas,
dan bekerja dengan data yang dianonimkan - sementara merupakan sebuah opsi yang menarik jika efektif - sangatlah
sulit (belum lagi yang menghabiskan banyak sumber daya) untuk benar-benar dilakukan secara tepat. Jadi apa pilihan
lainnya yang tersedia bagi bank untuk bekerja dengan data di dunia yang semakin diatur oleh peraturan (dan dunia
yang hanya akan terus diatur lebih ketat oleh peraturan, bukan malah berkurang)?
Pseudonimisasi adalah pemrosesan data pribadi sedemikian rupa sehingga data pribadi tidak dapat lagi dikaitkan
dengan subjek data tertentu tanpa penggunaan informasi tambahan. Sementara secara jelas artinya adalah data
pseudonim masih merupakan data pribadi (karena tidak dianonimkan), ia juga memberikan beberapa kebebasan
tambahan bagi bank untuk bekerja dengan data yang disediakan asalkan mereka memiliki proyek yang spesifik dan
khusus dengan akses yang terkontrol dan kebijakan retensi data yang jelas.
Dengan beberapa keahlian dan pendidikan yang dimiliki oleh orang-orang, proses tata kelola yang cermat, dan alat
yang tepat (misalnya, memilih platform AI yang memungkinkan kemampuan interpretasi model secara lengkap),
tantangan regulasi bukanlah tidak mungkin untuk diatasi.
BACAAN SELANJUTNYA
2 3
1
https://www.nature.com/articles/s42256-019-0048-x
2
https://pages.dataiku.com/executing-data-privacy-compliant-data-projects
3
https://pages.dataiku.com/oreilly-introduction-to-machine-learning-interpretability
Namun, masih ada perbaikan yang dapat dilakukan dan berbagai cara untuk mengatasi tantangan ini; yaitu dengan
mulai menerapkan konsistensi dan reproduktifitas ke dalam proses validasi dan dorongan akhir pada produksi.
Misalnya, kasus yang sering kali terjadi bahwa tim validasi risiko model melihat model dari berbagai organisasi atau
kelompok di seluruh perusahaan, yang masing-masing memiliki proses mereka sendiri dan mengirimkan model
dalam format yang berbeda, dan berisi informasi yang berbeda, dll. Berarti untuk setiap tinjauan, tim validasi risiko
model kehilangan waktu untuk mencoba memahami keadaan mereka sendiri dan mencari tahu hal yang mereka lihat.
Demikian pula, tanpa sistem atau proses konsisten yang dihasilkan oleh model, langkah selanjutnya (penerapan ke
produksi) juga menjadi rumit dan memakan waktu.
Sebaliknya, bank yang dapat melalui tahap validasi risiko model dengan cepat membuat semua orang di seluruh
perusahaan bekerja dengan alat yang sama sehingga begitu model perlu divalidasi, tim yang mengevaluasi risikonya
tahu hal yang sedang mereka hadapi, cara menemukan sumber data tempat model dibangun, mengetahui secara jelas
transformasi data yang telah dilakukan, dll. Dari sana, alat tempat model dikirimkan dan validasi diselesaikan idealnya
juga merupakan alat yang sama dengan tempat penerapan ke produksi terjadi.
Membuat semua orang berada di tujuan yang sama dan dengan alat yang sama akan menjamin proses yang lebih cepat
dari awal hingga akhir sehingga memastikan agar model dapat diproduksi dalam hitungan minggu (bukan bulan atau
tahun seperti yang terjadi pada banyak bank saat ini).
BACAAN SELANJUTNYA
4
www.dataiku.com
4
https://pages.dataiku.com/why-enterprises-need-ml-ai-platforms
Jika melihat ke belakang, seharusnya tidak mengherankan bahwa sebenarnya, mempekerjakan tenaga ahli di
bidang data dan analitik merupakan masalah bagi sebagian besar perusahaan. Biasanya, untuk perusahaan kecil,
masalah tersebut terjadi karena mereka tidak memiliki anggaran untuk menarik tenaga ahli terbaik. Namun untuk
perusahaan besar, sering kali mereka tidak memiliki komite perekrutan yang memahami hal-hal yang mereka cari ketika
berhubungan dengan ilmuwan data atau tujuan, serta kebutuhan organisasi yang berkaitan dengan strategi data.
Faktanya, sering kali daripada tidak, perusahaan mencari ilmuwan data bahkan sebelum mereka memiliki proyek atau
tujuan di dalam pikiran mereka. Hal ini tidak masuk akal karena beberapa alasan, di antaranya karena ilmuwan data1
tidak hanya ada satu jenisnya, sehingga mempekerjakan orang yang tepat dengan keterampilan yang tepat sangat
bergantung pada kasus penggunaan.
Namun bagi bank, perekrutan merupakan tantangan yang lebih besar karena selain menghadapi beberapa
masalah yang disebutkan di atas, bank juga sulit untuk menemukan orang yang melek teknologi AI dan memiliki
pemahaman mendalam tentang industri serta batasan peraturan dan persyaratannya. Bagaimana satu bank akan
menemukan seluruh tim ilmuwan data yang memiliki keterampilan ini, apalagi memastikan bahwa mereka dapat
mempertahankannya (khususnya, mengingat bahwa pergantian ilmuwan data terkenal sangat tinggi2)?
Jawaban atas tantangan ini, sekali lagi, terletak pada demokratisasi data. Tidak masuk akal (secara finansial atau
dalam hal risiko) untuk mencari ratusan ilmuwan data unicorn3 dan membangun tim dari awal. Sebaliknya, bank yang
mengalami kesuksesan saat ini memanfaatkan keahlian dari ratusan ribu staf yang telah memiliki pengetahuan bisnis.
Seperti yang telah disebutkan sebelumnya, banyak bank yang mengabaikan fakta bahwa mereka sudah memiliki
banyak tenaga ahli di bidang data di seluruh organisasi dan bahwa tantangan yang dihadapi bukan pada perekrutan
tetapi lebih pada pelatihan dan pendidikan.
Satu tantangan unik terakhir yang dihadapi bank dalam hal perekrutan adalah peningkatan besar dalam
mempekerjakan staf kepatuhan yang telah menjadi hal umum mengingat adanya kebutuhan untuk memenuhi standar
peraturan yang ketat. Ini adalah sesuatu yang menurut banyak bank tidak dapat dilanjutkan - masalah ini tidak dapat
diskalakan, dan akan ada titik kritis tertentu ketika tanpa adanya alat yang tepat untuk memungkinkan efisiensi, maka
lebih banyak staf kepatuhan tidak berarti akan menghasilkan lebih banyak kepatuhan. Sekali lagi dalam kasus ini,
tantangan tentang perekrutan bukanlah tentang melakukan dengan lebih baik atau melakukan lebih banyak perekrutan
melainkan tentang peralatan, pemberdayaan, dan penerapan efisiensi dengan staf yang ada.
1
https://medium.com/ai-musings/the-different-types-of-data-scientists-and-what-kind-you-should-hire-4475abee2bbd
2
https://medium.com/ai-musings/how-to-retain-data-scientists-28756af84628
3
https://blog.dataiku.com/how-to-hire-great-data-scientists-not-mythical-creatures-anymore
Bagi bank yang ingin merekrut tenaga ahli data, pertanyaan tentang ilmuwan data vs. analis data adalah pertanyaan
yang umum. Namun seiring dengan kemajuan industri, pertanyaan tersebut sebenarnya menjadi semakin rumit. Ini
alasannya mengapa.
Pendidikan
Menjadi ilmuwan data (atau bukan) vs. analis data Tidak, - Terutama mengingat fakta bahwa pengalaman
bukanlah pertanyaan sederhana dari memenuhi sebuah atau keterampilan tertentu (baik untuk ilmuwan data
gelar atau bidang studi tertentu. Misalnya, banyak orang atau analis data) mungkin penting bagi satu tim atau
yang memulainya dari bidang seperti statistik, analis lini bisnis di bank, tetapi tidak bagi yang lain. Misalnya,
kuantitatif, atau ilmu aktuaria yang tidak diragukan lagi mempekerjakan seseorang untuk membuat dasbor dan
selama ini telah melakukan pekerjaan yang tumpang kampanye pencegahan kehilangan pelanggan untuk divisi
tindih dengan ilmuwan data saat ini, dan beberapa pemasaran adalah keahlian yang sama sekali berbeda dari
bahkan telah sepenuhnya beralih ke sains data. mempekerjakan seseorang yang akan membangun sistem
Demikian pula, ilmuwan data juga dapat memiliki latar deteksi anomali untuk meningkatkan keamanan siber.
belakang di bidang studi seperti sains komputer, dan Namun, keduanya mungkin merupakan ilmuwan data.
banyak dari mereka (sekitar setengahnya, menurut suatu
publikasi) memiliki gelar PhD. Meningkat pada saat ini, Keterampilan
seseorang juga harus mempertimbangkan peran dari Salah satu karakteristik mendasar, pada tujuan yang
ribuan kursus sains data atau pendidikan data secara paling umum dan banyak yang mencoba untuk
online dan jika hal tersebut dapat membuat seseorang membedakan antara ilmuwan data dan analis data
dapat memenuhi syarat sebagai analis atau ilmuwan adalah bahwa ilmuwan data bersifat teknis, sedangkan
data itu sendiri. analis data tidak. Meskipun benar bahwa secara umum
Analis bisa jadi memiliki pendidikan secara formal ilmuwan data mungkin lebih mahir dalam lingkungan
seperti itu atau tidak serta dapat memiliki latar belakang pengkodean secara keseluruhan, ada banyak analis di
dan bidang studi yang beragam, termasuk risiko, luar sana yang juga teknis dan merasa nyaman dengan
bisnis umum, dan keuangan, tetapi bisa juga dari seni setidaknya satu bahasa pengkodean.
liberal. Dan,tentu saja, adanya istilah yang disebut Ini juga layak dikatakan bahwa bahkan ilmuwan data
sebagai “ilmuwan data warga negara” yang tampaknya yang memiliki semua keterampilan teknis di dunia pun
mengontrol dua dunia analis dan ilmuwan sehingga dapat memiliki nilai yang kecil di perusahaan jika mereka
semakin memperumit penggambaran tersebut. juga tidak memiliki keterampilan komunikasi dan/atau
Apakah satu bidang studi tertentu atau pembelajaran keterampilan bisnis - yaitu, kemampuan untuk terhubung
tentang satu keterampilan akan mendorong seseorang dengan orang-orang yang paling mengerti bisnis agar
dari analis menjadi ilmuwan data? Atau sebaliknya benar-benar dapat menggunakan keterampilan teknis
karena kurangnya pengetahuan di bidang tertentu? tersebut untuk memberikan nilai yang nyata.
1
https://www.kdnuggets.com/2018/05/simplilearn-9-must-have-skills-data-scientist.html
Kategori ini luas, yang artinya tidak ada kekurangan pada pelanggan ini dapat berdampak signifikan pada
kasus penggunaan dalam hal sains data, pembelajaran kompensasi personel cabang, menjadikan proses ini
mesin, serta AI di sektor perbankan dan jasa keuangan. sangat kontensius dan mengganggu. AI secara khusus
Tantangan yang lebih besar sering kali bukan menemukan dapat digunakan dalam skenario ini untuk membuat
kasus penggunaannya, tetapi memilih kasus penggunaan model Buku Bisnis berbasis pembelajaran mesin yang
yang akan terbukti paling berhasil sebagai inisiatif yang jelas dan mudah ditafsirkan serta yang terasa nyaman
didorong data berdasarkan potensi dampaknya, lihat bagi staf bank.
Praktik Terbaik: Memilih Kasus Penggunaan (Dari Mana
Memulainya?). Kehilangan Pelanggan: Baik pada skala yang lebih
besar seperti pada perbankan ritel atau pendekatan
Namun, bagian ini meninjau secara komprehensif yang lebih dipersonalisasi pada manajemen kekayaan,
(meskipun tidak lengkap) pada kasus penggunaan teratas mengidentifikasi pelanggan yang berisiko keluar
dan kasus penggunaan yang akan datang saat ini. secara efektif dan kemudian mengotomatiskan sistem
untuk mengambil tindakan terhadap pelanggan yang
PENINGKATAN PENDAPATAN berisiko tersebut adalah ruang yang sempurna untuk
Atribusi Pendapatan Pada keinginan mereka untuk AI. Untuk meningkatkan sistem deteksi kehilangan,
lebih dekat dengan para pelanggan, lembaga perbankan pendekatan sains data pertama-tama telah diizinkan
konsumen telah menciptakan konsep Buku Bisnis, untuk mengeksploitasi AI secara lebih komprehensif
yang mengharuskan tim TI untuk membuat aturan sehingga sistem yang terstruktur dapat menarik data
guna mengalokasikan setiap pelanggan ke satu atau dari berbagai silo dan sinyal dari berbagai sumber
lebih cabang di jejak mereka. Secara teori, tindakan ini untuk menghasilkan prediksi yang akurat, kapasitas
memungkinkan manajer cabang dan staf untuk fokus yang lebih tinggi untuk mengantisipasi pelanggan yang
dalam memberikan layanan kepada klien ini. Namun, berpotensi keluar dan untuk memberikan informasi
serangkaian aturan yang dibuat untuk mengalokasikan kontekstual terbaru bagi tim lapangan untuk membantu
1
https://www.forbes.com/sites/bhaktimirchandani/2018/08/28/laughing-all-the-way-to-the-bank-cybercriminals-targeting-us-financial-
institutions/#57fe1d46e906
2
https://www.mckinsey.com/business-functions/digital-mckinsey/our-insights/digital-blog/whats-the-value-of-a-better-model-more-than-you-
may-think
Manajemen Kas
Menganalisis Arus Uang Pengurangan Pembayaran yang
Risiko Produk
Tidak Berdasar dan Diblokir
Penurunan Risiko
AML & KYC
Pemangkasan Biaya
Peningkatan dan
Otomatisasi Proses
Keuntungan Kompetitif
1
https://pages.dataiku.com/ge-aviation-whitepaper
Sains data telah menciptakan kapasitas baru untuk pembelajaran mesin (ML) dan, yang terakhir, AI memiliki
analisis hebat oleh pedagang yang, sejauh ini, hanya peluang besar untuk memberikan keunggulan tersebut.
sedikit yang sudah memanfaatkannya. Meskipun Meskipun hal ini mungkin tampak menakutkan bagi
analisis kuantitatif telah menggunakan sains data pedagang yang belum siap, kabar baiknya adalah tidak
untuk sementara waktu, para pedagang sebagian ada kata terlambat untuk memulai transisi ke strategi
besar telah mengandalkan analisis kuantitatif tersebut yang lebih berorientasi pada sains data. Dan sejujurnya,
untuk menjalankannya dan belum melakukan banyak keengganan yang umumnya terjadi terhadap ML dan AI
perubahan untuk mengembangkan keterampilan di tidak hanya terjadi pada pedagang, karyawan di seluruh
bidang sains data itu sendiri. Namun, mengapa? industri yang tidak sepenuhnya memahami cara kerja ML
dan AI (dan cara mereka agar dapat bekerja sama dengan
Dalam dunia keuangan yang sangat kompetitif ini, para teknologi ini) sering kali tidak mau terjun kedalamnya.
pedaganglah yang paling dekat dengan pasar. Dan
faktanya, dibandingkan dengan analisis kuantitatif yang Namun dengan memahami cara ML dan AI dalam
sering bekerja dari sudut pandang yang lebih teoritis, mengubah industri dan mengambil beberapa langkah
pedagang adalah kandidat yang jauh lebih baik untuk sederhana untuk mengubah pola pikir Anda, siapa
memadukan sains data ke dalam pekerjaan mereka. pun dapat mulai memanfaatkan alat seperti ML dan
perdagangan algoritmik.
Sayangnya, sebagian besar dari mereka belum
melakukannya. Ini sangat disayangkan karena Mengapa Pembelajaran Mesin dalam Perdagangan?
keuntungan dari mempelajari sains data adalah ML dapat menggunakan data secara waktu nyata
pemahaman yang lebih baik tentang model yang dari sumber tidak terstruktur dan terstruktur untuk
mendasarinya. Sekali lagi, dalam industri yang kompetitif menemukan pola dan tren yang mendasari dan mungkin
seperti itu, seseorang tidak dapat berkembang hanya telah disembunyikan. Meskipun berfrekuensi tinggi,
dengan mengandalkan sepenuhnya pada informasi perdagangan yang ditentukan secara algoritme selalu
(model) yang diserahkan dari sebuah analisis kuantitatif. ada, pedagang sering kali dibatasi oleh hal yang dapat
Inilah saatnya bagi para pedagang untuk masuk ke mereka lakukan di spreadsheet.
datanya sendiri.
Sains data menawarkan cara bagi pedagang untuk
Sebelum melakukan lompatan hingga sampai ke posisi memadukan sumber data yang baru dan bermakna
saya saat ini sebagai ilmuwan data utama di Dataiku, dalam skala besar dan secara waktu nyata. Otomatisasi
saya adalah seorang pedagang Schneider di Inggris proses ini memungkinkan peningkatan lebih lanjut
Raya. Sekarang lebih dari sebelumnya, pedagang perlu dalam kemampuan untuk digunakan kembali dan
menemukan keunggulan kompetitif baru dalam industri produktivitas.
yang sepenuhnya telah didominasi oleh teknologi - yaitu
Perubahan di pasar terkenal sulit didapat karena Beberapa keterampilan yang umumnya sama pada
bisa datang dari mana saja - teknik sains data dapat kedua industri, meliputi:
meringankan kesulitan ini dengan memungkinkan • Pemahaman tentang cara mengelola risiko;
pedagang untuk menggabungkan data dari berbagai • Kemampuan untuk mengenali pola dalam himpunan
macam sumber dan memeriksa sejumlah besar data yang besar;
data tentang aktivitas pasar sebelumnya. Selain • Pengetahuan tentang cara membangun hubungan
menggabungkan data dari berbagai sumber, salah dengan pemangku kepentingan; dan
satu manfaat terbesar dari sains data dalam praktik • Pemahaman tentang matematika keuangan, termasuk
perdagangan adalah reproduktifitas. Dengan cepat dan teori penetapan harga aset, probabilitas, dan statistik.
andal, informasi yang tidak mungkin ditemukan, bahkan
oleh pedagang paling rajin sekali pun dapat didistilasi. Beberapa keterampilan yang bagus untuk dimiliki dan
digunakan dalam mengembangkan sains data yang akan
Semua ini memunculkan pertanyaan yang sangat penting, membantu transisi:
yaitu aspek peraturan dan keamanan. Jika dengan • Bahasa pengkodean akan menjadi nilai tambah
menggunakan alat yang tepat, dan dikombinasikan • Alat sains data yang akan memberikan beberapa
dengan praktik tata kelola data yang baik, sains data struktur
mestinya menjadi proses kotak putih. Semua aktivitas
pada proyek data dicatat, dan jelas sumber data apa Sains data adalah bidang yang sangat dinamis, jadi
yang digunakan untuk proyek data mana, bagaimana kebijakan terbaik untuk setiap pedagang yang berorientasi
data dimanipulasi, dll. Oleh karena itu, penggunaan ilmu pada sains data adalah dengan tetap mengikuti
data harus sangat mudah dikelola saat berhubungan perkembangan terkini dari kemajuan bidang tersebut.
dengan hal seperti audit atau regulasi.
Keterampilan yang berkembang dalam sains data
Bertransisi Menjadi Ilmuwan Data akan memiliki dampak jangka panjang pada karier
Profil tipikal dari ilmuwan data sering kali selaras dengan setiap pedagang. Meskipun perdagangan otomatis
profil pedagang -- dan inilah mengapa keduanya sangat hampir mencapai titik di setiap sendi kehidupan, ML
cocok. dan AI memiliki potensi untuk sepenuhnya mengubah
pengertian dari menjadi seorang pedagang.
• 420.000 pelanggan dan pendanaan lebih dari 7 • Meningkatkan kapasitas deteksi penipuan
miliar USD mereka sebesar 10 persen dengan beralih ke
• Berbasis di AS dengan 160 karyawan model berbasis pembelajaran mesin.
• Tim data yang terdiri dari enam orang
Evgeny Pogorelov
Direktur Ilmu Keputusan
Marlette Funding, Platform Pinjaman Egg Terbaik
• Ahli di bidang bisnis dan industri serta sisi rekayasa data
• Tujuan utama: Memudahkan ilmuwan data melakukan tugasnya
Sami Bouguezzi
Ilmuwan Data
Marlette Funding, Platform Pinjaman Egg Terbaik
• Bertanggung jawab penuh untuk membangun algoritme pembelajaran mesin bagi
perusahaan
• Tujuan utama: Mendapatkan model yang dia bangun dari sandbox dan masuk ke produksi
Tim ini - Evgeny dan Sami - memutuskan untuk 6. Mengevaluasi dampak pada pelanggan dan
mengimplementasikan model deteksi penipuan penghematan biaya bagi bisnis untuk menunjukkan
berbasis ML mereka menggunakan Dataiku dari awal nilai model dan mengumpulkan dukungan untuk
hingga akhir, karena akan memungkinkan mereka untuk pekerjaan mereka guna terus mengembangkan
mendapatkan model dan menjalankan produksi dengan model untuk bagian lainnya dari organisasi.
cepat serta kemudian melanjutkan untuk membangun
dan menerapkan proyek dengan prioritas yang tinggi Kombinasi dari proses yang tepat, orang-orang yang
(seperti pengoptimalan harga atau pengoptimalan saling bekerja bersama, dan teknologi memungkinkan
campuran pemasaran). Langkah-langkah kunci dalam Marlette Funding untuk mengembangkan model deteksi
proses mereka adalah: penipuan berbasis ML terbaik di kelasnya untuk Platform
Best Egg dengan tim yang relatif kecil yang tidak hanya
1. Bekerja sama dengan tim operasi penipuan untuk dapat membuat perbedaan dengan cepat, tetapi juga
mengumpulkan data dan memahami kebutuhan dapat dengan mudah dipantau dan diperbarui untuk
dan tujuan proyek dari sisi bisnis. mencegahnya agar tidak menyimpang atau tidak sinkron
dengan tujuan dan perubahan pada bisnis.
2. Mengumpulkan data yang tersedia dari berbagai
sumber (tentu saja, termasuk situs web mereka,
tetapi juga dari biro kredit dan vendor yang khusus
bergerak dalam data deteksi penipuan) untuk
membuat satu himpunan data yang besar.
1
https://blog.dataiku.com/dataiku-5.0-enterprise-ai-within-reach
2
https://pages.dataiku.com/lessons-in-data-science-from-the-top-banking-insurance-and-finance-enterprises
Terpusat, atau dikenal sebagai model “pusat keunggulan” yang keahlian datanya berada dalam satu tim
pusat untuk seluruh organisasi yang kemudian dikontrakkan ke lini bisnis sebagai layanan untuk membantu
menyelesaikan proyek data. Model ini dapat bekerja dengan baik karena model ini memastikan strategi terpusat
yang mengembangkan praktik terbaik untuk penerapan di semua lini bisnis. Namun, ini berarti bahwa pakar data
tidak juga menjadi ahli di bidang bisnis (perbankan ritel, asuransi, investasi, dll.), yang lebih menekankan pada
perlunya kolaborasi dengan ahli tersebut.
Terdesentralisasi, saat setiap lini bisnis memiliki sumber datanya sendiri yang hanya didedikasikan untuk
departemen tertentu. Model ini dapat bekerja dengan baik karena artinya sumber daya data tersebut tertanam
secara mendalam dalam bisnis dan dapat memiliki pemahaman yang lebih luas tentang masalah yang mereka
hadapi sehingga memungkinkan mereka untuk mengembangkan solusi yang lebih komprehensif dan inovatif.
Namun, ini berarti ada risiko yang lebih besar dari masalah tata kelola dan masalah “TI bayangan” yang telah
didiskusikan sebelumnya, karena setiap tim data mengembangkan proses dan praktiknya sendiri.
Setiap model memiliki kelebihan dan kekurangan, Intinya, terserah organisasi jika ingin memutuskan model
mana yang bekerja dengan baik berdasarkan cara perusahaan tersebut diatur, hal-hal yang dibutuhkan untuk
proyek data, seberapa solid komunikasi antar lini bisnis, dan lainnya. Poinnya adalah bahwa model mana yang
diputuskan untuk digunakan oleh bank harus dipertimbangkan dengan hati-hati atas keuntungan dan potensi
konsekuensinya di masa depan, serta pilihannya harus dipilih secara sadar sehingga komunikasi adalah kuncinya.
Secara umum, CIO harus lebih peduli dengan masalah infrastruktur dan memastikan bahwa infrastruktur perusahaan
melayani bisnis tersebut. Tanggung jawab tersebut termasuk kepemilikan atas saluran data, memastikan bahwa
data tersebut akurat dan tepercaya. Di sisi lain, CDO harus bertanggung jawab terutama untuk menetapkan strategi
organisasi secara keseluruhan guna menggunakan data di seluruh perusahaan.
Saat ini, bank sering kali memiliki banyak CDO atau CIO untuk berbagai lini bisnis. Ini adalah produk dari struktur
organisasi yang terdesentralisasi, yang mungkin artinya, bahwa CDO dan CIO bertanggung jawab mengepalai sumber
daya data untuk bagian tertentu di perusahaan. Dalam hal ini, peran tata kelola dan komunikasi data antar peran
tersebut menjadi sangat penting.
Pertama-tama, baik CDO dan CIO berperan penting dalam membuat dan menjunjung strategi tata kelola data, yang
tidak hanya melibatkan kepatuhan terhadap regulasi, tetapi juga strategi untuk kualitas data yang berkelanjutan,
standar untuk manajemen dan penggunaan data, serta rencana untuk arsitektur data. Setiap aspek dari rencana
tata kelola data harus didokumentasikan, dan setiap lini bisnis harus dapat bertanggung jawab - terlepas organisasi
tersebut mengikuti rencana terpusat atau terdesentralisasi untuk AI Perusahaan.
Namun tata kelola tidak dapat hanya berada di atas: ia harus menyaring semua aspek lainnya dari organisasi, turun
hingga ke individu yang bekerja dengan data. Jika tata kelola data tidak dipermudah bagi mereka yang memiliki
peran data setiap harinya, maka kenyataannya tata kelola tersebut tidak akan diikuti. Jadi membangun infrastruktur
yang mendorong tata kelola di tingkat mana pun, seperti melalui Sains data, pembelajaran mesin, atau platform AI -
merupakan bagian penting dari persamaan tersebut.
Tentu saja, bisnis ini secara fundamentarl berbeda dari lembaga keuangan tradisional. Namun, bukan berarti tidak ada
yang dapat dipelajari dari kesuksesan mereka. Dua dari faktor kunci kebangkitan mereka, misalnya, antara lain:
1. Berfokus secara penuh pada pelanggan akhir, yang berarti terjadi peningkatan fokus pada kepercayaan dan
transparansi yang telah mendorong pertumbuhan basis pengguna mereka. Pemain tradisional dapat mengambil
petunjuk di sini dan meningkatkan fokus pada interpretabilitas, kepercayaan, dan tanggung jawab, terutama
dalam hal pembelajaran mesin dan AI.
2. Kemampuan dalam menggunakan data untuk berinovasi, yang merupakan hasil dari tim yang tangkas dan
demokratisasi data. Jelas, bahwa tindakan ini jauh lebih mudah untuk dijalankan di perusahaan kecil yang
lahir di era mahadata, tetapi bank yang lebih besar dan lebih tradisional dapat mengambil petunjuk dengan
memberlakukan beberapa prinsip sederhana, seperti produk dengan kelayakan minimum (MVP) untuk proyek data.
1
https://www.forbes.com/sites/jimmarous/2018/08/27/future-of-banking-fintech-or-techfin-technology/#6fe6f7b65f2d
2
https://blog.dataiku.com/mvp-for-data-projects
Buku putih ini mencakup banyak hal, berikut adalah lima tema dan poin penting:
1. Regulasi adalah tantangan yang unik, tetapi tidak harus menghalangi bank untuk bersaing dengan AI: Meskipun
benar bahwa cara data pribadi dapat diperoleh dan digunakan itu terbatas (dan akan terus menjadi semakin
terbatas dalam memperkuat lingkungan regulasi saat ini), regulasi tidak menghentikan orang-orang untuk bekerja
dengan data dalam strategi tata kelola yang ditentukan dengan baik.
2. Topik seperti kepercayaan data, transparansi, interpretabilitas, dan tanggung jawab itu penting: Dengan kata lain,
mereka penting tidak hanya bagi pelanggan, tetapi juga bagi pembuat peraturan. Dengan ekstensi, yang berarti
mereka benar-benar perlu menjadi perhatian (dan menjadi perhatian utama dalam hal mengembangkan inisiatif
dan strategi tata kelola di tahun-tahun mendatang) bagi bank.
3. Inovasi sangat penting di berbagai tingkatan: Terlepas dari keuntungan yang jelas dalam menghadirkan
produk baru melalui pengembangan produk baru dan masih banyak lagi, penting untuk mempekerjakan dan
mempertahankan tenaga ahli di bidang data teratas. Memanfaatkan teknologi dan proses yang mutakhir
(seperti sumber terbuka) memastikan bahwa mereka yang bekerja dengan data merasa tertantang dan terus
mengembangkan keterampilan yang relevan.
4. Bank tidak perlu memulai dari awal untuk memulai perjalanan mereka menuju AI Perusahaan: Faktanya mereka
sudah memilikin banyak bagian di tempat, termasuk staf lintas peran dan lini bisnis yang sudah mencoba
menggunakan data untuk membuat keputusan. Artinya beberapa langkah pertama relatif mudah dicapai - sehingga
membuat proses lebih lancar bagi mereka yang sudah menggunakan data dalam peran mereka sehari-hari. Proyek
dan kasus penggunaan yang lebih kompleks dapat berkembang dari sana.
5. Sains data, pembelajaran mesin, dan platform AI adalah kemenangan yang jelas bagi bank: Mereka dapat
menyediakan platform untuk tata kelola, termasuk ruang kerja yang transparan untuk mengembangkan
proyek data dalam batasan regulasi. Mereka dapat mengeluarkan staf dari penggunaan spreadsheet dan juga
mengarahkan ahli data ke sumber terbuka. Mungkin yang paling penting, mereka umumnya mengurangi risiko
yang diakibatkan saat memulai proyek analitik, pembelajaran mesin, dan AI tingkat lanjut.
Filter on Mr.
450+ 45,000+
PELANGGAN PENGGUNA AKTIF
Dataiku adalah peron terdepan di dunia untuk AI Setiap hari, sistemisasi penggunaan data
untuk hasil bisnis yang luar biasa. Organisasi yang menggunakan Dataiku mengangkat
orang-orang mereka (baik teknis dan bekerja dalam kode atau di sisi bisnis dan kode rendah
atau tanpa kode) menjadi luar biasa, mempersenjatai mereka dengan kemampuan untuk
membuat keputusan hari-ke-hari yang lebih baik dengan data.