Anda di halaman 1dari 6

Introduction

Big data adalah istilah yang mencakup semua untuk kumpulan set data yang besar dan kompleks,
sehingga menjadi sulit untuk diproses menggunakan aplikasi pemrosesan data tradisional. “Ukuran”
data besar adalah target yang bergerak secara konstan, mulai tahun 2012 mulai dari beberapa lusin
terabyte hingga banyak petabyte data sekarang. Ini juga seperangkat teknik dan teknologi yang
menganalisis, menangkap, membuat, mengelola, dan memproses data dalam waktu yang telah
berlalu yang dapat ditoleransi (Wikipedia).

Ini memiliki banyak kegunaan yang berbeda - manajemen risiko penipuan, iklan tampilan web,
optimasi pusat panggilan, analisis media sosial, manajemen lalu lintas cerdas dan, untuk beberapa
nama. Sebagian besar solusi analitis ini tidak mungkin dilakukan sebelumnya karena teknologi data
tidak dapat menyimpan data dengan ukuran sangat besar atau teknologi pemrosesan tidak mampu
menangani volume kerja yang besar atau terlalu mahal untuk mengimplementasikan solusi pada
waktu yang tepat.

Dengan kebutuhan bisnis muncul, Alibaba menggunakan sistem dan platform yang dioptimalkan dan
mengembangkan metodologi dan pendekatan canggih untuk menangani volume harian level 10
miliar. Dimulai dari platform data RAC pada 2009, melalui GP dan Hadoop, dan menggunakan ODPS
sekarang. Pemrosesan dan analisis data juga ditingkatkan dari mode T +1 ke mode real-time.

Dengan menggunakan teknik big data, Alibaba menyoroti kemajuan yang dibuat dalam bidang
manajemen risiko penipuan. Ini membangun sistem pemantauan pencegahan penipuan pembayaran
real-time, yang disebut CTU (Counter Terrorist Unit). CTU adalah salah satu sistem manajemen
penipuan pembayaran online paling canggih di Tiongkok, yang dapat melacak dan menganalisis
perilaku akun atau pengguna, mengidentifikasi kegiatan yang mencurigakan dan menerapkan
berbagai tingkat perawatan berdasarkan arbitrase cerdas

Model risiko penipuan adalah salah satu lapisan pendukung CTU. Mereka menggunakan teknik
statistik dan teknik untuk menganalisis risiko agregat perantara (akun, pengguna atau perangkat,
dll). Atribut terperinci dihasilkan sebagai input. Algoritma yang berbeda adalah untuk menilai
korelasi atribut ini dan kegiatan penipuan, dan untuk memisahkan yang baik dari yang buruk.
Memvalidasi dan menyetel adalah untuk memastikan model berlaku untuk skenario yang berbeda.
Data besar di Alibaba menghasilkan ribuan atribut, dan model risiko penipuan dibangun untuk
menangani berbagai kegiatan penipuan.

Model penipuan berbasis data besar ini banyak digunakan di hampir setiap prosedur di Alibaba
untuk memantau penipuan, seperti pembukaan rekening, verifikasi identitas, penempatan pesanan,
sebelum dan sesudah transaksi, penarikan uang, dll. Untuk membangun lingkungan pembayaran
yang aman dan bersih, Alibaba memutuskan untuk memperluas kemampuan ini ke pengguna
eksternal. Produk yang ramah pengguna dibuat, disebut AntBuckler. AntBuckler adalah produk
untuk membantu pedagang dan bank untuk mengidentifikasi risiko kejahatan cyber dan kegiatan
penipuan. Dan skor risiko (Skor RAIN) dihasilkan berdasarkan analisis data besar dan diberikan
kepada pedagang dan bank untuk memberi tahu tingkat risiko

Makalah ini menceritakan tentang bagaimana data besar diterapkan di Alibaba dan bagaimana data
itu digunakan untuk membangun model dan sistem manajemen risiko penipuan. Ini juga
memperkenalkan metodologi dan penerapan produk pencegahan penipuan berbasis data yang
besar, AntBuckler. Makalah ini disusun sebagai berikut. Bagian selanjutnya: Aplikasi data besar di
Alibaba, menyediakan pengembangan data besar di Alibaba dalam 10 tahun terakhir. Dan kemudian
Bab 3: Manajemen Risiko Penipuan Alibaba merinci bagaimana data besar digunakan untuk
pencegahan penipuan dalam hal kerangka kerja dan sistem pemantauan. Terakhir, Bab 4
memberikan pengantar rinci tentang AntBuckler.

Chapter 2: Big Data Applications at Alibaba

Alibaba tumbuh cepat dalam 10 tahun terakhir. Pada tahun 2005, volume transaksi harian kurang
dari 10 ribu per hari. Mencapai 188 juta pada 11 November 2013 suatu hari. (Lihat Grafik 1).

Dengan pertumbuhan bisnis yang eksponensial, komputasi data, sistem pemrosesan, dan
penyimpanan data juga akan berubah. Itu dimulai dari platform komputasi data RAC (produk Oracle)
pada 2009, melalui GP dan Hadoop, dan sekarang menggunakan ODPS. Pemrosesan dan analisis
data juga ditingkatkan dari mode T + 1 ke mode real-time, terutama dalam pencegahan risiko di
Alibaba, pemeriksaan penipuan pada setiap transaksi dapat dikendalikan dalam 100 ms. Terlebih
lagi, sumber data diperluas dari data unit tunggal ke kombinasi data grup internal dan data biro
eksternal (Lihat Grafik 2). Alibaba tidak hanya memiliki data dari Taobao, Tmall, Alipay, tetapi juga
dari mitra, seperti Gaode Maps dll. Data dari berbagai sumber membangun platform data
terintegrasi, dari mana skenario bisnis diperluas sebagian besar juga. Pemasaran menggunakan
analisis data untuk secara akurat menargetkan pengguna dan menyediakan layanan yang
dipersonalisasi. Pedagang dan perusahaan keuangan membutuhkan klasifikasi data profesional
untuk menyaring pelanggan berharga. Layanan pelanggan yang cerdas dapat secara efektif dan
efisien menyelesaikan permintaan dan keluhan pengguna menggunakan platform data yang
komprehensif. Dan di bidang pembayaran, Alibaba, sebagai pemimpin dunia pembayaran online,
membangun platform manajemen risiko penipuan untuk memastikan pembeli dan penjual
bertransaksi dengan cepat dan aman. Skor kredit dan harga asuransi adalah produk lain di Alibaba
yang menggunakan data besar secara ekstensif.

Chapter 3: Alibaba Fraud Risk Management

3.1 Kerangka Risiko

Manajemen risiko penipuan di Alibaba sama sekali berbeda dari sistem keuangan dan perbankan
tradisional sekarang karena big data. Untuk menangani penipuan waktu nyata, pendekatan insinyur
baru diproduksi secara bertahap untuk menangani jumlah data yang demikian secara mendasar. Di
atas sistem perangkat keras, kerangka kerja pencegahan risiko juga dibangun untuk mendukung
metodologi dan algoritma baru. Ada beberapa jenis kerangka kerja pencegahan risiko.

One fundamental risk framework is call ‘multi-layers risk prevention framework’ (See Graph 3).

Di Alibaba, ada 5 lapisan untuk mencegah penipuan selama transaksi. Satu penipu dapat melewati
lapisan pertama, ia mungkin tidak dapat melewati lapisan berikutnya. Ketika suatu transaksi dimulai,
lapisan pertama adalah Pemeriksaan Akun, yang mencakup informasi akun pembeli dan informasi
akun penjual. Beberapa pertanyaan diajukan, mis. apakah akun pembeli atau penjual memiliki
aktivitas buruk / mencurigakan sebelumnya? Apakah ada kemungkinan akun pembeli dicuri dll?
Transaksi yang sangat mencurigakan dapat ditolak untuk melindungi pembeli, atau beberapa
metode otentikasi tambahan dapat memicu untuk menggandakan situasi. Lapisan berikutnya adalah
Pemeriksaan Perangkat. Apakah ada jumlah besar transaksi dari perangkat yang sama? Adakah
transaksi dari perangkat yang salah? Lapisan ketiga adalah Activity Check, disebut juga sebagai
Behavior Check. Ini memeriksa catatan sejarah, pola perilaku pembeli dan penjual, menghubungkan
antara akun, perangkat dan skenario. Strategi Risiko adalah lapisan keempat, menilai tindakan
berdasarkan analisis sebelumnya. Beberapa dikirim ke keputusan otomatis karena kegiatan
penipuan yang jelas. Beberapa kotak abu-abu dikirim ke lapisan kelima, tinjauan manual. Di satu sisi,
untuk bertanggung jawab atas kedua belah pihak, Alipay ingin memberikan pengalaman yang lebih
baik. Di sisi lain, Alipay tidak ingin salah menilai kasus apa pun. Tanpa bukti kuat, kasus
mencurigakan akan ditinjau secara manual, di mana lebih banyak info terungkap dan beberapa
panggilan telepon dapat dilakukan untuk mengingatkan pembeli

Perbedaan lain antara manajemen risiko penipuan Alibaba dan sistem keuangan dan perbankan
tradisional adalah objek utama risiko. Pelanggan adalah objek utama dalam sistem perbankan.
Sementara di Alibaba, pencegahan penipuan risiko ada di level pelanggan, di level akun, di level
perangkat dan di level skenario juga.

3.2 CTU - Sistem Pemantauan Pencegahan Penipuan

CTU (Counter Terrorist Unit), adalah sistem pemantauan pencegahan penipuan pembayaran real-
time di Alibaba. Ini adalah salah satu sistem manajemen penipuan pembayaran online paling canggih
di Cina, yang dapat melacak dan menganalisis perilaku akun atau pengguna, mengidentifikasi
kegiatan yang mencurigakan dan menerapkan berbagai tingkat perawatan berdasarkan arbitrase
cerdas.

versi pertama diluncurkan pada 1 Agustus 2005. Pada saat itu, ia lebih berfokus pada penyelidikan
transaksi besar, pengembalian dana mencurigakan dll. Sekarang ini mencakup pencucian uang,
penipuan pemasaran, akun dan kartu yang dicuri, dan monetisasi uang tunai juga. Terlebih lagi, ini
adalah sistem pemantauan 24 jam, yang menyediakan perlindungan sepanjang waktu kapan saja.

Ketika suatu peristiwa terjadi, itu melewati CTU untuk penilaian. Ada ratusan acara. Seorang
pengguna masuk, mengubah profilnya, memulai transaksi, menarik uang dari Alipay ke rekening
bank dll, semuanya adalah peristiwa. Di belakang CTU, ada platform data, platform pemodelan dan
mesin aturan. Suatu peristiwa memicu sesuai model dan aturan di balik CTU untuk komputasi real-
time, dan dalam 100 ms, CTU mengembalikan hasilnya dengan keputusan risiko. Bisa berisiko
rendah, yang lolos dari acara. Mungkin berisiko tinggi dengan penghentian langsung atau tantangan
lebih lanjut (Lihat Grafik 5).

 3.3 Pemodelan Risiko Penipuan

Data yang mendukung penilaian CTU adalah dari kasus historis, perilaku pengguna, menghubungkan
hubungan dan sebagainya. Model risiko dibangun untuk menganalisis pola kecurangan penipu,
hubungan antara penipu dan penipu, perilaku berbeda antara pengguna yang baik dan pengguna
yang buruk.
 Ada beberapa faktor yang perlu dipertimbangkan selama membangun model risiko. Bias dan
Variance biasanya terkait bersama untuk menyeimbangkan efektivitas dan dampak model risiko.
Bias adalah faktor untuk mengukur bagaimana model cocok untuk risiko, bagaimana menemukan
risiko akun atau transaksi secara akurat. Varians adalah untuk mengukur apakah suatu model stabil
atau tidak, apakah itu dapat mempertahankan siklus hidup yang relatif lebih lama dalam bisnis.
Tingkat positif negatif, juga disebut tingkat tutupan yang salah, adalah faktor lain yang perlu
diperhatikan dalam usia data besar. Tingkat positif negatif yang tinggi akan membawa tekanan bisnis
besar bagi perusahaan dan pengalaman pengguna yang buruk. Terlebih lagi, interpretabilitas
diperlukan untuk menjelaskan kepada pengguna alasan bahwa model memberikan tingkat risiko
seperti itu ke akun atau transaksinya. Di zaman big data, kecuali faktor-faktor yang disebutkan di
atas, para ilmuwan data terus berjuang untuk kekurangan data, sparsitas data, dan kemiringan data.

Proses pembangunan model juga relatif matang di Alibaba setelah pertimbangan berulang kali.
Sampel putih dan hitam dipilih terlebih dahulu. Data perilaku dan aktivitas dikumpulkan untuk kedua
sampel untuk menghasilkan variabel asli, dari mana variabel agregat diabstraksi. Melalui pengujian,
beberapa variabel divalidasi sebagai efektif. Mereka akhirnya digunakan dalam membangun model.
Dari pengalaman pemodelan kami dengan menggunakan data besar Alibaba, decision tree C5.0 dan
Random Forest memiliki kinerja yang lebih baik untuk menyeimbangkan antara bias dan Variance.
Salah satu alasan yang jelas adalah bahwa mereka tidak menganggap distribusi data karena mereka
adalah model algoritmik daripada model data. Ketika suatu model mampu memisahkan yang baik
dan yang buruk dengan lebih baik dalam sampel, pada dasarnya diproduksi. Namun, untuk
memastikan itu berlaku untuk skenario yang berbeda, validasi juga penting. Sebuah model dapat
diluncurkan hanya jika bekerja sebaik pengujian dan validasi data. Setelah diluncurkan, model risiko
perlu digunakan untuk lingkungan produksi, dan digunakan dalam CTU yang dikombinasikan dengan
strategi dan aturan lainnya

3.4 Skor RAIN

HUJAN adalah salah satu jenis pemodelan risiko. HUJAN adalah singkatan dari Risiko Aktivitas,
Identitas, dan Jaringan. Pada dasarnya, risiko suatu objek (pengguna, akun atau bahkan kartu) terdiri
dari tiga dimensi variabel, aktivitas, identitas, dan jaringan. Ratusan variabel pertama kali dipilih
untuk menafsirkan status dan perilaku suatu objek. Dan berdasarkan pengujian, verifikasi dan
validasi, variabel yang dipilih disimpan. Skor RAIN dihasilkan berdasarkan bobot variabel yang
berbeda dalam ketiga dimensi ini.

3.5 Contoh Analisis Berbasis Jaringan dalam Teori Grafik Deteksi Risiko Fraud (Analisis Berbasis
Jaringan) adalah subjek matematika terapan. Ini umumnya diterapkan pada analisis jejaring sosial,
seperti Facebook, Twitter dan sebagainya. Teori grafik dan analisis berbasis jaringan memainkan
peran baru dalam pengendalian risiko. Penipu saat ini cerdas, mereka tahu model risiko kami
memeriksa apakah akun penipuan berasal dari nama yang sama, alamat, telepon dan kartu kredit
dll. Sebaliknya, mereka mencoba yang baru 3.5 Contoh Analisis Berbasis Jaringan dalam teori Grafik
Deteksi Risiko Penipuan (Jaringan- Analisis berbasis) adalah subjek matematika terapan. Ini
umumnya diterapkan pada analisis jejaring sosial, seperti Facebook, Twitter dan sebagainya. Teori
grafik dan analisis berbasis jaringan memainkan peran baru dalam pengendalian risiko. Penipu saat
ini cerdas, mereka tahu model risiko kami memeriksa apakah akun penipuan berasal dari nama,
alamat, telepon dan kartu kredit yang sama, dll. Sebaliknya, mereka mencoba yang baru
Grafik ini menceritakan kisah lain kepada kita. Satu akun berbagi IP register yang sama dan
mendaftarkan jejak perangkat dengan grup kiri. Itu juga berbagi nama dan nomor info yang sama
dengan grup yang tepat. Ini adalah bukti kuat untuk membuktikan hubungan antara dua kelompok
akun.

Contoh di atas hanyalah kasus sederhana. Di dunia nyata, koneksi sangat rumit. Kita harus
menggunakan algoritma grafik paralel dan penyimpanan grafik khusus untuk menangani grafik
sebesar itu. Node antar (konsep dari analisis berbasis jaringan) memainkan peran penting dalam
menemukan koneksi dari berbagai akun. Koneksi sekarang banyak digunakan untuk menilai
hubungan akun, ini secara efektif mencegah penipu membangun jaringan mereka sendiri

Bab 4: AntBuckler - Produk Pencegahan Penipuan berbasis Data Besar

Untuk membangun lingkungan pembayaran yang aman dan bersih, Alibaba memutuskan untuk
memperluas kemampuan pencegahan risikonya kepada pengguna eksternal. Sebuah produk
manajemen penipuan berbasis data besar dibangun, yang disebut AntBuckler.

AntBuckler adalah produk untuk membantu pedagang dan bank untuk mengidentifikasi risiko
kejahatan cyber dan kegiatan penipuan. Kami menemukan bahwa pedagang umumnya menghadapi
pola penipuan serupa. Salah satu contohnya adalah penipuan program pemasaran. Pedagang sering
memberikan hadiah tunai atau sertifikat voucher kepada pengguna baru untuk memperluas basis
pengguna mereka. Penipu sering mengambil keuntungan ini dengan membuat ratusan akun. Untuk
pedagang, sumber daya pemasaran tidak diberikan untuk memperbaiki basis pengguna. Bagi
pengguna yang baik, mereka tidak dapat menikmati manfaatnya. Penipu juga dapat menjual akun
mereka dengan kupon dengan harga lebih tinggi. Ini tidak hanya merusak citra merek pedagang,
tetapi juga membingungkan pasar

Antbuckler menggunakan mesin model RAIN dan menghasilkan skor risiko (Skor RAIN) untuk
mengukur tingkat risiko. Skor berkisar dari 0 hingga 100. Semakin tinggi, semakin berisiko. Ini juga
memiliki visualisasi yang user-friendly. Alasan teratas ditampilkan di atas dengan bobot lebih tinggi
dan warna lebih cerah. Koneksi melalui akun, email, telepon, kartu dan sebagainya disajikan
menggunakan tampilan berbasis jaringan. Dasbor operasi adalah alat lain yang bermanfaat. Ini
memberi tahu Anda berapa banyak akun yang dinilai oleh AntBuckler, berapa banyak yang
diidentifikasi dengan risiko, di mana risiko dibagikan, dan sebagainya.

Bab 5: Kesimpulan

Seperti yang kita bicarakan di atas, manajemen risiko penipuan berbasis data besar merupakan tren
baru dalam dunia pembayaran. Ini mengarah ke generasi baru pemantauan penipuan, yang
didasarkan pada pemrosesan data besar dan teknologi komputasi, sistem pencegahan penipuan
waktu-nyata dan model risiko. Alibaba telah berhasil menggunakan manajemen penipuan berbasis
data besar untuk menangani penipuan harian sekarang. Dan kami ingin mengekspor kemampuan
kami ke pedagang eksternal, bank, perusahaan pembayaran pihak ketiga dan seterusnya untuk
membangun lingkungan pembayaran yang aman dan bersih.

Anda mungkin juga menyukai