From The Brookings Institution’s Artificial Intelligence and Emerging Technology (AIET) Initiative is part of
“AI and Bias” a series that explores ways to mitigate possible biases and create a pathway greater fairness in AI
and emerging technologies[2].
Sumber : [1] Caliskan, A., Bryson, J. J., & Narayanan, A. (2017). Semantics derived automatically from language corpora contain
human-like biases. Science, 356(6334), 183-186.
1. Memperbaiki dataset sesuai 5V terutama Volume dan Variasi, mengambil data yang
sedekat mungkin dengan kenyataan.
2. Memastikan data yang digunakan untuk melatih algoritme masa depan mewakili
orang tanpa ada prasangka.
3. Menambah library kata yang tidak ambigu, menyusun data dengan normalisasi data
terlebih dahulu .
4. Meminta orang yang berlatar belakang berbeda untuk ikut menilai data,
menyumbangkan pikiran, untuk memastikan blindspot kita diperiksa.
Resume Paper
Sistem yang otomatis yang dapat mengelompokkan berita sesuai dengan kategori berita
dengan menggunakan text mining. Menggunakan metode yang digunakan dalam
klasifikasi adalah SVM dan KNN.
Hasil dari penelitian ini bahwa SVM kernel linier dan kernel polynomial menghasilkan
ketepatan klasifikasi yang paling baik adalah kernel polynomial.
Hasilnya SVM lebih baik daripada KNN dengan hasil nilai akurasi, recall, precision dan
F-Measure sebesar 93.2%, 93.2%, 93.63% dan 93.14%.
Simulasi Pintu Masuk Bias - Tidak Sengaja
Proses analisis = menyiapkan data artikel - Pre processing text (Stemming, stopword,
tokenizing, vektorisasi dan pembobotan - Membagi data training dan data testing, Melakukan
klasifikasi - Membandingkan performansi berdasarkan akurasi ketepatan klasifikasi.
Hasil pengukuran performansi yang dilihat dari akurasi, precision, recall, dan F-Measure
SVM kernel linier lebih baik dari pada KNN. Hasil dari KNN memberikan tingkat akurasi
paling kecil dibandingkan dengan metode SVM.
Skenario Data Modified
Berikut data asli crawl berita detik.com :
Raw Result
Modified Result
Link UjiCoba
1. KNN
2. LDA
3. CART
Perbandingan Struktur Algoritma
Solusi