10 Analisis Benford
10 Analisis Benford
Analisis Benford
Analisis Benford menghitung berapa kali setiap digit utama (1–9) atau kombinasi digit utama
muncul (hukum digit pertama) pada field numerik, dan membandingkan jumlah sebenarnya
dengan jumlah yang diharapkan. Pada tahun 1938, seorang fisikawan bernama Frank Benford
menemukan bahwa kemunculan angka 1 pada digit pertama suatu data acak lebih sering dari angka
2, angka 2 lebih sering dari angka 3 dan seterusnya. Frekuensi kemunculan suatu angka akan
mengecil seiring bertambah besarnya angka di digit pertama. Benford’s Law dapat digunakan
untuk memprediksi frekuensi kemunculan sebuah angka dalam serangkaian data numerik.
Berdasarkan kemampuannya dalam menganalisis anomali data pada sebuah data set, Benford’s
Law banyak digunakan dalam berbagai bidang.
Hasil yang diharapkan, dihitung menggunakan rumus Benford, memberikan distribusi Benford.
Dalam serangkaian angka yang muncul secara alami, distribusi frekuensi dari jumlah digit utama
yang sebenarnya harus mendekati distribusi Benford. Jika satu atau lebih digit atau kombinasi digit
terdepan dalam data yang diuji menyimpang secara signifikan dari distribusi Benford, ini mungkin
menunjukkan bahwa angka-angka tersebut telah dimanipulasi. Penyimpangan mungkin juga
memiliki penjelasan yang sederhana dan masuk akal dan tidak selalu merupakan indikasi
manipulasi.
% distribution
according to
Leading Benford’s Law
Digit for base 10
1 0.301029996
2 0.176091259
3 0.124938737
4 0.096910013
5 0.079181246
6 0.06694679
7 0.057991947
8 0.051152522
9 0.045757491
Digit 0 1 2 3 4 5 6 7 8 9
1st N/A 30.1 % 17.6 % 12.5 % 9.7 % 7.9 % 6.7 % 5.8 % 5.1 % 4.6 %
2nd 12.0 % 11.4 % 10.9 % 10.4 % 10.0 % 9.7 % 9.3 % 9.0 % 8.8 % 8.5 %
3rd 10.2 % 10.1 % 10.1 % 10.1 % 10.0 % 10.0 % 9.9 % 9.9 % 9.9 % 9.8 %
1
Data apa yang dapat diuji menggunakan analisis Benford?
Analisis Benford hanya dapat digunakan untuk menguji data numerik yang terdiri dari "angka yang
muncul secara alami", seperti jumlah akuntansi, jumlah transaksi, pengeluaran, atau nomor alamat.
Analisis Benford tidak cocok untuk data numerik yang dibatasi dengan cara apa pun. Berikut
adalah panduan untuk mengidentifikasi data numerik yang cocok untuk analisis Benford:
• Size of the data set. Kumpulan data harus cukup besar untuk mendukung distribusi yang
valid. Analisis Benford kemungkinan tidak memberikan hasil yang dapat diandalkan untuk
data kurang dari 500 record.
• Leading digit requirement (persyaratan digit utama). Semua angka dari 1 hingga 9 harus
memiliki kemungkinan untuk muncul sebagai digit utama.
• Leading digit combination requirement Semua angka dari 0 hingga 9 harus memiliki
kemungkinan muncul sebagai digit depan kedua, dan sebagai digit tambahan apa pun yang
dianalisis.
• Constrained data Data numerik yang ditetapkan oleh suatu kebijakan atau dihasilkan
menurut pola yang ditentukan sebelumnya, tidak cocok digunakan pada analisis Benford.
Sebagai contoh jangan gunakan data berikut untuk analisis Benford:
• nomor cek atau faktur berurutan
• nomor jaminan sosial atau nomor telepon yang dipetakan ke pola tertentu
• skema penomoran apa pun dengan rentang yang mencegah munculnya angka-
angka tertentu
• Random numbers Angka yang dihasilkan oleh generator angka acak tidak cocok untuk
analisis Benford.
2
Contoh hasil analisis Benford: