http://journal.unnes.ac.id/sju/index.php/upj
V.R.C.Putri Sunarno
Prodi Fisika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Semarang,
Indonesia,50229
Info Artikel Abstrak
________________ ___________________________________________________________________
Sejarah Artikel: Dalam suatu persidangan, rekaman suara dapat digunakan sebagai barang bukti digital. Alat bukti rekaman
Diterima Mei 2014 suara yang ditemukan, dapat digunakan untuk mengungkap keidentikan antara suara pada rekaman barang bukti
Disetujui Mei 2014 dengan suara yang diduga sebagai pemiliknya. Untuk menentukan keindentikan antara suara suspect dari
Dipublikasikan Juni 2014 rekaman Handphone dan suara pembanding, dalam penelitian ini dilakukan uji coba analisis rekaman suara
menggunakan teknik audio forensik sehingga dapat digunakan untuk keperluan barang bukti digital. Potongan
________________ dari rekaman suara dianalisis melalui parameter pitch, formant dan spectogram menggunakan Analisis Statistik
Keywords: Pitch, Analisis Statistik Anova dan LR Forman Bandwidth, Analisis Sebaran Grafis dan Analisis Spectrogram pada
Statitical Analysis, Voice enam suara rekaman tanpa manipulasi objek suara. Dari hasil penelitian didapatkan bahwa suara suspect identik
Recording, Audio Forensic dengan subjek1 baik laki-laki maupun perempuan, simpulan ini diambil dari kelima hasil yang digunakan
____________________ menunjukkan keidentikan suara suspect dengan suara subjek1. Dapat disimpulkan bahwa teknik audio forensik
dapat menunjukkan secara ilmiah kepemilikan suara pada rekaman, sehingga layak digunakan dalam
menganalisis rekaman suara untuk menentukan kepemilikan suara sebagai barang bukti digital.
Abstract
___________________________________________________________________
In a court, a voice recording can be used as digital evidence. Evidence of voice recordings that founded, may be used to reveal
the identical between voice evidence with voice by the alleged owner. To determine the identical between suspect voice from
Handphone and voice recordings comparison, in this research conducted trials analysis voice recording using audio forensic
techniques, so that can be used for digital evidence. Section of the voice recording parameters were analyzed by a pitch, formant
and spectogram using statistical analysis of pitch, ANOVA and LR Forman Bandwidth, analysis graphical distribution and
analysis spectrogram on six voice recordings without sound object manipulation. The result showed that voice of subject1
identical to voice of suspect both men and women, the conclusions drawn from the five results that used indicate the identical
between voice of subject1 and voice of suspect. It can be concluded that the forensic audio techniques can demonstrate
ownership scientifically voice on tape, making it feasible to use in analyzing voice recordings to determine ownership of the
voice as digital evidence.
Alamat korespondensi: ISSN 2252-6978
E-mail: vera.rizchi7@gmail.com
Vera Rizchi Cahyani Putri/ Unnes Physics Journal 3 (1) (2014)
PENDAHULUAN
Sejak tahun 2008, rekaman suara pembicaraan parameter pitch, formant dan spectogram untuk
dapat diterima sebagai salah satu bukti hukum di menunjukkan adanya keidentikan.
pengadilan Indonesia (Sarwono et al ,2010). Dengan Masing-masing orang memiliki pitch yang
berkembangnya teknologi multimedia untuk khas (habitual pitch) yang sangat dipengaruhi oleh
menghasilkan rekaman suara, banyak ditemukan di aspek fisiologis larynx manusia (Tolga et al., 2006).
Tempat Kejadian Perkara (TKP) barang bukti audio Pada kondisi pembicaraan normal, level habitual pitch
recorder (alat rekam suara) yang menghasilkan berkisar pada 50 s/d 250 Hz untuk laki-laki dan 120
rekaman suara pembicaraan seseorang pada kasus s/d 500 Hz untuk perempuan. Formant adalah
pidana maupun perdata. Hal terpenting dalam frekuensi-frekuensi resonansi dari filter, yaitu vocal
rekaman suara sebagai barang bukti adalah tract (articulator) yang meneruskan dan memfilter
mengungkap keidentikan antara suara pada rekaman bunyi periodik dari getarnya pita suara (vocal cord)
barang bukti dengan suara yang diduga sebagai menjadi bunyi keluaran (output) berupa kata-kata
pemilik rekaman (Azhar, 2010). yang memiliki makna. Secara umum, frekuensi-
Untuk menentukan keindentikan antara suara frekuensi Formant bersifat tidak terbatas, namun untuk
suspect dari rekaman Handphone dan suara identifikasi suara seseorang, paling tidak ada 3 (tiga)
pembanding, dalam penelitian ini dilakukan uji coba Formant yang dianalisa, yaitu Formant 1(F1), Formant
analisis rekaman suara menggunakan teknik audio 2 (F2) dan Formant 3 (F3).
forensik sehingga dapat digunakan untuk keperluan Spektrogram merupakan representasi
barang bukti digital. Teknik audio forensik sendiri spectral yang bervariasi terhadap waktu yang
sudah digunakan dan berkembang dalam kalangan menunjukkan tingkat density (intensitas energi)
praktisi forensik penegak hukum (Azhar, 2012), spectral. Dengan kata lain spectrogram adalah bentuk
namun masih jarang ditemukan dalam penelitian visualisasi dari masing-masing nilai Formant yang
bidang akademisi di Indonesia. dilengkapi dengan level energi yang bervariasi
terhadap waktu. Level energy ini dikenal dengan
Pengantar Teori Suara istilah Formant Bandwidth. Nantinya pada kasus-kasus
Waktu berbicara, manusia menggunakan yang bersifat pemalsuan suara dengan teknik pitch shift
diafragma (sekat rongga badan antara dada dan perut) atau si subyek berusaha untuk menghilangkan
untuk mengalirkan udara ke paru-paru. Kemudian, karakter suara aslinya, maka Formant bandiwidth dapat
udara akan naik melalui saluran tenggorokan, lalu digunakan untuk memetakan atau mengidentifikasi
mengenai pita suara sehingga pita suara akan bergetar suara aslinya. Dikarenakan spectrogram memuat hal-
dan menghasilkan suara. Pita suara sendiri adalah hal yang bersifat detil, maka Spectrogram oleh
jaringan otot mirip gendang yang robek separuh pada beberapa ahli juga dikenal dengan istilah sidik jari
bagian tengahnya. Getaran yang diproduksi oleh suara (voice fingerprint). Spectrogram membentuk pola
pita suara akan menuju dua arah. Pertama akan umum yang khas dalam pengucapan kata dan pola
mengalir melalui lubang tenggorokan kemudian khusus masing-masing Formant dalam pengucapan
keluar melalui lubang hidung, sedang yang kedua suku kata, sehingga spectrogram juga digunakan untuk
mengalir keluar dari Tenggorokan lewat mulut. melakukan analisa identifkasi suara seseorang.
Didalam mulut, gigi dan lidah menjadi filter sekaligus
resonator (Rabiner dan Schafer, 1978). Audio Forensik
Dari rekaman suara, orang-orang yang Forensik secara inti berhubungan dengan
melakukan percakapan dapat diketahui identitasnya penyelamatan dan analisis barang bukti laten. Dalam
(Yudho et al., 2010), karena suara manusia hal ini, barang bukti laten dapat berbentuk banyak
mempunyai ciri khas tersendiri. Dalam bukunya format, mulai dari sidik jari di jendela, DNA yang
“Digital Forensik”, Azhar (2012) menyebutkan diperoleh dari noda darah sampai file-file di dalam
bahwa pada prinsipnya suara terdiri dari beberapa hard disk komputer. Secara garis besar terdapat 4
komponen yaitu, pitch, Formant dan spectogram. tahap utama dalam Digital Forensik yaiu:
Komponen ini dapat digunakan untuk pengumpulan, pengujian, analisis dan laporan. Audio
mengidentifikasi karakteristik suara seseorang untuk merupakan bagian dari konten multimedia. Menurut
kepentingan voice recognition dengan menggunakan Bohme (2009), berbeda dengan konsep umum dari
potongan dari rekaman suara yang dianalisis melalui Forensik digital, forensik pada konten multimedia
berfokus pada upaya untuk analisis
51
Vera Rizchi Cahyani Putri/ Unnes Physics Journal 3 (1) (2014)
METODE PENELITIAN
Tahap perekaman suara dilakukan di Mengungkapkan informasi pitch, forman
Laboratorium Fisika Medik FMIPA Universitas dan spektogram yang terdapat pada
Negeri Semarang (UNNES), sedangkan tahap analisis Rekaman Suara Suspect dan Rekaman
Suara Pembanding menggunakan
data rekaman suara dilakukan di Laboratorium Fisika
aplikasi PRAAT
Instrumentasi FMIPA Univesitas Negeri Semarang
(UNNES). Dalam penelitian ini objek yang
digunakan sebanyak 6 rekaman suara terdiri dari 3 Hasil informasi yang didapatkan
suara perempuan, 3 suara laki-laki dan 2 diantaranya menggunakan aplikasi PRAAT dianalisis
terdapat suara suspect. statitik menggunakan aplikasi Gnumeric
52
Vera Rizchi Cahyani Putri/ Unnes Physics Journal 3 (1) (2014)
MP3 Cutter Editor, Praat 5.3.56. dan Gnumeric perbandingan ratio F dan F critical, dan nilai
Spreadsheet. Secara umum skema diagram alir probability P.
penelitian ditunjukkan pada Gambar 1. Jika nilai ratio F lebih kecil dari F critical, dan
Teknik audio forensik yang digunakan dalam nilai probability P lebih besar dari 0.5 maka dapat
penelitian ini adalah menggunakan Voice Recognition, disimpulkan bahwa kedua kelompok data dari nilai
yaitu melakukan analisis antara suara suspect dengan formant yang dianalisa dari suara unknown dan known
suara pembanding terhadap informasi pitch, formant, tidak memiliki perbedaan (accepted) yang signifikan
bandwidth dan spectrogram merujuk pada Audio pada level 0.05. Kesimpulan ini memiliki tingkat
Forensik: Theory and Analysis yang disusun oleh konfidensi sebesar 95%.
Muhammad Nur Al-Azhar (2010) dari Pusat
Laboratorium Forensik Polri Bidang Fisika Dan Likehood Ratio (LR)
Komputer Forensik. Melalui analisis Likelihood Ratio (LR)
Untuk menentukan apakah suara suspect dengan melihat Probabilitas P (P- Value) dalam
identik dengan suara pembanding, disyaratkan menentukan nilai formant untuk dapat dijadikan
menemukan minimal 20 kata yang memiliki hipotesis penuntut atau hipotesis perlawanan. Jika LR
kesamaan dari hasil analisis pitch, formant,bandwidth > 1, maka hal ini akan mendukung p (E|Hp),
dan spectrogram. Ini merujuk pada “Speaker Voice sebaliknya jika LR < 1, maka p (E|Hd) yang
Identification: A Forensik Surcey” yang disusun oleh didukung. Untuk itu, haruslah nilai p (E|Hp) > 0.5
Koenig, B.E. dari Federal Bureau of Investigation (FBI) untuk menyimpulkan bahwa suara barang bukti
(Azhar,2010). (unknown) dan suara subjek (known) berasal dari orang
Gambaran dari analisis yang digunakan dalam yang sama (IDENTIK).
penelitian ini adalah sebagai berikut:
53
Vera Rizchi Cahyani Putri/ Unnes Physics Journal 3 (1) (2014)
54
Vera Rizchi Cahyani Putri/ Unnes Physics Journal 3 (1) (2014)
Gambar 1. Sinyal Suara Rekaman Suara Laki-Laki (a) Sinyal Suara Rekaman Suspect Sebelum diRemove Noise
(b) Sinyal Suara Rekaman Suspect Setelah diRemove Noise
Gambar 2. Sinyal Suara Rekaman Suara Perempuan (a) Sinyal Suara Rekaman Suspect Sebelum diRemove Noise (b)
Sinyal Suara Rekaman Suspect Setelah diRemove Noise
55
Vera Rizchi Cahyani Putri/ Unnes Physics Journal 3 (1) (2014)
Analisis Data
Selanjutnya berdasarkan data-data yang
telah dianalisis maka didapat rangkuman hasil
analisis sebagai pada pada Tabel 2. Hasil Analisis
Data Statistik.
Analisis Anova 27 14 11 11
Analisis Spektrogram 27 26 22 13
Analisis Anova 27 13 9 6
Analisis Spektrogram 27 26 20 9
Dari hasil analisis statistik nilai pitch perkata untuk Walaupun, diantara suara subjek perempuan, dua
suara suspect dan subjek 1 baik laki-laki mapun diantaranya terdapat hubungan kekerabatan namun
perempuan, ditemukan bahwa jumlah kata yang hal ini tidak
identik lebih dari 20 kata dari 27 kata yang dianalisis, menunjukkan keindentikan suara berdasarkan
sesuai dengan yang disusun oleh Koenig, B.E dari analisis statistik pitch, ini karena masing-masing orang
Federal Bureau of Investigation (FBI) yang mensyaratkan memiliki pitch yang khas yang sangat dipengaruhi
minimal 20 kata memiliki kesamaan antara suara oleh aspek fisiologis laring manusia (Tolga et al.
suspect dan suara subjek, Berdasarkan data kesamaan 2006).
pola habitual pitch range, kesamaan pola nilai Berdasarkan grafik sebaran nilai minimum dan
minimum dengan nilai maximum, dan pengujian maximum pada Gambar 3 didapatkan nilai tingkat
nilai-nilai data pitch dengan analisis statistik anova, habitual pitch pada laki-laki berkisar antara 100-200 Hz
maka dapat ditarik kesimpulan bahwa suara Suspect dan dan pada Gambar 4 didapatkan nilai tingkat
IDENTIK dengan suara Subjek1 untuk suara laki-laki habitual pitch pada perempuan berkisar antara150-
dan suara perempuan. 350Hz, ini sesuai standar habitual pitch untuk laki-laki
dan perempuan yang berkisar antara 50-250 Hz dan
120-500 Hz (Laver, 2002).
56
Vera Rizchi Cahyani Putri/ Unnes Physics Journal 3 (1) (2014)
(a) (b)
Gambar 3. Grafik Sebaran (a) Habitual Pitch Range (b) Minimum-Maximum Pitch untuk suara laki-laki
(a) (b)
Gambar 4. Grafik Sebaran (a) Habitual Pitch Range (b) Minimum-Maximum Pitch untuk suara perempuan
Nilai pitch sangat bergantung pada tingkat intonasi Dalam menarik kesimpulan Analisis Anova
dari suara yang diucapkan, semakin rendah intonasi dibutuhkan paling tidak formant 1, 2, dan 3
subjek mengucapkan suatu kata, maka semakin menunjukkan accapeted, maka hal tersebut adalah
rendah pula nilai pitch dari kata yang diucapkan. cukup untuk menarik kesimpulan IDENTIK (Azhar,
Sebaliknya, semakin tinggi intonasinya, maka akan 2012).
semakin tinggi pula nilai pitch-nya. Sering kali Berdasarkan Tabel 2 Hasil Analisis Data Statistik,
kondisi percakapan yang ada direkaman suspect pada analisis anova menunjukkan bahwa antara suara
berbeda dengan kondisi pengambilan suara subjek. suspect dengan suara subjek1 ditemukan 14 kata dari
Misalnya pada rekaman suspect berbicara penuh 27 kata yang dianalisis. Ini belum menujukkan
semangat diatas panggung dihadapan banyak orang, adanya keidentikan, namun berdasarkan penelitian
namum ketika diambil sampel untuk suara Malik (2013) yang juga menggunakan analisis Anova
pembanding, suspect berbicara sangat datar dengan untuk Formant Bandwidth menemukan lebih dari
kondisi psikologi yang berbeda meskipun dalam setengah jumlah kata yang identik dari jumlah kata
melakukan rekaman bersifat pro justisia (demi yang dianalisis antara suara suspect dan suara
hukum), walaupun begitu rekaman suara suspect pembanding, dan disimpulkan bahwa suara suspect
telah ditingkatkan intensitas suaranya melalui audio identik dengan suara pembanding.
enchancement (Bageshree et al., 2012). Pada Tabel 2 menunjukkan jumlah kata yang
ditemukan antara suspect dengan subjek 1 memenuhi
57
Vera Rizchi Cahyani Putri/ Unnes Physics Journal 3 (1) (2014)
setengah dari jumlah kata yang dianalisis, dapat Hasil analisis statistik suara perempuan pada
disimpulkan bahwa antara suara suspect IDENTIK Tabel 2b menunjukkan bahwa dari kelima metode
dengan subjek 1. Jumlah kata yang ditemukan pada analisis yang diterapkan, antara suara suspect dengan
analisis antara suara suspect dengan suara subjek 1 suara subjek1 semua metode menujukkan hasil
jauh lebih banyak dari hasil analisis antara suara identik, dari hasil analisis tersebut dapat ditarik
suspect dengan subjek 2 dan suara suspect dengan suara kesimpulan bahwa suara suspect IDENTIK dengan
subjek 3, dapat disimpulkan pula antara suara suspect suara subjek1
TIDAK IDENTIK dengan suara subjek 2 dan suara
subjek 3, karena jumlah kata yang ditemukan kurang KESIMPULAN
dari setengah jumlah kata yang dianalisis.
Analisis Sebaran Grafis (Graphical Distribution) ini Simpulan
menggambarkan bentuk grafis pola penyebaran Dari hasil penelitian yang telah dilakukan
masing-masing nilai Formant per kata guna melihat menunjukkan bahwa suara subjek1 IDENTIK dengan
tingkat perbedaan distribusi nilai Formant dari suara suara suspect, sedangkan untuk suara subjek2 dan
suspect dan suara subjek. Analisis ini dibuat dalam subjek3 dinyatakan TIDAK IDENTIK dengan suara
bentuk perbandingan F1 vs F2 dan F2 vs F3. Pola- suspect baik pada uji coba suara laki-laki dan suara
pola khas menjukkan 23 dan 24 kata yang memiliki perempuan. Hal ini berdasarkan pada hasil analisis
sebaran berada pada kelompok yang sama IDENTIK yang digunakan baik Analisis Pitch, Analisis Anova
untuk subjek 1 dengan suara suspect. Formant dan Bandwidth, Analisis LR Formant dan
Analisis spektogram menunjukkan pola umum yang Bandwidth, Analisis Graphical Distribution, dan
khas pada kata yang diucapkan dan pola khusus yang Analisis Spectrogram, yang menunjukkan keidentikan
khas pada masing-masing Formant suku kata yang suara suspect dengan subjek1. Analisis rekaman suara
dianalisis. Karena spectrogram mampu menampilkan menggunakan teknik audio forensik dalam penelitian
pola-pola yang khas dari forman dan Bandwidth pada ini dapat menunjukkan secara ilmiah kepemilikan
pengucapan kata yang mana pola-pola tidak suara pada rekaman, sehingga teknik audio forensik
terpengaruh dengan tinggi rendahnya frekuensi layak untuk digunakan dalam menganalisis rekaman
resonansi tiap forman ketika pengucapan kata-kata, suara untuk menentukan kepemilikan suara sebagai
maka sebagian ahli menyatakan bahwa spektogram barang bukti digital.
merupakan sidik jari suara (voice fingerprint). Meski
demikian ada juga ahli yang tidak sependapat dengan Saran
pernyataan tersebut. Mereka beragusatmentasi bahwa 1. Untuk lebih melihat keakuratan dari teknik
spektogram untuk pengucapan kata yang sama audio forensik, dapat ditambah sebanyak-
namun berasal dari dua orang yang berbeda akan banyaknya sample yang dianalisis.
menghasilkan pola khas spektogram yang sama. 2. Selain itu penelitian juga dapat difokuskan pada
Untuk itu, spektogram bukanlah satu-satunya pendalaman teknik audio forensik pada kasus
komponen suara yang dianalisis. Harus juga ada manipulasi objek suara.
analisis terhadap komponen suara yang lain terhadap 3. Salah satu tantangan lain adalah menerapkan
pitch dan Formant berbasis Anova dan Likehood Ratio konsep blind detection pada teknik audio forensik.
(LR) (Azhar, 2010).
DAFTAR PUSTAKA
Summary Total
Hasil analisis statistik suara laki-laki pada Tabel 2a Azhar, M.N. 2010. Audio Forensic: Theory and Analysis.
menunjukkan bahwa dari kelima metode analisis Pusat Laboratorium Forensik Polri Bidang
yang diterapkan, antara suara suspect dengan suara Fisika Dan Komputer Forensik.
subjek1 semua metode menujukkan hasil identik,
antara suara suspect dengan suara subjek2 hanya Azhar, M.N. 2012. Digital Forensic “Panduan Praktis
identik pada analisis spektogram, dan antara suara Investigasi Komputer:Audio Forensic”. Jakarta:
suspect dengan suara subjek3 tidak ada metode yang Salemba Infotek.
menunjukkan hasil identik. Dari hasil analisis tersebut
dapat ditarik kesimpulan bahwa suara suspect Bageshree V., P. Sathe & R. Panat. 2012. Extraction
IDENTIK dengan suara subjek1 dan TIDAK of Pith and Formants and its Analysis to
INDENTIK dengan suara subjek2 atau suara subjek3. indetify 3 different emotional states of a
58
Vera Rizchi Cahyani Putri/ Unnes Physics Journal 3 (1) (2014)
person. IJCSI International Journal of Computer Rabiner, L.R. & W.S. Schafer. 1978. Digital Processing
Science. Vol. 9, Issue 4, No. 1, July of Speech Signal. New Jersey: Pentice-Hall.
Bohme, R., F.C. Freiling & T. Gloe. 2009. Rose, P. 2003. Forensic Speaker Identification. Taylor &
Multimedia Forensic is not Computer Francis Forensic Science Series.
Forensic. Netherlands: International Workshop on
Computational Forensic (IWCF) 3rd. Sarwono, J., M.I. Mandasari, & Suprijanto. 2010.
Forensic Speaker Identification: an experience
Koenig, B. E. (1986). Spectrographic Voice Identification: in Indoneians court. Proceedings of 20th
A Forensic Survey. Federal Bureau of International Congres on Acoustics, ICA. 23-27
Investigation. August. Sydney, Australia.
Laver, J. 2002. Principlse of Phonetics. United Tolga K., C. Burcu, T. Taskin & O. Ziya. 2006.
Kingdom: University Press, Cambridge. Effects Of Tonsillectomy On Acoustic
Parameters. The Internet Journal of
Lucy, D. 2006. Introduction to Statistics for Forensic Otorhinolaryngology. Volume 6 Number 2.
Scientists. British: Wiley.
Yudho, T.D., A. Hidayanto & R. Isnanto. 2010.
Maher R. C. 2009. Audio Forensic Examination : Aplikasi Pencirian Dengan Transformasi Wavelet
Authenticity, Enhancement, And Untuk Pengenalan Pengucap Tak Bebas
Interpretation. IEEE Signal Processing Magazine, Mengggunakan Jaringan Saraf Tiruan. Skripsi.
Vol. 84. Semarang: Universitas Diponegoro.
59