Anda di halaman 1dari 12
ANALISIS SIMILARITAS MELODL MENGGUNAKAN THE EARTH MOVER’S DISTANCE Wabyu Kusuma Patalos tle Komputer & Teknologi Inforinos, Universitas Gunadarma wayukr@stafT gunadarma.cid ABSTRAK Dalam sistem retrivalinformast musth, ri pada umannya eran informa tks, sper nul lagu, nama penyany, lirik lagu atau ‘omposer. Slain it kueri dapat juga berypa Sinyal mas atau singel vokal(melodl voke) seperti bernyany, Bersenandingg devi ‘potongan lagu. Penlitin int Bera untae ‘menganalsis simllaritas melodi val saga dasa kuor! dengan melodi mucik sebagal deta (target, Metode similartas yang. digunaten adalah the Earth Moving Distance (EMD). Untwk menganalisis atures! simlaritas, maka pwia penelitn int peru dilltan proses ‘representasi melodi melalui metode segments! dengan decksi onset Representasi melod! ‘yang. dsilkan dalam format waltw ons, ‘itch interval, dan rasio waktu onset interval. Dalam pendewetsian onse, inal mengalami ‘proses penjlteran, pemjearahan, pem- bentukan kontur sina, pendeteksian gradien dan penilihan sinyal ai as nila threshold Passi onset yang diperolehdigunatn vant segmentasi sinyal,sehingga. setiop segmer hanya bersi sat nada. Selajutna set segmen menjalani proses penelusuran pitch Imelatl analisis freluensl. dengan bantu transformasi fourier dan estimasiptch dng endekatan cseibusfrekuensifondamental. Berdasarkan hasll penguin nila dlstance Imenggunakan EMD, dapat ditenukan ici rank dan rial mean reciprocal rank (MRR, Penguiian vane diakukan terhadap 30 date fer! (hernvanyi dan bersenandhag) dengan 30 data dofsmen (mus pao) diperole mies MRR sebesar 0.479. Pada perkitangan Kner ‘pada rank 6 dlperotehkinerja sebesar 93.3% esi! pengyian —meranjukan ars Similartas dan Kerja sistem retro ‘menggrsakon EMD sudahbaik Kata kunct : elstratsi, represemast melod, Similars, retrival nformasi mse Katageri : 11S.iyformation Interface and Presentation | HSSSound and Music Computing | Signal Analysis, Synthesis, and Processing ABSTRACT in music information revleval sytem, queries are generally inthe form of textual bate, such 1s, Song tla singer of the song, Irie and the composer. Other ype of queries inches signal form of the music and human vocal by singing or even by humming of the song, The purpose of ‘this research Isto analyze sinilarity Between vocal melody as query data and music melody as TARGET data. For similarity deettion, the Earth Moving Distance (EMD) was 1sed, To analyse the facewracy of similarity detection proces, segmentation and "ontet detection were employed in this research. Representation of Imelody is given the form of onset time, pitch Inerval and) ratio of interval onset time During the onset detection, signal passes ‘through several steps, namely, fllering, rectifying, signal contouring "gradient detection and selection of signal threshold level. The resulted onset position is used for Signal segmentation to generate only one tone Jor each segment. Following pitch aracking ‘precesy, each segnent is then. frequency ‘analyzed ‘sing Fourier transformation. In ‘adktion, ptch estimate is obtained from the ‘pplication of fundamental frequency ddsibuton approach, Based on the experiment result distance value using EMD, rank and mean reciprocal rank GARR) values can be determined. The experiment consists of 30 query data (singing ‘and humming) and 30 target data (pian). The 130 rl nformatta Komputer Nod, Volume 1, Agus 2009 results of the fist experiment show that MRR value of 0.479 and performance vale af 93.3% on Rank 6. The experimental resus show that similarity accuracy and retrieval sytem performance wing EMD perform very Keywor: Exracion Melody represenaion, Music information retrieval, Silarty ‘Subject description: 1.5.Iyformation interface land. Presentation | H5.3Sound and Me Computing | Signal Analysis, Sohecs, and Processing PENDAHULUAN Perkembangan teknologipenyimpanan data mmemungkinkan seseorang dapat_menyinpan ratusan baan ribuan Kolekst musik atau eg, Pormasaloban yang dihadapipecinta musik yang mempunyaikolesi lag yang tersimpan {alam banyak perekam adalah tidak nga jel Jagu dan nama penyanyi dari musi ata fg ‘yang ingindiputarnya. Dia berarap ada sat sistem yang dapat -mengenali—stara nyanyianya stv senandungnye,sehinggn dari suara ity dapat mencarkan lagu yang ddinginkannya Pemasalshan tersebut, dalam lingkungan Penelian termasok dalam. Tingkup. site retrival informasi musik (Music nformation Retrieval, MIR) dan Query by Singing tumming (QBSH). Palam sistem ni, ier buat tidale hanya boric informasl teks, sepert judul lagu, nama penyanyi, lik lagu atau komposer. Tetapi juga dlingnksn ‘quer berupesinyal musik (melodi musik) dan sara manusia (molod) vokal) —sepet Sermany uubrscandong ar ptogan log Peoaltian MIR dan QBSH masih out untuk slimplementasikan dengan akurasi 100% [2.4] (Oleh Karena itu penelitan di Bidang ini mash fecusdilakukan dalam — meningkathan Keakurstan dengan berbagaipebaikan tmetode yang. diusukan. ‘Terdapet beberepa pokok persoalen pentiog dalam membangin MIR, Khususaya untuk kueri melod) voll Perscalan tersbut diantaranya adalah sist Kusama, Anais Sires Jarus dapat mengaiasi kveri masukcan terhadap ‘bermacam error dati Kemampusn beryany user, Pesoalan lain yang trad adalah suara vokal manusia mengalem inkonsstensiplteh, hanya | dar 1.000 orang yang mempuny shsolut pitch benar (7. Peneltian Mute Information Retrieval (MIR) ‘ban Query by Singing Hhmmming (QBSH) telah Gllakukan dalam Tokus metode ekstraksi dan Imetode revel’ similarits. Peeltian yang difoluskan pada metodeekstakst rmenghasilkan bentok atau format represents mele. Beberapa penelitian pada Tokus Ietode ekstaksiantia lain Melodie Contour 1B, 8]. Melodic Contour Inerval [2}, Triplet Representation Melody (9) Slain pentition pada fokus pengekstraksian sinyal, erdepatpeneltian pada fokus metode retrial Penelign pada fokus inh menitikberathan pada penerapan rerival dats ‘veri dengan data dokumen, Peneltan metode retrval yang telah dipublikasilan diklasfkasiten dalam tiga ‘katagori [2] Pertama, metodo retrval melo berdasar des matching, Metode retrval yang, termasle katagor ini adalah N-gram (3) Kedus, metode retrivalberdasar sequence ‘matching. Metode rerival yang termacik atagori ini adalah "Strings Matching (8) . metode Dynamic Time Warping (DTW) [10], ‘dan metode Hiden Markov. Ketiga, metode retrival berdaser geometric ‘matching. Metode rerval yang ‘termasik Katagori ini adalah The Barth Mover's Distance (EMD) dan Proportional Tranportation Distance (PTD) (6) Peneitian —usulan yang dilakokan smenggunskan keri melo! vol, represents secaraintervalik, dan metode ekstalsi scgmentnsi dengan detest onan Permasalahan yang. mendaserirepesentasi fervalik adalah pada suara melodi vokal manusia yang cenderung tidak Konsisten pitch «lan tempofitme. Schingea pendekatan dengan ‘represents interval pitch dan raso rte akan lebih invarian terhadap inkonsiens pitch dan sme pada melodi vokal manusia, 131 Penelian ini menceba_—menentucan represenasi melodi dalam lingkup geomeric ‘matching. yang mengacu pada metode END. a ini didasarkan [volk etal 2007] pada sift mmetode EMD yang pardal matching. Sita ini Jebih menguntimgkan jka panjang urtan pitch sara dain kurt dengan data target berbed, Poneltian ini mengginakan data dokumen yang berupe melodi musik dengan data keri ‘yang borypa melodi vokal mempunyai panjang trutan pitch yang. berbeda. Penelitian ini hermjuan monganaliss similaritas-mekdi vokal dan melodi musik menggunakan metede EMD sehingga dapat diketahui tngkat akurasnya ‘Sinyal Melodi Musik dan Pitch Nada Salah situ karakteristik yang paling pening dari sebuah nada adalah pitch,” Puch didefiiskan sebagai tinggi stau_ rendah sebuah nada yang dinyatakan dalam besaran fiokuensi.Nilai dari pith ini _sangat tergantung pada frekuonst-dasat, Sebagai contol, frekvensidasar untuk Ad adalah =40 Hz, Pada scbush oka, interval antara dot ‘bush nada (not) adalah digtndakan act fekuensi das (9). F{AB) = 2f(A4) . ® Pada the western welltempered scle, fekuesi nada n, diketahu dari frekwesi nada 1 kur dalam semitones H(na).28 ° S(t) = DimanaS adslah perbedaan anata ny dan nd dalam semitones. Ketka sebuah not atau nada dimainkan dengan alst musik, tidak hanya fickuensi dasar yang diasikan, tlapi jun terdapat sekumpulan frekuensi= sin yang disebut dengan fokuensi armonik. Frekuenst hammonik “unumiya‘mempunyaiperbedaan amplitudo dari fekbensi dasar. Bentuk gelombang amplitudo dapat dilihat_ dalam Karekterisikspekirum yang disebut dengan timbre pada sebuah alt usik Persamaan fekuesi harmonic ditunjukkan sthagai boriku F(fi) = @+1)Flb0) ° DDimana ffi) adatsh frekuesihaemoni urutan ke dari fokuesi dasar fo) ‘The Earth Mover's Distance (EMD) Metode EMD merupakan metode untuk mengukur similarias pada himpunan tik besbabor Similarity Measures for Weighted Point Sets) (3). EMD entara dua himpunen tittik berbobot adsl mengukur jumah rinimam Keja dalam mentransfrmesian nla bobot stu ke bobot yang lain, Bentuk umum weighted point set ak ‘oordinay, weigh), (9| menggunakan varabel onset time dan pitch untuk tit Koordiaat not musik. Sodangkan dursi sebagai weight. Pada Peneltian ini, menggunakan variabel_ waktu ‘set dan pitch interval sebagai tik Koorinat, den rasio. waktu onset interval sebagai bobotnya.thstasi feasible flow durasi det sskuensmelodi musik ditunjakkan seperi ‘gambar 1 jamb | Iustasi Feasible Flow Duras dar Sekvns Melo Masi 12 ural nformatta Komputer No.2, Volume 14 Agsaas 2009 Pendefinisian variabel EMD Jka A dan Bmerupakan himmpunan te berbobot. Let A= (al, a2, 83, oan), dimana ai = ((xiy, Ww) Sedantkan W dan U mising-masing alah ‘obot total Himpunan A dan B, PE add =Dhy 4) ‘Alu bobotantara himpunan A dan B adaeh F 3. Baty Sti d= bast 4. Sha jai Sy = min WU) Persamaan ukuran similar EMD adalah sir Sa Bee it) 9) dj = Ground Distance menggunakan Eelidean Distance, Jrakantara Dua Not yang berkcodinat (WOi, Phi) dan (WO},Pl) adalah aj= (BO- WOES Pe] Penentuan Rank dan Tingkat Akurasi Similaritas Rank merupakan nil peringkat/urutan sil distance similartas data kueri dengan data taroct dengan urutan dari kecil ke besar (ascending). Ranke menunjukkan distance terkeil. ‘Akurasi dari metode ekstaksi dan similaritas iukur dengan Mean Reciprocal Rank (MER) MRR merupakan salah satu yarabel ‘penentuan tingkat akurasi dalam sistem MIR [5]. Metode evaluasi MRR ini jugs diterapkan alam MIREX 2006, NRA 2D) (MRR menunjukkan ila rata-sata dari UR, limana mle distance data kur terhadap data target dtunjekkanurutan dalam rank. Semakin ‘eel nila distance, semakin kecil rank. Data Jeri yang) mempunyai rank terkeil ‘erupakan data yang paling mip stu similar Nila! MRR berkisarantara 0 sampai 1. Dimana jiken MRE 1 dapat dikatakan “perfec Sedangkan jika ili MRR = 0 dikatakan aera METODE PENELITIAN 9) i pene yang dilakukan dipertibakan seperti Gambar 2 > an LS ae es bE “Gamer 3. Dag Tabspan Porsiian ‘Tahapan Proses Ekstraksi Secara heselruhan proses estraksi melodi vokal dan melodi musik diperlibatkan sept ‘gambar 3. Dats pengujian diambil dari sanpel lanesang menggunkan perangkat nak ‘Audacity sebagai program perekam sara asuma, Analisis Slates ‘yang. menghasikan file dengan ekstension ‘wav. dan juga berupa data sekunder yang idownload dar internet (Roger Jang corpus). Sinyal Yokal dan sinyal musik dicksinlsi Untuk menghasithan representa mod Pengekstrasian siya! dilskukan dengan beberapatabap, sepert trina pads gambar 3 13 BES vs “Gambar 3 Biok Ding Tohapan Basi Pach Intel roses Deteksi Awal Pitch pada gamber 4, igunakan untuk mencariposisi-posisi gradien yang berilai tinggi (di stas hreshold) det ikontur sinyal. Prose ini terdiet dai = Blak Jilerng digunskan untuk meloloskanfrkuersi musik dan frekuensi —vokaldengzn menggunakan band pass filter. Prose, Pengambilan sinyl post, dilakukan dengen proses reeling, dimana scluruh simpangen ‘yang beri nepatif ijadikan posi. ya) = Proses —_pembentokan —Kontur_—sinyal Ailakokanmelalu proses konvolsisinyal xchanzon z xancece mo ‘untuk mendapatkan nila gradin, Yn) = (+l) — x(n) 10) +> in vat est oi “Gamer Bok Diam Poses Daal Onset roses tresholding digunakan _untus mmendapatan nilaigradien yang tinggi. Psis posi dari gradien yang clainya. datas fambang merupakan posisi onset dari no Posisi onset yang diperole, digunakan pad proses. berkutnya, yaitu segments. Pada roses segmentas ini sinyal dipotong-potong schingga pada stip potongan (segmen) sinyel kan terdapet satu not. Seluens sogmen kemudian dikrim ke proses itch tracking. Plch tracking adalah proses ‘unk mengidentifikas not-ot yang terdapat pada suitu segmen sinyal musik dan voka, ‘Metede utama yang digunaksn di sini adalan frequency anabis, yang dalam eksperimen it dilakukan dengan bantuan FFT (Fast Fourier Transform), Dati spektrum FFT. yang Aiprol, dicari nila Fekuensi yang meniliki ink kemudian dikonversi menjadi kode nov pitch. Pitch interval diproleh dari sckuens kode not Representasi Melodi Setigp not yang. diekstraksi_ akan tersusun dalam representsi seperti berks (Wo, Pi, Woir) Dimana Wo =waktu aal pitch onset) PL =Piteh Interval PL = Plich() = Picht+1) WOlr = Rasio waktu onset interval Wor = worgrwori+l) Pengujian Similaritas Pengujan int digunakan untuk: mengetabui ‘ingkat simiaritas data sinyal_ kuor vocal dengan data dokumen musik. Penguin menggunakanmetode EMD. Has dri pengujian inj dipeotch vial distance, untae Kemudian diperoleh nila’ rank dan’ mean reciprocal rank (MRK). Blok diagram engujian ii telat seperti Garnbar 5, 134 ral nfrmatta Komputer No.2, Volume 1, Aguas 2009 Melos music Data Percobaan Data pengujian terdiri ats doa data yaita sinyal melodi vokal sebagai data kueri dan sinyal metodi sebagai data dokumen, Sebigai ata kueri dimbil dari 42 responden devasa teri dar 24 pia dan 18 wana, Pengamtiln dats kueridiakukan dengan beberapa vist ‘model kur. Model kueriberupa menyanyikan link, berenandung (dur da, lala) tau “ ® oO ° FSS as @ ombinasi lik dan sonandung,.Sedangkan ate target diganakansinyal musik fle MID Sebanyak 30 potongan lagu, monafonik (musik yang dibasian oleh enya satu instumen ‘musi, dengan insrumen musik piseo. HASIL DAN PEMBAHASAN Pendeteksian Onset ‘Ganbar 6, Has proses dea ons, File wa sinyal snag du du (gtongan ig Begawan Slo) (A) Tanpilan File wav siya candang(ptonga lagu Bunpeean Selo, (©) Tampon seal yng tlh discrahkan (CAD) Tampinsinyal hail konvoas (©) Taplin has isrensis (©) Tampa snyal onset sume, Anais Smilers ass Berdasarkan proses pendctesian onset dari file Dudu tgwSole w2.vav.menggunakan program Matleb diperoleh datedata seperti ‘iperlthatkan pada abel berikut a ast Peadtksen Onset Sinyal File: Dada by Solo 2a senandung 6 (ud bengaan sl) ‘Name File dads bg wr Tudul ‘Bengawan Solo Frekensi pencuplikan 44100, Jumlah indek pencuplikan 16585 Tamla Pitch Yan. Teich é Posisiindeks pitch yang tordetakst a aan as0 937 15290 14754 Hasit Iainnys adelsh pitch yang terdetcksi 0 detik. Waktu onset yang tersimpan dalam banyak 6 buah dan posisi indeks picnya represents! melodi [0 054 102 1.39 (). Hist posisi indeks ini menennkan 2.51 3.00], ‘aiabelrepresentasi melo yait wakta onset ‘Wakt onsetdtnnukan dengan persanssn:Proses Penelusuran Pitch Wo @= pO /1s ‘Sehinggeurutan waktu onset diperoteh ‘Tampilan erik, iustasi dari proses {006 0.60 108 145237 3.06) —penelusuran pitch’ file = Dudu. bgwSolo asl wrtan waktu datas menunjulkan baba seat perckaman sinyal sus ada siayal iam Sebelum responden mengeluarkan_suaranya, Penmasslshan ini dapat ilakukan dengan mengorangl urtan data Waktu tersebut dengan wakiu onset pertama Wo @)=Wo Wot) Sehingen wake onset pertama pada repretentsi melodi penelitan ini dimelai pada w2.av. sinyal senandung (potongan lagu Bengawan Solo). Setigp segmen dilakukan transformasi fourier sehingga diperolchurutan sinyal "dalam —kawasan —frekvens, Pada peneltan ini urutan fekuensi yang diperoleh,

Anda mungkin juga menyukai