Anda di halaman 1dari 4

BAB I

PENDAHULUAN

1.1. Latar Belakang

Seiring dengan berkembangnya teknologi saat ini, data memiliki peranan yang
sangat penting. Data tidak hanya disajikan dalam bentuk teks saja, melainkan data
dan informasi dapat juga berupa gambar, suara dan video yang lebih dikenal
dengan multimedia. Peningkatan penggunaan data telah menyebabkan masalah
pada penyimpanan data dan secara tidak langsung meningkatkan permintaan akan
penyimpanan data. Semakin besar ukuran file, semakin banyak ruang
penyimpanan yang dibutuhkan. Saat ini, file memiliki berbagai jenis format.

Teks adalah kumpulan dari karakter – karakter atau string yang menjadi
satu kesatuan. Salah satu media yang biasa kita jumpai dalam penggunaan teks
yakni media analog atau kertas yang biasa dipakai dalam penulisan suatu teks atau
karakter – karakter. Hingga saat ini, sudah sangat banyak metode/algoritma yang
dapat digunakan untuk melakukan kompresi / pemampatan pada data. Sehingga
dalam hal ini kita perlu mempelajari tentang teknik pengompresan data teks
tersebut. Kompresi (pemampatan) dilakukan untuk memperkecil jumlah
ukuran data (hasil kompresi) dari data aslinya. Kompresi data teks dapat
dilakukan dengan berbagai algoritma, seperti metode algoritma Huffman dan
Algoritma Unary Code. Unary Coding umumnya direpresentasikan dalam sebuah
string dari n dan bit 1 diikuti dengan satu bit 0 yang mengakhiri yang
didefenisikan sebagai n -1 bit 1 diikuti satu bit 0, atau sebaliknya sebagai
alternatif dapat juga secara ekuivalen dimulai dari n bit 0 diikuti dengan bit 1
yang mengakhiri yang didefenisikan sebagai n -1 bit 0 diikuti dengan satu bit 1.
Pada metode Unary Coding tidak terdapat pembagian frekuensi simbol-simbol
yang ada pada string (Michael Simangunsong, 2020). Sedangkan Algoritma
Huffman menggunakan prinsip pengkodean yang mirip dengan kode Morse, yaitu
tiap karakter (simbol) dikodekan hanya dengan rangkaian beberapa bit, dimana
karakter yang sering muncul dikodekan dengan rangkaian bit yang pendek dan
karakter yang jarang muncul dikodekan.dengan rangkaian bit yang lebih panjang.
Pada penelitian kali ini, maka penulis ingin mengembangkan penelitian
sebelumya dengan mengompresi file data berupa file teks dengan Judul penelitian
“Penerapan Algoritma Unary Codes dan Algoritma Huffman Untuk Kompresi
File teks”. Hasil yang diharapkan adalah mampu menganalisa algoritma mana
paling efisien dalam melakukan kompresi file teks, dalam hal kecepatan dan
ukuran file hasil kompresi.

1.2. Rumusan Masalah


Berdasarkan uraian pada latar belakang, maka rumusan masalah dalam penelitian
ini adalah bagaimana menerapkan algoritma Huffman dan Unary Codes didalam
kompresi file teks.

1.3. Batasan Masalah


Dengan rumusan masalah yang telah disebutkan diatas, Penulis membatasi
permasalahan yang akan diteliti yakni sebagai berikut:
1. Bahasa pemrograman yang akan digunakan adalah bahasa Java, dan C++
2. Format yang digunakan untuk melakukan pengujian adalah format .doc
dengan 10 file teks sebagai data sampel.

1.4. Tujuan dan Manfaat Penelitian


1.4.1. Tujuan Penelitian

Tujuan dari penelitian ini adalah untuk menghasilkan sebuah aplikasi untuk
kompresi file teks.

1. Menganalisis kompresi file citra dengan algoritma Unary Code dan


algoritma Huffman.
2. Membandingankan kecepatan prosess kompresi file teks antara algoritma
Huffman dan Algoritma Unary Code
3. Membandingankan ukura file hasil prosess kompresi file teks antara
algoritma Huffman dan Algoritma Unary Code
1.4.2. Manfaat
Manfaat yang diharapkan dalam penelitian ini adalah Untuk mengetahui kinerja
dari algoritma Unary Codes dan algoritma Huffman dalam pengkompresian File
teks.

1.5. Keterbaruan

Fitri Angelina Siahaan (2018) Unary Coding dikenal juga dengan thermometer
code adalah sebuah encoding entropy yang mempergunakan angka dimulai n
dengan n berikutnya dimulai oleh 0 (jika angka awal dimengerti sebagai bilangan
non negative integer) atau dengan n-1 yang diikuti oleh 0 (jika angka yang
pertama dimengerti sebagai bilangan positif). Sebagai contoh 5 di dalam bilangan
biner adalah 111110 atau 11110. Sering menggunakan n atau n-1, 0 diikuti dengan
1. 1 dan 0 bergantian tanpa kehilangan nilai biasanya. Unary coding adalah
keduanya sebuah prefix kode dan sinkronisasi kode sendiri.
Rahmat Limbong (2020) Algoritma unary coding adalah algoritma yang
dapat mengkompresi citra ultrasonografi. Format citra yang paling baik untuk
mengkopresi citra ultrasonografi adalah format bitmap .bmp yang hasilnya jauh
lebih baik dari ekstensi lainnya. Hasil kompresi dapat dilihat berdasarkan rasio
yang diperoleh, jika hasil rasio positif maka hasil kompresi baik dan jika rasio
negatif maka hasil kompresi buruk. Perancangan aplikasi dengan menggunakan
software Matlab sangat memudahkan untuk mengolah data citra untuk
mengkompresi.
Mhd.Rajani Pane (2017) telah berhasil membuat aplikasi kompresi teks
pada Unary Coding. Pada saat proses kompresi aplikasi ini membaca
karakter yang ada dalam data teks, kompresi file teks yang efektif, dan dapat
dilihat pada data teks berukuran kecil, rasio kompresi teks dengan menerapkan
Unary Coding
Meisiria Sitorus (2020) telah melakukan penelitian dengan kesimpulan
mengkompresi SMS dapat dilakukan dengan menerapkan algotitma Unary Coding
,dengan menerapka Algoritma Unary Coding maka pengkompresian SMS
berjalan dengan baik. Algoritma Unary Coding membaca teks yang akan
dikompresi terlebih dahulu dan mencari teks yang sama agar tidak terjadi
perulangan huruf yang sama dan menghemat teks.Kompresi SMS dapat dirancang
dan dibangun dengan menggunakan aplikasi android. Dengan begitu di harapkan
memudahkan penulis dalam menerapkan algoritma Unary Coding.
Irfaan Hanif (2019) telah melakukan penelitian dengan hasil pengujian
yang dilakukan, algoritma Huffman dapat mengompres teks sekitar 70% jika
dibandingkan dengan menggunakan kode ASCII dan sekitar 25% jika
dibandingkan dengan kita menggunakan 3-bit kode.
M Taofik Chulkamdi, Sholeh Hadi Pramono, dan Erni Yudaningtyas
(2016) Kompresi teks menggunakan algoritma Huffmaan berhasil dibuat. Tingkat
kompresi hingga mencapai 75% jika ukuran file yang digunakan sebesar 16 bit
dan 96 bit dan masing-masing jenis mempunyai frekuensi kemunculan karakter
yang hampir sama. Kompresi teks ini kurang berhasil jika isi teks terlalu sedikit
karena karakter yang muncul tidak terjadi

Anda mungkin juga menyukai