Anda di halaman 1dari 6

Pelita Teknologi: Jurnal Ilmiah Informatika, Arsitektur dan Lingkungan 14 (1) 2019 74-79

Pelita Teknologi: Jurnal Ilmiah Informatika,


Arsitektur dan Lingkungan
Journal homepage: jurnal.pelitabangsa.ac.id

ANALISIS ALGORITMA SEQUENTIAL SEARCH DAN BINARY SEARCH


PADA BIG DATA

Yoga Religia1

Program Studi Teknik Informatika, STT Pelita Bangsa


Korespondensi email: yoga.religia@pelitabangsa.ac.id

Abstrak: Informasi Artikel:


Pemakaian data berkembang pesat pada jaman Diterima : 22 Juni 2019
yang dipenuhi dengan berbagai teknologi yang Direvisi : 30 Juni 2019
ada. Dimulai dari banyaknya kemudahan yang Dipublikasikan : 17 Juli 2019
bisa dinikmati sehari–hari hingga
memanfaatkannya untuk berbagai bidang Kata kunci:
contohnya untuk analisis suatu bisnis. Adanya Big Data, Binary Search,
fasilitas teknologi yang mumpuni Kompleksitas Algoritma Pencarian,
memudahkan orang dalam pencarian Sequential Search
(Searching) informasi dalam berbagai bentuk
data yang ada. Akan tetapi pada masalah
pencarian data akan menimbulkan masalah
dikemudian hari apabila data tersebut dalam
jumlah yang besar atau lebih dikenal dengan
Big Data. Big Data tidak hanya mengarah pada
jumlah memori yang tersimpan akan tetapi
atribut-atribut yang melekat pada suatu data.
Perlu penanganan yang lebih dalam mengelola
Big Data terutama pada saat pencarian suatu
kata atau kalimat tertentu sehingga waktu
untuk memproses tidak memakan waktu yang
terlalu lama. Algoritma Searching merupakan
sebuah proses untuk memeriksa sekumpulan
elemen (daftar elemen) untuk menemukan
sebuah elemen tertentu. Dari berbagai macam
algoritma Searching yang ada, dalam
penelitian ini kami bermaksud untuk
memberikan gambaran perbandingan antara
dua jenis algoritma Searching yaitu Sequential
Search dan Binary Search dalam menangani
Big Data. Penelitian ini akan menunjukkan
analisis kenerja dari kedua algoritma tersebut
dalam sebuah data yang besar (Big Data). Dari
hasil analisis dan percobaan dapat disimpulkan
bahwa algoritma Binary Search memiliki
kompleksitas waktu yang lebih cepat
dibanding dengan Sequential Search.

Pelita Teknologi: Jurnal Ilmiah Informatika, Arsitektur dan Lingkungan | 74


ISSN: p.2301-475X e.2656-7059

I. Pendahuluan hingga paling akhir dari sebuah list


Algoritma dan struktur data sampai data ditemukan [7]. Selain itu
berperan sangat besar dalam ada algoritma Binary Search, yaitu
pembangunan sebuah perangkat lunak, sebauh list yang sudah terurut kemudian
baik dalam pembuatan desain serta dibagi menjadi dua bagian [10].
implementasinya. Sebuah algoritma Awalnya adalah membandingkan
adalah satu set intruksi untuk inputan dengan nilai tengah, selanjutnya
melakukan tugas atau fungsi tertentu dibandingkan ke kanan atau ke kiri
sehingga tercapai tujuan yang sesuai dengan urutan listnya.
diinginkan dengan proses jalan Oleh karena itu, dengan masalah
menghabiskan waktu tertentu [1]. adanya data yang besar kami ingin
Kompleksitas dari sebuah menguji kecepatan waktu proses dan
algoritma menggunakan fungsi g(n) kompleksitas algoritma pencarian
yang memberikan batas atas dari jumlah dengan menggunakan algoritma
operasi yang berada dalam algoritma Sequential dan algoritma Binary.
tersebut saat sebuah masukan sebanyak
n. Kompleksitas sendiri dibagi menjadi II. Landasan Teori
dua, yang pertama kompleksitas waktu 2.1. Sequential Search
adalah jumlah waktu yang diperlukan Sequential Search adalah cara
komputer saat menjalankan algoritma untuk pencarian data dalam array 1
tersebut. Yang kedua yaitu komplek- dimensi. Data yang akan dicari nanti
sitas ruang, yaitu jumlah ruang memori akan ditelusuri dalam semua elemen-
komputer yang dibutuhkan saat elemen array dari awal sampai akhir,
algoritma itu melakukan proses dari dan data yang dicari tersebut tidak perlu
awal sampai selesai [6]. diurutkan terlebih dahulu. Terdapat 2
Data Searching adalah proses yang kemungkinan yang akan terjadi dalam
ada dan dibutuhkan dalam pembangun- waktu pencarian data Sequential
an sebuah aplikasi, ada banyak Search, diantaranya yaitu [7] :
algoritma yang bisa diterapkan namun 1. Best Case
tidak semua algoritma memiliki Best case / kemungkinan terbaik
efisiensi yang baik selama algoritma itu akan terjadi apabila data yang dicari
berjalan. Untuk data yang sedikit terletak pada index array yang paling
mungkin perbedaannya belum terlalu depan, sehingga waktu yang
besar, namun saat ini perkembangan dibutuhkan untuk mencari data
data juga semakin berkembang yang sedikit.
biasa disebut Big Data. Big Data adalah 2. Worse Case
sekumpulan data yang sangat besar bisa Worse case / kemungkinan terburuk
terdiri dari data text, numerik ataupun akan terjadi apabila data yang dicari
multimedia yang disimpan dalam terletak pada index array yang paling
sebuah database tertentu [2]. akhir, sehingga waktu yang
Ada beberapa algoritma yang bisa dibutuhkan untuk mencari data akan
digunakan untuk melakukan pencarian, sangat lama.
salah satunya adalah Sequential Search,
yaitu algoritma yang dasar dan simpel Untuk meningkatkan efisiensi
dari pencarian, dimana menggunakan pencarian data pada Sequential Search
metode pencarian data dari paling awal dapat dilakukan dengan cara

Pelita Teknologi: Jurnal Ilmiah Informatika, Arsitektur dan Lingkungan | 75


ISSN: p.2301-475X e.2656-7059

menghentikan looping dengan mengelola dan menganalisis [3]. Tujuan


menggunakan BREAK apabila data Big Data adalah untuk menciptakan
yang dicari sudah ketemu [7]. nilai tambah danmemberikan implikasi
mengenai bagaimana organisasi harus
didesain, diorganisir dan dikelola.
2.2. Binary Search Big Data mengacu pada dataset
Binary Search adalah cara untuk yang ukurannya diluar kemampuan dari
pencarian data pada array yang sudah database software tools untuk meng-
terurut. karena salah satu syarat dalam capture, menyimpan, me-manage dan
Binary Search adalah data sudah dalam menganalisis. Ukuran Big Data sekitar
keadaan terurut. dengan kata lain beberapa lusin TeraByte sampai ke
apabila data belum dalam keadaan beberapa PetaByte tergantung jenis
terurut, pencarian Binary tidak dapat Industri. Isi dari Big Data adalah
dilakukan. Binary Search ini dilakukan Transaksi+interaksi dan observasi atau
untuk [10] : bisa dibilang segalanya yang
a. Memperkecil jumlah operasi berhubungan dengan jaringan internet,
perbandingan yang harus dilakukan jaringan komunikasi, dan jaringan
antara data yang dicari dengan data satelit [5].
yang ada didalam tabel, khususnya Big Data dapat di artikan kedalam
untuk jumlah data yang sangat 9 karakter (IBM) menurut responden
besar ukurannya. sehingga disimpulkan oleh IBM, Big
b. Beban komputasi lebih kecil karena Data adalah data yang memiliki scope
pencarian dilakukan dari depan, informasi yang sangat besar, model
belakang dan tengah. informasi yang real-time, memiliki
c. Prinsip dasarnya adalah melakukan volume yang besar, dan berasalkan
proses pembagian ruang pencarian social media data [8]. Jadi dapat
secara berulang-ulang sampai data disimpulkan bahwa Big Data adalah
ditemukan atau sampai pencarian dataset yang memiliki volume besar dan
tidak dapat dibagi lagi (berarti salah satu isinya berdasarkan social
terdapat kemungkinan data tidak media data, dan informasi. Big Data
dtiemukan). selalu yang terbaru (latest data)
sehingga model informasi nya real-time,
2.3. Big Data dan scope informasi nya tidak terfocus
Menurut Dumbill (2012) , Big Data pada industri-indrustri kecil saja atau
adalah data yang melebihi proses industri-indrustri besar saja melainkan
kapasitas dari kovensi sistem database semuanya baik industry kecil maupun
yang ada [4]. Data terlalu besar dan besar [9].
terlalu cepat atau tidak sesuai dengan
struktur arsitektur database yang ada. III. Metode Penelitian
Untuk mendapatkan nilai dari data, Pada penelitian ini akan dilakukan
maka harus memilih jalan altenatif beberapa tahapan yang meliputi latar
untuk memprosesnya. belakang penelitian, analisis kebutuhan,
Big Data menurut Richard adalah metode yang digunakan, implementasi,
sekumpulan data (data set) yang pengujian, analisis pengujian dan hasil.
besarnya jauh melebihi kemampuan adapun tahapan dari penelitian ini dapat
database software tools pada umumnya dilihat pada gambar 3.1
untuk melakukan capture, menyimpan,
Pelita Teknologi: Jurnal Ilmiah Informatika, Arsitektur dan Lingkungan | 76
ISSN: p.2301-475X e.2656-7059

Metode yang akan digunakan IV. Hasil Pengujian


dalam penelitian ini akan melalui 4.1. Kompleksitas Sequential
beberapa tahapan yaitu : Search Kompleksitas algoritma
1. Mengetahui kompleksitas secara Search adalah tergantung dari jumlah
teoritis antara dua algoritma yang perbandingan yang terjadi dalam
akan dilakukan komparasi. perulangan saat melakukan pencarian
2. Menggunakan data sampel data data dalam sebuah list. Misalkan ada n
transaksi perpindahan barang di elemen di dalam list. berikut adalah
perusahaan Darmanusa Intermedia notasi dalam bentuk larik.
sebanyak 150000 record. Berikut adalah ekspresi jumlah
3. Menghitung lama waktu proses yang rata-rata perbandingan yang ada pada
berjalan saat proses pencarian algoritma Sequential Search adalah
dengan menggunakan spesifikasi sebuah kasus yang berhasil:
komputer sebagai berikut: • Kasus terbaik ialah elemen yang
a. Processor Intel core i5, v5 dicari berada diposisi pertama pada
b. Ram 4 GB list, jadinya hanya melakukan sekali
c. Harddisk 500 GB perbandingan dengan notasi f (n) =
d. Operating system Elementary OS O(1). Kasus rata rata ialah elemen
freya yang dicari berada di tengah-tengah
e. Source code menggunakan bahasa list, dengan notasi:
python. f (n) = O[(n +1)/ 2]
• Kasus terburuk ialah elemen yang
dicari berada diakhir list, sehingga ia
melakukan pencarian atau komparasi
data sampai selesai atau sebanyak list
itu.
• Lama Waktu Process Sequential
Search : Untuk mengukur lama
waktu Sequential Search kami
melakukan pengujian sebanyak lima
kali. Yaitu menguji dalam keadaan
worst case, dan best case. Rata - rata
lama proses worst case ialah
0,014357 ms, sedangkan rata - rata
lama proses untuk keadaan best case
ialah 0,000942 ms.

4.2. Kompleksitas Binary Search


Kompleksitas algoritma Binary
Search ialah tergantung dari banyaknya
data, dan data yang dimiliki adalah data
yang sudah terurut, pada penelitian ini
data terurut secara ascending, untuk
kompleksitasnya jika keyword yang
Gambar 3.1 Tahapan Penelitian
dimasukkan adalah sebagai mid value
dari list maka itulah kasus terburuknya.

Pelita Teknologi: Jurnal Ilmiah Informatika, Arsitektur dan Lingkungan | 77


ISSN: p.2301-475X e.2656-7059

Namun kasus terburuknya ialah


keyword adalah data terendah atau
tertinggi dari data yang dimiliki serta
kemungkinan data tidak ditemukan juga
memiliki waktu yang lama untuk proses
pencarian.
Untuk notasi matematisnya ialah
dengan konsep membagi dua block data
dari n mnjadi setengah menjadi log2n.
Jadi proses pencarian bisa direduksi
menjadi setengah dari semua log n.
• Lama Waktu Process Binary
Search : Untuk Binary Search kami
melakukan pengujian sebanyak lima Gambar 4.2. Worse Case
kali masing masing pada kondisi
worst case dan best case, dengan
waktu lama proses worst case
didapat rata rata 0,000115 ms, dan V. Kesimpulan
lama waktu proses dalam keadaan Algoritma Searching merupakan
best case ialah 0,000103 ms. algoritma yang sangat penting dalam
pengelolaan sistem manajemen
4.3. Perbandingan Kedua Algoritma database. Data yang besar (Big Data)
Dari pengujian yang telah perlu diolah untuk memudahkan dalam
dilakukan dapat disimulasikan dalam pencarian data. Dari pembahasan diatas,
sebuah grafik agar dapat dibaca dan kami membandingkan beberapa
dipahami lebih mudah. Adapun grafik algoritma Searching seperti Sequential
yang dimaksud dibagi kedalam 2 jenis, Search dan Binary Search dengan
yaitu grafik perbandingan best case dan mengimplementasi-kan dalam berbagai
grafik perbandingan worst case, yang segi antara lain konsep, algoritma,
masing-masing dapat dilihat pada koding dan kompleksitas waktu. Dari
gambar 4.1 dan gambar 4.2. percobaan dengan menggunakan bahasa
phyton, dapat disimpulkan algoritma
Sequential Search memiliki komplek-
sitas waktu lebih besar dibanding
dengan Binary Search.

VI. Saran
Pada penelitian penelitia ini hanya
terbatas membandingkan 2 algoritma
Searching, diharapkan dari penelitian
ini akan semakin banyak muncul
penelitian terkait kemangkusan
algoritma Searching yang lain.

Gambar 4.1. Best Case

Pelita Teknologi: Jurnal Ilmiah Informatika, Arsitektur dan Lingkungan | 78


ISSN: p.2301-475X e.2656-7059

Daftar Pustaka
[1] Roy Debadrita Roy , Kudu Arnab,
“A Comparative Analysis of Three
Different Types of Searching
Algorithms in Data Structure”,
Vol.3, issue 5, 2016
[2] BM. (n.d.). Analytics: The
realworld use of Big Data.
Retrieved from How innovative
enterprises extract value from
uncertain data:
http://www935.ibm.com/services/u
s/gbs/thoughtleadership/ibv-big-
data-at-work.html
[3] Putri Sujana Aprianti, “Memanfaat-
kan Big Data untuk Mendeteksi
Emosi”, Vol.2, 2015
[4] Dumbill, E. Big Data Now Current
Perspective. O'Reilly Media. 2014.
[5] Zoumpatianos Kostas, Ideros
Stratos, Palpanas Themis.
“Indexing for Interactive
Exploration of Bid Data Series”.
2013
[6] Laxmi R., Saranya, S. Pujtha. “Data
Searching and Implementing
Fautolerance using Sector Sphere
File System”. ICAESM. 2014
[7] English Thomas.” No More Lunch:
Analysis of Sequential Search”.
2008
[8] Cheng Weiqing, Yang Geng,
Zhang Shanshan, Zhang Shaobai.
“Stratified
[9] Multi-Ring Distributed Search
Model for Big Data”. 2016.
[10] Wan Dingsheng, Xiao Yan, Zhang
Pengcheng, Leung Hareton.
“Hydrological Big Data Prediction
Based On Similarity Search and
Improved BP Neural Network”.
2017.
[11] Lim Hyesook, Lee Nara.“Survey
and Proposal on Binary Search
Algorithms for Longest Prefix
Match”. Vol.14 no.3. 2014

Pelita Teknologi: Jurnal Ilmiah Informatika, Arsitektur dan Lingkungan | 79

Anda mungkin juga menyukai