Komputer pada awalnya diciptakan sebagai perangkat untuk melakukan kalkulasi secara otomatis
dan akurat. Meskipun awalnya hanya berfokus pada kalkukasi numerik, komputer modern yang
dijumpai sekarang telah melakukan kalkulasi pada banyak hal, seperti teks ataupun gambar. Berbagai
kalkulasi dan analisa yang dilakukan komputer biasanya diimplementasikan melalui perangkat lunak.
Dengan semakin besarnya ruang lingkup hal-hal yang dilakukan oleh komputer, perangkat lunak
yang dikembangkan juga menjadi semakin kompleks. Algoritma, sebagai bagian dari perangkat
lunak yang melakukan pemrosesan, juga memerlukan berbagai teknik baru. Misalkan, untuk
menghitung total jumlah dari bilangan-bilangan yang ada di dalam sebuah list, kita dapat
menggunakan perulangan sederhana:
print(total) # 255
Algoritma perulangan yang digunakan pada kode di atas memang sederhana dan memberikan hasil
yang benar, tetapi terdapat beberapa masalah pada kode tersebut, yaitu perhitungan dilakukan secara
linear, yang menghasilkan kompleksitas O(n)O(n). Hal ini tentunya cukup ideal untuk ukuran list
kecil, tetapi jika ukuran list menjadi besar (beberapa Milyar elemen) maka perhitungan akan menjadi
sangat lambat. Kenapa perhitungannya menjadi lambat? Karena nilai dari total tergantung kepada
kalkulasi nilai total sebelumnya. Kita tidak dapat melakukan perhitungan total dari depan dan
belakang list sekaligus, sehingga kita dapat mempercepat perhitungan dua kali lipat. Dengan kode di
atas, kita tidak dapat membagi-bagikan pekerjaan ke banyak pekerja / CPU!
Lalu apa yang dapat kita lakukan? Langkah pertama yang dapat kita lakukan adalah menerapkan
teknik rekursif untuk membagi-bagikan masalah menjadi masalah yang lebih kecil. Jika awalnya kita
harus menghitung total keseluruhan list satu per satu, sekarang kita dapat melakukan perhitungan
dengan memecah-mecah list terlebih dahulu:
def sums(lst):
if len(lst) >= 1:
return lst[0]
mid = len(lst) // 2
left = sums(lst[:mid])
right = sums(lst[mid:])
print(sums(nums)) # 255
Singkatnya, setelah membagikan list menjadi dua bagian terus menerus sampai bagian terkecilnya,
kita menjumlahkan kedua nilai list tersebut, seperti pada gambar berikut:
1. Divide (Memecah): pada langkah ini kita memecahkan masalah atau data ke dalam bentuk
yang sama, tetapi dalam ukuran yang lebih kecil. Pemecahan langkah biasanya dilakukan
dengan menggunakan algoritma rekursif, sampai ukuran data menjadi sangat kecil dan dapat
diselesaikan dengan algoritma sederhana.
2. Conquer (Menaklukkan): dalam langkah ini kita mencoba menyelesaikan masalah atau data
yang telah dipecahkan pada langkah pertama, dengan menggunakan algoritma sederhana.
3. Combine (Menggabungkan): setelah menjalankan langkah conquer, tentunya kita harus
menggabungkan kembali hasil dari masing-masing pecahan yang ada, untuk mendapatkan
hasil akhir kalkulasi. Langkah combine mencoba mencapai hal tersebut.
def sums(lst):
if len(lst) >= 1: # 1 langkah
return lst[0] # 1 langkah
f(n)=4+f(n2)+f(n2)=4+2f(n2)f(n)=4+f(n2)+f(n2)=4+2f(n2)
karena ukuran dari mid adalah panjang list (nn) dibagi dua. Dengan begitu, kompleksitas dari
algoritma adalah:
f(n)=2f(n2)=2(2(n4))=2(2(2(n8)))...=2k(n2k)f(n)=2f(n2)=2(2(n4))=2(2(2(n8)))...=2k(n2k)
dengan syarat berhenti adalah ketika k≥1k≥1, sehingga:
n2knk=1=2k=log2nn2k=1n=2kk=log2n
Kompleksitas dari fungsi sums adalah O(logn)O(logn), meningkat dari O(n)O(n) pada algoritma
awal!
Secara umum, kompleksitas algoritma D&C adalah O(nlogn)O(nlogn), jika ukuran data adalah nn,
dan pada setiap langkahnya kita membagikan masalah ke dalam pp sub-masalah.
def merge_sort(lst):
if len(lst) <= 1:
return lst
mid = len(lst) // 2
left = merge_sort(lst[:mid])
right = merge_sort(lst[mid:])
return result
Dari kode di atas terlihat bahwa merge sort memiliki dua bagian, yang dituliskan dalam dua buah
fungsi: merge dan merge_sort. Fungsi merge_sort memiliki logika dan cara kerja yang sama dengan
fungsi penjumlahan total yang kita bangun sebelumnya, dengan perbedaan pada bagian yang
melakukan penggabungan list (return merge(left, right)).
Penggabungan list sendiri dilakukan dengan cukup sederhana dan gamblang, yaitu hanya
membandingkan elemen-elemen dari dua buah list yang dikirimkan satu per satu, untuk kemudian
disimpan ke dalam variabel result secara terurut. Untuk lebih jelasnya, mari kita coba bedah
algoritma pada fungsi merge, langkah demi langkah.
Misalkan kita memanggil fungsi merge seperti berikut:
left = [3, 5]
right = [1, 4]
merge(left, right)
Note
Ingat bahwa list pada variabel left maupun right harus sudah terurut jika ukuran list lebih dari 1.
Fungsi merge dengan argumen list berukuran >> 1 hanya dipanggil dari hasil merge dua buah list
berukuran satu dalam kasus merge_sort.
Jika kita mengikuti langkah demi langkah pada kode, maka pada setiap iterasi while kita akan
mendapatkan nilai masing-masing variabel sebagai berikut:
# Awal fungsi
left = [3, 5]
right = [1, 4]
result = []
# Iterasi 1
left = [3, 5]
right = [4]
result = [1]
# Iterasi 2
left = [5]
right = [4]
result = [1, 3]
# Iterasi 3
left = [5]
right = []
result = [1, 3, 4]
# Iterasi 4
left = []
right = []
result = [1, 3, 4, 5]
Penggabungan seperti di atas dilakukan pada setiap submasalah yang telah dipecah oleh merge_sort,
sampai kita mendapatkan sebuah list dengan ukuran yang sama pada list awal. Untuk mempermudah
pengertian, gambar di bawah menunjukkan proses pemecahan dan penggabungan kembali dari merge
sort:
Langkah Kerja Merge Sort
Proses divide terjadi ketika kotak dan panah berwarna merah, sementara conquer dan combine terjadi
ketika kotak dan panah diberi warna biru. Proses conquer merupakan proses di mana kita
mengurutkan elemen dalam list, dan combine adalah ketika kita menggabungkan hasil urutan dari list
tersebut.
Contoh D&C 2: Binary Search
Binary search merupakan salah satu algoritma pencarian yang paling efisien, dengan
kompleksitas O(logn)O(logn). Algoritma ini memanfaatkan teknik divide and conquer dengan
memecah lingkup pencarian data menjadi setengahnya pada setiap kali divide. Kekurangan dari
binary search yaitu bahwa algoritma ini hanya dapat digunakan pada sebuah data atau lsit yang telah
terurut.
Langsung saja, implementasi binary search menggunakan python:
Mari kita lihat cara kerja binary search. Misalkan kita diberikan data berupa list bilangan seperti
berikut:
[1, 2, 4, 6, 7, 8, 9, 10]
dan diminta untuk mencari letak angka 2 pada list tersebut. Sebelum mulai menjalankan algoritma,
pastinya kita harus mengetahui nilai-nilai awal terelbih dahulu. Adapun nilai awal yang dibutuhkan
untuk fungsi binary_search adalah sebagai berikut:
Setelah mendapatkan nilai tengah, kita lalu melakukan cek apakah nilai dari data pada indeks
tersebut lebih besar atau lebih kecil dibandingkan nilai yang akan kita cari ( 2). Langkah pengecekan
ini dilakukan pada perintah if berikut:
Dalam kasus ini, nilai dari mid_idx adalah 3, dan karena data[3] berisi 6, maka kita akan melakukan
pemotongan terhadap seluruh nilai pada data setelah 6, karena nilai tersebut sudah pasti tidak
diperlukan lagi (ingat, data harus terurut pada binary search). Kita lalu memanggil
fungsi binary_search lagi, kali ini dengan mencari hanya pada submasalah (list) berikut (perhatikan
bagaimana pada pemanggilan binary_search yang kedua nilai max_idx kita ubah
menjadi mid_idx - 1):
[1, 2, 4]
Dan dengan mengaplikasikan logika yang sama dengan tahap sebelumnya, kita akan langsung
menemukan bilangan yang dicari.