Anda di halaman 1dari 2

Google DeepMind – AlphaGo

Tantangan
Go dikenal sebagai permainan klasik yang paling menantang untuk dibuat dengan kecerdasan buatan
dikarenakan kompleksitasnya.

Meski telah pekerjaan selama sedekade, program computer untuk Go yang paling hebat hanya mampu
untuk bermain setingkat pemain amatir. Metode standard kecerdasan buatan, yang menguji segala
langkah yang mungkin dengan menggunakan search tree, tidak dapat mengatasi jumlah langkah dalam
permainan Go yang amat banyak atau mengevaluasi kekuatan dari setiap posisi setiap di papan.

Apa itu Go?


Go berasal dari China sekitar 3000 tahun yang lalu. Untuk memenangkan permainan papan ini
memerlukan strategi berpikir yang berlapis.

Dua orang pemain, antara batu hitam atau putih, secara bergilir menempatkan batu tersebut pada
papan. Tujuan dari permainan ini adalah mengelilingi atau menguasai batu lawan atau secara taktis
membentuk ruang territorial. Saat, semua langkah yang mungkin sudah habis, kedua batu di papan dan
ruang yang dikuasai dihitung. Poin tertinggi adalah pemenangnya.

Peraturannya terdengar sederhana, tapi percayalah Go sangat kompleks. Terdapat 10 pangkat 170
kemungkinan konfigurasi yang dapat dibentuk di papan – lebih banyak dari jumlah atom yang ada di
alam. Ini membuat Go lebih kompleks dibandingkan dengan catur.

Pendekatan DeepMind
Untuk mendapatkan aspek intuitif dari permainan ini, diperlukan pendekatan baru.

Dibuatlah AlphaGo, sebuah program computer yang mengombinasikan search tree lanjutan dengan
deep neural networks. Sarar jaringan tersebut yang mendeskripsikan papan Go sebagai input dan
memprosesnya melalui sejumlah lapisan jaringan yang berbeda yang mengandung jutaan koneksi
seperti neuron.
Satu jaringan saraf, disebut policy network, memilih langkah selanjutnya untuk dimainkan. Jaringan saraf
lainnya yaitu, disebut value network, memprediksi pemenang permainan. Diperkenalkanlah AlphaGo
kepada beberapa pertadingan amatir untuk membantunya mengembangkan pemahaman terhadap
penjelasan tentang permainan manusia. Kemudian dimainkan terhadap versi dirinya sendiri sebanyak
ribuan kali dan setiap saat ia belajar dari kesalahannya.

Setelah sekian lama, AlphaGo berkembang dan menjadi bertambah kuat dan lebih baik dalam belajar
dan membuat keputusan. Proses ini disebut penguatan belajar. AlphaGo lalu mampu mengalahkan juara
dunia Go pada arena yang berbeda-beda dan menjadi pemain Go terhebat sepanjang masa.

Pertandingan
Pada Oktober 2015, AlphaGo memainkan pertandingan pertamanya melawan juara 3 kali kejuaraan
Eropa, Fan Hui. AlphaGo memenangkan pertandingan pertamanya melawan seorang professional Go
dengan skor 5-0.

Kemudianm AlphaGo bertanding lagi dengan pemain legenda Go, Lee Sedol, juara 18 gelar dunia, yang
dianggap sebagai pemain terhebat sedekade kebelakang. AlphaGo menang dengan skor 4-1 di Korea
pada Maret 2016 yang telah ditonton sebanyak 200 juta pemirsa di seluruh dunia. Pencapaian ini lebih
cepat satu decade dari yang seharusnya.

Pertandingan tersebut membuat AlphaGo meraih peringkat Dan 9, peringkat tertinggi. Ini menjadi kali
pertama sebuah pemain Go computer mendapat gelar kehormatan. Selama pertandingan, AlphaGo
beberapa kali menemukan langkah yang menentukan kemenangan. Pemain dari segala tingkatan
mempelajari langkah-langkah tersebut setelahnya.

Anda mungkin juga menyukai