Oyun trleri
Tam bilgili; tam olmayan bilgili Belirlenmi Talih Satran,dama,go- tam bilgili, belirlenmi
Satran : her durumda yaklak ~15 hareket, 80 karlkl hamle aata 1580 dm Go : her durumda ~200 hareket, 300 karlkl hamle aata 200300 dm Optimal zmn ou zaman mmkn olmamas
Oyun-arama sorunu
Balang durum-ilk pozisyon ve birinci hamle yapacak oyuncu Ardl fonksiyonu- (hareket,durum) iftleri listesini veriyor; yasal hareket ve bu hareket sonucu durum U dm (terminal) denemesi -oyunun bittiini belirler. Oyunun son bulduu durumlara u durumlar denir Yarar fonksiyonu - u durumlar iin say deer Oyun aac- balang durum ve her iki tarafn yasal hareketleri
7
Minimax yntemi
Belirlenmi oyunlar iin mkemmel taktik Temel fikir: en yksek minimax deerli hareketi semeli = en iyi ulalabilir sonu
Minimax deer
Minimax deer (n)= Yarar(n) , eer n son durum ise
10
Minimax algoritmas
11
minimaxn zellikleri
tam? Evet (eer aa sonlu ise) Optimal? Evet (optimal rakibe kar) Zaman karmakl? O(bm) Uzay karmakl O(bm) (derinine izleme) m- aacn en fazla derinlii b- her noktada mmkn hamleler says Satran iin b 35, m 100
12
MINI MAX
Snrlamalar: 2 oyuncu: MAX (bilgisayar) ve MIN (rakip) belirlenmi, tam bilgi Derinine arama ve deerlendirme fonksiyonu
MAX Bu hareketi se
- Derine doru aa oluturmal -Her seviye iin deerlendirme fonksiyonunu hesaplamal -Deerlendirme fonksiyonunu yaymal: - MINde minimum kabul ediliyor - Maxda maximum kabul ediliyor
13
MIN
2
MAX
Alpha-Beta budama
Tm aacn (yukardan aaya doru derinine) oluturulmasna ve deerlerin tm aa boyu yaylmasna gerek kalmaya bilir Edinilmi baz deerler ,aacn retilmemi ksmlarnn fazla olduu ve retilmesine gerek kalmad bilgisini vere bilir
14
olduu anlalyor.
15
- budama rnei
16
- budama rnei
17
- budama rnei
18
- budama rnei
19
- budama rnei
20
-nn zellikleri
Budama son neticeyi etkilemez Hareketlerin iyi sralanmas budamann etkiliini ykseltir
21
Neden -?
, max iin yol boyunca
seilmi en iyi (en yksek) deer Eer v dan kt ise max onu iptal edecek uygun dal budanacak Min iin , benzer yolla deerlendirilir
22
- algoritmas
23
- algoritmas
24
-MIN-deer (1), babann (2) MAX deerinden kktr -MIN-deer daha ileride kle bilir,
MIN
=2
MAX
1
25
Alpha-deer
MIN
=2
Beta-deer
MAX
1
26
Alpha-deer
MIN
=2
Beta-deer
MAX
27
MIN
=2
Beta-deer
MAX
Alpha-deer
28
Mini-Max ve
4 16 5 31 = 5 39 3 38
MAX
8 6
= 4 15
5 23
= 5 30
MIN
8 2
=8 5
9 8
2 10 1 18 4 12 3 20
= 4 14 = 5 22
3 25 9 27 6 29 = 3 37
1 33 2 35
MAX
8 7 3 9 1 6 2 4 1
1 3 4 7 9 11 13
1 3 5 3 9 2 6 5 2
17 19 21 24 26 28
1 2 3 9 7 2 8 6 4
32 34 36
29
MIN
MAX
30
MAX
3
21
12
MIN
21
24
27
12
15
18
MAX
21 20 19 24 23 22 27 26 25
12 11 10 15 14 13 18 17 16
3 2 1 6 5 4 9 8 7
31
Deerlendirme fonksiyonlar
Arlkl dorusal fonksiyon Eval(s) = w1 f1(s) + w2 f2(s) + + wn fn(s) w-zelliin arl f-zellik rnek: satranta f(s) = ayn trden talarn says w-uygun tan arl (rn., piyon iin 1)
32
snrlamalar
rnek: arama iin 100 saniyelik zaman tannmtr. Her saniyede 104 dm aratrlmaldr her harekette 106 dm yaklamlar: Kesme denemesi (cutoff test): Derinlik snr Deerlendirme fonksiyonlar
33
34
Ufuk etkisi
Vezir kayb
Piyonun kayb
Derinine ilerlemekle felaketi nleye bilmesek de onu geciktire biliriz zm: sezgisel devam
35
Sezgisel Devam
Strateji durumlarda ok nemli oyun tann kayb, piyonun vezire evrilmesi, ... Araman derinlik snrnn dnda da yapmal!
Derinlik snr
36
Talih oyunlar
rnek: Tavla: Oyun aacnn biimi:
37
MAX
d1 d2 d3 d4 d5
Beklenen_max( C ) =
s1 s2 s3 s4 S(C,d3)
Min
38
39
belirlenmi oyunlar
Checkers: Chinook ended 40-year-reign of human world champion Marion Tinsley in 1994. Used a precomputed endgame database defining perfect play for all positions involving 8 or fewer pieces on the board, a total of 444 billion positions. Chess: Deep Blue defeated human world champion Garry Kasparov in a six-game match in 1997. Deep Blue searches 200 million positions per second, uses very sophisticated evaluation, and undisclosed methods for extending some lines of search up to 40 ply.
Othello: human champions refuse to compete against computers, who are too good. Go: human champions refuse to compete against computers, who are too bad. In go, b > 300, so most programs use pattern knowledge bases to suggest plausible moves.
40
41
42
43
Chess Rating
3500 3000 2500 2000 1500 2 4 6 8 10 12 14
Kasparov
Depth in ply
1. Deep Blue saniyede 200,000,000 in zerinde pozisyonu inceleye ve deerlendire bilir Bir usta ise saniyede 3 pozisyon deerlendire bilir 2. Satran programnn bilgisi azdr ,ama hesaplama yetenei ok yksektir Ustann ok byk satran bilgisi var, ama hesaplama yetenei snrldr. 3.nsan satran oynad zaman duyumundan,nsezisinden yararlanyor. Programn duyma, sezme yetenei yoktur. 4. Deep Blue ,bir uluslararas byk usta ve be IBM aratrmac bilim adamnn rehberliinden faydalanmtr Bir ustaya ise antrenr ve ok iyi satran oynaya bilme yetenei yardm eder 5. nsan kendi hatalarndan ve baarlarndan renebilme yeteneine sahiptir. Deep Blue, bugnk haliyle, renme sistemi deildir; bu nedenle, rakibinden renmek ve ya satran tahtasndaki durumu dnmek iin yapay zeka kullanma yeteneine sahip deildir
45
6. Programn korku duygusu, fikrinin datlmas endiesi yoktur (rnein,Kasparovun sabit baklarndan). Bir ustann ise ise insani zafiyeti var, can skla bilir, fikri dala bilir ve s. 7. Program satran oynarken ok etkileyicidir, ama zekas en geri zekal insandan da geridir Satran ustalar ise genellikle aydn insanlardr, birka dil biliyorlardr, toplumun ileri gelenleridir 8. Programn oyun anlayndaki deiimler ,gelitirme ekibi tarafndan yaplmaldr Usta ise her oyundan nce,sonra, oyun iinde oyununda deiiklik yapa bilir. 9. nsan rakibini deerlendire, onun zayf ynlerini rene ve bundan yararlana bilir. Program ise satran pozisyonlarn ok iyi deerlendirse de rakibinin zayf ynlerinden yararlana bilmez. 10. nsan , deerlendire bildii pozisyonlar iinden seim yapar Program ise mmkn pozisyonlar iinden en iyisini see biliyor (Deep Blue saniyede 200 milyon pozisyon iinde arama yapa biliyor)
46