0026 Mi 4 4 PDF

Mestersges Intelligencia
Modern megkzeltsben
Msodik, tdolgozott, bvtett kiads
Russell, Stuart
Norvig, Peter
Created by XMLmind XSL-FO Converter.
Mestersges Intelligencia: Modern megkzeltsben: Msodik,

tdolgozott, bvtett kiads
Russell, Stuart
Norvig, Peter
delkraut, Rbert
Antal, Pter
Dobrowiecki, Tadeusz
Haidegger, Gza
Haidegger, Tams
Hja, Gergely
Mszros, Tams
Pataki, Bla
Romn, Gyula
Strausz, Gyrgy
Tilly, Kroly
Valyon, Jzsef
Varga, Pter
Vrkonyin Kczy, Annamria
Ez a knyv az Oktatsi Minisztrium tmogatsval, a Felsoktatsi Tanknyv- s Szakknyv-tmogatsi
Plyzat keretben jelent meg.
Publication date 2005
Szerzi jog 2005 Hungarian Translation Panem Knyvkiad, Budapest
A m eredeti cme: ARTIFICIAL INTELLIGENCE. A MODERN APPROACH. 2nd Edition. ISBN 0137903952, by Russell, Stuart and
Norvig, Peter, published by Pearson Education, Inc., publishing as Prentice Hall, Upper Saddle River, New Jersey, 07458 Copyright
2003, 1995 Pearson Education Inc.
A kiadsrt felel a Panem Kft. gyvezetje, Budapest, 2005
Minden jog fenntartva. Jelen knyvet, illetve annak rszeit tilos reproduklni, adatrgzt rendszerben trolni, brmilyen formban vagy
eszkzzel - elektronikus ton vagy ms mdon - kzlni a kiadk engedlye nlkl
Tartalom
Elsz .......................................................................................................................................... xxxiv
1. Bevezets ........................................................................................................................................ 1
1. Mi az MI? .............................................................................................................................. 1
1.1. Emberi mdon cselekedni: Turing-teszt megkzelts ............................................. 2
1.2. Emberi mdon gondolkodni: a kognitv modellezs ................................................ 3
1.3. Racionlisan gondolkodni: a gondolkods trvnye ................................................ 3
1.4. Racionlisan cselekedni: a racionlis gens ............................................................. 4
2. A mestersges intelligencia alapjai ....................................................................................... 5
2.1. Filozfia (i. e. 428-tl napjainkig) ............................................................................ 5
2.2. Matematika (kb. 800-tl napjainkig) ........................................................................ 6
2.3. Gazdasgtan (1776-tl napjainkig) ........................................................................... 8
2.4. Neurlis tudomnyok (1861-tl napjainkig) ............................................................. 8
2.5. Pszicholgia (1879-tl napjainkig) ......................................................................... 10
2.6. Szmtgpes tudomnyok (1940-tl napjainkig) .................................................. 11
2.7. Irnytselmlet s kibernetika (1948-tl napjainkig) ............................................ 12
2.8. Nyelvszet (1957-tl napjainkig) ............................................................................ 13
3. A mestersges intelligencia trtnete .................................................................................. 13
3.1. A mestersges intelligencia rleldse (19431955) .............................................. 13
3.2. A mestersges intelligencia megszletse (1956) ................................................... 14
3.3. Korai lelkeseds, nagy elvrsok (19521969) ...................................................... 15
3.4. Egy adag realits (19661973) ............................................................................... 17
3.5. Tudsalap rendszerek: a hatalom kulcsa? (19691979) ....................................... 18
3.6. Az MI iparr vlik (1980-tl napjainkig) ................................................................ 20
3.7. A neurlis hlk visszatrse (1986-tl napjainkig) ............................................... 20
3.8. Az MI tudomnny vlik (1987-tl napjainkig) ..................................................... 21
3.9. Az intelligens gensek kialakulsa (1995-tl napjainkig) ...................................... 22
4. A mestersges intelligencia jelenlegi helyzete .................................................................... 22
5. sszefoglals ...................................................................................................................... 23
5.1. Irodalmi s trtneti megjegyzsek ........................................................................ 24
5.2. Feladatok ................................................................................................................ 24
2. Intelligens gensek ....................................................................................................................... 27
1. Bevezets ............................................................................................................................ 27
2. J viselkeds: a racionalits koncepcija ............................................................................ 29
2.1. Teljestmnymrtkek ............................................................................................ 29
2.2. Racionalits ............................................................................................................ 30
2.3. Mindentuds, tanuls s autonmia ........................................................................ 31
3. A Krnyezetek termszete .................................................................................................. 32
3.1. A krnyezet meghatrozsa .................................................................................... 32
3.2. A krnyezetek tulajdonsgai ................................................................................... 34
4. Az intelligens gensek struktrja ....................................................................................... 36
4.1. gensprogramok .................................................................................................... 36
4.2. Egyszer reflexszer gensek ................................................................................. 38
4.3. Modellalap reflexszer gensek ............................................................................ 40
4.4. Clorientlt gensek ............................................................................................... 41
4.5. Hasznossgorientlt gensek .................................................................................. 42
4.6. Tanul gensek ....................................................................................................... 43
5. sszefoglals ...................................................................................................................... 46
5.2. Feladatok ................................................................................................................ 48
3. Problmamegolds keresssel ...................................................................................................... 50
1. Problmamegold gensek .................................................................................................. 50
1.1. Jl definilt problmk s megoldsok ................................................................... 52
1.2. A problmk megfogalmazsa ............................................................................... 53
2. Pldaproblmk ................................................................................................................... 54
2.1. Jtkproblmk ....................................................................................................... 54
2.2. Valsvilg-beli problmk ...................................................................................... 57
iii
3. Megoldsok keresse .......................................................................................................... 58

3.1. A problmamegold hatkonysg mrse .............................................................. 62
4. Nem informlt keress ........................................................................................................ 63
4.1. Szlessgi keress ................................................................................................... 63
4.2. Egyenletes kltsg keress ................................................................................... 64
4.3. Mlysgi keress ..................................................................................................... 65
4.4. Mlysgkorltozott keress .................................................................................... 66
4.5. Iteratvan mlyl mlysgi keress ....................................................................... 67
4.6. Ktirny keress ................................................................................................... 69
4.7. A keressi stratgik sszehasonltsa .................................................................... 70
5. Az Ismtelt llapotok elkerlse ......................................................................................... 70
6. Keress rszleges informci mellett .................................................................................. 72
6.1. Szenzor nlkli problmk ..................................................................................... 72
6.2. Eshetsgi problmk ............................................................................................. 74
7. sszefoglals ...................................................................................................................... 75
7.2. Feladatok ................................................................................................................ 77
4. Informlt keressi s felfedez mdszerek ................................................................................... 82
1. Informlt (heurisztikus) keressi stratgik ........................................................................ 82
1.1. A moh legjobbat-elszr keress .......................................................................... 83
1.2. A* keress: a teljes becslt tkltsg minimalizlsa ............................................ 84
1.3. Memriakorltozott heurisztikus keress ............................................................... 90
1.4. Tanuljunk, hogy jobban keressnk! ........................................................................ 93
2. Heurisztikus fggvnyek ..................................................................................................... 93
2.1. A heurisztikus fggvny pontossgnak hatsa a megolds hatkonysgra ......... 94
2.2. Elfogadhat heurisztikus fggvnyek kitallsa ..................................................... 95
2.3. A heurisztikus fggvny tanulsa tapasztalatbl .................................................... 97
3. Loklis keres algoritmusok s optimalizcis problmk ................................................. 98
3.1. Hegymsz keress ................................................................................................. 99
3.2. Szimullt lehts ................................................................................................... 102
3.3. Loklis nyalb keress .......................................................................................... 103
3.4. Genetikus algoritmusok ........................................................................................ 103
4. Loklis keress folytonos terekben ................................................................................... 106
5. Online keres gensek s ismeretlen krnyezetek ............................................................ 108
5.1. Online keressi problmk ................................................................................... 108
5.2. Online keres gensek .......................................................................................... 111
5.3. Online loklis keress ........................................................................................... 112
5.4. Tanuls online keress sorn ................................................................................ 114
6. sszefoglals .................................................................................................................... 115
6.1. Irodalmi s trtneti megjegyzsek ...................................................................... 115
6.2. Feladatok .............................................................................................................. 119
5. Knyszerkielgtsi problmk ................................................................................................... 122
1. Knyszerkielgtsi problmk ......................................................................................... 122
2. A visszalpses keress alkalmazsa knyszerkielgtsi problmkra ............................ 125
2.1. Vltoz- s rtkrendezs ..................................................................................... 127
2.2. Az informci terjesztse a knyszereken keresztl ............................................. 128
2.2.1. Elrenz ellenrzs ................................................................................ 128
2.2.2. A knyszerek terjesztse .......................................................................... 128
2.2.3. Specilis knyszerek kezelse .................................................................. 130
2.3. Intelligens visszalps: visszanzni ...................................................................... 131
3. Loklis keress knyszerkielgtsi problmknl ............................................................ 132
4. A problmk struktrja .................................................................................................... 134
5. sszefoglals .................................................................................................................... 137
5.1. Irodalmi s trtneti megjegyzsek ...................................................................... 138
5.2. Feladatok .............................................................................................................. 140
6. Keress ellensges krnyezetben ................................................................................................ 143
1. Ktszemlyes jtkok ........................................................................................................ 143
2. Optimlis dntsek ktszemlyes jtkokban ................................................................... 144
2.1. Optimlis stratgik .............................................................................................. 145
2.2. A minimax algoritmus .......................................................................................... 146
iv
2.3. Optimlis dntsek tbbszemlyes jtkokban ....................................................

3. Alfa-bta nyess ................................................................................................................
4. Nem tkletes, vals idej dntsek .................................................................................
4.1. Kirtkel fggvnyek .........................................................................................
4.2. A keress levgsa ................................................................................................
5. Vletlen elemet is tartalmaz jtkok ...............................................................................
5.1. Az lls kirtkelse vletlen csompontokat tartalmaz jtkok esetn .............
5.2. A vrhatminimax komplexitsa ..........................................................................
5.3. Krtyajtkok .......................................................................................................
6. A jelenleg legfejlettebb jtkprogramok ...........................................................................
6.1. Sakk ......................................................................................................................
6.1.1. Dmajtk ................................................................................................
6.1.2. Othello ......................................................................................................
6.1.3. Ostbla .....................................................................................................
6.1.4. G .............................................................................................................
6.1.5. Bridzs .......................................................................................................
7. rtkels ............................................................................................................................
8. sszefoglals ....................................................................................................................
8.1. Irodalmi s trtneti megjegyzsek ......................................................................
8.2. Feladatok ..............................................................................................................
7. Logikai gensek ..........................................................................................................................
1. A tudsbzis gens ..........................................................................................................
2. A wumpus vilg ...............................................................................................................
3. A logika .............................................................................................................................
3.1. Szintaxis ...............................................................................................................
3.2. Szemantika ...........................................................................................................
3.3. Egy egyszer tudsbzis .......................................................................................
3.4. Kvetkeztets .......................................................................................................
3.5. Ekvivalencia, rvnyessg s kielgthetsg .......................................................
4. Az tletkalkulus kvetkeztetsi minti .............................................................................
4.1. Rezolci ..............................................................................................................
4.1.1. Konjunktv norml forma .........................................................................
4.1.2. A rezolci algoritmus ............................................................................
4.1.3. A rezolci teljessge ..............................................................................
4.2. Elre- s htrafel lncols ...................................................................................
5. Hatkony tletkalkulus kvetkeztets ..............................................................................
5.1. Egy teljes visszalpses algoritmus ......................................................................
5.2. Loklis keress algoritmus ...................................................................................
5.3. Nehz kielgthetsgi problmk ........................................................................
6. tletlogikt alkalmaz gensek ........................................................................................
6.1. Csapdk s wumpusok megtallsa logikai kvetkeztets felhasznlsval ........
6.2. A hely s az irny nyomkvetse .........................................................................
6.3. Az ramkrn alapul gens ................................................................................
6.4. sszehasonlts .....................................................................................................
7. sszefoglals ....................................................................................................................
7.2. Feladatok ..............................................................................................................
8. Elsrend logika .........................................................................................................................
1. Mg egyszer a reprezentcirl .........................................................................................
2. Az elsrend logika szintaxisa s szemantikja ................................................................
2.1. Az elsrend logika modelljei ..............................................................................
2.2. Szimblumok s interpretcik ............................................................................
2.3. Termek ..................................................................................................................
2.4. Atomi mondatok ...................................................................................................
2.5. sszetett mondatok ...............................................................................................
2.6. Kvantorok .............................................................................................................
2.7. Univerzlis kvantor ( ) ........................................................................................
2.8. Egzisztencilis kvantor ( ) ..................................................................................
2.9. Egymsba gyazott kvantorok ..............................................................................
2.10. Az s az kapcsolata .....................................................................................
v
147
148
152
153
154
157
160
160
161
162
162
163
164
164
164
164
164
166
166
169
175
176
177
180
183
185
186
187
188
189
191
193
193
195
195
199
199
200
201
203
203
204
205
208
209
209
212
216
216
219
219
221
222
222
223
223
223
224
225
226
2.11. Egyenlsg .........................................................................................................

3. Az elsrend logika hasznlata .........................................................................................
3.1. Kijelentsek s lekrdezsek az elsrend logikban ...........................................
3.2. A rokonsgi trgyterlet .......................................................................................
3.3. Szmok, halmazok s listk ..................................................................................
3.4. A wumpus vilg ....................................................................................................
4. Tudstervezs az elsrend logikban ..............................................................................
4.1. A tudstervezs folyamata ....................................................................................
4.2. Az elektronikus ramkrk trgyterlete ..............................................................
4.3. A feladat meghatrozsa .......................................................................................
4.4. A relevns tuds sszegyjtse .............................................................................
4.5. A sztr meghatrozsa ........................................................................................
4.6. A trgyterlettel kapcsolatos ltalnos tuds kdolsa .........................................
4.7. A problmaspecifikus pldnyok kdolsa ..........................................................
4.8. Lekrdezsek megfogalmazsa a kvetkeztetsi eljrs fel ................................
4.9. Hibk kiszrse a tudsbzisbl ...........................................................................
5. sszefoglals ....................................................................................................................
5.2. Feladatok ..............................................................................................................
9. Kvetkeztets elsrend logikban ............................................................................................
1. tletlogikai kvetkeztets kontra elsrend logikai kvetkeztets ..................................
1.1. Kvantorokra vonatkoz kvetkeztetsi szablyok ...............................................
1.2. Redukls tletlogikra ........................................................................................
2. Egyests s kiemels ........................................................................................................
2.1. Egy elsrend kvetkeztetsi szably ...................................................................
2.2. Egyests ...............................................................................................................
2.3. Trols s visszakeress .......................................................................................
3. Elrefel lncols ..............................................................................................................
3.1. Elsrend hatrozott klzok .................................................................................
3.2. Egy egyszer elrefel lncolsi algoritmus .........................................................
3.3. Hatkony elrefel lncols ..................................................................................
3.3.1. Szablyok illesztse az ismert tnyekhez .................................................
3.3.2. Inkrementlis elrefel lncols ...............................................................
3.3.3. Irrelevns tnyek ......................................................................................
4. Htrafel lncols ..............................................................................................................
4.1. Egy htrafel lncolsi algoritmus ........................................................................
4.2. Logikai programozs ............................................................................................
4.3. A logikai programok hatkony megvalstsa ......................................................
4.4. Redundns kvetkeztets s vgtelen hurkok .......................................................
4.5. Korltozott logikai programozs ..........................................................................
5. Rezolci ..........................................................................................................................
5.1. Az elsrend logika konjunktv norml formja ..................................................
5.2. A rezolcis kvetkeztetsi szably .....................................................................
5.3. Pldabizonytsok .................................................................................................
5.4. A rezolci teljessge ...........................................................................................
5.5. Az egyenlsg kezelse ........................................................................................
5.6. Rezolcis stratgik ............................................................................................
5.6.1. Egysgpreferencia ....................................................................................
5.6.2. Tmogat halmaz .....................................................................................
5.6.3. Bemeneti rezolci ...................................................................................
5.6.4. Bennfoglals .............................................................................................
5.7. Ttelbizonytk .....................................................................................................
5.7.1. Egy ttelbizonyts szerkesztse ..............................................................
5.7.2. A Prolog kiterjesztse ..............................................................................
5.7.3. Ttelbizonytsok mint segdeszkzk ....................................................
5.7.4. A ttelbizonytsok gyakorlati felhasznlsa ...........................................
6. sszefoglals ....................................................................................................................
6.2. Feladatok ..............................................................................................................
10. Tudsbzis reprezentci ..........................................................................................................
vi
226
227
227
228
229
231
233
233
235
235
235
236
237
237
238
238
238
239
240
244
244
244
245
246
247
248
249
251
251
252
254
254
255
257
257
257
259
260
261
263
264
264
266
266
268
271
272
272
273
273
273
273
274
275
276
276
277
278
281
286
1. Ontolgiaszervezs ...........................................................................................................
2. Kategrik s objektumok .................................................................................................
2.1. Fizikai sszettel ...................................................................................................
2.2. Mrtkek ...............................................................................................................
2.3. Szubsztancik s objektumok ...............................................................................
3. Cselekvsek, szitucik s esemnyek ..............................................................................
3.1. A szitucikalkulus ontolgija ............................................................................
3.2. Cselekvsek lersa a szitucikalkulusban ..........................................................
3.3. A reprezentcis problma megoldsa .................................................................
3.4. A kvetkeztetsi keretproblma megoldsa ..........................................................
3.5. Id- s esemnykalkulus .......................................................................................
3.6. ltalnostott esemnyek ......................................................................................
3.7. Folyamatok ...........................................................................................................
3.8. Intervallumok .......................................................................................................
3.9. Foly esemnyek s objektumok ..........................................................................
4. Mentlis esemnyek s mentlis objektumok ...................................................................
4.1. A hiedelmek formlis elmlete .............................................................................
4.2. Tuds s hiedelem ................................................................................................
4.3. Tuds, id s cselekvs .........................................................................................
5. Az internetes bevsrls vilga .........................................................................................
5.1. Ajnlatok sszehasonltsa ...................................................................................
6. Kvetkeztet rendszerek kategrik szmra ...................................................................
6.1. Szemantikus hlk ................................................................................................
6.2. Ler logikk ........................................................................................................
7. Kvetkeztets alaprtelmezett informcival ....................................................................
7.1. Nyitott s zrt vilgok ...........................................................................................
7.2. Negls mint kudarc s stabil modell szemantika ................................................
7.3. Krlrs s alapeseti logika .................................................................................
8. Igazsg-karbantart rendszerek .........................................................................................
9. sszefoglals ....................................................................................................................
9.2. Feladatok ..............................................................................................................
11. Tervkszts ..............................................................................................................................
1. A tervksztsi problma ...................................................................................................
1.1. A tervksztsi problmk nyelve .........................................................................
1.2. Kifejezkpessg s kiterjesztsek .......................................................................
1.3. Plda: Lgi teherszllts ......................................................................................
1.4. Plda: A ptkerk problma .................................................................................
1.5. Plda: A kockavilg ..............................................................................................
2. Tervkszts llapottr-keresssel .....................................................................................
2.1. Elrefel keress az llapottrben .........................................................................
2.2. Htrafel keress az llapottrben ........................................................................
2.3. llapottr-keressi heurisztikk ...........................................................................
3. Rszben rendezett tervkszts ..........................................................................................
3.1. Plda a rszben rendezett tervksztsre ...............................................................
3.2. Rszben rendezett tervkszts ktetlen vltozkkal ............................................
3.3. Heurisztikk a rszben rendezett tervksztsre ....................................................
4. Tervksztsi grfok ..........................................................................................................
4.1. Tervksztsi grfok heurisztikus becslsekre ......................................................
4.2. A Graphplan algoritmus .......................................................................................
4.3. A Graphplan algoritmus lellsa ..........................................................................
5. Tervkszts tletlogikval ...............................................................................................
5.1. Tervksztsi problmk tletlogikai lersa ........................................................
5.2. Az tletlogikai lers bonyolultsga .....................................................................
6. A tervksztsi mdszerek elemzse .................................................................................
7. sszefoglals ....................................................................................................................
7.2. Feladatok ..............................................................................................................
12. Tervkszts s cselekvs a val vilgban ................................................................................
1. Id, temezs s erforrsok .............................................................................................
vii
286
288
289
290
292
293
293
295
296
297
298
299
301
302
303
304
304
306
306
307
310
311
311
314
316
316
318
319
321
322
323
328
334
334
335
336
338
338
339
340
340
341
342
344
347
349
350
350
352
353
355
356
356
358
360
361
361
363
369
369
1.1. temezs erforrskorltokkal .............................................................................

2. Hierarchikus feladathl tervkszts ................................................................................
2.1. A cselekvsdekompozcik reprezentcija .........................................................
2.2. A tervkszt mdostsa a dekompozcik kezelshez ......................................
2.3. Elemzs .................................................................................................................
3. Tervkszts s cselekvs nemdeterminisztikus problmakrkben .................................
4. Feltteles tervkszts ........................................................................................................
4.1. Feltteles tervkszts teljesen megfigyelhet krnyezetekben ............................
4.2. Feltteles tervkszts rszlegesen megfigyelhet krnyezetekben ......................
5. Vgrehajts monitorozsa s jratervezse .......................................................................
6. Folytonos tervkszts .......................................................................................................
7. Multigens tervkszts .....................................................................................................
7.1. Kooperci: kzs clok s tervek ......................................................................
7.2. Tbbtest tervezs ................................................................................................
7.3. Koordinl mechanizmusok .................................................................................
7.4. Versengs .............................................................................................................
8. sszefoglals ....................................................................................................................
8.2. Feladatok ..............................................................................................................
13. Bizonytalansg ..........................................................................................................................
1. Cselekvs bizonytalan tuds esetn ...................................................................................
1.1. Bizonytalan tuds kezelse ...................................................................................
1.2. Bizonytalansg s racionlis dntsek ..................................................................
1.3. Egy dntselmleti gens tervezse ......................................................................
2. Valsznsgi alapfogalmak .............................................................................................
2.1. lltsok ...............................................................................................................
2.2. Elemi esemnyek ..................................................................................................
2.3. A priori valsznsg ............................................................................................
2.4. Feltteles valsznsg .........................................................................................
3. Valsznsgi aximk .....................................................................................................
3.1. A valsznsgi aximk hasznlata ....................................................................
3.2. Ami a valsznsgi aximkat indokolja ............................................................
4. Teljes egyttes valsznsg-eloszlson alapul kvetkeztets .......................................
5. Fggetlensg .....................................................................................................................
6. A Bayes-ttel s hasznlata ...............................................................................................
6.1. Bayes ttelnek alkalmazsa: egyszer eset .........................................................
6.2. A Bayes-ttel alkalmazsa: tbb egyttes tny figyelembevtele ........................
7. A wumpus vilg jraltogatsa .........................................................................................
8. sszefoglals ....................................................................................................................
8.2. Feladatok ..............................................................................................................
14. Valsznsgi kvetkeztets .....................................................................................................
1. A tuds reprezentlsa bizonytalansg esetn ...................................................................
2. A Bayes-hlk szemantikja .............................................................................................
2.1. Az egyttes valsznsg-eloszls fggvny lersa ............................................
2.2. Feltteles fggetlensgi relcik Bayes-hlkban ................................................
3. Feltteles eloszlsok hatkony reprezentcija .................................................................
3.1. Bayes-hlk folytonos vltozkkal .......................................................................
4. Egzakt kvetkeztets Bayes-hlkban ..............................................................................
4.1. Kvetkeztets felsorolssal ...................................................................................
4.2. A vltoz elimincis algoritmus .........................................................................
4.3. Az egzakt kvetkeztets komplexitsa .................................................................
4.4. Csoportost algoritmusok ....................................................................................
5. Kzelt kvetkeztets Bayes-hlkban ............................................................................
5.1. Kzvetlen mintavtelezsi mdszerek ..................................................................
5.2. Kvetkeztets Markov-lnc szimulcival ...........................................................
6. Elsrend reprezentcik valsznsgi kiterjesztse ......................................................
7. Egyb mdszerek a bizonytalan krnyezetben trtn kvetkeztetshez .........................
7.1. Bizonytalansgi kvetkeztets szablyalap eljrsokkal ....................................
7.2. Az ismerethiny reprezentlsa: a DempsterShafer-elmlet ...............................
viii
371
373
374
376
378
380
382
382
386
389
393
396
397
398
399
400
400
401
404
408
408
408
410
411
411
412
412
413
414
415
416
417
418
421
422
422
423
425
428
429
430
434
434
436
436
440
440
441
444
444
447
449
449
450
450
455
457
460
461
463
7.3. A meghatrozatlansg reprezentlsa: fuzzy halmazok s logikk ......................

8. sszefoglals ....................................................................................................................
8.2. Feladatok ..............................................................................................................
15. Idbeli valsznsgi kvetkeztets .........................................................................................
1. Id s bizonytalansg ........................................................................................................
1.1. llapotok s megfigyelsek ..................................................................................
1.2. Stacionrius folyamatok s a Markov-felttel ......................................................
2. Kvetkeztets idbeli modellekben ..................................................................................
2.1. Szrs s elrejelzs .............................................................................................
2.2. Simts ..................................................................................................................
2.3. A legvalsznbb sorozat megtallsa ..................................................................
3. Rejtett Markov-modellek ..................................................................................................
3.1. Egyszerstett mtrix algoritmusok ......................................................................
4. Kalman-szrk ..................................................................................................................
4.1. Gauss-eloszlsok frisstse ...................................................................................
4.2. Egy egyszer egydimenzis plda ........................................................................
4.3. Az ltalnos eset ...................................................................................................
4.4. A Kalman-szrs alkalmazhatsga .....................................................................
5. Dinamikus Bayes-hlk ....................................................................................................
5.1. DBH-k ltrehozsa ...............................................................................................
5.2. Egzakt kvetkeztets DBH-kban ..........................................................................
5.3. Kzelt kvetkeztets DBH-kban .......................................................................
6. Beszdfelismers ...............................................................................................................
6.1. Beszdhangok .......................................................................................................
6.2. Szavak ...................................................................................................................
6.3. Mondatok ..............................................................................................................
6.4. Egy beszdfelismer ptse .................................................................................
7. sszefoglals ....................................................................................................................
7.2. Feladatok ..............................................................................................................
16. Egyszer dntsek meghozatala ...............................................................................................
1. Meggyzdsek s kvnsgok sszekapcsolsa bizonytalansg esetn ...........................
2. A hasznossgelmlet alapjai ..............................................................................................
2.1. Megktsek a racionlis preferencikra ................................................................
2.2. s aztn jtt a hasznossg .....................................................................................
3. Hasznossgfggvnyek .....................................................................................................
3.1. A pnz hasznossga ..............................................................................................
3.2. Hasznossgsklk s a hasznossg megbecslse ..................................................
4. Tbbvltozs hasznossgfggvnyek ...............................................................................
4.1. Dominancia ...........................................................................................................
4.2. A preferencik rendszere s a tbbattribtumos hasznossg ................................
5. Dntsi hlk ....................................................................................................................
5.1. Dntsi problmk reprezentlsa dntsi hlkkal .............................................
5.2. Dntsi hlk kirtkelse ....................................................................................
6. Az informci rtke .........................................................................................................
6.1. Egy egyszer plda ...............................................................................................
6.2. Egy ltalnos kplet ..............................................................................................
6.3. Az informci rtknek tulajdonsgai ................................................................
6.4. Egy informcigyjt gens megvalstsa ..........................................................
7. Dntselmleti szakrt rendszerek ..................................................................................
8. sszefoglals ....................................................................................................................
8.2. Feladatok ..............................................................................................................
17. Komplex dntsek meghozatala ...............................................................................................
1. Szekvencilis dntsi problmk ......................................................................................
1.1. Egy plda ..............................................................................................................
1.2. Optimalits szekvencilis dntsi problmkban .................................................
2. rtkiterci ......................................................................................................................
2.1. Az llapotok hasznossga .....................................................................................
ix
464
465
465
469
473
473
473
474
476
477
479
481
482
483
485
486
487
489
490
491
492
495
496
499
500
502
504
506
507
508
510
513
513
514
514
516
517
517
519
520
521
522
524
524
525
526
527
527
529
529
530
532
533
534
538
538
538
541
542
543
2.2. Az rtkiterci algoritmus ...................................................................................

2.3. Az rtkiterci konvergencija ...........................................................................
3. Eljrsmd-iterci ...........................................................................................................
4. Rszlegesen megfigyelhet Markov dntsi folyamatok ..................................................
5. Dntselmleti gensek .....................................................................................................
6. Tbbgenses dntsek: a jtkelmlet ..............................................................................
7. Mkdsi md tervezs .....................................................................................................
8. sszefoglals ....................................................................................................................
8.2. Feladatok ..............................................................................................................
18. Megfigyelsek alapjn trtn tanuls ......................................................................................
1. Tanulsi formk ................................................................................................................
2. Induktv tanuls .................................................................................................................
3. Dntsi fk megalkotsa tanulssal ...................................................................................
3.1. Cselekv komponensknt hasznlt dntsi fk .....................................................
3.2. A dntsi fk kifejezkpessge ...........................................................................
3.3. A dntsi fk pldk alapjn trtn felptse ....................................................
3.4. Attribtumteszt-vlaszts .....................................................................................
3.5. A tanul algoritmus teljestmnynek becslse ....................................................
3.6. Zaj s tlilleszkeds ..............................................................................................
3.7. A dntsi fk alkalmazhatsgnak kiterjesztse .................................................
4. Hipotzishalmaz egyttes tanulsa ....................................................................................
5. Mirt mkdik a tanuls: a tanuls szmtsi elmlete .....................................................
5.1. Hny pldra van szksg? ...................................................................................
5.2. Dntsi listk tanulsa ..........................................................................................
5.3. Elemzs .................................................................................................................
6. sszefoglals ....................................................................................................................
6.2. Feladatok ..............................................................................................................
19. A tuds szerepe a tanulsban ....................................................................................................
1. A tanuls logikai megfogalmazsa ....................................................................................
1.1. Pldk s hipotzisek ............................................................................................
1.2. A pillanatnyilag legjobb hipotzis keresse ..........................................................
1.3. Legkisebb megkts elv keress .........................................................................
2. A tuds szerepe a tanulsban .............................................................................................
2.1. Nhny egyszer plda .........................................................................................
2.2. Nhny ltalnos sma .........................................................................................
3. Magyarzatalap tanuls ...................................................................................................
3.1. ltalnos szablyok kinyerse pldkbl .............................................................
3.2. A hatkonysg javtsa .........................................................................................
4. Tanuls relevns informci alapjn .................................................................................
4.1. A hipotzistr meghatrozsa ...............................................................................
4.2. Tanuls relevns informci felhasznlsval ......................................................
5. Induktv logikai programozs ............................................................................................
5.1. Egy plda ..............................................................................................................
5.2. Fellrl lefel tanulsi mdszerek ........................................................................
5.3. Induktv tanuls inverz rezolcival .....................................................................
5.4. Felfedezs induktv logikai programozssal .........................................................
6. sszefoglals ....................................................................................................................
6.2. Feladatok ..............................................................................................................
20. Statisztikai tanulsi mdszerek .................................................................................................
1. Statisztikai tanuls .............................................................................................................
2. Teljes adattal trtn tanuls .............................................................................................
2.1. Maximum-likelihood paramtertanuls: diszkrt modellek .................................
2.2. Naiv Bayes-modellek ...........................................................................................
2.3. Maximum-likelihood paramtertanuls: folytonos eset ........................................
2.4. Bayes-paramtertanuls ........................................................................................
2.5. Bayes-hlstruktrk tanulsa ..............................................................................
3. Rejtett vltozkkal trtn tanuls: az EM algoritmus .....................................................
x
544
545
548
550
553
555
563
565
566
567
571
571
572
574
574
575
576
579
580
582
583
584
588
588
590
592
593
593
595
598
598
598
599
601
605
606
607
608
609
610
612
612
613
615
615
618
620
622
623
623
625
627
627
630
630
632
633
635
637
638
3.1. Nem ellenrztt osztlyozs: Gauss-eloszlsok keverknek tanulsa ................

3.2. Rejtett vltozkkal felptett Bayes-hlk tanulsa ..............................................
3.3. Rejtett Markov-modellek tanulsa ........................................................................
3.4. Az EM algoritmus ltalnos alakja .......................................................................
3.5. Bayes-hlstruktra tanulsa rejtett vltozk esetn ............................................
4. Pldnyalap tanuls .........................................................................................................
4.1. Legkzelebbi-szomszd modellek ........................................................................
4.2. Kernelmdszerek ..................................................................................................
5. Neurlis hlk ...................................................................................................................
5.1. A neurlis hl egysgei .......................................................................................
5.2. Hlstruktrk ......................................................................................................
5.3. Egyrteg elrecsatolt neurlis hlk (perceptronok) ..........................................
5.4. Tbbrteg elrecsatolt neurlis hlk .................................................................
5.5. Neurlis hlstruktrk tanulsa ...........................................................................
6. Kernelgpek ......................................................................................................................
7. Esettanulmny: kzzel rott szmjegyek felismerse ........................................................
8. sszefoglals ....................................................................................................................
8.2. Feladatok ..............................................................................................................
21. Megerstses tanuls ...............................................................................................................
1. Bevezets ..........................................................................................................................
2. Passzv megerstses tanuls ...........................................................................................
2.1. Kzvetlen hasznossgbecsls ...............................................................................
2.2. Adaptv dinamikus programozs ..........................................................................
2.3. Az idbeli klnbsg tanulsa ..............................................................................
3. Aktv megerstses tanuls ..............................................................................................
3.1. Felfedezs .............................................................................................................
3.2. Egy cselekvsrtk-fggvny tanulsa .................................................................
4. A megerstses tanuls ltalnost-kpessge ...............................................................
4.1. Alkalmazsok a jtkok terletn .........................................................................
4.2. Robotirnytsi alkalmazsok ...............................................................................
5. Stratgiakeress .................................................................................................................
6. sszefoglals ....................................................................................................................
6.2. Feladatok ..............................................................................................................
22. Kommunikci .........................................................................................................................
1. A kommunikci mint cselekvs ......................................................................................
1.1. A nyelv alapjai ......................................................................................................
1.2. A kommunikcit alkot lpsek .........................................................................
2. formlis nyelvtan az angol nyelv egy tredkre ..............................................................
2.1. Az 0 szkincse ....................................................................................................
2.2. Az 0 nyelvtana ....................................................................................................
3. Szintaktikai analzis (elemzs) ..........................................................................................
3.1. Hatkony elemzs .................................................................................................
4. Kiterjesztett nyelvtanok ....................................................................................................
4.1. Igk alkategrikba osztsa ..................................................................................
4.2. Kiterjesztett nyelvtanok generlkpessge .........................................................
5. Szemantikai rtelmezs .....................................................................................................
5.1. Az angol nyelv egy rszletnek szemantikja ......................................................
5.2. Id s igeid .........................................................................................................
5.3. Kvantifikls .........................................................................................................
5.4. Pragmatikus rtelmezs ........................................................................................
5.5. Nyelv generlsa DCG-kkel .................................................................................
6. Tbbrtelmsg s feloldsa .............................................................................................
6.1. A tbbrtelmsg feloldsa ..................................................................................
7. Szvegrts .......................................................................................................................
7.1. Utalsfelolds .......................................................................................................
7.2. Egy koherens szveg struktrja ..........................................................................
8. A nyelvtan indukcis tanulsa ...........................................................................................
9. sszefoglals ....................................................................................................................
xi
639
641
644
645
645
646
646
648
649
650
651
652
656
660
660
664
665
666
669
673
673
674
675
676
677
679
680
683
684
687
687
688
691
692
694
697
697
698
699
702
702
703
704
706
711
713
715
716
717
718
719
721
722
723
724
725
725
727
728
730

9.2. Feladatok ..............................................................................................................
23. Valsznsgi nyelv-feldolgozs ..............................................................................................
1. Valsznsgi nyelvi modellek .........................................................................................
1.1. Valsznsgi krnyezetfggetlen nyelvtanok .....................................................
1.2. PCFG-valsznsgek tanulsa ............................................................................
1.3. PCFG-szablystruktrk tanulsa .........................................................................
2. Informcikeress .............................................................................................................
2.1. Az IR-rendszerek rtkelse .................................................................................
2.2. Az IR-rendszerek tovbbfejlesztse ......................................................................
2.3. Az eredmnyhalmaz prezentlsa .........................................................................
2.4. Az IR-rendszerek megvalstsa ..........................................................................
3. Informcikinyers ...........................................................................................................
4. Gpi fordts ......................................................................................................................
4.1. Gpi fordt rendszerek ........................................................................................
4.2. Statisztikai gpi fordts .......................................................................................
4.3. Valsznsgek tanulsa gpi fordtshoz ............................................................
5. sszefoglals ....................................................................................................................
5.2. Feladatok ..............................................................................................................
24. Az szlels ................................................................................................................................
1. Bevezets ..........................................................................................................................
2. Kpalkots .........................................................................................................................
2.1. Lencsk nlkli kpek: a sttkamra ....................................................................
2.2. Lencserendszerek ..................................................................................................
2.3. A fny: a kpalkots fotometrija .........................................................................
2.4. Sznek: a kpalkots spektrlis fotometrija .........................................................
3. Elzetes kpfeldolgozsi mveletek .................................................................................
3.1. ldetektls ...........................................................................................................
3.2. A kp szegmentlsa ............................................................................................
4. D informci kinyerse .....................................................................................................
4.1. A mozgs ..............................................................................................................
4.2. Ktkamers (binokulris) trbeli lts ..................................................................
4.3. Textragradiensek ................................................................................................
4.4. rnyals ................................................................................................................
4.5. Kontrok ...............................................................................................................
5. Objektumok felismerse ....................................................................................................
5.1. Fnyessgalap felismers ....................................................................................
5.2. Jellemzalap felismers ......................................................................................
5.3. Az elhelyezkeds becslse ....................................................................................
6. Navigls s manipulls a lts segtsgvel ...................................................................
7. sszefoglals ....................................................................................................................
7.2. Feladatok ..............................................................................................................
25. Robotika ...................................................................................................................................
1. Bevezets ..........................................................................................................................
2. Robothardver .....................................................................................................................
2.1. rzkelk ..............................................................................................................
2.2. Beavatkoz szervek ..............................................................................................
3. rzkels a robotikban ....................................................................................................
3.1. Helymeghatrozs ................................................................................................
3.2. Trkpezs ............................................................................................................
3.3. Tovbbi rzkelsi tpusok ...................................................................................
4. Mozgstervezs .................................................................................................................
4.1. Konfigurcis tr ..................................................................................................
4.2. Celladekompozcis mdszerek ...........................................................................
4.3. Szkeletonizcis mdszerek .................................................................................
5. Bizonytalan mozgsok tervezse ......................................................................................
5.1. Robusztus mdszerek ...........................................................................................
6. Mozgs ..............................................................................................................................
xii
731
734
737
737
739
741
742
742
745
745
746
747
748
751
752
753
756
757
757
759
762
762
763
763
764
765
766
766
767
770
770
771
774
775
776
777
780
782
783
785
787
789
789
791
795
795
796
796
797
799
800
805
808
808
808
811
813
814
815
817
6.1. Dinamika s vezrls ............................................................................................

6.2. Potenciltr-vezrls .............................................................................................
6.3. Reaktv irnyts ...................................................................................................
7. Szoftverarchitektrk a robotikban .................................................................................
7.1. Alrendelt architektra .........................................................................................
7.2. Hromrteges architektra ....................................................................................
7.3. Robotprogramozsi nyelvek .................................................................................
8. Alkalmazsi terletek ........................................................................................................
9. sszefoglals ....................................................................................................................
9.2. Feladatok ..............................................................................................................
26. Filozfiai alapok .......................................................................................................................
1. Gyenge MI: Tudnak-e a gpek intelligensen cselekedni? .................................................
1.1. A kpessg hinybl vett rv ..............................................................................
1.2. A matematikai ellenvets ......................................................................................
1.3. A meghatrozatlansgbl vett rv .........................................................................
2. Ers MI: Tudnak-e tnylegesen gondolkodni a gpek? ....................................................
2.1. A testelme problma ...........................................................................................
2.2. Az agy a tartlyban ksrlet ...............................................................................
2.3. Az agyprotzis-ksrlet .........................................................................................
2.4. A knai szoba ........................................................................................................
3. A mestersges intelligencia fejlesztsnek etikai krdsei s kockzatai .........................
4. sszefoglals ....................................................................................................................
4.2. Feladatok ..............................................................................................................
27. MI: Jelen s jv .......................................................................................................................
1. genssszetevk ...............................................................................................................
2. gensarchitektrk ...........................................................................................................
3. Egyltaln a j irnyba haladunk? ....................................................................................
4. Mi van, ha az MI sikerrel jr? ...........................................................................................
A. Matematikai alapok ...................................................................................................................
1. A1. Bonyolultsganalzis s az O() jells ........................................................................
1.1. Aszimptotikus analzis ..........................................................................................
1.2. NP s az inherensen nehz problmk ..................................................................
2. A2. Vektorok, mtrixok s lineris algebra .......................................................................
3. A3. Valsznsgi eloszlsok ............................................................................................
B. Megjegyzsek a nyelvekrl s az algoritmusokrl .....................................................................
1. B1. Nyelvek definilsa BackusNaur-Formban (BNF) .................................................
2. B2. Az algoritmusok lersa pszeudokddal .....................................................................
3. B3. Online segdnyjts ....................................................................................................
C. Irodalomjegyzk ........................................................................................................................
D. Magyar nyelv szakirodalom .....................................................................................................
1. Mestersges intelligencia ltalnossgban ........................................................................
xiii
818
819
820
821
822
823
823
824
826
827
829
834
834
835
836
837
838
840
840
841
842
844
847
847
849
851
851
853
854
856
857
857
857
858
858
860
861
863
863
863
864
865
942
942
Az brk listja
1.1. Az MI nhny meghatrozsa ngy kategriba szervezve ......................................................... 1
1.2. Az idegsejt vagy neuron rszei. Minden neuron sejttestbl vagy szmbl ll, amely sejtmagot
tartalmaz. A sejttestbl gazik el nhny dendritnek nevezett s egy hossz, axonnak nevezett szl. Az
axon j messzire elr, sokkal messzebbre, mint ahogy ezt a jelen bra sugallja. Az axonok tipikusan 1 cm
hosszak (ez a sejttest tmrjnek 100-szorosa), de elrhetik az 1 m-t is. Egy neuron 10100 000 ms
neuronnal tart kapcsolatot a szinapszisoknak nevezett csatlakozsokon keresztl. A jeleket neuronrl
neuronra egy sszetett elektrokmiai reakci tovbbtja. A jelek rvid tvon szablyozzk az agy
aktivitst, hossz tvon pedig befolysoljk a neuronok helyzett s a kapcsoldsi rendszerket. gy
tartjk, e mechanizmusok kpezik az agyi tanuls alapjt. Az informcifeldolgozs zme az agykregben
trtnik, ami az agy kls rtege. A feldolgozs szervezeti egysge, gy tnik, egy kb. 0,5 mm-es
tmrj szvetoszlop, amelynek magassga az egsz kregre kiterjed, ez az embereknl kb. 4 mm. Egy
oszlop kb. 20 000 neuront tartalmaz. .................................................................................................. 9
1.3. A szmtgpek szmtsi erforrsainak (2003 krl) s az agy erforrsainak durva
sszehasonltsa. A knyv els kiadsa ta a szmtgpekre jellemz szmok legalbb egy 10-es
szorzval megnttek, s vrhat, hogy ez a nvekeds ebben az vtizedben is folytatdik. Az agyra
jellemz szmok az utbbi 10 000 vben nem vltoztak. ................................................................. 10
1.4. Egy konkrt problma, amelyet Evans ANALOGY programja megoldott ..................................... 16
1.5. Egy elrendezs a kockavilgban. A SHRDLU robot (Winograd, 1972) ppen sikeresen teljestette a
keresd meg azt a blokkot, ami a kezedben tartottnl magasabb, s tedd a dobozba utastst. ....... 16
2.1. Az gensek krnyezetkkel rzkelkn s beavatkozkon keresztl llnak kapcsolatban ...... 27
2.2. A porszvvilg mindssze kt helysznnel ............................................................................... 28
2.3. A 2.2. brn szerepl porszvvilg egy egyszer gensfggvnye rszleges tblzatos formban
28
2.4. Egy automatizlt taxi feladatkrnyezetnek TKB-lersa ....................................................... 32
2.5. Pldk genstpusokra s TKB-lersuk .................................................................................. 33
2.6. Pldk feladatkrnyezetekre s jellemzik ................................................................................ 35
2.7. A TBLZAT-VEZRLS-GENS program minden egyes j szlelsre meghvdik, s minden
alkalommal visszaad egy cselekvst. Sajt adatstruktrjban kveti nyomon az szlelsi sorozatot. 37
2.8. Egy egyszer reflexszer gens programja a ktllapot porszvkrnyezetben. A 2.3. brn megadott
gensfggvnyt valstja meg. .......................................................................................................... 38
2.9. Egy egyszer reflexszer gens sematikus diagramja ............................................................... 38
2.10. Egy egyszer reflexszer gens. A jelenlegi szitucira (amit az szlels hatroz meg) illeszked
felttel szably megkeressvel, majd a hozz tartoz cselekvs vgrehajtsval mkdik. ......... 39
2.11. Bels llapottal rendelkez reflexszer gens ......................................................................... 40
2.12. A modellalap reflexszer gens. Nyomon kveti a vilg jelenlegi llapott egy bels modellben.
Ezek utn a reflexszer genshez hasonlan vlaszt egy cselekvst. ............................................... 40
2.13. Egy modellalap, clorientlt gens. Nyomon kveti a vilg llapott s az elrend clok halmazt
is, s kivlaszt egy cselekvst, amely (vgs soron) cljainak elrshez vezet. ............................. 41
2.14. Egy modellalap, hasznossgalap gens. A vilg modellje mellett egy hasznossgfggvnyt is
alkalmaz, amely a vilg llapotaihoz rendelt preferenciit mri. Ezek utn olyan cselekvst vlaszt, amely
a legjobb vrhat hasznossghoz vezet, amit az sszes lehetsges vgllapot elfordulsi valsznsgvel
slyozott tlagolsval szmt ki. ..................................................................................................... 43
2.15. Tanul gensek egy ltalnos modellje ................................................................................... 44
3.1. Egy egyszer problmamegold gens. Elszr a clt s a problmt fogalmazza meg, majd a
problmt megold cselekvssorozatot keres, vgl a cselekvseket egyenknt vgrehajtja. Amikor ksz
vele, egy msik clt fogalmaz meg, s az egszet jrakezdi. Jegyezzk meg, hogy a cselekvssorozata
vgrehajtsa alatt az gens az rzkelseivel nem foglalkozik. Felttelezi, hogy az ltala megtallt
megolds mindig mkdkpes. ...................................................................................................... 51
3.2. Romnia egy rsznek sematikus orszgti trkpe .................................................................. 53
3.3. A porszvvilg llapottere. Az lek cselekvseket jelentenek: B = Balra, J = Jobbra, S = Szv. 54
3.4. A 8-as kirakjtk egy tipikus feladvnya ................................................................................. 55
3.5. Egy majdnem j megolds a 8-kirlyn problmra. (A megolds megkeresst az olvasra bzzuk.)
56
3.6. Az Arad s Bukarest kztti tkeressi problma rszleges keressi fi. A kifejtett csompontokat
rnykoltuk, a legenerlt, de mg ki nem fejtett csompontok vastagon keretezettek, a mg le nem
generlt csompontokat pedig halvny szaggatott vonalak jelzik. ................................................... 59
xiv
3.7. Az ltalnos fakeressi algoritmus informlis lersa ................................................................ 60

3.8. A keressi fa alapvet pt adatstruktri a csompontok. Minden csompontnak van szlje,
llapota s szmos adminisztrl adatmezeje. A nyilak a gyerekektl a szlkig mutatnak. ........... 60
3.9. Az ltalnos fakeressi algoritmus. (Vegyk szre, hogy a perem argumentumnak egy res sornak
kell lennie, s a sor tpusa befolyssal lesz a keress sorrendjre.) A MEGOLDS fggvny a szlmutatk
gykrig val kvetsvel kinyert cselekvssorozatot adja vissza. .................................................. 61
3.10. Szlessgi keress egy egyszer binris fban. Minden lpsnl a kvetkez kifejtend csompontot
egy marker jelzi. ............................................................................................................................... 63
3.11. A szlessgi keress id- s trignye. Az bra adatai b = 10-es elgazsi tnyezt, 10 000
csompont/percet s 1000 bjt/csompontot feltteleznek. .............................................................. 64
3.12. Mlysgi keress egy binris keressi fban. A kifejtett csompontok, amelyeknek a peremben
nincsenek kvetik, el is hagyhatk a memribl. Ezeket feketvel jelltk meg. A 3-as mlysg
csompontokrl felttelezzk, hogy nincsenek kvetik, valamint azt is feltesszk, hogy M az egyetlen
clcsompont. ................................................................................................................................... 65
3.13. A mlysgkorltozott keress rekurzv implementcija ........................................................ 66
3.14. Az iteratvan mlyl keressi algoritmus mlysgkorltozott keresst alkalmaz ismtelten, nvekv
mlysgkorlttal. Az algoritmus megll, ha a megoldst megtallja, vagy ha a mlysgkorltozott keress
kudarccal tr vissza, jelezve, hogy megolds nem ltezik. ............................................................... 67
3.15. Az iteratvan mlyl keressi algoritmus ngy itercija egy binris fn .............................. 68
3.16. A ktirny szlessgi keress sematikus brja. Az brn a kt keressi irny majdnem tallkozik,
amikor a kiindul csompontbl kinyl egyik g sszer egy a clcsompontbl kinyl msik ggal.
69
3.17. A keressi stratgik rtkelse. b az elgazsi tnyez, d a legseklyebb megolds mlysge, m a
keressi fa maximlis mlysge, a mlysgkorlt. A fels indexszel jelzett kiktsek a kvetkezk: a
teljes, ha b vges; b teljes, ha a lpskltsg , pozitv -ra; c optimlis, ha a lpskltsgek mind
azonosak; d ha mindkt irnyban szlessgi keresst hasznlunk. .................................................... 70
3.18. Egy exponencilisan nagyobb keressi ft generl llapottr. (a) Egy olyan llapottr, amelyben kt
lehetsges cselekvs vezethet A-bl B-be, kett B-bl C-be s gy tovbb. Ez az llapottr d+1 llapotot
tartalmaz, ahol d a maximlis mlysg. (b) Az (a) llapottr megfelel keressi fja, 2 d ggal, amely az
llapotr 2d tjnak felel meg. (c) Egy ngyzetrcs. A kezdeti (A) llapottl ktlpsnyire fekv
llapotokat szrke sznnel jelltk. ................................................................................................... 71
3.19. Az ltalnos grfkeres algoritmus. A zrt halmazt egy hash-tblval lehet implementlni, hogy az
ismtelt llapotokat hatkonyan ellenrizni tudjuk. Ez az algoritmus felttelezi, hogy az s llapothoz
vezet els t a legolcsbb (lsd szveg). ........................................................................................ 71
3.20. A porszvvilg nyolc lehetsges llapota ............................................................................... 73
3.21. A determinisztikus, szenzor nlkli porszvvilg hiedelmi llapotternek hozzfrhet rsze.
Minden rnyalt doboz egyetlenegy hiedelmi llapothoz tartozik. Minden pillanatban az gens egy konkrt
hiedelmi llapotban tartzkodik, azonban nem tudja, hogy melyik fizikai llapotban van. A kezdeti
hiedelmi llapot (a teljes tudatlansg) legfell kzpen helyezkedik el. A cselekvseket a cmkzett nyilak
jellik. Az nhurkokat a nagyobb ttekinthetsg rdekben az brbl kihagytuk. ....................... 73
3.22. Egy elrendezs sokszgakadlyokkal ...................................................................................... 79
4.1. A hLMT rtkei a lgvonalbeli tvolsgok Bukarestig ............................................................... 83
4.2. A moh legjobbat-elszr keress lpsei Bukarest esetn a lgvonalban mrt tvolsgot (hLMT)
alkalmazva. A csompontok a sajt h-rtkeikkel vannak felcmkzve. .......................................... 83
4.3. Az A* keress lpsei Bukarest keresse sorn. A csompontok az f = g + h rtkekkel vannak
felcmkzve. A h-rtkek a Bukaresttl lgvonalban mrt tvolsgokat jellik, melyeket a 4.1. brbl
vettnk t. ......................................................................................................................................... 86
4.4. Romnia trkpe. Az bra Arad mint kiindul llapot esetn az f = 380, f = 400 s f = 420 rtkekhez
tartoz hatrvonalat mutatja. Egy adott hatrvonalon belli csompontokhoz a hatrvonal rtknl kisebb
f kltsg tartozik. .............................................................................................................................. 88
4.5. A rekurzv legjobbat-elszr keress algoritmusa ..................................................................... 90
4.6. Az RLEK lpsei, mikzben a legrvidebb utat keresi Bukarest fel. A mindenkori rekurzv hvs fkorlt rtke a mindenkori aktulis csompont felett lthat. (a) A Rimnicu Vilcen t vezet utat az
algoritmus addig kveti, amg az aktulis legjobb levl (Piteti) rtke nem lesz rosszabb, mint a legjobb
alternatv t rtke (Fogaras). (b) A rekurzi visszalp s az elfelejtett alfa legjobb levlrtkt (417)
Rimnicu Vilcenl feljegyezzk. Majd Fogaras kifejtse kvetkezik 450-nel, mint a legjobb levlrtkkel.
(c) A rekurzi visszalp. Az elfelejtett alfa legjobb levlrtkt (450) Fogarasnl jegyezzk fel.
Kvetkezik Rimnicu Vilcea kifejtse. Ezttal, mivel a legjobb alternatv t (Temesvron keresztl) 447-be
kerl, a kifejts folytatdik Bukarest fel. ........................................................................................ 91
4.7. A 8-as kirakjtk egy tipikus feladata. A megolds 26 lps hossz. ...................................... 94
xv
4.8. A keressi kltsg s az effektv elgazsi tnyez sszehasonltsa ITERATVAN-MLYL-KERESS

s A* esetn h1 s h2 hasznlatval. Az adatokat klnbz hosszsg megoldsokra a 8-as kirakjtk
100 egyedt megoldva tlagolva kaptuk. .......................................................................................... 94
4.9. A 4.7. brn lthat 8-as kirakjtk eset egy rszproblmja. A feladat az, hogy 1, 2, 3 s 4 lapkt a
helyes pozcikba juttassuk el, nem trdve azzal, hogy a tbbi lapkval mi fog trtnni. ............. 97
4.10. Egy egydimenzis llapottrfelszn, ahol a magassg a clfggvnynek felel meg. A cl a globlis
maximum megtallsa. A hegymsz keress az aktulis llapotot mdostja a javuls irnyban, ahogy
ezt a nyl is mutatja. A klnbz topografikus jellemzkkel a szvegben foglalkozunk. .............. 98
4.11. A hegymsz keressi algoritmus (a legmeredekebb emelked (steepest ascent) vltozat) a loklis
keress alapvet mdszere. Minden lpsben az aktulis csompontot a legjobb szomszdjval cserli le,
ami ebben a vltozatban a legmagasabb RTK- szomszdot jelenti. Ha azonban egy h heurisztikus
kltsgbecslst alkalmazunk, ez akkor a legalacsonyabb h-j szomszd lenne. ............................... 99
4.12. (a) A 8-kirlyn problma h = 17 heurisztikus kltsgbecsls llapota, ahol minden olyan kvet
llapot h rtkt megadtuk, amikor a kirlynt a sajt oszlopban mozgatjuk. A legjobb lpseket
bejelltk. (b) Egy loklis minimum a 8-kirlyn trben. Az llapot h rtke egysgnyi, azonban minden
kvetnek magasabb a kltsge. ..................................................................................................... 100
4.13. Annak illusztrlsa, hogy a gerinc mirt jelent nehzsget a hegymsz keress szmra. Az
llapotok rcshlzata (stt krk) r van illesztve a balrl jobbra emelked gerincre, egy olyan loklis
maximum sorozatot eredmnyezve, ahol a maximumok nincsenek kzvetlen mdon egymssal
sszekapcsolva. Minden egyes loklis maximumbl az sszes lehetsges cselekvs a lejtn lefel mutat.
101
4.14. A szimullt lehts keressi algoritmus. A hegymsz keress egy olyan vltozata, ahol lefel tart
lpsek is megengedettek. A lefel tart lpseket a lehtsi terv elejn inkbb, az id mlsval egyre
kevsb fogadjuk el. A lehtsi terv, mint az eljrs bemenete, a T rtkeit mint idfggvnyt adja meg.
102
4.15. A genetikus algoritmus. Az (a)-beli kezdeti populcit (b)-ben fitness-fggvny alapjn
rangsoroljuk, aminek eredmnyt a (c)-ben lthat reprodukl prok adjk. A ltrehozott utdok a (d)ben lthatk, melyekre mg hat a mutci (e). ............................................................................... 104
4.16. A 4.15. (c) brn lthat els kt szlnek s a 4.15. (d) brn lthat kt utdnak megfelel 8kirlyn llapotok. Az rnyalt oszlopok a keresztezds sorn elvesznek, a nem rnyalt oszlopok
megmaradnak. ................................................................................................................................ 104
4.17. Egy genetikus algoritmus. Ez az algoritmus ugyanaz, mint amelyet a 4.15. brn mutattunk, egy
kivtellel. Ebben a jobban elterjedt vltozatban a kt szl reprodukcija nem kt, hanem csak egy utdot
hoz ltre. ......................................................................................................................................... 105
4.18. Egy egyszer labirintusproblma. Az gens S-nl kezd s C-t kell elrnie, a krnyezetrl azonban
semmit sem tud. .............................................................................................................................. 109
4.19. (a) Kt olyan llapottr, amely az online keres genst egy zskutcba viheti. (b) Egy ktdimenzis
krnyezet, amely arra ksztetheti az online keres genst, hogy a clhoz legkevsb hatkony utat
kvesse. Akrmit is vlaszt az gens, az ellensg eltorlaszolja az tjt egy msik hossz, vkony fallal
gy, hogy a kvetett t sokkal hosszabb lesz, mint a legjobb lehetsges t. .................................. 110
4.20. Egy mlysgi feltrst hasznl online keres gens. Az gens csak a ktirny keressi terekben
alkalmazhat. .................................................................................................................................. 111
4.21. Egy krnyezet, amelyben a vletlen vndorlsnak exponencilisan sok lpsre lesz szksge, hogy a
clt megtallja ................................................................................................................................. 113
4.22. A TRTA* t itercija egydimenzis llapottrben. Minden llapotot H(s)-sel, a cl elrsnek
aktulis becslsvel, s minden lt a lpskltsggel cmkztnk. Az rnyalt llapot az gens helyt jelli
meg, s a frisstett rtkeket minden iterciban bekarikztuk. ...................................................... 113
4.23. A TRTA* gens a cselekvseit a krnyez llapotok rtkei alapjn vlasztja ki, mely az llapotokat
az llapottrben mozogva folyamatosan frissti .............................................................................. 114
5.1. (a) Ausztrlia llamai s terletei. A trkp kisznezse tekinthet knyszerkielgtsi problmnak is.
A cl az, hogy minden egyes rszhez olyan sznt talljunk, amely nem azonos egy szomszdos rsz
sznvel sem. (b) A trkpsznezsi problma knyszergrfknt reprezentlva. ............................ 123
5.2. (a) Egy betrejtvny. Mindegyik bet klnbz szmjegyet jell, a rejtvny clja olyan
szmjegyeket helyettesteni a betk helyre, amelyekkel a kiadd sszeg aritmetikailag helyes lesz (azzal
a kln megktssel, hogy nem kezd nullk nem megengedettek). (b) A betrejtvny knyszerhipergrfja
a MindKl knyszer s az oszloponknti sszeadsi knyszerek feltntetsvel. A knyszereket ngyzet
alak dobozok jellik. Minden doboz azzal a vltozval van sszektve, amelyre a doboz ltal jelzett
knyszer vonatkozik. ...................................................................................................................... 125
5.3. Egy egyszer visszalpses keressi algoritmus knyszerkielgtsi problmkhoz. Az algoritmus a 3.
fejezet rekurzv mlysgi keresjn alapul. A HOZZRENDELETLEN-VLTOZ-KIVLASZTSA s a
xvi
TARTOMNY-RTKEK-SORRENDEZSE fggvnyek hasznlhatk a szvegben bemutatott ltalnos cl
heurisztikk megvalstsra. ......................................................................................................... 126

5.4. Rszlet a keressi fbl, amelyet az egyszer visszalpses keress generlt az 5.1. brn bemutatott
trkpsznezsi problmhoz .......................................................................................................... 126
5.5. Az egyes CSP-algoritmusok teljestmnye klnbz problmk megoldsban. Az algoritmusok
balrl jobbra haladva a kvetkezk: egyszer visszalpses, MRV-heurisztikval bvtett visszalpses,
elrenz ellenrzs, MRV-heurisztikval kiegsztett elrenz ellenrzs s a minimlis konfliktusok
loklis keresse. Az egyes cellkban a problma megoldsa sorn elvgzett konzisztencia-ellenrzsek
szma tallhat (t futtats medinrtkbl meghatrozva); figyeljnk fel arra, hogy a kt jobb fels cella
kivtelvel mindegyik rtk ezrekben van megadva (ezt jelzi a K bet). Az els problma az Amerikai
Egyeslt llamok 50 llamt tartalmaz trkp ngy sznnel trtn sznezse. A tbbi problma a
(Bacchus s van Run, 1995)-bl szrmazik (1. tblzat). A msodik problma az n-kirlyn megoldshoz
szksges ellenrzsek szma (n rtkeire 2-tl 50-ig sszegezve). A harmadik az 5.13. feladatban is
szerepl zebrarejtvny. A maradk kett mestersges vletlenszeren generlt problmk. (A minkonfliktusok algoritmus ezeken nem futott.) Az eredmnyek azt rzkeltetik, hogy az MRV-heurisztikval
kombinlt elrenz ellenrzs mindegyik problma esetn jobban teljest, mint a tbbi visszalpses
algoritmus, de nem minden esetben jobb a min-konfliktusokat hasznl helyi keressnl. ........... 126
5.6. A trkpsznezs folyamata elrenz ellenrzses keress esetn. Az els hozzrendels az NyA =
vrs, majd az elrenz ellenrzs trli a vrs rtket a szomszdos T s DA vltozk tartomnyaibl.
A Q = zld hozzrendels utn a zld is kikerl az T, DA s DW vltozk tartomnyaibl. A V = kk-et
kveten a kk is trldik a DA s DW vltozk tartomnyaibl, s DA szmra nem marad megengedett
rtk. ............................................................................................................................................... 129
5.7. Az AC-3 lkonzisztencia algoritmus. Az AC-3 alkalmazst kveten vagy mindegyik l
lkonzisztens, vagy nhny vltoz tartomnya res, azaz a knyszerkielgtsi problma nem hozhat
lkonzisztens alakra (teht nem oldhat meg). Az AC-3 nevet az algoritmus kitallja (Mackworth,
1977) vezette be, mert ezt az algoritmust mutatta be cikkben harmadikknt. ............................... 129
5.8. A MIN-KONFLIKTUSOK algoritmus knyszerkielgtsi problmk megoldsra loklis keresssel. A
kezdeti llapotot vletlenszeren vlasztjuk ki, vagy egy moh hozzrendelsi folyamat segtsgvel,
amely minden egyes sorra kerl vltoznak egy minimlis-konfliktus rtket vlaszt. A KONFLIKTUSOK
fggvny megszmolja az adott rtk ltal megsrtett knyszerek szmt (adottnak tekintve az aktulis
hozzrendelsek fennmarad rszt). ............................................................................................. 133
5.9. Egy ktlpses megolds a 8-kirlyn problmra a MIN-KONFLIKTUSOK felhasznlsval. Mindegyik
fzisban egy kirlynnek keresnk j oszlopot. A konfliktusok szmt (esetnkben a tmad pozciban
lv kirlynk szmt) mindegyik ngyzetben feltntettk. Az algoritmus a kirlynket a MINKONFLIKTUSOK ngyzetre viszi, vletlenszeren trve fel ezzel a ktseket. ................................. 134
5.10. (a) Egy faszerkezet knyszerkielgtsi problma knyszergrfja. (b) Az A csompont gykrnek
tekintsvel konzisztens vltozk egy lineris rendezse. .............................................................. 135
5.11. (a) Az 5.1. brn szerepl eredeti knyszergrf. (b) A knyszergrf DA eltvoltst kveten. 135
5.12. Az 5.11. bra (a) rszn szerepl knyszergrf egy fa dekompozcija ................................ 136
6.1. A 3 3-as ambajtk (rszleges) keressi fja. A legfels csompont a kiindul llapot. MAX lp
elszr, egy X-et tve valamelyik res ngyzetbe. A keressi fa egy rszt mutatjuk, MIN (O) s MAX
vltakoz, egymst kvet lpseit megadva, amg el nem rjk a vgllapotokat, melyekhez a jtk
szablyai szerint lehet hasznossgi rtkeket hozzrendelni. ......................................................... 144
6.2. Egy lpsvltsos jtkfa. A csompontok MAX lpseit, mg a csompontok MIN lpseit jellik.
A vgcsompontok a hasznossgi fggvnnyel szmtott hasznossgi rtkeket MAX szemszgbl
mutatjk, mg a tbbi csompontnl a minimax rtkt jelltk be. MAX legjobb lpse a gykrben a1,
mert ez vezet a legmagasabb minimax rtk kvethz. MIN legjobb vlasza b1, mert ez vezet a minimlis
minimax rtk kvethz. ............................................................................................................ 145
6.3. Egy algoritmus a minimax dntsek kiszmtsra. Az algoritmus a lehet legjobb lpshez tartoz
opertort adja vissza, vagyis ahhoz a lpshez tartoz opertort, amelyik a legnagyobb hasznossgi
rtkkel rendelkez eredmnyre vezet, felttelezve, hogy az ellenfl gy jtszik, hogy minimalizlja a
hasznossgi rtket. A MAX-RTK s MIN-RTK fggvnyek vgigmennek a teljes jtkfn, le egszen a
levlcsompontokig, hogy meghatrozzk a csompont felfel terjesztett rtkt. ....................... 147
6.4. Hrom jtkos (A, B, C) jtkfja a hrom els fl lps esetn. Minden csompontot az sszes
jtkos szemszegbl szmtott rtkkel cmkztk meg. A legjobb lpst a gykrnl jelltk be. 148
6.5. Az optimlis dnts kiszmtsnak lpsei a 6.2. brn lthat jtkfa esetn. Minden ponton a
lehetsges rtkek terjedelmt mutatjuk meg minden egyes csompont szmra. (a) A B csompont alatt
az els levlnek 3 az rtke. B teht, ami egy MIN csompont, legfeljebb 3 rtk. (b) A B alatti msodik
csompontnak 12 az rtke. MIN ezt a lpst elkerli, gy B rtke mg mindig legfeljebb 3. (c) A B alatti
harmadik levlnek 8 az rtke. B sszes kvetit lttuk mr, B rtke teht pontosan 3. Most azt
xvii
kvetkeztethetjk ki, hogy a gykr rtke legalbb 3, mert MAX-nak a gykrben 3-as rtk vlasztsa
van. (d) A C alatti els levlnek 2 az rtke. C teht, ami egy MIN csompont, legfeljebb 2 rtk. De mi
tudjuk mr, hogy B-nek 3 az rtke, MAX teht C-t soha nem fogja vlasztani. Azrt nem is rdemes C
tovbbi kvetit megvizsglni. Ez az alfa-bta nyess egy pldja. (e) A D alatti els levlnek 14 az
rtke, gy D rtke legfeljebb 14. Ez tbb mint MAX legjobb alternatvja (azaz 3), meg kell vizsglni ezrt
D kvetit. Jegyezzk meg, hogy most a gykr minden kvetje esetn rendelkeznk rtkkorlttal, a
gykr rtke legfeljebb 14. (f) D msodik kvetjnek rtke 5, gy tovbb kell folytatnunk a vizsglatot.
A harmadik kvet rtke 2, D rtke teht pontosan 2. MAX dntse a gykrnl, hogy B fel kell lpni, 3as rtkkel. ...................................................................................................................................... 149
6.6. Alfa-bta nyess: ltalnos eset. Ha m a Jtkos szmra jobb, mint n, akkor a jtk sorn sosem
fogunk elrni n-be. .......................................................................................................................... 150
6.7. Az alfa-bta keressi algoritmus. Ugyanazt a szmtst hajtja vgre, mint egy norml minimax
algoritmus a 6.3. brn, kivve kt sort a MAX-RTK s a MIN-RTK hvsokban, ahol az s a
rtkeket kezeli (s adminisztrlja e paramterek tadst). .......................................................... 152
6.8. Kt, kiss eltr sakktblalls. (a) Feketnek egy huszr s kt gyalog elnye van, s a jtkot
megnyeri. (b) Fekete veszt, miutn Fehr a vezrt leti. ............................................................. 154
6.9. A horizonthats. A fekete bstyval adott sorozatos sakk a horizonton tlra knyszerti az
elkerlhetetlen vezrr vltoztat lpst, s ezt a tblallst enyhn elnys llsknt tnteti fel Fekete
szmra, holott Fehr szmra ez egy biztos nyer lls. ............................................................... 155
6.10. Egy tipikus ostblalls. A jtk lnyege, hogy az egyik fl sszes bbujt eltvoltsuk a tblrl.
Fehr az ramutat jrsval egyez irnyban halad a 25-s fel, mg Fekete az ramutat jrsval
ellenttes irnyban, a 0 fel halad. Egy bbuval brmelyik helyre lehet lpni, kivve azokat a helyeket,
ahol az ellenflnek mr legalbb kt bbuja tallhat. Ha egy olyan helyre lpnk, ahol az ellenflnek egy
bbuja tallhat, akkor azt a bbut elfogtuk, s a lpkedst az elejrl kell jrakezdenie. Ennl a
tblallsnl Fehr pp most dobott 65-t, s ngy megengedett lps kzl vlaszthat: (510,511), (5
11,1924), (510,1016) s (511,1116). .................................................................................... 157
6.11. Egy ostblalls sematikus jtkfja ...................................................................................... 158
6.12. A levlrtkeken vgrehajtott sorrendrz transzformci megvltoztatja a legjobb lpst . 160
6.13. Egy olyan egylpsvltsos jtkfa, amire a minimax alkalmatlannak tnik ........................ 165
6.14. Egy egyszer jtk kiindul llsa. Az A jtkos indul elsnek. Mindkt jtkos felvltva lp s a
zsetonjt a szomszdos szabad helyre helyezheti, mindkt irnyban. Ha a szomszdos mez foglalt, akkor
a jtkos az ellenfl felett tugorhat a kvetkez szabad helyre, ha van ilyen. (Pldul ha A a 3-n s B a 2n van, akkor A visszalphet 1-re.) A jtknak vge, ha az egyik jtkos elri a tbla ellenttes vgt. Ha az
A jtkos elsnek ri el a 4-et, a jtk rtke +1, ha B jtkos ri el elsnek az 1-et, a jtk rtke az A
szmra 1. ..................................................................................................................................... 170
6.15. Az a helyzet, amikor az algoritmus eldnti, hogy lenyesheti-e az nj csompontot ................ 171
7.1. Egy ltalnos tudsbzis gens .............................................................................................. 176
7.2. Egy tipikus wumpus vilg. Az gens a bal als sarokban van. ................................................ 177
7.3. Az gens els lpse a wumpus vilgban. (a) A kezdeti helyzet a [Nincs, Nincs, Nincs, Nincs, Nincs]
rzkelse utn. (b) Az els lps utn, rzkelve a [Nincs, Szell, Nincs, Nincs, Nincs]-et. ......... 179
7.4. Kt ksbbi helyzet az gens elrehaladsa sorn. (a) A harmadik lpst kveten, miutn [Bz,
Nincs, Nincs, Nincs, Nincs]-et rzkelt. (b) Az tdik lps s a [Bz, Szell, Csillogs, Nincs, Nincs]
rzkelse utn ................................................................................................................................ 180
7.5. Lehetsges modelljei a csapda jelenltnek az [1, 2], [2, 2] s [3, 1]-ben, ha adott a megfigyels, hogy
az [1, 1]-ben semmi s a [2, 1]-ben szell rezhet. (a) A tudsbzis s 1(nincs csapda[1, 2]-ben)
modelljei. (b) A tudsbzis s 2(nincs csapda[2, 2]-ben) modelljei. ............................................ 182
7.6. A mondatok az gens fizikai konfigurcii, s a kvetkeztets az a folyamat, amely j fizikai
konfigurcikat hoz ltre rgiekbl. A logikai kvetkeztetsnek biztostania kell, hogy az j konfigurcik
olyan aspektusait reprezentljk a vilgnak, amelyek tnylegesen is kvetkeznek azokbl az
aspektusokbl, amelyeket a rgi konfigurcik reprezentlnak. .................................................... 183
7.7. tletkalkulus-beli mondatok BNF (BackusNaur-forma) nyelvtana ...................................... 184
7.8. Az t logikai sszektjel igazsgtblja. Amikor a tblt hasznljuk pldul a P Q rtknek
szmtsra, ha P igaz s Q hamis, akkor elszr megkeressk azt a sort, amelyben P igaz s Q hamis (a
harmadik sor). Ezutn a sorban megkeressk a P Q alatti oszlopot, hogy megtalljuk az eredmnyt:
igaz. Tekinthetjk a tblzat gy is, hogy minden sor egy modell, s az egyes oszlopbeli elemek az adott
sorban azt mondjk meg, hogy a megfelel mondat igaz-e az adott modellben. ............................ 186
7.9. A tudsbzis alapjn ptett igazsgtbla lthat az brn. A TB igaz, ha Sz1-tl s Sz5-ig igaz, amely a
128 sorbl csak 3-ban fordul el. Mind a 3 sorban C1,2 hamis, teht nincsen csapda az [1, 2]-ben. Viszont
lehet, hogy van csapda [2, 2]-ben (br lehet, hogy nincs). ............................................................. 187
xviii
7.10. Egy igazsgtbla felsorol algoritmus tletkalkulus llts vonzatnak eldntsre. Az IT az

igazsgtblt jelli. A IK-IGAZ? igazat ad vissza, ha a mondatot tartalmazza a modell. A modell vltoz
reprezentl egy rszleges modellt, egy hozzrendelst a vltozk egy rszhez. A KIEGSZT (P, igaz,
modell) fggvny egy j rszleges modellt ad vissza, amelyben P rtke igaz. ............................. 187
7.11. Standard logikai ekvivalencik. Az , , szimblumok tetszleges tletkalkulus mondatokat
jellnek. .......................................................................................................................................... 188
7.12. Egy egyszer rezolcis algoritmus az tletkalkulushoz. Az IK-REZOLVLS a kt bemenetknt
megkapott llts rezolvlsbl szrmaz sszes lehetsges klz halmazt adja vissza. .............. 194
7.12. Az IK-REZOLCI algoritmus rszleges alkalmazsa egy egyszer wumpus vilgbeli
kvetkeztetsre. A fels sor els ngy klza alapjn szrmaztatjuk a P1,2-t. ................................ 194
7.14. Elrefel lncols algoritmus az tletkalkulus szmra. Az agenda tartalmazza azokat a
szimblumokat, amelyek ismerten igazak, de mg nem dolgoztk fel ket. A szmol tbla kveti, hogy
az egyes implikciknak hny premisszja ismeretlen. Ha az agendrl egy j p szimblumot
feldolgozunk, minden olyan implikci szmllja cskken eggyel, amelynek premisszjban p
megjelenik. (Ez megoldhat konstans idben, ha a TB megfelelen indexelt.) Ha a szmll elri a nullt,
azaz az implikci minden premisszja ismert, akkor az implikci konklzijt hozz lehet adni az
agendhoz. Vgl szksgnk van arra, hogy kvessk melyik szimblumot dolgoztuk mr fel; egy
kikvetkeztetett szimblumot nem kell hozzadni az agendhoz, ha azt mr korbban sikeresen
feldolgoztuk. gy elkerlhet a redundns munka, s megakadlyozza a vgtelen ciklusok kialakulst,
amelyet olyan implikcik okozhatnak, mint a P Q s Q P. .................................................. 196
7.15. (a) Egyszer Horn-klzokbl ll tudsbzis. (b) Ugyanez a tudsbzis S-VAGY grfknt. 197
7.16. A DPLL algoritmus tletkalkulus mondatok kielgthetsgnek ellenrzse. A TISZTASZIMBLUM-KERESS s az EGYSG-KLZ-KERESS eljrsokat a szvegben elmagyarztuk; mindkett
egy szimblummal vagy nullval tr vissza, s a szimblumhoz hozzrendelend igazsgrtkkel. Mint az
IT-VONZAT? eljrs, ez is rszleges modelleken dolgozik. ............................................................. 200
7.17. A WALKSAT algoritmus, kielgthetsgnek ellenrzse vletlenszeren cserlgetetett vltoz
rtkekkel. Szmos vltozata ismert az algoritmusnak. .................................................................. 201
7.18. (a) A grafikon a klz/szimblum arny fggvnyben annak valsznsgt mutatja, hogy n = 50
mondat kzl vletlenszeren vlasztott 3-CNF mondat kielgthet-e. (b) A grafikon a DPLL s a
WALKSAT algoritmusok futsi idinek kzprtkt mutatja 100 kielgthet 3-CNF mondaton n = 50
mellett, a kritikus m/n arny melletti szk svban. ......................................................................... 202
7.19. (Egy wumpusvilg-beli gens programja, amely tletkalkulust hasznl a csapdk, a wumpusok s a
biztonsgos ngyzetek azonostsra. Az TVONAL-PROBLMA szubrutin ltrehoz egy keressi problmt,
aminek megoldsa egy cselekvssorozat, amely elvezet az [x, y] ngyzetbl az [i, j]-be, s csak korbban
mr ltogatott ngyzeteken vezet keresztl. ................................................................................... 203
7.20. Egy ramkralap, wumpusvilg-beli gens egy rsze, a bemeneteket s a kimeneteket mutatva, az
arany megragadst megvalst ramkr, s az ramkr, amely meghatrozza, hogy a wumpus l-e. A
regisztereket ngyzet jelli, s a ksleltetket kis hromszgek mutatjk. .................................... 205
7.21. Egy ramkr, amely meghatrozza, hogy az gens az [1, 1]-ben van-e. Minden pozci s orientci
regiszterhez egy hasonl ramkr csatlakozik. ............................................................................... 206
8.1. Formlis nyelvek, valamint azok ontolgiai s ismeretelmleti hozzrendelsei .................... 219
8.2. Egy t objektumot kt binris relcit, hrom egyelem relcit (cmkkkel jelezve az
objektumokon) s egy egyargumentum fggvnyt, bal lb tartalmaz modell ......................... 220
8.3. Az elsrend logika (egyenlsggel kiegsztett) szintaxisa BackusNaur-forma jellseivel. (Lsd az
1. szakasz - B1. Nyelvek definilsa BackusNaur-Formban (BNF) rszben, ha ez a jells ismeretlen.)
A szintaxis szigor a zrjelezs tekintetben; a zrjelekrl s az opertori elsbbsgrl a 3.1. szakasz Szintaxis rszben szerepl megjegyzsek ugyangy vonatkoznak az elsrend logikra is. ......... 221
8.4. Egy C1-es digitlis ramkr, amelynek az a clja, hogy egy egybites teljes sszeadst vgezzen. Az
els kt bemenet az a kt bit, amit ssze kell adni, mg a harmadik bemenet az tvitel. Az els kimenet az
sszeg, mg a msodik kimenet az tvitel a kvetkez sszead fel. Az ramkr kt XOR, kt AND s
egy OR kaput tartalmaz. ................................................................................................................. 235
8.5. Egy tipikus csaldfa. Az = szimblum a hzastrsakat kti ssze, a nyilak a gyerekekre mutatnak.
242
8.6. Egy ngybites sszead ........................................................................................................... 243
9.1. Az egyestsi algoritmus. Az algoritmus sszehasonltja a bemenetek felptst elemrl elemre. A
helyettests, amely az EGYESTS argumentuma, tkzben pl fel, s arra hasznljuk, hogy
meggyzdjnk arrl, hogy a ksbbi sszehasonltsok konzisztensek lesznek az ltalunk elzleg
ltrehozott lektsekkel. Egy sszetett kifejezsben, mint pldul az F(A, B), a VL fggvny kiveszi az F
fggvnyszimblumot, s az ARGOK fggvny kiveszi az (A, B) argumentumlistt. ...................... 248
xix
9.2. (a) A bennfoglalsi hl, amelynek a legalacsonyabb csompontja ez a mondat: Alkalmaz(AIMA.org,

Richrd). (b) A bennfoglalsi hl arra a mondatra, hogy: Alkalmaz(Jnos, Jnos). .................... 250
9.3. Egy koncepcionlisan egyszer, de kevss hatkony elrefel lncolsi algoritmus. Minden egyes
iterciban hozzadja a TB-hez az sszes atomi mondatot, amelyet egy lpsben az implikcis
mondatokbl s a TB-ben mr meglv atomi mondatokbl kikvetkeztethetnk. ....................... 252
9.4. Az elrefel lncols algoritmus ltal generlt bizonytsi fa a bntny pldra. A kiindul tnyek az
als sorban jelennek meg, az els iterciban kikvetkeztetett tnyek a kzps sorban, mg a msodik
iterciban kikvetkeztetett tnyek a legfels sorban. .................................................................... 253
9.5. (a) Ausztrlia trkpnek kisznezst bemutat knyszergrf (5.1. bra). (b) A trkpsznez
knyszerkielgtsi problma egy hatrozott klzzal reprezentlva. Vegyk szre, hogy a vltozk
trgyterlete a KL-re megadott alaptnyek konstansai ltal implicit mdon definiltak. .............. 255
9.6. Egy egyszer htrafel lncolsi algoritmus ............................................................................ 257
9.7. Egy htrafel lncolssal ltrehozott bizonytsi fa, annak bizonytsra, hogy West egy bnz. A ft
mlysgi keresssel kell kirtkelni, balrl jobbra. Hogy bebizonytsuk a Bnz(West) klzt, be kell
bizonytanunk az alatta elhelyezked ngy konjunktot is. Nhnyan kzlk megtallhatk a
tudsbzisban, mg msok tovbbi htrafel lncolst ignyelnek. Mindegy egyes sikeres egyests
lektseit lthatjuk a megfelel rszcl mellett. Jegyezzk meg, hogy mihelyt egy konjunkciban egy
rszcl sikeres, helyettestseit a kvetkez rszclokhoz alkalmazzuk. gy teht, mire az ERL-HLKRDEZ eljut az utols konjunkciig, az eredetileg Ellensges(z)-ig, az mr a Nono-hoz lesz lektve. 258
9.8. A Csatol prediktum fordtsnak pszeudokdos reprezentcija. Az J-VLTOZ fggvny egy j
vltozt ad vissza, amely klnbzik a korbban visszaadott vltozktl. A HV (folytats) eljrs folytatja
a vgrehajtst a megadott folytatssal. ........................................................................................... 261
9.9. (a) Az A-bl a C-be vezet tvonal megtallsa a Prologot egy vgtelen hurokba vezetheti. (b) Egy
grf, amelyben minden csompontot kt vletlenszer kvetkez rtegbeli csomponthoz kapcsolunk a
kvetkez rtegben. Egy tvonal megtallsa az A1-bl a J4-be 877 kvetkeztetst ignyel. ......... 262
9.10. (a) Az A-bl a C-be vezet tvonal bizonytsa. (b) Vgtelen mlysg bizonytsi fa, amely akkor
generldik, ha a klzok rossz sorrendben vannak. .................................................................... 262
9.11. Egy rezolcis bizonyts arra, hogy West bnz ............................................................... 266
9.12. Egy rezolcis bizonytsa annak, hogy a Kvncsisg lte meg a macskt. Figyeljk meg a
faktorls hasznlatt a Szereti(G(Jank), Jank) klz szrmaztatsnl. ..................................... 268
9.13. A rezolciteljessg bizonytsnak a szerkezete .................................................................. 269
9.14. Az OTTER ttelbizonyts vzlata. A heurisztikus kontrollt alkalmazzk a legknnyebb klz
kivlasztsra s a FILTER funkciban, amely kitrli a jelentktelen klzokat a tovbbi vizsglatbl. 274
10.1. A vilg ontolgijnak felsbb szintjei, amelyek a fejezetben ksbb trgyalt tmkat mutatjk.
Minden l azt jelzi, hogy az als fogalom a fels fogalom egy specializldsa. .......................... 287
10.2. Szitucikalkulusban minden szituci (az S0-t kivve) valamilyen cselekvs eredmnye ... 294
10.3. ltalnostott esemnyek. Az univerzumnak trbeli s idbeli dimenzija van. Ezen az brn csak
egy trbeli dimenzit mutatunk. Minden esemny az univerzum Rsze. Az olyan esemny, mint a
MsodikVilgHbor a tr-id egy tartomnyban trtnik, melynek hatrai kiss szabadon vlaszthatk,
s idben vltozk. Egy Intervallum, mint amilyen a HuszadikSzzad, rgztett s korltos idbeli,
valamint maximlis trbeli kiterjedssel rendelkezik. A Hely, amilyen pldul Ausztrlia, nagyjbl
rgztett trbeli s maximlis idbeli kiterjedssel rendelkezik. .................................................... 299
10.4. sszetett esemnyek brzolsa. (a) T(Mindkett(p, q), i), mskppen T(p o q, i), (b) T(Egyik(p, q),
i), (c) T(VagyVagy(p, q), i). ............................................................................................................ 301
10.5. Az idintervallumok prediktumai ........................................................................................ 302
10.6. Az Elnk(USA) objektum smaszer brzolsa ltezsnek els 15 vben ....................... 303
10.7. Egy absztrakt online bolt weblapja, ahogy egy bngszt hasznl ember ltja (fell), s a hozz
tartoz HTML-fzr, ahogy azt a bngsz vagy a vsrl gens ltja (alul). A HTML-ben a < s a >
kztti karakterek a jell direktvk, amelyek meghatrozzk, hogy a lapot hogyan kell kijelezni. Az
<i>Vlasszon</i> fzr pldul jelzi, hogy dlt betre kell tkapcsolni, a Vlasszon szt kijelezni s a dlt
bet hasznlatt befejezni. Egy lapazonost, mint amilyen a http://absz-bolt.com/zene az n. egysges
erforrs azonost (uniform resource locator, URL).Az <a href="url">hivatkozs</a> bejells jelzi,
hogy az url fel ltesteni kell egy hipertextkapcsolatot a hivatkoz szveg (anchor text) hivatkozssal.
307
10.8. (a) A termkkategrik taxonmija. (b) Ezen kategrik szmra a hivatkoz szvegek. .. 309
10.9. Egy szemantikus hl ngy objektummal (Jnos, Mria, 1 s 2) s ngy kategrival. A relcikat a
cmkzett lek jellik ...................................................................................................................... 312
10.10. A szemantikus hl egy rszlete, amely a Repl(Shankar, NewYork, jdelhi, Tegnap) logikai llts
reprezentcijt valstja meg ........................................................................................................ 313
10.11. A lersok szintaxisa a CLASSIC nyelv egy rszhalmazban ............................................... 315
xx
10.12. Horn-klzok egy halmaznak Clark-lezrsa. Az eredeti Horn-program (balra) ngy tantrgyat
emlt explicit mdon, s azt is lltja, hogy minden egszre a 101 s a 130 kztt ltezik egy matematikai
trgy, meg azt is, hogy minden SZT trgyhoz a 100-as (BSc) sorozatban ltezik egy megfelel tantrgy a
200-as (MSc) sorozatban. A Clark-lezrs (jobbra) azt mondja, hogy ms tantrgy nincs is. A lezrssal s
az egyedi elnevezsek felttelezssel (valamint az Egsz prediktum nyilvnval defincijval) egytt
eljutunk a kvnt konklziig, miszerint pontosan 36 tantrgy van: 30 matematikai s 6 SZT trgy. 317
11.1. A Strips s az ADL nyelv sszehasonltsa a tervksztsi feladatok reprezentcijnak
szempontjbl. Mindkt esetben a clok gy viselkednek, mint egy paramterek nlkli cselekvs
elfelttelei. .................................................................................................................................... 337
11.2. A STRIPS-problma replterek kztti lgi teherszlltsi feladathoz ................................ 338
11.3. Az egyszer ptkerk problma ............................................................................................ 338
11.4. A kockavilg tervksztsi problmja: egy hrom kockbl ll torony ptse. A [Mozgat(B,
Asztal, C), Mozgat(A, Asztal, B)] cselekvssor egy lehetsges megolds. ...................................... 340
11.5. A tervkszts kt megkzeltse. (a) Elrefel (progresszv) llapottr-keress, a kiindul llapotbl
indulva s a problma cselekvseit hasznlva halad a cl fel. (b) Visszafel (regresszis) llapottrkeress: valsznsgi llapot keress (lsd 6.1. szakasz - Szenzor nlkli problmk rszben) a
clllapot(ok)bl indulva a cselekvsek inverzt alkalmazva keresi visszafel a kezdeti llapotot. 341
11.6. Egy rszben rendezett terv a zokni s a cip felvtelhez, s a hat lehetsges sorba rendezs a
teljesen rendezett tervhez ................................................................................................................ 344
11.7. Az egyszer kerkcsere problma ......................................................................................... 347
11.8. A nem teljes rszben rendezett terv a kerkcsere problmhoz, miutn megvlasztottuk a
cselekvseket az els kt nyitott elfelttelhez. A dobozok cselekvseket testestenek meg, a bal oldalon
az elfelttelekkel, a jobb oldalon pedig a kvetkezmnyekkel. (Az Indt cselekvst kivve a
kvetkezmnyeket elhagytuk.) A fekete nyilak az okozati kapcsolatokat mutatjk, melyek a nyl fejnl
szerepl lltst vdik. .................................................................................................................... 347
11.9. A terv alakulsa, az Otthagyjszakra vlasztsa utn, amit a Ott(LaposKerk, Tengely) elrshez
vlasztottunk. Hogy elkerljk az tkzst az Ott(Ptkerk, Csomagtart)-t vd, az Eltvolt(Ptkerk,
Csomagtart)-bl indul okozati kapcsolattal, az Otthagyjszakra cselekvst egy rendezsi megktssel
az Eltvolt(Ptkerk, Csomagtart) el helyeztk, amit a szaggatott nyllal jelltnk. ................ 348
11.10. A kerkcsere problma vgs megoldsa. Vegyk szre, hogy az Eltvolt(Ptkerk, Csomagtart)
s az Eltvolt(LaposKerk, Tengely) tetszleges sorrendben vgrehajthat a Felszerel(Ptkerk, Tengely)
eltt. ................................................................................................................................................ 349
11.11. A legyen sti s egynk is problma ................................................................................ 351
11.12. A legyen sti s egynk is problma tervksztsi grfja az S2 szintig. A tglalapok az akcikat
jelentik (a kicsi ngyzetek a megrz cselekvsek), az egyenesek az elfeltteleket s a kvetkezmnyeket
jellik. A klcsns kizrsokat velt szrke vonalak jellik. ........................................................ 351
11.13. A GRAPHPLAN algoritmus. A GRAPHPLAN algoritmus egy megolds kinyer s egy grf-bvt lps
kztt alternl. A MEGOLDS-KINYERS a befejezstl visszafel keresve ellenrzi, hogy tallhat-e
megolds. A GRF-BVTS adja a cselekvseket az adott szinthez s az llapotliterlokat a kvetkezhz.
......................................................................................................................................................... 353
11.14. A kerkcsere problma tervksztsi grfja az S2 szintre bvts utn. A mutex kapcsolatokat szrke
vonalak jellik. Csak nhny fontos mutexet mutatunk, mert az bra olvashatatlann vlna, ha az sszeset
jellnnk. A megoldst megvastagtott vonalak s kiemelsek jellik. .......................................... 354
11.15. A SATPLAN algoritmus. A tervksztsi feladatot egy konjunktv norml formj mondatra fordtjuk
le, amelyben minden cl egy megadott T idpillanatban teljesl, s T-ig minden lpsre tartalmazza az
aximkat. (A fordts rszleteit a szvegben rjuk le.) Ha a kielgthetsgi algoritmus tall modellt,
akkor a tervet a modellben az igaz rtket kapott tletlogikai szimblumokhoz tartoz cselekvsek
kinyersvel kapjuk meg. Ha nem ltezik modell, akkor a folyamatot ismteljk, a clt egy lpssel
ksbbre mozgatva. ........................................................................................................................ 356
11.16. A Sussman-anomlia kockavilg tervksztsi problma .................................................... 365
11.17. Shakey vilga. Shakey kpes egy szobn bell mozogni, t tud menni a szobk kztti ajtkon, fel
tud mszni trgyakra, el tudja tolni a mozdthat trgyakat, valamint a villanyt tudja kapcsolni. . 366
12.1. A kt aut sszeszerelst tartalmaz temezsi feladat. A jellsben az Idtartam(d) jelentse,
hogy egy cselekvs d percet vesz ignybe. A Motor(E1, C1, 60) jelentse az, hogy az E1 egy motor, ami a
C1 alvzba illeszthet s 60 perc alatt szerelhet be. ...................................................................... 369
12.2. A 12.1. brn szerepl temezsi problma megoldsa. Az bra tetejn a rszben rendezett terv
megoldsa lthat. Minden cselekvs hozza a tglalap aljn lthat, a legkorbbi s a legksbbi kezdsi
idkkel [ES, LS] a bal fels sarokban. A kt szm kztt klnbsg a cselekvs mozgstere, a 0
mozgster cselekvsek a kritikus tvonalon vannak, melyeket vastag vonallal jellnk. Az bra aljn
ugyanezen megolds idrendjt lthatjuk. A szrke tglalapok azt az intervallumot jellik, ami alatt a
xxi
cselekvs vgrehajthat, felttelezve, hogy a sorrendezsi megktseket betartjuk. A szrke tglalapok

nem felhasznlt, nem kitlttt terletei a mozgsteret jellik. ........................................................ 370
12.3. Kt aut sszeszerelsnek temezsi feladata erforrsokkal. Egy sszeszerel lloms, egy
kerkszerel-lloms s kt vizsglbiztos az sszes elrhet erforrs. Az ERFORRS:r jells jelentse,
hogy az r erforrst egy cselekvs vgrehajtsa alatt hasznljuk, de a cselekvs befejezse utn jra
szabad. ............................................................................................................................................ 372
12.4. A 12.3. bra erforrsokat is tartalmaz temezsi feladatnak megoldsa. Az bra bal szle az
erforrsokat sorolja fel, a cselekvsek az ltaluk hasznlt erforrsokkal egy sorban jelennek meg. Attl
fggen, hogy melyik sszeszerels hasznlja a motorszerel-llomst elszr, kt lehetsges temezs
ltezik. Mi az optimlis megoldst brzoltuk, ami 115 percet vesz ignybe. ............................... 372
12.5. A Hzatpt cselekvs egy lehetsges dekompozcija ........................................................ 374
12.6. A hzptsi problma cselekvseinek lersa s a Hzatpt cselekvs rszletes dekompozcija. A
lersok a pnzzel kapcsolatban egy egyszerstett, az ptkkel kapcsolatban egy optimista nzetet
alkalmaznak. ................................................................................................................................... 375
12.7. Egy magas szint cselekvs dekompozcija egy ltez tervben. A Hzatpt cselekvst a 12.5. bra
dekompozcijval helyettestjk. A Telek kls elfelttelt a mr ltez TelketVesz-bl kiindul okozati
kapcsolat biztostja. A Pnz kls elfelttel nyitott marad a dekompozcis lps utn, ezrt a
KlcsntVeszFel cselekvst szrjuk be. .......................................................................................... 376
12.8. Az O. Henrik trtnetbl kiragadott Mgusok ajndka problma egy inkonzisztens absztrakt tervet
mutat, ami azonban dekomponlhat egy konzisztens megoldsra. Az (a) bra a problmt mutatja be: egy
szegny hzasprnak csak kt rtkes tulajdona van. A frfinek egy aranyrja, a nnek pedig a gynyr
hossz haja. Mindketten azt tervezik, hogy ajndkot vsrolnak a msiknak, hogy az boldog legyen. A
frfi gy dnt, hogy az rjt egy ezstfsre cserli be, mg a n eladja a hajt, hogy aranylncot vegyen
az rhoz. (Felttelezzk, hogy a Fst ad cselekvs elfelttele a Haj, mivel ha a felesgnek nincs
hossz haja, a cselekvs nem ri el a kvnt hatst, hogy boldogg tegye; s hasonlkppen a Lncot ad
cselekvsre.) A (b) brn szerepl rszleges terv inkonzisztens, mert a Fst ad s Lncot ad absztrakt
lpsek nem sorrendezhetk konfliktus nlkl. (c) Dekomponljuk a Fst ad lpst egy beilleszt terv
metdussal. A dekompozci els lpsben a frj megszerzi a fst, s odaadja felesgnek, mikzben az
rt egy ksbbi idpontban adja oda fizetsgl. A msodik lpsben az rt tadja, s a ktelezettsget
teljesti. Egy hasonl mdszer dekomponlja a Lncot ad lpst. Amg mindkt odaad lpst a
szlltsi lps el sorrendezzk, ez a dekompozci megoldja a feladatot. (Vegyk szre, hogy ez azon
mlik, hogy a lnc hasznlata az rhoz vagy a fs hasznlata a hajhoz boldogsgot okoz mg akkor is,
ha a tulajdonjogot mr elvesztettk.) .............................................................................................. 378
12.9. A dupla-Murphy porszvvilg keressi fjnak els kt szintje. Az llapotcsompontokban s a
VAGY csompontokban cselekvseket kell vlasztani. A valsznsgi csompontok, amelyeket krkkel
jelltnk S csompontok, ahol, ahogy azt a kimen gakon szerepl v is jelli, minden kimenetelt
kezelni kell. A megoldst vastag vonallal jelltk. ........................................................................ 383
12.10. Egy algoritmus a nemdeterminisztikus krnyezetek ltal generlt S-VAGY grfok keressre.
Felttelezzk, hogy az LLAPOTTMENET fggvny a cselekvsek egy listjt adja vissza, melyek
mindegyike egy lehetsges kimenetel halmazhoz tartozik. A cl egy feltteles terv megtallsa, ami
brmilyen krlmnyek kztt elr egy clllapotot. ..................................................................... 384
12.11. A tripla-Murphy porszvvilg keressi grfjnak els szintje, ahol a ciklusokat explicit
megjelltk. A problma sszes megoldsa ciklikus terv. ............................................................. 385
12.12. A vltakoz dupla-Murphy porszvvilg S-VAGY grfjnak egy rszt mutatja be, melyben a
tiszta ngyzetet elhagy gens piszkot hagyhat maga utn. Az gens nem tudja rzkelni a ms
ngyzetben lev piszkot. ................................................................................................................. 387
12.13. Egy cselekvsmonitoroz s -jratervez gens. Ez szubrutinknt a TERVKSZT teljes llapottr
tervkszt algoritmust hasznlja. Ha a kvetkez cselekvs elfelttelei nem teljeslnek, az gens a
teljes_terv lehetsges p pontjain iterl olyat keresve, amelyhez a TERVKSZT tvonalat tud tervezni. Ezt
az tvonalat hvjuk javtsnak. Ha a TERVKSZT sikeres a javtsban, az j terv ksztshez sszefzi a
javtst s a terv p utni rszt. Az gens ezutn a terv els lpst adja vissza. ............................ 390
12.14. A vgrehajts eltt a tervkszt egy teljes_terv-nek nevezett tervet kszt, mely S-bl G-be vezet.
Az gens az E-vel jellt pontig vgrehajtja a tervet. A terv htralev rsznek vgrehajtsa eltt a
szoksos mdon ellenrzi az elfeltteleket, s azt tallja, hogy valjban az O llapotban van, s nem az
E-ben. Ezutn meghvja a tervkszt algoritmust, hogy ksztsen egy javts-t, mely egy terv az O-bl az
eredeti teljes_terv egy P pontjhoz. Az j terv ezutn a javts s a folytats (az eredeti teljes_terv
maradk rsze) sszefzsbl addik. .......................................................................................... 391
12.15. Az llapotok sora, amint a folytonos tervkszt gens megprblja a (d)-nek megfelel Rajta(C,
D) Rajta(D, B) clllapotot elrni. A kiindul llapot az (a). A (b) llapotnl egy msik gens
kzbelpett s (d)-t (b)-re helyezte. A (c) llapotban az gens a Mozgat(C, D) cselekvst hajtotta vgre,
xxii
ami sikertelen volt, (c)-t az (a)-ra ejtette. jraprblja a Mozgat(C, D) cselekvst, amivel elri a (d)
clllapotot. .................................................................................................................................... 394
12.16. A folytonos tervkszt gens ltal ksztett kiindul terv. A terv egyelre nem klnbzik egy
tlagos rszben rendezett tervkszt ltal ksztettl. .................................................................... 394
12.17. Miutn valaki ms elmozdtotta a D kockt a B-re, a Tiszta(B) s a Rajta(D, G) biztostsra
szolgl kapcsolatokat eldobjuk, ami ezt a tervet eredmnyezi ..................................................... 394
12.18. A Mozgat(C, D) ltal ltrehozott kapcsolatot helyettestettk az Indt kapcsolatval, a most mr
redundns Mozgat(D, B) lpst pedig elhagytuk ............................................................................ 395
12.19. A Mozgat(C, D) vgrehajtsa s a tervbl val eltvoltsa utn az Indt lps kvetkezmnyei azt a
tnyt tkrzik, hogy a C a vrt D helyett az A kockra kerlt. A Rajta(C, D) cl elfelttel mg minding
nyitott. ............................................................................................................................................. 395
12.20. A nyitott elfelttelt a Mozgat(C, D) ismtelt hozzadsval oldjuk fel. Vegyk szre az
elfelttelekhez szksges j kapcsolatokat. .................................................................................. 395
12.21. A Mozgat(C, D) vgrehajtsa s tervbl eltvoltsa utn a Rajta(C, D) megmaradt nyitott felttelt
az Indt lpsbl indul okozati kapcsolat hozzadsval oldjuk fel. A terv most teljes. ............... 395
12.22. A FOLYTONOS-RRT-GENS, egy folytonos, rszben rendezett tervkszt gens. Egy rzkels utn
az gens eltvolt egy lpssorozatot a folytonosan javtott tervbl, s visszaad egy cselekvst. Gyakran
szmos cselekvssor-eltvolt tervksztsi lpsre van szksg, mialatt csak a NoOp-ot adja vissza,
mieltt kszen llna egy vals cselekvs vgrehajtsra. ............................................................... 396
12.23. A pros tenisz problma. Kt gens egytt jtszik, s ngy pozci egyikben lehetnek: [Bal,
Alapvonal], [Jobb, Alapvonal], [Bal, Hl] s [Jobb, Hl]. A labda visszaadhat, ha pontosan egy
jtkos van a megfelel helyen. ...................................................................................................... 397
13.1. Dntselmleti gens, amely racionlis cselekvseket vlaszt ki. A lpseket a kvetkez t
fejezetben rszletezzk. .................................................................................................................. 411
13.2. Mivel az 1. gens meggyzdse nem kvetkezetes, ezrt a 2. gens tud gy tteket tenni, amely a
s b kimeneteltl fggetlenl biztostja, hogy az 1. gens vesztsen ............................................ 418
13.3. A Fogfjs, Lyuk, Beakads vilg egy teljes egyttes valsznsg-eloszlsa ...................... 418
13.4. A valsznsgi kvetkeztets egy olyan algoritmusa, amely valamely teljes egyttes valsznsgi
eloszls bejegyzseit veszi szmba ................................................................................................. 420
13.5. Kt plda nagymret egyttes eloszlsok kisebb eloszlsokra val felbontsra az abszolt
fggetlensg alapjn. (a) Az idjrs s a fogszati problmk fggetlenek. (b) A pnzfeldobsok
fggetlenek. .................................................................................................................................... 421
13.6. (a) Az gens beragad, miutn [1, 2]-ben s [2, 1]-ben is szellt szlel nincs feltrhat biztonsgos
hely. (b) A ngyzetek sztosztsa Ismert, Perem s Egyb csoportokba az [1, 3]-ra vonatkoz
lekrdezshez. ................................................................................................................................. 426
13.7. C2,2 s C3,1 peremvltozk, az egyes modellek C(perem) rtkt mutat konzisztens modelljei: (a)
hrom, kt vagy hrom csapdt jelz modell C1,3 = igaz mellett, s (b) kt, egy vagy kt csapdt jelz
modell C1,3 = hamis mellett. ............................................................................................................ 427
14.1. Egy egyszer Bayes-hl, amelyben az Idjrs fggetlen a tbbi hrom vltoztl, a Fogfjs s a
Beakads pedig felttelesen fggetlenek a Lyuk ismeretben ........................................................ 435
14.2. Egy tipikus Bayes-hl, amely a topolgit s a feltteles valsznsgi tblkat (FVT) is mutatja.
Az FVT-kben B, F, R, J s M szerepel Betrs, Fldrengs, Riaszts, JnosTelefonl s MriaTelefonl
helyett. ............................................................................................................................................ 435
14.3. A hl struktrja fgg a hozzads sorrendjtl. A csompontokat mindegyik hlhoz fellrl
lefel haladva adtuk hozz. ............................................................................................................. 438
14.4. (a) Az X csompont felttelesen fggetlen a nem leszrmazottaitl (Zij-ktl) a szlei (a szrke
terleten lthat Ui-k) ismeretben. (b) Az X csompont felttelesen fggetlen a hl sszes tbbi
csompontjtl a Markov-takarjnak ismeretben (a szrke terlet). .......................................... 440
14.5. Egy egyszer hl diszkrt (Tmogats s Vsrol) s folytonos (Terms s r) vltozkkal 442
14.6. Az (a) s (b) grafikonok az r valsznsg-eloszlst mutatjk a Terms fggvnyben s a
Tmogats igaz s hamis rtke mellett. A (c) diagram a P(r Terms) eloszlst mutatja, ami a kt aleset
sszegzseknt addik. ................................................................................................................... 443
14.7. (a) A Vsrls valsznsgnek probit eloszlsa az r ismeretben, = 6,0 s = 1,0 mellett. (b)
Logit eloszls hasonl paramterekkel. .......................................................................................... 443
14.8. A (14.3) egyenletben szerepl kifejezs struktrja. A kirtkels fentrl lefel halad, sszeszorozva
az rtkeket az egyes tvonalak mentn, s sszegezve a + csompontoknl. Vegyk szre, a j-hez s az
m-hez tartoz tvonalak megismtldst. ..................................................................................... 445
14.9. A felsorol algoritmus Bayes-hls lekrdezsek megvlaszolsra .................................... 446
14.10. A vltoz eliminls algoritmus Bayes-hls lekrdezsek megvlaszolsra ................... 448
xxiii
14.11. (a) Egy tbbszrsen sszekttt hl feltteles valsznsgi tblkkal. (b) Egy tbbszrsen
sszekttt hl csoportostott ekvivalense. ................................................................................... 450
14.12. Egy mintavtelez algoritmus, amely esemnyeket generl egy Bayes-hlbl ................. 451
14.13. Az elutast mintavtel algoritmusa, ami Bayes-hls lekrdezseket vlaszol meg bizonytkok
esetn .............................................................................................................................................. 452
14.14. A valsznsgi slyozs algoritmusa Bayes-hlban trtn kvetkeztetshez ................ 454
14.15. Az MCMC algoritmus Bayes-hlban trtn kzelt kvetkeztetshez .......................... 455
14.16. (a) Egy kt osztlyt (Professzor s Dik) ler RVM. Kt professzor s kt dik van, mindkt dik
konzulense KovcsProf. (b) Az (a)-beli RVM Bayes-hl ekvivalense. ........................................ 459
14.17. Egy Bayes-hl rszlete, ami egy olyan RVM-hez tartozik, amelyben a Konzulens(Jnos)
ismeretlen, de vagy KovcsProf, vagy MrProf. A konzulens vlasztsa az egyes professzorok
finanszrozstl fgg. Vegyk szre, hogy a Siker(Jnos) most mind a kt professzor Hrnev-tl fgg,
br a Konzulens(Jnos) rtke meghatrozza, hogy valjban melyiknek is van hatsa. ............... 460
14.18. Egy gpkocsi elektromos s motorikus rendszereinek rszeit ler Bayes-hl. Minden vltoz
binris, s az igaz rtk jelzi a megfelel funkci helyes mkdst. ............................................ 469
14.18. Hrom lehetsges hl a tvcsproblmra ......................................................................... 470
15.1. (a) Egy elsrend Markov-folyamathoz tartoz Bayes-hlstruktra. A reprezentlt Markovfolyamatban az llapotot az Xt vltozk definiljk. (b) Egy msodrend Markov-folyamat. ....... 475
15.2. Az esernys vilgot ler Bayes-hlstruktra s feltteles eloszlsok. Az lapottmenet-modell a
P(Est|Est1) feltteles valsznsg-eloszls, az rzkel modell a P(Esernytt|Est). ................. 476
15.3. A simts egy mltbeli k idpontban az llapot a posteriori P(Xk|e1:t) eloszlst szmtja ki egy teljes,
1-tl t-ig terjed megfigyels sorozat ismeretben ......................................................................... 479
15.4. Az elre-htra algoritmus, ami llapotok egy sorozatnak az a posteriori valsznsgeit szmtja ki
adott megfigyelsi sorozat ismeretben. Az ELRE s a HTRA mveleteket rendre a (15.3) s (15.7)
egyenletek definiljk. .................................................................................................................... 480
15.5. (a) Az Est lehetsges llapotsorozatait tekinthetjk egy tvezet tnak egy grfon, aminek
csompontjai a lehetsges llapotok az egyes idpontokban. (Az llapotokat ngyzetes csompont jelzi,
hogy flrerthetetlenl megklnbztessk ket egy Bayes-hl csompontjaitl.) (b) A Viterbialgoritmus mkdse az [igaz, igaz, hamis, igaz, igaz] megfigyelsi sorozatra. Minden t idpontra
feltntettk az m1:t zenet rtkeit, ami minden egyes t idpontbeli llapothoz megadja a legjobb, benne
vgzd sorozat valsznsgt. Minden egyes llapothoz egy vastag nyl is vezet, ami a legjobb eldjt
jelzi, a megelz sorozat valsznsgnek s az tmenet valsznsgnek a szorzata szerint. A vastag
nyilak visszafel kvetse az m1:5-beni legvalsznbb llapotbl pedig megadja a legvalsznbb
sorozatot. ........................................................................................................................................ 482
15.6. Egy lland d lpsnyi idklnbzettel simt algoritmus, folyamatos mkds (online)
algoritmusknt megvalstva: egy j idpontbeli megfigyelsre kiadja az j simtott becslst ...... 484
15.7. Egy Xt hely,
sebessg s Zt helymegfigyels alkotta lineris dinamikus rendszerhez tartoz
Bayes-hlstruktra ........................................................................................................................ 486
15.8. A Kalman-szrs frisstsi ciklusnak a lpsei egy vletlen bolyongs esetn. A vletlen bolyongs
a priori eloszlsa 0 = 0,0 s 0 = 1,0, az tmenet bizonytalansga x = 2,0, az rzkel bizonytalansga z
= 1,0, az els megfigyels pedig z1 = 2,5 (az x tengelyen csillaggal jellve).Vegyk szre, ahogy a P(x1)
elrejelzs ellapul a P(x0)-hoz kpest az tmenet bizonytalansga miatt. Vegyk azt is szre, hogy az a
posteriori P(x1|z1) kiss balra helyezkedik el a z1 megfigyelstl, mivel az tlag az elrejelzs s a
megfigyels slyozott tlaga. .......................................................................................................... 488
15.9. (a) A Kalman-szrs eredmnye egy XY skon mozg objektumnl, feltntetve a valdi (balrl
jobbra halad) plyagrbt, a zajos megfigyelsek egy sorozatt s a Kalman-szrs alapjn becslt
plyagrbt. A helybecslsek szrsait az ovlisok jelzik. (b) A Kalman-simts eredmnye ugyanarra a
megfigyelsi sorozatra. ................................................................................................................... 490
15.10. Egy fa fel repl madr (fellnzetben). (a) Egy Kalman-szr elrejelzse a madr helyzetre,
ami egyetlen Gauss-eloszls az akadly kzepre illesztve. (b) Egy valsghbb modell szmtsba veszi
a madr elkerl manvereit, s azt jelzi elre, hogy az egyik vagy a msik oldalon fog elszllni. 491
15.11. (a) Az esernys DBH-hoz tartoz a priori eloszls, az llapottmenet-modell s az rzkel modell
megadsa. Az sszes kvetkez szelet feltevsnk szerint az 1. szelet msolata. (b) Egy XY skon val
robotmozgshoz tartoz egyszer DBH. ........................................................................................ 493
15.12. (a) Fels grbe: az Akkumultort vrhat rtknek a plyagrbje egy olyan megfigyelsi
sorozatnl, ami csak 5-sket tartalmaz, kivve a 0-kat a t = 21 s a t = 22 idpontokban, egy egyszer
Gauss-hibamodell felhasznlsval. Als grbe: a plyagrbe, amikor a megfigyelsek 0-val folytatdnak
t = 21-tl. (b) Ugyanez a ksrlet az tmenetihiba-modellel elvgezve. Vegyk szre, hogy az tmeneti
hibt jl kezeli, de a vgleges hiba tlzott pesszimizmust eredmnyez. ......................................... 494
xxiv
15.13. (a) Az rzkel llapotvltozjt bemutat DBH-rszlet. Ez a vltoz szksges az

akkumultormr vgleges hibjnak a modellezsre. (b) Fels grbk: az Akkumultort vrhat
rtknek a plyagrbje az tmeneti hibj s a tarts hibj megfigyelsi sorozatoknl. Als
grbk: az AMHibs valsznsgnek plyagrbi a kt megfigyelsi sorozatnl. ...................... 495
15.14. Egy dinamikus Bayes-hl kibontsa: a szeletek ismtldnek befogadva a megfigyelsi sorozatot (a
halvny csompontok). Tovbbi szeleteknek mr nincs hatsa a megfigyelsi periduson belli
kvetkeztetsre. Ha a DBH-t kibontottuk, brmely kvetkeztetsi algoritmus hasznlhat vltoz
eliminls, egyestsi fa mdszerek s gy tovbb , ami a 14. fejezetben szerepel. ...................... 496
15.15. A rszecskeszrs algoritmus megvalstsa egy rekurzv frisstsi mvelettel s llapottal (ami a
mintk halmaza). A mintavtelez lpsek mindegyike az aktulis szelet vltozinak a mintavtelezst
jelenti egy topolgiai sorrendben, hasonlan, mint a PRIOR-MINTA-ban. A SLYOZOTT-MINTAVISSZATTELLEL mvelet megvalsthat O(N) vrhat futsi idvel. ......................................... 497
15.16. A rszecskeszrs frisstsi ciklusa az eserny DBH-nl N = 10 esetn, bemutatva minden egyes
llapot mintapopulcijt. (a) A t idpontban 8 minta jelez Es-t s 2 Es-t. Mindegyiket
tovbbterjesztjk a kvetkez llapottmenet-modell szerinti mintavtelezsvel. A t + 1 idpontban 6
minta jelez Es-t s 4 Es-t. (b) A t + 1 idpontban Eserny a megfigyels rtke. Mindegyik mintt
slyozzuk a mintnak a megfigyelsre vett feltteles valsznsgvel, amit a krk nagysga jelez. (c)
Egy j 10-es mintahalmaz generldott az aktulis halmazbl trtn slyozott sorsolssal, 2 olyan mintt
eredmnyezve, ami Es-t jelez, s 8 olyat, ami Es-t. .................................................................. 498
15.17. A DARPA fonetikus bc, avagy ARPAbet, amely az amerikai angolban hasznlt
beszdhangokat sorolja fel. Szmos alternatv felrs ltezik, kztk az International Phonetic Alphabet
(IPA), mely az sszes ismert nyelv beszdhangjt tartalmazza. ..................................................... 500
15.18. Az akusztikus jel talaktsa keretek sorozatv; mindegyik keretet hrom akusztikus jellemzvel
runk le ............................................................................................................................................ 501
15.19. A tomato sz kt kiejtsi modellje. Mindegyik modellt egy tmenetdiagramknt brzoljuk,
amiben az llapotokat krrel jelljk, a megengedett tmeneteket pedig nyilakkal, rajtuk a kapcsold
valsznsgekkel. (a) Egy nyelvjrsbeli klnbsgeket is tekintetbe vev modell. A 0,5-s rtkek a kt
szerz preferlt kiejtsein alapul becslsek. (b) Egy olyan modell, ami az els magnhangzn egy
koartikulcis hatst is figyelembe vesz, megengedve az [ow] vagy az [ah] beszdhangokat. ...... 503
15. Az [m] hromllapot beszdhang egy RMM-je. Mindegyik llapotnak szmos lehetsges kimenetele
lehet, klnll valsznsgekkel. A C1, , C7 VK-cmkk nknyesen lettek megvlasztva. ... 504
15.21. Az unigram s bigram szmllknak egy rszleges tblzata a jelen knyv (eredeti angol nyelv
kiadsnak) szavai alapjn. A the a leggyakoribb egyedlll sz 33 508 elfordulssal (513 893 sszes
szbl). A leggyakoribb bigram az of the, 3833 elfordulssal. Nhny szm nagyobb, mint vrhat
(pldul 4-szer fordul el az on is), mivel a bigram szmlls figyelmen kvl hagyja az elvlasztst:
egy mondat vgzdhet on-ra s a kvetkez kezddhet is-zel. ............................................... 505
15.22. Egy vlt Kalman-szr Bayes-hl reprezentcija. Az St vlt vltoz egy diszkrt
llapotvltoz, aminek az rtke meghatrozza az Xt folytonos llapotvltozk tmeneti modelljt.
Minden i diszkrt llapotra a P(Xt+1|Xt, St = i) llapottmenet-modell egy lineris Gauss-modell, pontosan
gy, mint egy szablyos Kalman-szrben. A diszkrt llapotok kzti P(St+1|St) llapottmenet-modellt
egy mtrixnak tekinthetjk, ahogyan egy rejtett Markov-modellben. ............................................ 511
16.1. (a) A cserk egy teljes ciklusa, bemutatva, hogy a nemtranzitv A B C A preferencik
irracionlis viselkedst eredmnyeznek. (b) A felbonthatsgi axima. ........................................ 515
16.2. A pnz hasznossga. (a) Empirikus adat Beard rtl egy korltos tartomnyban. (b) Egy tipikus
grbe a teljes tartomnyban. ........................................................................................................... 518
16.3. Szigor dominancia. (a) Determinisztikus: A-t szigoran dominlja B, de sem C, sem D nem. (b)
Bizonytalan: A-t szigoran dominlja B, de C nem. ...................................................................... 521
16.4. Sztochasztikus dominancia. (a) S1 sztochasztikusan dominlja S2-t a kltsgek vonatkozsban. (b) S1
s S2 negatv kltsgeinek eloszlsfggvnyei. ............................................................................... 521
16.5. Egy egyszer dntsi hlzat a repltr-elhelyezsi problmra ......................................... 524
16.6. A repltr-elhelyezsi problma egy egyszerstett reprezentcija. A kimeneti llapotokhoz
tartoz vletlen csompontok hatst kiszmtottuk, majd a csompontokat elhagytuk. ............... 526
16.7. Hrom ltalnos eset az informci rtkre. Az (a) esetben A1 majdnem teljes bizonyossggal jobb
marad A2-hz kpest, gy az informci nem szksges. A (b) esetben a vlaszts nem egyrtelm, s az
informci dnt fontossg. A (c) esetben a vlaszts bizonytalan, de igazbl nem szmt, gy az
informci is kevsb rtkes. ........................................................................................................ 528
16.8. Egy egyszer informcigyjt gens vza. Az gens folyamatosan a legnagyobb informcirtk
megfigyelst vlasztja, mindaddig, amg a kvetkez megfigyels kltsge kisebb, mint a vrhat haszna.
......................................................................................................................................................... 529
16.9. Az aortaszklet hatsdiagramja (Peter Lucas hozzjrulsval) .......................................... 531
xxv
17.1. (a) Egy egyszer 4 3-as krnyezet, ami az gens szmra szekvencilis dntsi problma. (b) A
krnyezet llapottmenet-modelljnek illusztrlsa: a szndkolt kimenetel 0,8 valsznsggel
kvetkezik be, de 0,2 valsznsggel az gens oldalra mozdul a szndkolt irnyhoz kpest. A fallal val
tkzskor nincsen mozgs. A kt vgllapot jutalma a jelzett +1 s 1, az sszes tbbi llapot jutalma
0,04. ................................................................................................................................................ 538
17.2. (a) Egy optimlis eljrsmd a sztochasztikus krnyezetre R(s) = 0,04 esetn nem vgllapotoknl.
(b) Optimlis eljrsmdok R(s) ngy klnbz rtktartomnya esetn. .................................... 540
17.2. Az llapotok hasznossgai a 4 3-as vilgban, = 1 s a nem vgllapotoknl R(s) = 0,04 esetn
543
17.4. Az rtkiterci algoritmus az llapotok hasznossgnak kiszmtsra. A lellsi felttel a (17.8)
egyenletbl szrmazik. ................................................................................................................... 545
17.5. (a) A grafikonokon kivlasztott llapotok hasznossgainak a fejldse lthat az rtkiterci
felhasznlsnl. (b) A szksges rtkitercik szma (k), hogy a hiba garantltan legfeljebb = cRmax
legyen, c klnbz rtkeinl, mint a leszmtolsi tnyez fggvnye. ................................... 545
17.6. A hasznossgbecsls maximlis hibja ||Ui U|| s az eljrsmd vesztesge
az optimlis
eljrsmdhoz viszonytva az rtkiterci iterciszmnak fggvnyben ................................ 547
17.7. Az eljrsmd-itercis algoritmus egy optimlis eljrsmd kiszmtsra ........................ 549
17.8. (a) Az gens elhelyezkedsnek kezdeti valsznsgi eloszlsa. (b) tszri Balra mozgs utn. (c)
tszri Fel mozgs utn. (d) tszri Jobbra mozgs utn. ............................................................ 550
17.9. Egy dinamikus dntsi hl ltalnos struktrja. Az ismert rtk vltozk rnykoltak. A jelenlegi
idpont t, s az gensnek el kell dntenie, hogy mit tegyen azaz vlasztania kell egy rtket At szmra.
A hl hrom jvbeli lpsre van kibontva, s a jvbeli jutalmakat, valamint az elrelt horizonton
lv llapot hasznossgt brzolja. ............................................................................................... 553
17.10. A 17.9. brn lthat DDH elrenz megoldsnak egy rsze .......................................... 554
17.11. (a) s (b): Minimax jtkfk a ktujjas snblijtkhoz, ha a jtkosok a fordulkban tiszta stratgit
jtszanak. (c) s (d): Parametrizlt jtkfk, ahol az els jtkos kevert stratgit jtszik. A jutalmak
fggnek a kevert stratgia (p s q) valsznsgi paramtereitl. (e) s (f): A valsznsgi paramter
brmely konkrt rtknl a msodik jtkos a kt cselekvs kzl a jobbikat fogja vlasztani, gy az
els jtkos kevert stratgijnak az rtkt a vastag vonal jelli. Az els jtkos a kevert stratgia
valsznsgi paramtert a metszspontnl fogja megvlasztani. ................................................. 560
18.1. (a) Plda (x, f(x)) rtkprok s egy velk konzisztens lineris hipotzis. (b) Egy ugyanazokkal az
adatokkal konzisztens hetedfok polinom. (c) Egy msik adathalmaz egy pontosan illeszked hatodfok
polinommal, illetve egy kzelt lineris illesztssel. (d) Egy egyszer szinuszos illeszts ugyanazokra az
adatokra. ......................................................................................................................................... 573
18.2. Egy dntsi fa annak eldntsre, hogy vrjunk-e asztalra ................................................... 575
18.3. Pldk az tterem problmaterletre ...................................................................................... 577
18.4. A pldahalmaz attribtumtesztelssel trtn sztosztsa. (a) A Konyha alapjn trtn sztoszts
nem visz kzelebb ahhoz, hogy a pozitv s negatv pldkat megklnbztessk. (b) A Vendgek
attribtum tesztje jl szeparlja a pozitv s negatv pldkat. Miutn a Vendgek tesztjt elvgeztk, az
hes egy elgg j msodik tesztlehetsget ad. ............................................................................ 577
18.5. A dntsi fa tanulsra szolgl algoritmus ............................................................................ 578
18.6. A 12 plds tant minta halmazbl szrmaztatott dntsi fa ................................................ 579
18.7. Tanulsi grbe az tterem problmatrre vletlenszeren generlt 100 plda esetn. A grbe 20
ksrlet eredmnyt sszegzi. ......................................................................................................... 581
18.8. A egyttes tanuls eredmnyekppen nyert megnvekedett kifejezert illusztrl plda. Hrom
lineris kszb jelleg hipotzist vizsglunk, mindegyik a nem vonalkzott flskon ad pozitv besorolst.
Az egyttesben csak arra adunk pozitv osztlyozst, amelyre mindhrom pozitvat ad. Az eredmnyl
kapott hromszgterlet egy olyan hipotzisnek felel meg, amelyet az eredeti hipotzistr egyetlen eleme
sem kpes kifejezni. ........................................................................................................................ 585
18.9. A turb algoritmus mkdse. Mindegyik rnykolt tglalap egy pldnak felel meg, a tglalap
magassga mutatja a plda slyt. A pipk s keresztek mutatjk, hogy a pldt jl vagy rosszul
osztlyoztuk a pillanatnyi hipotzis alapjn. A dntsi fa mrete mutatja, hogy ennek a hipotzisnek
mekkora a slya a vgs egyttesben. ............................................................................................ 586
18.10. Az egyttes tanuls turb mdszereinek ADABOOST nev varinsa. Az algoritmus hipotzisek
kombincijt hozza ltre. A SLYOZOTT-TBBSG egy hipotzist generl. Ez az j hipotzis azt a
kimeneti rtket adja vissza, amely a h-ban tallhat hipotzisek kzl, a z-ben szmon tartott slyozssal
a legtbb szavazatot kapta. ............................................................................................................. 586
18.11. (a) A dntsi tnkk s a turbzott dntsi tnkk teljestmnynek az tterem pldn trtn
sszehasonltsa M = 5 esetn. (b) A tant halmazon s a teszthalmazon kapott j vlaszok arnya M-nek
xxvi
az egyttesben tallhat hipotzisek szmnak a fggvnyben. Figyeljk meg, hogy a teszthalmazon

mrt pontossg mg azutn is javul egy kicsit, amikor a tant halmazon elrte az 1-et, azaz miutn az
egyttes pontosan illeszkedett az adatokra. .................................................................................... 587
18.12. A hipotzistr sematikus brzolsa a keresett f fggvny krl felvett -gmb brzolsval
589
18.13. Az ttermi problmra alkotott dntsi lista ........................................................................ 590
18.14. Egy dntsi lista tanulsra hasznlhat algoritmus .............................................................. 591
18.15. A DNTSI-LISTA-TANULS algoritmusnak az ttermi adatokon felvett tanulsi grbje. Az
sszehasonlts kedvrt feltntettk a DNTSI-FA-TANULS algoritmus grbjt is. ................. 591
19.1. (a) Egy konzisztens hipotzis. (b) Egy hamis negatv plda. (c) A hipotzist ltalnostottuk. (d) Egy
hamis pozitv plda. (e) A hipotzist szktettk. ........................................................................... 600
19.2. A pillanatnyilag-legjobb-hipotzis tanul algoritmus. Konzisztens hipotzist keres s viszszalp, ha
nem tallhat konzisztens szkts/ltalnosts. ........................................................................... 600
19.3. Verzitr tanul algoritmus. V-nek olyan rszhalmazt tanulja meg, amelynek elemei a pldkkal
konzisztensek. ................................................................................................................................. 602
19.4. A verzitr a pldkkal konzisztens sszes hipotzist tartalmazza ........................................ 602
19.5. A G s az S elemeinek kiterjesztsei. A kett kztt nem tallhat ismert plda. ................. 604
19.6. A kumulatv tanulsi folyamat felhasznlja s idvel folyamatosan bvti a httrtuds kszlett
606
19.7. Az egyszerstsi problma bizonytsi fi. Az els fa az eredeti problmapldny bizonytsa,
amibl az AritmetikaiIsmeretlen(z) Egyszersts(1 (0 + z), z) vezethet le. A msodik fa az a
bizonyts, amikor az eredeti problmapldnyban szerepl sszes konstanst vltozkkal helyettestettk,
amibl viszont tovbbi szablyok sokasgt vezethetjk le. .......................................................... 610
19.8. Algoritmus egy minimlis konzisztens meghatrozs megkeressre ................................... 613
19.9. Az RADFT s a DNTSI-FA-TANULS hatkonysgnak sszehasonltsa vletlen mdon generlt
adatok s egy olyan clfggvny esetn, amely a lehetsges 16 attribtumbl csak 5-t hasznl . 614
19.10. Az (a) s (b) bra a fehrjemolekula sszehajtogatsnak trgyterletn a ngy-heliklis fel-s-le
kteg fogalom pozitv s negatv pldjt mutatja. Mindkt plda struktrjt egy olyan kb. 100
konjunktv tagot tartalmaz logikai kifejezsbe kdoltk, mint amilyen pldul a TeljesHossz(D2mhr,
118) HeliklisSzm(D2mhr, 6) kifejezs. .......................................................................... 616
19.11. Egy tipikus csaldfa ............................................................................................................. 616
19.12. A FOIL algoritmus vza, amely pldkbl elsrend Horn-klzokat tanul meg. Az J-LITERLOK
s a LITERL-MEGVLASZTSA eljrsokat a szvegben magyarzzuk meg. ................................. 619
19.13. Az inverz rezolcis eljrs kezd lpsei. Az rnykolt klzokat az inverz rezolcis eljrs
generlja a jobb oldalon s az alatta lv klzokbl. A nem rnykolt klzok a Lersok-bl s a
Besorolsok-bl szrmaznak. ......................................................................................................... 620
19.14. Egy j P prediktumot generl inverz rezolcis lps ..................................................... 622
20.1. (a) A (20.1) egyenletbl szmtott P(hi|d1,,dN) a posteriori valsznsgek. A megfigyelsek szma
1-tl 10-ig terjed, s mindegyik megfigyels citromz cukorka. (b) A (20.2) egyenlet alapjn szmtott
P(dN+1 = citrom|d1,,dN) Bayes-predikci. ...................................................................................... 628
20.2. (a) Bayes-hl modell az ismeretlen arnyban citrom-, illetve meggyz cukorkk esetre. (b) Annak
a modellje, amikor a csomagolpapr szne fgg (valsznsgi alapon) a cukorka ztl. ........... 630
20.3. A 18. fejezet tterem problmjra alkalmazott naiv Bayes-tanuls tanulsi grbje. A dntsi fa
tanuls tanulsi grbjt sszehasonlts cljbl brzoltuk. ........................................................ 633
20.4. (a) Egy y = (1 + j + 2) egyenlettel lerhat lineris Gauss-modell additv, rgztett variancij
Gauss-zajjal. (b) E modell alapjn generlt 50 adatpontbl ll halmaz. ....................................... 634
20.5. Pldk a bta[a,b] eloszlsra klnbz [a,b] rtkek esetn ................................................ 635
20.6. Egy Bayes-tanulsnak megfelel Bayes-hl. A , 1, 2 vltozk a posteriori eloszlsai
kikvetkeztethetk az a priori eloszlsokbl s az zi, Csomagoli vltozkra vonatkoz tnyekbl. 636
20.7. (a) A rejtett vltoznak felttelezett szvbetegsg egyszer diagnosztikai hlja. Minden egyes
vltoznak hrom lehetsges rtke van, a vltozkat a feltteles eloszlsukban szerepl fggetlen
vltozk szmval cmkztk, a vgs szmuk 78. (b) A SzvBetegsg eltvoltsval kszlt ekvivalens
hl. Vegyk szre, hogy a tnetvltozk most mr nem felttelesen fggetlenek, ha a szlket megadjuk.
Ez a hl 708 paramtert ignyel. ................................................................................................... 639
20.8. (a) 500 ktdimenzis adatpont, amely hrom osztly jelenltt sugallja. (b) Egy hrom-komponens
kevert Gauss-modell, a slyok (balrl jobbra) 0,2, 0,3 s 0,5. Az (a) brn lthat adatokat ebbl a
modellbl generltuk. (c) Az adatokbl az EM algoritmussal rekonstrult modell ........................ 640
20.9. Az L log likelihood rtknek az EM iterciszmnak fggvnyben val alakulst bemutat
grbk. A vzszintes vonal a helyes modellnek megfelel log likelihood rtket mutatja. (a) A 20.8. brn
xxvii
lthat kevert Gauss-modellre vonatkoz grbe. (b) A 20.10. (a) brn lthat Bayes-hlra vonatkoz
grbe. .............................................................................................................................................. 641
20.10. (a) A cukorkk kevert modellje. A klnbz z cukorkk, a csomagolsok, valamint a lyukas
cukrok arnya a zsktl fgg, amelyet nem figyelnk meg. (b) Egy kevert Gaussra vonatkoz Bayes-hl.
Az X megfigyelhet vltoz tlaga s kovariancija a C komponenstl fgg. ............................... 642
20.11. Rejtett Markov-modellt reprezentl kitertett dinamikus Bayes-hl (a 15.14. bra megismtlse)
644
20.12. (a) A 20.8. (a) bra adatainak 128 pontos rszhalmaza, kt kivlasztott ponttal, s 10 legkzelebbi
szomszdjukkal. (b) Az adatok ellltsnl hasznlt kevert Gauss-eloszls 3D brja. .............. 647
20.13. A 20.12. (a) brn lthat adatokra vgzett srsgbecsls, k = 3 (a); k = 10 (b) s k = 40 (c) esetn
......................................................................................................................................................... 647
20.14. A 20.12. (a) brn lthat adatok srsgbecslse Gauss-kernelekkel, w = 0,02 (a); w = 0,07 (b) s
w = 0,20 (c) esetn. ........................................................................................................................ 648
20.15. A neuron egyszer matematikai modellje. Az egysg kimeneti aktivcija

ahol aj a j-edik egysg kimeneti aktivcija s Wj,i a j-tl i-ig vezet sszekttets slya. ............ 649
20.16. (a) A kszb aktivcis fggvny, amely 1-et ad a kimeneten, ha a bemenete pozitv, klnben
pedig 0-t. (Nha az eljelfggvnyt is hasznljk ehelyett, amely 1-et ad a bemenet eljeltl fggen.)
(b) A szigmoid fggvny 1/(1+ex). ............................................................................................... 650
20.17. Megfelel bemeneti s eltolsslyokkal rendelkez, kszbaktivcij egysgek kpesek logikai
kapuknt mkdni .......................................................................................................................... 651
20.18. Egy nagyon egyszer, kt bemeneti egysggel, egyetlen kt egysgbl ll rejtett rteggel s
egy kimeneti egysggel rendelkez hl ........................................................................................ 652
20.19. (a) Egy perceptronhlzat hrom kimeneti egysgbl, amelyeknek t kzs bemenete van. Ha
kivlasztunk egy kimeneti egysget (mondjuk a msodikat, vastag vonallal kiemelve), akkor azt ltjuk,
hogy bemeneti sszekttetsei nincsenek semmilyen hatssal a tbbi kimeneti egysgre. (b) Egy
ktbemenet szigmoid aktivcis fggvny perceptronegysg kimenetnek brzolsa. ............ 653
20.20. Lineris szeparlhatsg kszbperceptronok esetn. Fekete ptty jelzi a bemeneti tr olyan
pontjait, amelyekre a fggvny rtke 1, fehr ptty pedig az olyan pontokat, amelyre 0 ez az rtk. A
perceptronkimenet az egyenes nem rnykolt oldaln 1. A (c) esetben nincs olyan egyenes, amely jl
osztlyozn a bemeneteket. ............................................................................................................ 653
20.21. A gradiensalap perceptron tanulsi algoritmus, felttelezve, hogy a g aktivcis fggvny
differencilhat. Kszbperceptronokra elhagyjuk a g'(in) faktort a slyfrisstsbl. A NEURLIS-HLHIPOTZIS fggvny egy olyan hipotzist ad vissza, amely brmely bemenetre kiszmtja a hl vlaszt.
......................................................................................................................................................... 655
20.22. A perceptronok s dntsi fk teljestmnynek sszehasonltsa. (a) A perceptronok jobbak a 11
bemenet tbbsgfggvny tanulsban. (b) A dntsi fk jobbak az tterem pldban a VrjunkE
prediktum tanulsban. ................................................................................................................. 655
20.23. (a) Kt egymssal szemben ll lgy kszbfggvny kombincijnak eredmnye: egy
hegygerinc. (b) Kt hegygerinc kombincijnak eredmnye a dudor. .......................................... 657
20.24. Tbbrteg neurlis hl egy rejtett rteggel s 10 bemeneti egysggel, alkalmas az tterem
problmhoz ................................................................................................................................... 657
20.25. A tbbrteg hlkra kidolgozott hiba-visszaterjesztses tanulsi algoritmus .................... 658
20.26. (a) Az tterem problma egy adott pldahalmazn felvett tanulsi grbe, ami a slyok szmos
epoch sorn trtn mdostsval elrt fokozatos hibacskkenst mutatja. (b) sszehasonlt tanulsi
grbk, amelyek azt mutatjk, hogy a dntsi fa tanuls valamivel jobb teljestmnyt ad, mint a tbbrteg
hl hiba-visszaterjesztses tanulsa. ............................................................................................. 659
20.27. (a) Egy ktdimenzis tant halmaz, amelyben a pozitv pldkat fekete, a negatvakat fehr krk
jellik. Az
valdi elvlaszt hatrt is bejelltk. (b) Ugyanazok az adatok az
hromdimenzis trbe val lekpezs utn. Az (a) brn lthat kr alak dntsi hatr a hromdimenzis
trben lineris dntsi felletbe ment t. ........................................................................................ 661
20.28. Az els kt dimenzira vettett kzelkp: a 20.27. (b) bra optimlis szepartora. A szepartort
vastag vonallal jelltk, a hozz legkzelebbi pontokat a szupport vektorokat bekarikztuk. A
tartalk nem ms, mint a pozitv s negatv pldk kzti elvlaszt sv szlessge. .................... 662
20.29. Nhny plda az NIST kzzel rt szmjegyekre ltrehozott adatbzisbl. A fels sorban a 09
karakterek knnyebben felismerhet pldit mutatjuk be, az als sorban pedig ugyanezen szmjegyekre
nehezebben felismerhet pldkat ltunk. ...................................................................................... 664
xxviii
21.1. (a) A 4 3-as vilgban alkalmazott stratgia. Ez optimlis stratgia, ha nem alkalmazunk
lertkelst, s minden llapotban, amely nem vgllapot, R(s)= 0,04. (b) A 4 3-as vilg llapotainak
hasznossga a stratgia esetn. .................................................................................................... 674
21.2. Egy adaptv lineris programozs alapon tanul passzv megerstses gens. A kd egyszerstse
rdekben feltettk, hogy minden egyes szlels sztbonthat egy szlelt llapotra s egy jutalomjelre.
676
21.3. A passzv ADP-tanul tanulsi grbi a 4 3-as vilg tanulsa sorn, a 21.1. brn lthat optimlis
stratgia hasznlata esetn. (a) Az llapotok egy kivlasztott rszhalmazra kiszmtott
hasznossgbecslsek a ksrletek szmnak fggvnyben. Figyeljk meg a 78-adik ksrlet krnykn a
jelents vltozsokat ez az els eset, amikor az gens a (4,2) vgllapotba jut, melyben 1 jutalmat kap.
(b) Az U(1,1) hibjnak RMS-rtke 20 egyenknt 100 ksrletbl ll futsra tlagolva. ..... 677
21.4. Egy idbeli klnbsg alapon hasznossgot tanul passzv megerstses gens ................. 678
21.5. Az IK-tanuls 4 3-as vilgon mrt tanulsi grbi. (a) Nhny kivlasztott llapot
hasznossgbecslse a ksrletszm fggvnyben. (b) Az U(1,1) becslsnek RMS-hibja, amelyet 20
futs tlagbl szmoltunk, mindegyik futs 500 ksrletet tartalmazott. Csak az els 100 ksrletbl
szrmaz eredmnyt rajzoltuk fel, hogy a grbe a 21.3. brval sszehasonlthat legyen. .......... 678
21.6. Annak a moh ADP-gensnek a felmutatott teljestmnye, amely vgrehajtja a tanult modell alapjn
optimlisnak tn cselekvst. (a) A kilenc nem vgllapot alapjn szmolt tlagos RMS-hiba. (b) Az a
szuboptimlis stratgia, amely fel ebben a ksrletsorozatban a moh gens konvergl. ............. 680
21.7. A felfedez ADP-gens teljestmnye, R+ = 2 s Ne = 5 esetn. (a) Nhny kivlasztott llapot
hasznossgnak becslse az id fggvnyben. (b) A hasznossgrtkek RMS-hibja, s az ehhez
kapcsolhat, a stratgibl szrmaz vesztesg. ............................................................................. 683
21.8. Egy felfedez Q-tanul gens. Egy aktv tanul, amely megtanulja minden cselekvsnek minden
egyes llapotban a Q(a, s) rtkt. Ugyanazt az f felfedezsi fggvnyt hasznlja, amelyet a felfedez
ADP-gens is hasznlt, de elkerli az llapottmenet-modell tanulst, mivel az llapot Q-rtkt
kzvetlenl a szomszdos llapotok Q-rtkeihez tudja kapcsolni. ............................................... 684
21.9. A mozg kocsi tetejn ll hossz rd egyenslyozsnak vizsglatra szolgl berendezs. A kocsit
az
llapotvltozkat megfigyel szablyz jobbra vagy balra lkheti. ........................... 688
21.10. Idben eltolt kpek egymsra msolsa tjn kapott ered kp, amelyen egy nagyon bonyolult
krberepls orral a kr kzppontja fele manvert hajtanak vgre. A helikoptert egy Pegasus
stratgiakeres algoritmussal fejlesztett stratgival vezrlik. Egy szimultormodellt fejlesztettek a vals
helikopter egyes vezrlsi beavatkozsokra adott vlaszainak vizsglatra. Ezek utn egsz jszaka
futtattk az algoritmust a szimultoron. Egy sor vezrlt fejlesztettek ki klnbz manverekre. Minden
esetben, amikor tvirnytst hasznltak, messze jobb volt az eredmny, mint a kpzett humn piltk. (A
kpet Andrew Ng engedlyvel kzljk.) ..................................................................................... 690
22.1. A kommunikciban rszt vev ht folyamat, a The wumpus is dead mondat felhasznlsval
700
22.2. Egy kommunikl gens, amely elfogad parancsokat, krdseket s lltsokat. Az gens lerhatja az
aktulis llapotot, valamint vgrehajthat hagyomnyos, nem szlsaktus cselekvst is, ha nincs mit
mondania. ....................................................................................................................................... 701
22.3. 0 szkincse ........................................................................................................................... 702
22.4. Az 0 nyelvtana, minden egyes szablyra plda kifejezst adva ........................................... 703
22.5. A the wumpus is dead lentrl felfel trtn elemzsi lpsei. A szavakat tartalmaz csompontok
listjval kezdnk. Ezek utn egy szably jobb oldalra illeszked rszsorozatokat felcserlnk egy j
csomponttal, amelynek gykere a szably bal oldala. Pldul a harmadik sorban az Article s Noun
csompontokat lecserljk egy NP csompontra, amelynek e kt csompont lesz a gyereke. A fentrl
lefel elemzs hasonl lpseket eredmnyezne, de pp a fordtott irnyban. ............................... 705
22.6. A The agent feels a breeze mondat diagramjnak egy rszlete. Mind a hat csompont lthat, de
csak hrom l szerepel azok kzl, melyek teljes elemzst eredmnyeznnek. ............................. 706
22.7. A diagramelemz algoritmus. S a kezd szimblum s S' egy j nem zr szimblum, diagram[j]
pedig azon lek listja, melyek a j csompontban vgzdnek. A grg bc beti nulla vagy tbb
szimblumbl ll fzrekre illeszkednek. ..................................................................................... 707
22.8. Az 0 I 1 feel 2 it 3 mondat diagramelemzse. Az m:S jells azt jelenti, hogy az m lnek egy S ll a
jobb oldaln, mg az f:VP/Verb azt, hogy az f lnek VP van a bal oldaln, de egy Verb-et vr. t teljes l
van a csompontok felett, s nyolc hinyos alattuk. ....................................................................... 708
22.9. Az 0 I 1 feel 2 it 3. elemzsi lpsei. Az am lek mindegyikre megmutatjuk azt az eljrst, amit az
l ms, a diagramon mr szerepl lekbl trtn szrmaztatsra hasznltunk. Bizonyos leket a rvidsg
rdekben elhagytunk. .................................................................................................................... 709
22.10. Egy balsarok-elemz algoritmussal elkerlhet a ride szval kezdd VP jslsa, de jsolni fog
egy was szval kezdd VP-t, mivel a nyelvtan egy NP-t kvet VP-t vr. A the horse gave feletti
xxix
hromszg azt jelenti, hogy a szavaknak van egy RelCause elemzsk, amihez azonban kzvetlenl
tovbbi rszek kapcsoldnak, amik nem lthatk. .......................................................................... 710
22.11. Fell: Az 1 egy BNF nyelvtana, amely kezeli az alanyi s a trgyas esetet a fnvi kifejezsekben,
s ezrt annyira nem is generl tl. Az 1 nyelvtanval megegyez rszeket elhagytuk. Lent: Az 1 egy
definit klz nyelvtana (DCG). ........................................................................................................ 712
22.12. Pldk igkre az alkategria-listikkal egytt ..................................................................... 714
22.13. A You give me the gold (Ideadod nekem az aranyat) elemzsi fja, amely bemutatja az ige s az
igei kifejezs alkategriit .............................................................................................................. 715
22.14. Szemantikval kibvtett nyelvtan az aritmetikai kifejezsekre. Minden xi vltoz egy szszetev
szemantikjt reprezentlja. Vegye szre, hogy a {teszt} jellst hasznljuk olyan logikai prediktumok
definilsra, amelyeket ki kell elgteni, de nem sszetevk! ...................................................... 716
22.15. A 3 + (4 2) fzr elemzsi fja szemantikai rtelmezsekkel ....................................... 717
22.16. Egy nyelvtan, amely kpes egy elemzsi fa s szemantikai rtelmezs levezetsre a John loves
Mary (s hrom msik) mondat szmra ...................................................................................... 717
22.17. A John loves Mary fzr elemzsi fja szemantikai rtelmezsekkel .............................. 718
22.18. Minden szintaktikai kategria kvzilogikai formj kifejezsnek tpust mutat tbla. A t r
jells egy fggvnyt takar, amely egy t tpus argumentumot fogad, s r tpus eredmnnyel tr vissza.
Pldul a Preposition szemantikai tpusa object2 sentence, ami azt jelenti, hogy az elljrsz
szemantikja egy fggvny, amelyet ha kt logikai objektumra alkalmazunk, akkor egy logikai mondatot
eredmnyez. .................................................................................................................................... 720
22.19. Az Every agent smells a wumpus mondat elemzsi fja, amely mind a szintaktikai struktrt,
mind a szemantikai rtelmezseket mutatja .................................................................................... 720
22.20. Szemantikval elltott nyelvtan kvzilogikai formban ...................................................... 721
22.21. Koherenciarelcik listja (Hobbs, 1990) alapjn. Mindegyik relci kt, egymst kvet
szvegrszlet, S1 s S2 kztt ll fenn. ............................................................................................ 727
22.22. Az abcdbcabcd bemeneti szveget elemz nyelvtant tartalmaz Sequitur-rendszer futsi lpsei.
Egy S-re vonatkoz szablybl indulunk ki, s ezen szably vghez sorban minden egyes szimblumot
hozzadunk. Miutn a hatodik szimblumot is hozzadtuk, megkapjuk egy ismtld pr els
elfordulst: bc. Ezrt a bc mindkt elfordulst lecserljk egy j nem zrra, A-ra, s egy j szablyt
vesznk fel: A bc. Miutn hrom jabb szimblumot hozzraktunk a bemenethez, a kilencedik a bc egy
jabb ismtlst eredmnyezi, gy jra A-val helyettestjk. Ez az aA kt elfordulshoz vezet, ezrt egy
j nem zrval, B-vel helyettestjk. Miutn a tizedik, utols szimblumot is hozzraktuk, Bd kt
elfordulst kapjuk, ezrt lecserljk ket egy j nem zrval, C-vel. De B immr csak egyszer szerepel,
a C szably jobb oldaln, ezrt B-t a neki megfelel bvtssel, aA-val cserljk le. .................... 729
23.1. Viterbi-alap szszegmentl algoritmus. Egy szkzket nem tartalmaz szfzrt feldolgozva
megadja a legvalsznbb szavakra trtn szegmentcit. ........................................................... 739
23.2. Az 0 nyelvtan egy rszletnek valsznsgi krnyezetfggetlen nyelvtana (PCFG) s szkincse. A
szgletes zrjelben lev szm jelzi a valsznsgt annak, hogy az adott bal oldali szimblumot a
megfelel szably szerint rjuk t ................................................................................................... 740
23.3. A Minden wumpus bzlik mondat elemzsi fja, megadva minden egyes rszfa valsznsgt. A
teljes fa valsznsge 1,0 0,5 0,05 0,15 0,60 0,10 = 0,000225. Mivel a mondatnak ez az
egyetlen elemzse, ezrt ennyi a mondat valsznsge is. ............................................................ 740
23.4. A [Bayes information retrieval model] lekrdezs-valsznsgi IR-modellje a knyv els t
fejezett tartalmaz dokumentumgyjtemny felett. Megadjuk a szgyakorisgot mindegyik
dokumentum-sz prra, s a szavak szmt (N) az sszes dokumentumra. Kt dokumentummodellt
alkalmazunk, Di az i-edik dokumentumon alapul simtatlan unigram szmodell, mg D'i ugyanaz a modell
adj-hozz-egyet simtssal, majd kiszmtjuk a lekrdezs valsznsgt minden dokumentumra mindkt
modellel. A jelen (23.) fejezet az egyrtelm gyztes, mindkt modell esetn tbb mint ktszzszor
valsznbb, mint brmely ms dokumentum. ............................................................................... 744
23.5. Egy gpi fordt rendszer vlasztsi lehetsgeit brzol sematikus diagram. A fenn tallhat angol
szveggel kezdjk. A kztes nyelven alapul rendszer a folytonos vonalakat kveti, az angol szveget
elszr szintaktikai elemzsnek veti al, majd szemantikai s kztes nyelvi reprezentcit llt el, vgl
szemantikai, szintaktikai s lexikai formkon keresztl francia szveget llt el. Az tvitelalap
rendszerek a szaggatott vonalak ltal jellt rvidzrakat hasznljk. Az egyes rendszerek eltr szinteken
vgzik az tvitelt, egyes rendszerek tbb szinten is. ....................................................................... 753
24.1. A kpalkots geometrija a sttkamrban ............................................................................ 763
24.2. Az emberi szem vzszintes keresztmetszete .......................................................................... 765
24.3. (a) Egy asztalon lv tzgp fnykpe. (b) Az (a) egy 12 12 kppontbl ll, nagytott rszlete.
(c) A rszletnek megfelel kpfnyessgrtkek egy 0-tl 255-ig tart skln. ............................. 765
xxx
24.4. Klnfle lek: (1) mlysgi diszkontinuits, (2) felleti orientci diszkontinuits, (3)
viszszaverdsi kpessg diszkontinuits, (4) fnyessgi diszkontinuits (rnykok) ................... 768
24.5. (a) Egy asztalon nyugv tzgp fnykpe. (b) Az (a) alapjn meghatrozott lek. ............. 768
24.6. Fell: Az I(x) intenzitsprofil egy egydimenzis rszlet mentn egy lpcsfok ln t. Kzpen: Az
intenzits derivltja, I'(x). A fggvny nagy rtkei leknek felelnek meg, de a fggvny zajos. Lent: Az
intenzits simtott vltozatnak derivltja, (I G )', amely I G'-hoz hasonlan egy lpsben szmolhat.
Az x = 75 pontban lev zajos l jellt eltnt. .................................................................................. 768
24.7. (a) Rubik-kocka egy forg lemezkorongon. (b) Ugyanaz a kocka 19/30 msodperccel ksbb
(Richard Szeliski nyomn). (c) Az (a) s (b) kpek sszehasonltsa alapjn szmolt optikai folyam
vektorok (Joe Weber s Jitendra Malik hozzjrulsval). ............................................................. 772
24.8. (a) Egy olyan videokp-sorozat ngy kockja, amelyben a kamera a trgyhoz kpest mozgott s
forgott. (b) A sorozat els kpkockja, amelyen apr ngyzetek jelzik a tulajdonsgfelismer ltal
megtallt tulajdonsgokat (Carlo Tomasi hozzjrulsval). ......................................................... 773
24.9. (a) A 24.8. brn lthat kp tulajdonsgai elhelyezkedsnek hromdimenzis rekonstrukcija. (b)
A valdi hz ugyanabbl a perspektvbl. .................................................................................... 773
24. A trbeli lts alapgondolata: klnbz kamerapozcik ugyanannak a hromdimenzis jelenetnek
kiss eltr ktdimenzis nzeteit eredmnyezik ........................................................................... 774
24.11. A diszparits s a mlysg sszefggse a sztereoltsban ................................................. 774
24.12. (a) A textragradienseket illusztrl jelenet. Feltve, hogy a vals mintzat egyforma, lehetv
teszi a fellet irnygnak a meghatrozst. A szmtott irnyt a kpen oly mdon elhelyezett fehr kr
s nyl jelzi, mintha a krt a felletre festettk volna abban a pontban. (b) Egy velt fellet alakjnak
meghatrozsa a mintzat alapjn. (A kpeket Jitendra Malik s Ruth Rosenholtz hozzjrulsval
kzljk [Malik s Rosenholtz, 1994].) .......................................................................................... 775
24.13. Egy felidz vonalas rajz (Isha Malik hozzjrulsval) ..................................................... 777
24.14. Klnfle vonalcmkk ........................................................................................................ 778
24.15. A trideres cscsok ngy fajtja .......................................................................................... 778
24.16. A 24.15. brn 1-gyel jellt cscs klnbz elfordulsai ................................................ 779
24.17. A HuffmanClowes-cmkekszlet ....................................................................................... 779
24.18. Kt hromdimenzis trgy tbbfle nzete .......................................................................... 782
24.19. Egy arcmegtall algoritmus eredmnye (Henry Schneiderman s Takeo Kanade hozzjrulsval)
......................................................................................................................................................... 783
24.20. Alakzatkontextus-szmts s -illeszts. (a, b) Kt alakzat lnek mintapontjai. (c) Az
alakzatkontextus szmtsra hasznlt log-polr hisztogram rekeszek brja. 5 rekeszt hasznlunk a log r
s 12 rekeszt szmra. (df) Az (a) s (b) brn jellt referenciamintk alakzatkontextusai: , , .
Minden alakzatkontextus a maradk ponthalmaz koordintinak log-polr hisztogramja a referenciapontot
mint origt hasznlva. (A stt cellk tbb pontot jelentenek a rekeszekben.) Vegye szre a s pontok
alakzatkontextusainak vizulis hasonlsgt, amelyeket a kt alakzat relatve hasonl pontjaira
szmoltunk! Ezzel ellenttben a alakzatkontextusa egszen eltr. (g) Az (a) s (b) kztt ktoldali
illesztssel megtallt megfeleltetsek, a hisztogramok 2 tvolsga ltal definilt kltsget hasznlva. 784
24.21. Az illesztsalgoritmus informlis lersa ............................................................................. 786
24.22. (a) A tzgp fnykpn tallt sarkok. (b) Az eredeti kpre rhelyezett hipotetikus rekonstrukci
(Clark Olson hozzjrulsval). ...................................................................................................... 787
24.23. Az t kpe egy autban lv kamerval lefnykpezve. A vzszintes fehr cskok jelzik azokat a
keressi ablakokat, amiken bell a vezrl az tvonali jeleket keresi. A gyenge kpminsg nem szokatlan
az alacsony felbonts fekete-fehr videk esetben. .................................................................... 787
24.24. A megcmkzend objektum, amelynek minden sarokpontja trideres ............................... 792
24.25. Fellnzeti kp egy ktkamers ltrendszerrl, amely egy veget figyel meg, amely mgtt egy
fal van ............................................................................................................................................. 793
25.1. (a) A NASA Sojourner mobil robotja, amely a Mars felsznt dertette fel 1997 jliusban. (b) A
Honda P3 s Asimo elnevezs humanoid robotjai. ....................................................................... 795
25.2. (a) A mobil robotoknl npszer SICK LMS lzeres tvolsgmr. (b) Egy horizontlisan felszerelt
tvolsgmr ltal mrt visszaverdsi kp 2D-s trkpre vettve. ................................................ 796
25.3. (a) A Stanford manipultor: egy korai robotkar t rotcis (R) s egy transzlcis (prizmatikus)
csuklval (P), sszesen hat szabadsgfokkal. (b) Egy elskerk-kormnyzs nemholonomikus
ngykerek jrm mozgsa. ........................................................................................................... 798
25.4. (a) Marc Raibert egyik lpeget robotja mozgs kzben. (b) A Sony AIBO robot focizs kzben
(copyright 2001, The RoboCup Federation). .................................................................................. 799
25.5. A robotrzkels felfoghat gy, mint cselekvsek s mrsek sorozatnak idbeli egymsra hatsa,
ahogy ezt a dinamikus Bayes-hl is illusztrlja ............................................................................ 800
xxxi
25.6. (a) Egy mobil robot egyszerstett kinematikai modellje. A robotot a kr jelkpezi, s a bevgs
mutatja a haladsi irnyt. Kln-kln lthatjuk a t-beli s a t + 1-beli pozcit s orientcit a vt t s t
t frisstsi rtkekkel. Szintn fel van tntetve egy t idpontban megfigyelt referenciapont (tereptrgy) az
(xi, yi) pontban. (b) A psztz tvolsgmrs modellje. Egy adott tvolsg mrshez (z1, z2, z3, z4) tartoz
kt lehetsges robothelyzet lthat. Sokkal valsznbb, hogy a bal oldali helyzetbl szrmaznak a
tvolsgmrsek. ............................................................................................................................. 801
25.8. A Monte Carlo lokalizci, egy rszecskeszr algoritmus mobil robotok pozcijnak
meghatrozsra. Fell: a kezdeti, teljes bizonytalansg. Kzpen: nagyjbl ktplus bizonytalansg,
miutn a robot elindult a kzps (szimmetrikus) folyosn. Alul: egyetlen pont kr szklt
bizonytalansg, miutn bement az egyik irodba. .......................................................................... 802
25.7. A Monte Carlo lokalizl algoritmus, fggetlen zajjal terhelt psztz tvolsgmrses modellt
hasznlva ........................................................................................................................................ 804
25.9. Egydimenzis, linearizlt mozgsi modell illusztrlsa: (a) Az f fggvny s t + 1 idpontbeli t
kzprtke s kovariancija (t alapjn). (b) A linearizlt vltozat az f rintje a t pontban. A t
kzprtk ugyanaz marad, ugyanakkor az elrevettett
kovariancia mr klnbzik a t+1-tl. 804
25.10. Plda a kiterjesztett Kalman-szr hasznlatra lokalizcis problmhoz. A robot egy egyenes
mentn mozog. Ahogy halad elre, a sajt helyzetnek ismerethez tartoz bizonytalansg fokozatosan
n, ahogy azt a hibaellipszisek mutatjk. Amikor szrevesz egy ismert pozcij referenciapontot, a
bizonytalansg cskken. ................................................................................................................. 805
25.11. A KKSZ alkalmazsa a robottrkpezs problmjra. A robot plyja a szaggatott vonal, s a
besatrozott ellipszisek jelentik helyzetre vonatkoz sajt becslseit. Nyolc pont jelenti az ismeretlen
helyzet referenciapontokat, mg a helyzetkre vonatkoz becslseiket a fehr ellipszisek mutatjk. Az
(a), (b) s (c) brkon a robot helyzetre vonatkoz becsls bizonytalansga folyamatosan nvekszik,
ahogy azok a referenciapontok is, amelyek mellett elmegy. A (d) brn a robot jra elrkezik az els
referenciaponthoz, gy az sszes tbbi pont helyzetnek bizonytalansga is cskken, ksznheten annak,
hogy a becslsek korrelltak. .......................................................................................................... 806
25.12. (a) Egy kt szabadsgfok robotkar munkatere. A munkatr egy doboz, amiben egy lapos akadly
lg a mennyezetrl. (b) Ugyanennek a robotnak a konfigurcis tere. A fehrrel jelzett terlet jelenti
azokat a konfigurcikat, ahol a robot nem tkzik ssze semmivel. A pont az brn a robot bal oldali
konfigurcijt mutatja. .................................................................................................................. 809
25.13. Hrom klnbz robotkonfigurci a munkatrben s a konfigurcis trben ................. 810
25.14. (a) A kltsgfggvny s az ellltott trajektria a konfigurcis trben, diszkrt hls
celladekompozcis kzelts esetn. (b) Ugyanaz az tvonal a munkatrben brzolva. rdemes
megfigyelni, hogy a robot behajltja a knykt, hogy elkerlje a fggleges akadlyt. ............... 811
25.15. (a) A taszt potenciltr tvol tartja a robotot az akadlyoktl. (b) A megoldsknt kapott plya, ha
egyszerre minimalizljuk az thosszt s a potencilfggvnyt. ...................................................... 812
25.16. (a) A Voronoi-diagram azon pontok halmaza a konfigurcis trben, amelyek egyenl tvolsgra
vannak kt vagy tbb akadlytl. (b) A szabad tr 400 vletlenszeren kivlasztott pontjbl felptett
valsznsgi thlzat. .................................................................................................................. 813
25.17. Egy ktdimenzis krnyezet, a sebessg vektor bizonytalansgt brzol kppal. A vezrls
bizonytalansga miatt az eredeti szndknak megfelel v sebessg valjban brmilyen vektor lehet a Cv
kpon bell. Ennek eredmnyekppen a robot vgs konfigurcija brhol lehet a burkoln (a
vilgosabban rnyalt terleten), azaz nem tudjuk, hogy eljutottunk-e a lyukba, vagy sem. ........... 816
25.18. Az els mozgsparancs s a lehetsges robotmozgsok burkolja. A hibtl fggetlenl tudjuk,
hogy a vgs konfigurci a lyuk bal oldaln lesz. ........................................................................ 816
25.19. A msodik mozgsparancs s a lehetsges mozgsok. Mg hibk esetn is vgl bele fogunk tallni
a lyukba. ......................................................................................................................................... 817
25.20. Robotkarvezrls (a) egysgnyi ersts arnyos szablyozval; (b) 0,1-es erstsi tnyezj
arnyos szablyozval; (c) PD szablyozval, 0,3-as ersts arnyos taggal s 0,8-as differencil
komponenssel. Mindhrom esetben a robotkar a szrkvel jellt plyt prblta kvetni. ............ 818
25.21. Potenciltr-vezrls. A robot egy potenciltrben halad, amely az akadlyoktl taszt erkbl s a
clkonfigurcihoz vonzkbl ll. (a) Sikeres tvonal. (b) Loklis optimum. ............................... 820
25.22. (a) Hexapod robot. (b) Kiterjesztett vges automata (KVA) (augmented finite state machine,
AFSM) egyetlen lb vezrlshez. Fontos, hogy ez a KVA-szenzoros visszacsatolsra reagl: ha a lb
megakad az elremozgats sorn, akkor magasabbra emeli. .......................................................... 821
25.23. (a) A Helpmate robot lelmiszert s egyb orvosi felszerelst szllt tbb tucat krhzban,
vilgszerte. (b) Sebszrobotok a mtben (da Vinci Surgical Systems). ........................................ 825
25.24. (a) Egy elhagyatott bnya feltrkpezse egy robottal. (b) A bnynak a robot ltal kapott 3D kpe.
......................................................................................................................................................... 825
25.25. Diagram a 25.5. feladathoz .................................................................................................. 830
xxxii
25.26. Egyszerstett robot egy labirintusban. Lsd 25.6. feladat. ................................................. 832
27.1. Egy modell- s hasznossgalap gens, ahogyan elszr a 2.14. brn bemutattuk ............. 851
27.2. A kompills clja a megfontolt (deliberatv) dntshozatal hatkonyabb, reflexszer
mechanizmuss val talaktsa ..................................................................................................... 853
xxxiii
Elsz
A mestersges intelligencia (MI) nagyon nagy terlet, s ez a knyv is igen terjedelmes. A knyvben
megksreltk e terletet teljes szlessgben feltrni: tlelve a logikt, a valsznsg-szmtst, a folytonos
matematikt, az rzkelst, a kvetkeztetst, a tanulst, a cselekvst, valamint mindent, a mikroelektroniktl a
vilgrt kutat robotokig. A knyv azrt is terjedelmes, mert bizonyos mrtkig el is mlyednk az eredmnyek
trgyalsban, mikzben az egyes fejezetek kzponti rszben csak a leglnyegesebb gondolatokat igyeksznk
bemutatni. Tovbbi eredmnyekre az egyes fejezetek vgn tallhat irodalmi feljegyzsekben mutatunk r.
A knyv alcme modern megkzeltsben. E taln nmagban res szfordulat szndkolt jelentse az, hogy
az ismert eredmnyeket egy kzs keretbe szintetizlva igyekeztk bemutatni, ahelyett hogy az MI egyes
rszterleteit kln-kln a sajt trtnelmi htterkben trgyaljuk. Elnzst is krnk mindazoktl, akik a sajt
szakterletket gy a szoksosnl kevsb ismerik fel.
A knyv f egysgest motvuma az intelligens gens koncepcija. Felfogsunkban az MI egyszeren a
krnyezetket szlel s cselekv gensek tanulmnyozsa. Minden ilyen gens egy rzkelseket
cselekvsekre lekpez fggvnyt valst meg. A knyvben e fggvnykapcsolat tbbfle reprezentcijval
foglalkozunk, olyan reprezentcikkal, mint pldul a produkcis rendszerek, a reaktv gensek, a vals idej
feltteles tervkszt rendszerek, a neurlis hlk s a dntselmleti rendszerek. A tovbbiakban bemutatjuk a
tanuls szerept, mint a rendszerterveznek azt a mdszert, amivel ismeretlen krnyezeteket is kpes
figyelembe venni, s megmutatjuk, hogy a tanuls milyen korltozsokat jelent az gens tervezsben, kiemelve
az explicit tudsreprezentci s a kvetkeztets szerept. A robotikt s a gpi ltst nem fggetlenl definilt
problmaknt trgyaljuk, hanem mint a cl elrshez szksges szolgltatsokat. Kln hangslyozzuk a
feladatkrnyezet fontossgt az gens megfelel megtervezse szempontjbl.
A f clunk azokat a gondolatokat tadni, amelyek az MI-kutats elmlt 50 vben s a kapcsold terleteken
az elmlt ktezer vben szlettek. E gondolatok bemutatsnl, mikzben a precizits megtartsra trekedtnk,
igyekeztnk kerlni a tlzott formalizmust. Ahol alkalmasnak talltuk, pszeudokd szint algoritmusokat is
kzltnk, hogy a gondolatok konkrt alakot ltsenek. Az ltalunk hasznlt pszeudokdot rviden a B)
fggelkben rjuk le. A klnbz programozsi nyelveken implementlt algoritmusokat az olvas a
http://aima.cs.berkeley.edu weboldalon tallja meg.
A knyvet alapveten egy alapkpzsbeli trgyhoz vagy trgysorozathoz szntuk. Ugyanakkor hasznlhat a
gradulis kpzs trgyaiban is (esetleg az irodalmi megjegyzsekben javasolt forrsok nmelyiknek
hozzadsval). A szles tmalefeds s a nagyszm rszletezett algoritmus miatt a knyv alapreferenciaknt
szolglhat az MI-szakos vgzs hallgatk s a szkebb kutatsi terletkbl kitrni kvn szakemberek
szmra. Egyetlen felttel a szmtgpes tudomnyok alapvet fogalomszint ismerete (algoritmusok,
adatstruktrk, komplexits) egy els-msodves hallgat szintjn. Az analzis alsbb ves szint ismerete jl
jn a neurlis hlk s a statisztikai tanuls rszleteinek megrtshez. A szksges matematikai httr egyes
rszeit az A) fggelkben adjuk meg.
A knyv ttekintse
A knyv nyolc rszbl ll. Az I. rsz, a Mestersges intelligencia az MI-kutatsok olyan megkzeltst adja,
amely az intelligens gens elkpzels kr szervezdik. Egy olyan rendszer kr, amely kpes eldnteni, hogy
mit cselekedjen s amely cselekedni is kpes. A II. rsz, a Problmamegolds olyan dntsi mdszerekkel
foglalkozik, amikor nhny lpsre elre kell gondolkodni. Ilyen pl. a sakk vagy a nylt terepen trtn
navigls. A III. rsz, a Tuds s kvetkeztets a vilgrl alkotott tuds reprezentlsval foglalkozik, valamint
azzal, hogy hogyan mkdik egy ilyen reprezentci, milyen reprezentcikat ismernk, hogyan
befolysolhatjuk ezeket a cselekvsnkkel, s hogy ezzel a tudssal hogyan lehet logikusan kvetkeztetni.
Ennek folytatsaknt a IV. rsz, a Tervkszts e kvetkeztetsi mdszerek hasznlatt mutatja a cselekvs
eldntsben, pontosabban a tervek ksztsben. Az V. rsz, a Bizonytalan tuds s kvetkeztets hasonlt a
III. s IV. rszekre, de a bizonytalansgok melletti kvetkeztetsre s dntshozatalra koncentrl. Ilyen
problmkra pl. az orvosi diagnosztizl s kezel rendszerekben kell szmtani.
A II.-tl az V. rszig az anyag az intelligens genseknek azzal a komponensvel foglalkozik, amely a
dntshozatalrt felels. A VI. rsz, a Tanuls a dntshoz komponens ltal ignyelt tuds megszerzsi
mdszereit rja le. A VII. rsz, a Kommunikci, szlels s cselekvs olyan mdszereket tr fel, amelyekkel
az intelligens gens a krnyezett rzkelheti lts, tapints, halls vagy akr nyelvmegrts rvn abbl a
clbl, hogy megtudja, mi trtnik krltte, tovbb olyan mdszerekkel foglalkozik, melyek kpesek az gens
xxxiv
Elsz
terveit igazi cselekvss alaktani, ahol a cselekvs lehet egy robotmozgs, de akr nyelvi kzls is. Vgl a
VIII. rsz, a Konklzik az MI mltjt s jvjt, valamint a filozfiai s etikai kvetkezmnyeit elemzi.
Vltozsok az els kiadshoz kpest
Az els kiads ta az MI sok vltozson ment t, s ez a knyv is sokat vltozott. Lnyegben t is rtunk
minden fejezetet abbl a clbl, hogy a knyv tkrzze a kutats legjabb eredmnyeit, a korbbi munkknak az
j eredmnyekhez jobban illeszked rtelmezst adhassa, valamint hogy a gondolatok folyamnak oktat
jellege mg jobban rvnyeslni tudjon. Az MI kvetit btortani szeretnnk, hogy a mai mdszerek sokkal
praktikusabbak, mint az 1995-sek. A tervksztst pldnak vve az els kiads algoritmusai nhny tz
lpsbl ll tervek generlsra voltak kpesek, e kiads algoritmusai tbb tzezer lpsnyi tervekre
sklzhatk fel. Hasonl nagysgrendi javuls tapasztalhat a valsznsgi kvetkeztets, a nyelvfeldolgozs
s ms terletek esetben is. A knyvben az albbiak a legfontosabb vltozsok:
Az I. rszben mltatjuk a szablyozselmlet, a jtkelmlet, a gazdasgtan s a neurlis tudomnyok
trtnelmi szerept. Ez segti, hogy e gondolatokat a kvetkez fejezetekben integrltabb mdon tudjuk
trgyalni.
A II. rszben az online keressi algoritmusokkal foglalkozunk, s egy j, a korltozskielgtsrl szl
fejezetet is beiktattunk. Ez utbbi termszetes tmenetet kpez a logikval foglalkoz anyagrszek fel.
A III. rszben az tletkalkulus, amit az els kiadsban az elsrend logika fel vezet lpcsnek tekintettnk,
itt mint egy nll hasznos reprezentcis nyelv kerl bemutatsra, gyors kvetkeztetsi eljrsokkal s
ramkralap gensfejlesztssel. Az elsrend logikval foglalkoz fejezetet tszerveztk, hogy az anyag
ttekinthetbb legyen s alkalmazsi pldaknt az internetes vsrls trgyterlettel bvtettk.
A IV. rszben foglalkozunk olyan jabb mdszerekkel, mint a GRAPHPLAN s a kielgtsalap tervkszts.
Bvlt az temezs, a feltteles tervkszts, a hierarchikus tervkszts s a tbbgenses tervkszts
bemutatsa.
Az V. rszben a valsznsgi hlk anyagt j algoritmusokkal bvtettk, mint pldul a vltozeliminls
s Markov lnc Monte Carlo algoritmusok. Egy, a bizonytalan temporlis kvetkeztetsekkel foglalkoz j
fejezetet rtunk, ahol rejtett Markov-modellekrl, Kalman-szrkrl s dinamikus valsznsgi hlkrl van
sz. Mlyebb a Markov dntsi folyamat trgyalsa, j alfejezetek foglalkoznak a jtkelmlettel s a
mechanizmustervezssel.
A VI. rszben kapcsoljuk ssze a statisztikai, a szimbolikus s a neurlis tanulst tovbb a boosting
algoritmusokkal, az EM algoritmussal, a pldnyalap tanulssal s a kernelmdszerekkel (support vector
machines, szupport vektor gpek) foglalkoz rszekkel bvtjk anyagot.
A VII. rszben a nyelvfeldolgozs trgyalst a prbeszdmegrtssel s a nyelvtaninduklssal bvtjk. j
rsz foglalkozik a nyelv valsznsgi modellezsvel, az informci-visszakeressi s fordtsi
alkalmazsokkal. A robotika trgyalsnl kiemeljk a bizonytalan szenzoradatok egyestst. A ltssal
foglalkoz anyagrsz objektumfelismerssel bvlt.
A VIII. rszben egy j alfejezetben az MI etikai kvetkezmnyeivel foglalkozunk.
A knyv javasolt hasznlata
A knyvnek 27 fejezete van, mindegyik nagyjbl egyhetes eladsnyi anyagot jelent. Az egsz knyv
feldolgozsa kt flvet tenne gy ki. A tanfolyamot azonban a szkebb hallgati s eladi rdekldshez is
szabhatjuk. Mivel a knyv szles terletet fed le, j httranyag lehet egy rvid bevezet alapkurzushoz, de
felhasznlhat egyes tmakrket magasabb szinten bemutat specializlt gradulis kurzusokhoz is. A knyv
els kiadst felhasznl 600 egyetemi kurzus tematikjbl egy zelt az aima.cs.berkeley.edu weblapon
tallhat. Itt nhny hasznos tancs is tallhat arra nzve, hogy konkrt specilis ignyekhez hogyan
llthatunk ssze egy megfelel tmaszekvencit.
A knyv 385 gyakorlatot tartalmaz. Azokat, amelyekhez nagyobb llegzet programozsi munka is szksges,
egy klaviatra ikon jelzi. Az ilyen gyakorlatokat legjobban gy lehet megoldani, hogy ignybe vesszk az
aima.cs.berkeley.edu programkdtr szolgltatsait. Mretnl fogva nhny gyakorlat flves hzi feladatknt
is kiadhat.
xxxv
Elsz
Olvasnival. A gyakorlatok egy rsze irodalmazst is ignyel. Ezeket egy nyitott knyv ikon jelzi.
Fontos
A knyvben a fontos rszeket egy mutat kz ikon jelzi. Hogy a knyvben az egyes tmkat knny
legyen megtallni, kiterjedt trgymutatt is ksztettnk.
A Weboldal hasznlatrl
Az aima.cs.berkeley.edu weboldalon megtallhatk:
a knyvbeli algoritmusok implementcija tbb klnbz programozsi nyelven;
a knyvet hasznl tbb mint 600 oktatsi intzmny listja, szmos webes linkkel az online oktatsi
anyagokhoz;
annotlt linkek listja tbb mint 800 olyan weboldalhoz, ahol hasznos MI-tartalom tallhat;
a segdanyagok s linkek fejezetenknti listja;
tmutat, hogy hogyan csatlakozhatunk a knyvvel foglalkoz vitafrumhoz;
tmutat, hogy a krdseinkkel s az szrevteleinkkel hogyan lphetnk kapcsolatba a szerzkkel;
tmutat, hogy a nagy valsznsggel elfordul hibkat hogyan jelezzk;
a knyvbeli brk, flik s ms oktatshoz hasznos anyagok.
Ksznetnyilvnts
A 24. fejezet (Az szlels) nagy rszt Jitendra Malik, a 25. fejezet (Robotika) tbbsgt az els kiadsban John
Canny, a jelen kiadsban pedig Sebastian Thrun rta. Az Irodalmi s trtneti megjegyzseket az els kiadshoz
Doug Edwards kutatta fel. Tim Huang, Mark Paskin s Cynthia Bruyns segtettek az brk s az algoritmusok
megfelel formj kialaktsban. A Prentice Hall kiadnl Alan Apt, Sondra Chavez, Toni Holm, Jake Warde,
Irwin Zucker s Camille Trentacoste minden tlk telhett megtettek, hogy rknyszertsenek bennnket a
hatridk betartsra, s sok hasznos javaslattal segtettk, hogy a knyv a megfelel tartalommal s megfelel
kntsben jelenjen meg.
Stuart meg szeretn ksznni szleinek a folyamatos tmogatst s btortst, felesgnek, Loy Sheflottnak a
vgtelen trelmt s a hatrtalan blcsessgt. Remli, hogy Gordon s Lucy rvidesen mr olvashatjk is ezt.
Igen segtksznek bizonyult az RKHC (Russell Kivteles Hallgati Csoportja) is.
Peter szeretn megksznni szleinek (Torsten s Gerda) az indttatst. Felesgnek (Kris), gyerekeinek s
bartainak kszni a btortst s azt, hogy elviseltk t a knyv megrsnak hossz ideje s a knyv trsnak
mg hosszabb ideje alatt.
Adsak vagyunk a Berkeley, a Stanford, az MIT s a NASA knyvtrosainak s a CiteSeer, tovbb a Google
fejlesztinek, hogy a kutats mdjt forradalmastottk.
Nem tudunk kln-kln ksznetet mondani mindenkinek, aki a knyvet hasznlta, s hasznos
megjegyzsekkel llt el, azonban az albb felsoroltak klnsen hasznos megjegyzseit meg szeretnnk
ksznni: Eyal Amir, Krzysztof Apt, Ellery Aziel, Jeff Van Baalen, Brian Baker, Don Barker, Tony Barrett,
James Newton Bass, Don Beal, Howard Beck, Wolfgang Bibel, John Binder, Larry Bookman, David R. Boxall,
Gerhard Brewka, Selmer Bringsjord, Carla Brodley, Chris Brown, Wilhelm Burger, Lauren Burka, Joao
Cachopo, Murray Campbell, Norman Carver, Emmanuel Castro, Anil Chakravarthy, Dan Chisarick, Roberto
Cipolla, David Cohen, James Coleman, Julie Ann Comparini, Gary Cottrell, Ernest Davis, Rina Dechter, Tom
Dietterich, Chuck Dyer, Barbara Engelhardt, Doug Edwards, Kutluhan Erol, Oren Etzioni, Hana Filip, Douglas
Fisher, Jeffrey Forbes, Ken Ford, John Fosler, Alex Franz, Bob Futrelle, Marek Galecki, Stefan Gerberding,
Stuart Gill, Sabine Glesner, Seth Golub, Gosta Grahne, Russ Greiner, Eric Grimson, Barbara Grosz, Larry Hall,
Steve Hanks, Othar Hansson, Ernst Heinz, Jim Hendler, Christoph Herrmann, Vasant Honavar, Tim Huang,
Seth Hutchinson, Joost Jacob, Magnus Johansson, Dan Jurafsky, Leslie Kaelbling, Keiji Kanazawa, Surekha
Kasibhatla, Simon Kasif, Henry Kautz, Gernot Kerschbaumer, Richard Kirby, Kevin Knight, Sven Koenig,
xxxvi
Elsz
Daphne Koller, Rich Korf, James Kurien, John Lafferty, Gus Larsson, John Lazzaro, Jon LeBlanc, Jason
Leatherman, Frank Lee, Edward Lim, Pierre Louveaux, Don Loveland, Sridhar Mahadevan, Jim Martin, Andy
Mayer, David McGrane, Jay Mendelsohn, Brian Milch, Steve Minton, Vibhu Mittal, Leora Morgenstern,
Stephen Muggleton, Kevin Murphy, Ron Musick, Sung Myaeng, Lee Naish, Pandu Nayak, Bernhard Nebel,
Stuart Nelson, XuangLong Nguyen, Illah Nourbakhsh, Steve Omohundro, David Page, David Palmer, David
Parkes, Ron Parr, Mark Paskin, Tony Passera, Michael Pazzani, Wim Pijls, Ira Pohl, Martha Pollack, David
Poole, Bruce Porter, Malcolm Pradhan, Bill Pringle, Lorraine Prior, Greg Provan, William Rapaport, Philip
Resnik, Francesca Rossi, Jonathan Schaeffer, Richard Scherl, Lars Schuster, Soheil Shams, Stuart Shapiro, Jude
Shavlik, Satinder Singh, Daniel Sleator, David Smith, Brian So, Robert Sproull, Lynn Stein, Larry Stephens,
Andrea Stolcke, Paul Stradling, Devika Subramanian, Rich Sutton, Jonathan Tash, Austin Tate, Michael
Thielscher, William Thompson, Sebastian Thrun, Eric Tiedemann, Mark Torrance, Randall Upham, Paul
Utgoff, Peter van Beek, Hal Varian, Sunil Vemuri, Jim Waldo, Bonnie Webber, Dan Weld, Michael Wellman,
Michael Dean White, Kamin Whitehouse, Brian Williams, David Wolfe, Bill Woods, Alden Wright, Richard
Yen, Weixiong Zhang, Shlomo Zilberstein s a Prentice Hall nvtelen brli.
A knyv bortjrl
A bortn lthat kpet a szerzk szerkesztettk s Lisa Marie Sardegna s Maryann Simmons kivitelezte SGI
Inventor s az Adobe Photoshop segtsgvel. A cmlap az MI trtnetbl az albbiakat eleventi fel:
1. Arisztotelsz tervkszt algoritmusa a De Motu Animalium c. mbl (kb. i.e. 400).
2. Ramon Lull fogalomgenertora az Ars Magna c. mbl (1300 krl).
3. Charles Babbage Differencil Gpe, az els univerzlis szmtgp prototpusa (1848).
4. Az elsrend logika Gottlob Frege-fle formalizmusa (1789).
5. A logikai kvetkeztets Lewis Carroll-fle diagramjai.
6. A valsznsgi hlzat Sewall Wright-fle brzolsa (1921).
7. Alan Turing (19121954).
8. Shakey a Robot (19691973).
9. Egy korszer diagnosztikai szakrti rendszer (1993).
A Szerzkrl
Stuart Russell 1962-ben Portsmouth-ban, Angliban szletett. 1982-ben Oxfordban fizikbl szerzett
kitntetses oklevelet, majd 1986-ban a Stanfordon doktorlt szmtgpes tudomnyokbl. Ettl kezdve a
Kalifornai Berkeley Egyetemen (University of California at Berkeley) dolgozik, ahol jelenleg a szmtgpes
tudomnyok professzora, az Intelligens Rendszerek Kzpont igazgatja s a SmithZadeh mrnktudomnyi
tanszk vezetje. 1990-ben megkapta a Nemzeti Kutatsi Alap Fiatal Kutatk Elnki Djt, 1995-ben pedig
msodmagval a Szmtgp s a Gondolat Djat. 1996-ban a Miller Intzet sztndjas professzora volt a
Kaliforniai Egyetemen s 2000-ben megkapta a tekintlyes hromves, rektori kutati-professzori sztndjat.
1998-ban a Stanfordon Forsythe-emlkeladsokat tartott. Az Amerikai MI Trsasg tagja, korbban pedig a
trsasg vezetsgi tagja volt. Tbb mint 100 cikket publiklt az MI klnbz terleteirl. Tovbbi knyvei
kztt megtalljuk a The Use of Knowledge in Analogy and Induction s (Eric Wefalddal egytt) a Do the Right
Thing: Studies in Limited Rationality c. knyveket.
Peter Norvig a Search Quality rszleg vezetje a Google-nl. Az Amerikai MI Trsasg vezetsgi tagja.
Korbban a NASA Ames Research Centerben a Szmtstudomnyi Osztly igazgatja volt, ahol felgyelte a
NASA MI- s robotikai kutatsait s fejlesztseit. Ezt megelzen a Junglee-nl dolgozott tudomnyos
fmunkatrsknt, ahol hozzjrult az els internetes informcikinyer szolgltats kifejlesztshez, valamint a
Sun Microsystems Laboratoriesnl vezet kutatknt, ahol az intelligens informci-visszaszerzsen dolgozott.
Diplomjt alkalmazott matematikban a Brown Egyetemen, PhD-fokozatt, szmtgpes tudomnyokban, a
Kaliforniai Egyetemen Berkeleyben kapta. A Dl-kaliforniai Egyetemen professzorknt, a Berkeleyben,
Kaliforniban pedig a tanszki kutatcsoport tagjaknt dolgozott. Tbb mint 50 publikcija van a szmtgpes
tudomnyok terletn. Ezek kztt talljuk a Paradigms of AI Programming: Case Studies in Common Lisp,
Verbmobil: A Translation System for Face-to-Face Dialog s Intelligent Help System for UNIX c. knyveket.
xxxvii
1. fejezet - Bevezets
Amelyben megksreljk megmagyarzni, hogy mirt tartjuk a mestersges intelligencit olyan terletnek, amit
igenis rdemes tanulmnyozni, s amelyben azt is megksreljk eldnteni, hogy vajon mi is ez a terlet.
Az ember Homo sapiensnek gondolkod embernek nevezte el a sajt fajtjt, mert mentlis kpessgeink
annyira fontosak a szmunkra. vezredek ta prbljuk megrteni azt, hogy hogyan gondolkozunk. Azt, hogy az
anyag nhny marknyi mennyisge hogyan kpes a sajt magnl sokkal nagyobb s bonyolultabb vilgot
szlelni, megrteni, a vilg alakulst megjsolni s manipullni. A mestersges intelligencia (artificial
intelligence), rviden MI (AI), mg tovbb is megy: az intelligens entitsok megrtse mellett ilyen entitsok
ptsvel is prblkozik.
Az MI az egyik legjabb tudomnyterlet. A munka kzvetlenl a msodik vilghbor befejeztvel kezddtt.
A mestersges intelligencia elnevezs 1956-ban szletett meg. A molekulris biolgival egyetemben az MI az
a terlet, amirl ms tudomnyterletek kutati gy nyilatkoznak, hogy n legszvesebben ezzel foglalkoznk.
Egy fizikushallgat teljes joggal gondolhatja, hogy Galilei, Newton, Einstein s msok mr minden j tlettel
rg ellltak. Ezzel szemben az MI-ben az Einstein-kaliber egynisgek eltt mg szabad az t.
Az MI jelenleg az ltalnos rendeltets terletektl, mint az szlels s a tanuls, egszen olyan specifikus
feladatokig, mint a gpi sakk, a matematikai ttelbizonyts, a gpi kltszet vagy az orvosi diagnzis, a
legklnbzbb rszterletek risi vlasztkt leli t. Az MI az intellektulis kpessgeket ignyl feladatokat
rendszerezi s automatizlja, s gy potencilisan relevns az rtelmes emberi cselekvs minden terletn. Ilyen
rtelemben az MI igazn univerzlis tudomny.
1. Mi az MI?
Eddig arrl beszltnk, hogy mirt izgalmas az MI, de nem mondtuk meg, hogy mi is valjban? Az MI
definciit, nyolc jelenlegi tanknyvet kvetve, az 1.1. bra mutatja. Ezek a defincik kt dimenzi mentn
rtelmezhetk. Az bra fels rszben levk a gondolati folyamatokat s a kvetkeztetst clozzk, mg az als
rszben levk trgya a viselkeds. A bal oldali defincik a sikert az emberi teljestmnyhez mrik, mg a jobb
oldaliak mrcje az intelligencia egy idelis koncepcija, amit mi racionalitsnak (rationality) fogunk nevezni.
Egy rendszer racionlis, ha tudshoz viszonytva helyesen cselekszik.
1.1. bra - Az MI nhny meghatrozsa ngy kategriba szervezve
1
Bevezets
Az idk folyamn mind a ngy irnyzat kvetre tallt. De ahogy ez vrhat volt, feszltsg uralkodik az
embercentrikus s a racionalitscentrikus irnyzatok kztt. 1 Az embercentrikus irnyzat szksgkppen
empirikus tudomny, hipotzisekkel s empirikus igazolssal.
A racionalitscentrikus megkzelts a matematikra s a mrnki tudomnyokra tmaszkodik. Mindegyik
csoport rgalmazta is, de segtette is a tbbi csoport munkjt. Nzzk most a ngyfle megkzeltst kicsit
rszletesebben.
1.1. Emberi mdon cselekedni: Turing-teszt megkzelts

A Turing-tesztet (Turing-test) Alan Turing javasolta azzal a cllal, hogy az intelligencinak egy kielgt
munkadefincit adjon (Turing, 1950). Ahelyett hogy az intelligencira jellemz kvalitsok hossz s
felteheten vits listjt megadn, Turing egy tesztet javasolt, amelynek alapja a vitathatatlanul intelligens
entitstl egy embertl val megklnbztethetetlensge. A szmtgp akkor llja ki a prbt, ha az emberi
krdez nhny rsos krds feltevse utn nem kpes eldnteni, hogy az rsos vlaszok egy embertl vagy
egy gptl rkeznek-e. A tesztet a 26. fejezet trgyalja rszletesen, ahol azzal is foglalkozunk, hogy
intelligensnek mondhat-e a szmtgp, ha teljesti a tesztet. Jelenleg igen sok feladatot jelent egy gpet gy
programozni, hogy teljestse a tesztet. A szmtgpnek a kvetkez kpessgekkel kellene rendelkeznie:
termszetes nyelvfeldolgozs (natural language processing) a sikeres angol (illetve ms emberi) nyelv
prbeszdhez;
tudsreprezentci (knowledge representation) az ismert vagy hallott informci trolsra;
automatizlt kvetkeztets (automated reasoning), hogy a trolt informcit krdsek megvlaszolsra s
j kvetkeztetsek levonsra hasznljuk;
gpi tanuls (machine learning) az j krlmnyekhez val adaptldshoz, a mintzatok detektlsra s
ltalnostsra.
Meg kell jegyeznnk, hogy az emberi s a racionlis viselkeds megklnbztetse nem jelenti, hogy az emberek szksgszeren
irracionlisak emocionlisan instabil, elmebeteg rtelemben. Azonban fel kell figyelni arra, hogy nem vagyunk tkletesek. Nem
vagyunk valamennyien sakkmesterek, azok sem, akik a sakk minden szablyval tisztban vannak. Sajnlatos mdon nem is vizsgzik
mindenki jelesre. Az emberi kvetkeztetst terhel szisztematikus hibk egy rszt Kahneman sorolja fel (Kahneman s trsai, 1982).
1
2
Bevezets
A Turing-teszt a krdez s a szmtgp kztti fizikai klcsnhatst szndkosan kerlte, mert egy szemly
fizikai szimulcija az intelligencihoz nem szksges. Az n. teljes Turing-teszt (total Turing-test) azonban
videojelet is fel kell dolgozzon, hogy a krdez tesztelni tudja az illet rzkelsi kpessgeit, valamint
tartalmazza annak a lehetsgt is, hogy a krdez az objektumokat tadhassa egy nylson keresztl. A teljes
Turing-teszt teljestshez a szmtgpnek szksge lesz:
gpi ltsra (computer vision), az objektumok rzkelshez s
robotikra (robotics) az objektumok mozgatshoz.
Ez a hat terlet nagyjbl lefedi az MI-t. Turing becsletre vlik, hogy egy olyan tesztet tallt ki, amely 50 v
mltval is relevns maradt. Az MI-n bell a kutatk sok erfesztst mgsem fejtettek ki a Turing-teszt
teljestse rdekben, abban a hiedelemben, hogy a mgtte sorakoz elvek tanulmnyozsa fontosabb, mint
egy pldny dupliklsa. A mestersges repls kutatsa akkor jrt sikerrel, amikor a Wright testvrek
abbahagytk a madarak utnzst, s az aerodinamikt kezdtk tanulmnyozni. A replssel foglalkoz knyvek
nem azt a clt fogalmazzk meg, hogy olyan gpeket kellene pteni, amelyek annyira hasonlan replnek a
galambokhoz, hogy ezzel akr ms galambokat is kpesek megtveszteni.
1.2. Emberi mdon gondolkodni: a kognitv modellezs

Ha azt szeretnnk kijelenteni, hogy egy program emberi mdon gondolkodik, valamilyen mdon meg kellene
hatroznunk, hogy az emberek hogyan gondolkodnak. Ehhez az emberi elme mkdsi mechanizmusnak
belsejbe kellene tudnunk belenzni. Kt mdja van ennek: nelemzs rvn az tsuhan gondolataink
megragadsval vagy pszicholgiai ksrletekkel. Ha egyszer majd rendelkeznk az elme elegenden rszletes
elmletvel, lehetsgess vlik az elmlet szmtgpes programmal val kifejezse. Ha a program bemenetei s
kimenetei, valamint idztse az emberi viselkedssel megegyeznek, ez egyben bizonytk arra, hogy a program
bizonyos mechanizmusai felteheten az emberben is megtallhatk. gy pldul Newell s Simon, akik az
ltalnos problmamegoldt (General Problem Solver, GPS) (Newell s Simon, 1961) kifejlesztettk, csupn
azzal, hogy a programjuk helyesen oldja meg a problmkat, nem voltak elgedettek. Jobban rdekelte ket,
hogy sszehasonltsk a program kvetkeztetsi lpseit az ugyanazon a feladaton dolgoz emberek lpseivel.
Az MI szmtgpes modelljeit s a pszicholgia ksrleti technikit a kognitv tudomny (cognitive science)
interdiszciplinris terlete kapcsolja ssze azltal, hogy ksrletet tesz precz s verifiklhat elmletek
megfogalmazsra az emberi elme mkdsrl.
A kognitv tudomny nmagban is vonz terlet, annyira, hogy egy nll enciklopdia ltrehozsnak is van
rtelme (Wilson s Keil, 1999). A knyvnkben meg sem ksreljk lerni, hogy az emberi megismersbl mit
tudunk mr. Esetenknt azonban kitrnk az MI-technikk s az emberi gondolkods kztti hasonlsgokra s
klnbsgekre. Az igazi kognitv tudomny szksgszeren a valdi emberek, illetve llatok ksrleti
kutatsn alapul, mi pedig felttelezzk, hogy az olvas a ksrleteihez csupn szmtgppel rendelkezik.
Az MI-kutats kezdeti szakaszban a megkzeltseket sokszor ssze is kevertk. Egy szerz llthatta pldul,
hogy ha egy algoritmus egy feladaton jl vizsgzik, akkor j modellje az emberi kpessgeknek, s megfordtva.
A mai szerzk a ktfle ignyt elklntik. Ez a megklnbztets mind az MI, mind a kognitv tudomny
gyorsabb fejldst tette lehetv. Az MI s a kognitv tudomny folyamatosan termkenyten hatnak
egymsra, klnskppen a lts s a termszetes nyelv vonatkozsban. A lts a kzelmltban klnsen
sokat fejldtt a neurofiziolgiai eredmnyeket s a szmtsi modelleket sszefog integrlt megkzelts
rvn.
1.3. Racionlisan gondolkodni: a gondolkods trvnye

Arisztotelsz grg filozfus volt az elsk egyike, aki megksrelte a helyes gondolkods, azaz a
megcfolhatatlan kvetkeztetsi folyamatok trvnyekbe foglalst. Hres szillogisztikja (syllogisms) olyan
mintkat szolgltatott a kvetkeztetsi smkhoz, amelyek helyes premisszkbl mindig helyes
kvetkezmnyekre vezettek. Pldul Szkratsz egy ember; minden ember haland; azaz Szkratsz haland.
Ezekrl a gondolkodsi trvnyekrl feltteleztk, hogy az elme mkdst irnytjk, s ezek indtottk el a
logika (logic) tudomnynak kialakulst.
A 19. szzadban a logikusok a logika tudomnyt mvelk megadtk a vilg mindennem objektumra s
az azok kztti relcikra vonatkoz lltsoknak a precz megfogalmazst. (Hasonltsuk ezt a kznsges
aritmetikai jellsrendszerhez, ami fleg a szmokon rtelmezett egyenlsgek s egyenltlensgek kifejezsre
alkalmas.) 1965-ben lteztek mr olyan programok, amelyek legalbb elvben kpesek voltak tetszleges,
3
Bevezets
logikai jellsekkel kifejezett problmhoz megadni a problma megoldst. 2 Az MI-n bell uralkod logicista
(logicist) hagyomny azt remli, hogy ilyen programokra alapozva intelligens rendszereket kpes ltrehozni.
Ennek a megkzeltsnek kt alapvet baja van. Elszr is a logikai jellsrendszer ltal ignyelt formlis
elemekkel informlis tudst kifejezni nem ilyen egyszer, klnsen ha a tuds nem 100%-osan biztos. A msik
az, hogy nagy a klnbsg egy problma elvi, illetve gyakorlati megoldsa kztt. Mr a nhny tz tnyt
kitev problmk megoldsa is kimertheti egy tetszleges szmtgpes rendszer szmtsi erforrsait, hacsak
valamilyen mdon nincs vezrelve, hogy melyik kvetkeztetsi lpsekkel prblkozzk elszr. Annak
ellenre, hogy ez a kt problma a szmtgpes kvetkeztet rendszer brmilyen elven trtn fejlesztsnl
felbukkan, elszr a logicista hagyomnyban jelent meg.
1.4. Racionlisan cselekedni: a racionlis gens

Egy gens (agent) nem ms, mint valami, ami cselekszik (az gens sz forrsa a latin agere cselekedni).
Szmtgpes gensektl azonban elvrjuk, hogy legyenek ms jellemzi is, amelyekben klnbznek a
mezei programoktl. Ilyen jellemzk pldul az autonm vezrls felgyelte cselekvs, a krnyezet szlelse,
a hosszabb idej tarts ltezs, a vltozsokhoz trtn adaptci s msok cljainak az tvtele. Egy racionlis
gens (rational agent) a legjobb kimenetel rdekben vagy bizonytalansg jelenltben a legjobb vrhat
kimenetel rdekben cselekszik.
A gondolkods trvnye megkzeltsben a hangsly teljes egszben a korrekt kvetkeztetseken volt.
Korrekt kvetkeztetsek meghozatala egyes esetekben a racionlis gensek rszt kpezi, hiszen a racionlis
cselekvs egyik mdja, hogy logikusan kvetkeztetve olyan kvetkezmnyekre jutunk, hogy adott cselekvs a
cljaink elrst biztostja. A korrekt kvetkeztets azonban nem egsze a racionalitsnak, mert gyakran
megesik, hogy akkor is cselekedni kell, amikor bizonythatan korrekt cselekvs nem ltezik. A racionlis
cselekvsnek olyan esetei is vannak, amikor kvetkeztetsnek nyoma sincs. gy pldul a forr klyhtl a kezet
elrnt reflexszer cselekvs sikeresebb, mint a tudatos megfontolsbl add lassabb mozdulat.
A Turing-teszthez szksges minden kpessg lnyeges a racionlis cselekvs megvalstsa szempontjbl. A
tudsreprezentls s a kvetkeztets kpessge szksges ahhoz, hogy a helyzetek szles spektrumban helyes
dntsre juthassunk. Termszetes nyelven megfogalmazott rthet szvegek kimondsval egy komplex
trsadalomban is elboldogulunk. Tanulsra nem a mveltsg kedvrt van szksg. A vilg mkdsrl
alkotott jobb elkpzelsek hatkonyabb stratgikhoz vezethetnek a krnyezetnkkel val kapcsolat
kialaktsban. A vizulis rzkels nem azrt szksges, mert ltni szrakoztat dolog, hanem mert gy jobb
elkpzelsnk lesz arrl, hogy egy cselekvssel mit rhetnk el. Egy zletes falat ltvnya pldul segt abban,
hogy tudatosan rte nyljunk.
Fontos
Emiatt az MI-nek mint racionlis gensek tervezsnek a tanulmnyozsa kt elnyt jelent. Elszr is
ez a megkzelts a gondolkods trvnye megkzeltsnl ltalnosabb, hiszen a korrekt
kvetkeztets csupn egyike a racionalitst biztost mechanizmusoknak. Msodszor, tudomnyosan
jobban is kezelhet, mint azok a megkzeltsek, amelyek az emberi viselkedsen vagy emberi
gondolkodson alapulnak, mert a racionalits mrtke jl definilt s teljesen ltalnos. Az emberi
viselkeds viszont egy bizonyos specifikus krnyezethez jl adaptldott, s rszben egy olyan
bonyolult, zmben nem ismert evolcis folyamat eredmnye, amely valsznleg mg messze ll a
tkletessgtl. Knyvnk teht a racionlis gensek ltalnos elveire s a ltrehozsukhoz szksges
komponensekre koncentrldik. Ltni fogjuk, hogy a problmamegfogalmazs ltszlagos
egyszersge ellenre, hihetetlen sok kvetkezmnnyel kell szembenznnk, ha megksreljk a
problmt megoldani. Nhny ilyen kvetkezmnyrl rszletesebben a 2. fejezet szl.
Egy fontos dologrl nem szabad elfeledkezni: rvidesen megltjuk, hogy sszetett krnyezetben a tkletes
racionalitst mindig helyesen cselekedni lehetetlen elrni. A szmtsi szksgletek egyszeren tl nagyok.
A knyv nagyobb rszben azonban azzal a munkahipotzissel fogunk lni, hogy a tkletes dntshozatal
megrtse j kiindulpont. A problma gy egyszerbb vlik, s megfelel keretet nyjt a terlethez tartoz
alapoz anyag tbbsghez. A korltozott racionalitssal (limited rationality) azaz megfelelen cselekedni,
mikzben az sszes kvnt szmts elvgzsre nincs elegend id explicit mdon a 6. s a 17. fejezet
foglalkozik.
Ha nincs megolds, a program a keresst esetleg soha nem fejezi be.
4
Bevezets
2. A mestersges intelligencia alapjai

Ebben a rszben azon tudomnyterletek rvid trtnett mutatjuk be, amelyek tleteikkel, nzpontjukkal,
mdszereikkel hozzjrultak az MI-hez. Mint minden trtnetnl, most is csak kevs szemlyrl s esemnyrl
tudunk megemlkezni, msokat, akik, illetve amelyek szintn fontosak, figyelmen kvl hagyunk. Az
esemnyeket egy krdssorozat krl rendeztk sorba. Ugyanakkor azt a benyomst sem szeretnnk kelteni,
mintha ezek a krdsek a terlet ltal kizrlagosan vizsglt krdsek lennnek, vagy, hogy ezek a
tudomnyterletek clkitzseikben mind az MI irnyba fejldtek volna.
2.1. Filozfia (i. e. 428-tl napjainkig)

Lehet-e formlis szablyok rvn helyes konklzikhoz jutni?
Hogyan emelkedik ki a mentlis elme a fizikai agybl?
Honnan jn a tuds?
A tuds hogyan vezet a cselekvshez?
Arisztotelsz (i. e. 384322) volt az els, aki megksrelte preczen megfogalmazni az elme racionlis rszn
uralkod trvnyszersgeket. A korrekt kvetkeztetseket ler szillogizmusok informlis rendszert
fejlesztette ki, ami elvben lehetv tette a konklzik gpies szrmaztatst, ha a kezdeti premisszk egyszer
adottak voltak. Sokkal ksbb Ramon Lull (lt 1315-ig) javasolta, hogy a hasznos kvetkeztetst ppensggel
egy gpezetre r lehetne bzni. Az ltala javasolt fogalmi kerekek a knyv bortjn lthatk. Thomas Hobbes
(15881679) felvetette, hogy a kvetkeztets olyan, mint egy numerikus szmts, vagyis hogy csendes
gondolatainkban kivonunk s sszeadunk. Ekzben a szmtsok automatizlsa mr a legjobb ton haladt.
1500 krl Leonardo da Vinci (14521519) megtervezett br meg nem ptett egy mechanikus kalkultort.
A kalkultor kzelmltbeli rekonstrukcija bebizonytotta, hogy a tervezet mkdkpes volt. Az els ismert
szmtgpet 1623 krl Wilhelm Schickard (15921635) nmet tuds konstrulta, br a Blaise Pascal (1623
1662) ltal 1642-ben ptett Pascaline ismertebb. Pascal azt rta, hogy az aritmetikai gp olyan hatst produkl,
ami kzelebbinek tnik a gondolathoz, mint az llatok sszes cselekvse. Gottfried Wilhelm Leibniz (1646
1716) egy mechanikus berendezst ptett, amely nem a szmokon, hanem a fogalmakon vgzett mveleteket,
br mkdsi kre igen korltozott volt.
Most, hogy van mr elkpzelsnk arrl, hogy az elme formlis, racionlis rszt milyen elvek alapjn lehet
lerni, a kvetkez lpsknt az elmt fizikai rendszernek tekintjk. Ren Descartes (15961650) elemezte
elszr vilgosan az elme s az anyag kztti klnbsget s az ebbl add problmkat. Az elme tiszta fizikai
megkzeltsnek egyik problmja az, hogy kevs helyet hagy a szabad akarat szmra. Ha az elmt csupn
fizikai trvnyek uraljk, nincs tbb szabad akarata mint egy sziklnak, amely eldnti, hogy a fld
kzppontja fel fog esni. Annak ellenre, hogy Descartes a kvetkeztets hatalmnak szszlja volt, volt az
is, aki a dualizmust (dualism) javasolta. Azt tartotta, hogy az elmnek (vagy a lleknek) van olyan rsze, amely
nem rsze a termszetnek s nem alanya a fizikai trvnyeknek. Ezzel szemben gy rezte, hogy az llatok
nlklzik ezt a dualista termszetet, lnyegben gpeknek tekintendk. A dualizmus alternatvja a
materializmus (materialism), amely azt tartja, hogy ppen az agynak a fizikai trvnyek szerinti mkdse
valstja meg az elmt. A szabad akarat nem ms, mint az a md, ahogyan a vlasztsi lehetsgek szlelse a
dntsi folyamat szmra megjelenik.
Ha az elme a benne lev ismereteken operl fizikai eszkz, akkor a kvetkez problma a tuds forrsnak a
meghatrozsa. Francis Bacon (15611626) Novum Organumtl3 indul empiricista (empiricist) mozgalmat
John Locke (16321704) kijelentse jellemzi: Nincs semmi a megrtsben, ami elbb ne ltezne az
rzkszervekben. David Hume (17111776) A Treatise of Human Nature c. mvben (Hume, 1739) javasolja
azt a fogalmat, amit ma indukcinak (induction) neveznk, nevezetesen hogy az ltalnos elveket a
komponenseik ismtld kapcsolataibl emeljk ki. Ludwig Wittgenstein (18891951) s Bertrand Russell
(18721970) munkjra alapozva a Rudolf Carnap (18911970) vezette hres Bcsi Kr kialaktotta a logikai
pozitivizmus (logical positivism) doktrnjt. Ez a doktrna azt lltja, hogy minden tudst vgs soron az
rzkszervi bemeneteknek megfelel megfigyelses lltsokon (observation sentences) alapul logikai
elmletekkel meg lehet magyarzni.4 Rudolf Carnap s Carl Hempel (19051997) igazol elmlete
Az Arisztotelsz-fle Organon, azaz a gondolkods eszkznek egy jabb vltozata.
Ebben a megkzeltsben, megvizsglva a szavak rtelmt illetve ksrleteket vgezve, vagy igazolni, vagy cfolni lehet minden rtelmes
lltst. Mivel ez a szndknak megfelelen a metafizika tbbsgt kizrja, a logikai pozitivizmus bizonyos krkben nem volt npszer.
3
4
5
Bevezets
(confirmation theory) megksrelte megvilgtani, miknt gyaraptja a tudst a tapasztalat. Carnap knyve, a
The Logical Structure of the World (Carnap, 1928) a tuds elemi tapasztalatbl trtn kinyersre egy explicit
szmtsi eljrst definilt. Ez volt taln az els olyan elmlet, amely az elmt szmtsi folyamatknt brzolta.
Az elme filozfiai kpnek utols eleme a tuds s a cselekvs kapcsolata. Az MI szempontjbl ez a krds
elsdleges fontossg, mert az intelligencia cselekvst is s kvetkeztetst is ignyel. Tovbb ahhoz, hogy
vilgos legyen elttnk, hogyan kell egy olyan genst pteni, amelynek cselekvsei jogosak vagy racionlisak
lesznek, meg kell rtennk, hogy hogyan igazolhatk a cselekvsek. Arisztotelsz a cselekvseket azrt tartotta
jogosnak, mert a clok s a cselekvsek kimenetelei kztt logikai kapcsolat lelhet fel (az albbi idzet zr
rsze a knyv bortjn is megtallhat):
De hogyan lehetsges, hogy a gondolatot nha kveti cselekvs, s nha nem, nha mozgssal
s nha anlkl? gy tnik, mintha ugyanaz a dolog trtnne itt is, mint ami a vltozatlan
objektumokra vonatkoz kvetkeztetsek meghozatalnl. De ebben az esetben az eredmny
egy spekulatv llts holott itt a premisszbl kvetkez konklzi egy cselekvs.
Kellene egy ruha, a kpeny egy ruha. Kell egy kpeny. Ami kell, azt el kell lltanom, s kell
egy kpeny. El kell lltanom egy kpenyt. A konklzi teht, hogy el kell lltanom egy
kpenyt nem ms, mint egy cselekvs.
(Nussbaum, 1978, 40. o.)
A Nicomachean Ethicsben (III. knyv, 3, 1112b) Arisztotelsz a tmt tovbb folytatja, egy algoritmust
javasolva:
Nem a clokat, hanem az eszkzket mrlegeljk. Az orvos nem azt fontolgatja, hogy
gygytson-e, a sznok sem, hogy meggyzzn-e, az llamfrfi sem azon hezitl, hogy jogot
s trvnyt teremtsen, s senki sem a clt mrlegeli. Mindenki felttelezi a clt, s azt
fontolgatja, hogy az hogyan, milyen eszkzkkel rhet el, s hogy azltal knnyen s a
lehet legjobban rhet-e el. s ha valamilyen eszkzzel elrhet a cl, azt fontolgatjuk, hogy
azzal az eszkzzel hogyan, milyen mdon rhetjk el, amg a legels okhoz el nem jutunk. Ez
az ok a felfedezs sorban a legutols s ami az elemzs rendjben az utols, a megtrtns
rendjben elsnek tnik. s ha lehetetlensghez jutunk, a keresst feladjuk, pldul ha pnzre
van szksgnk, azt viszont megszerezni nem lehet. Ha azonban valami lehetsgesnek tnik,
akkor megprblkozunk vele.
Arisztotelsz
Arisztotelsz megkzeltst 2300 vvel ksbb Newell s Simon a GPS-programjukban implementltk. Ma
ezt regresszis tervkszt rendszernek neveznnk (lsd 11. fejezet).
A clalap analzis hasznos, de nem segt akkor, amikor a clt tbb cselekvssel is el lehet rni, vagy pedig, ha
annak elrshez egy cselekvs sem elegend. Antoine Arnauld (16121694) helyesen adta meg azt a
kvantitatv formult, hogy ilyen esetekben milyen cselekvshez kellene folyamodni (lsd 16. fejezet). John
Stuart Mill (18061873) Utilitarianism c. mvben (Mill, 1863) a racionlis dnts kritriumnak a gondolatt
az emberi cselekvs minden aspektusra kiterjesztette. A dntshozatal egy jobban formalizlt elmletrl a
kvetkez rszben lesz sz.
2.2. Matematika (kb. 800-tl napjainkig)

Melyek az rvnyes kvetkeztetsek formlis szablyai?
Mi az, ami kiszmthat?
Hogyan vagyunk kpesek a bizonytalan informci alapjn kvetkeztetseket levonni?
A filozfusok szmba vettk az MI fontosabb tleteit, de ahhoz, hogy a formlis tudomnyra rtrhessnk,
szksges volt legalbb hrom alapvet terletnek a logiknak, a szmtstechniknak s a valsznsgnek
bizonyos szint matematikai formalizlsa.
A formlis logika elkpzelse egszen az kori Grgorszg filozfusaihoz nylik vissza (lsd 7. fejezet), de a
matematikai kialakulsa George Boole (18151864) munkssgval kezddtt igazn, aki rszleteiben
kidolgozta az tlet- vagy Boole-logikt (Boole, 1847). 1879-ben Gottlob Frege (18481925) kiterjesztette a
Boole-logikt, hogy az objektumokat s relcikat is tartalmazhasson. Ezzel megalkotta azt az elsrend
6
Bevezets
logikt, amely lnyegben manapsg a legalapvetbb tudsreprezentcis rendszer. 5 Alfred Tarski (19021983)
egy referenciaelmletet vezetett be, amely azt mutatja meg, hogy hogyan rendelhetk ssze a logika s a vals
vilg objektumai. A kvetkez lps annak a kidertse volt, hogy hol vannak a logiknak s a szmtsoknak az
alkalmazsi hatrai.
Az els nem trivilis algoritmusnak (algorithm) a legnagyobb kzs osztt kiszmt euklideszi algoritmust
tekintik. Az algoritmusok nmagban val tanulmnyozsa al-Hvrizmi, a 9. szzadi perzsa matematikus idejig
nylik vissza, akinek a mvei az arab szmokkal s az algebrval is megismertettk Eurpt. Boole s msok a
logikai dedukci algoritmusaival foglalkoztak, a 19. szzad vgn pedig mr erfesztsek trtntek az ltalnos
matematikai rvels logikai dedukciknt val formalizlsra. 1900-ban David Hilbert (18621943) 23
problmbl ll listt publiklt, amelyrl helyesen azt vlte, hogy matematikus trsait a szzad nagy
rszben le fogja ktni. Utols problmja azt firtatta, vajon ltezik-e a termszetes szmokra vonatkoz
tetszleges logikai llts igazsgt eldnt algoritmus. Ez a hres n. Entscheidungsproblem (eldnthetsgi
problma). Hilbert lnyegben azt a krdst tette fel, hogy a hatkony bizonytsi eljrsoknak vannak-e elvi
korltjai. Kurt Gdel (19061978) 1930-ban megmutatta, hogy a Frege s Russell-fle elsrend logikban
ltezik hatkony eljrs tetszleges igaz llts bizonytsra. Az elsrend logika azonban nem elegend a
matematikai indukci kifejezshez, ez utbbi viszont a termszetes szmok jellemzshez szksges. 1931-ben
Gdel meg is mutatta, hogy valban lteznek elvi korltok. Nemteljessgi ttele (incompleteness theorem)
kimutatja, hogy minden, a termszetes szmok tulajdonsgait kifejezni kpes nyelvben lteznek igaz, de abban
az rtelemben eldnthetetlen lltsok, hogy az igazsguk algoritmikusan nem mutathat ki.
Ez az alapvet eredmny gy is interpretlhat, hogy lteznek az egsz szmokon rtelmezhet olyan
fggvnyek, amelyek algoritmikusan nem rhatk le, magyarn nem szmthatk ki. Ez motivlta Alan Turingot
(19121954), hogy megksrelje a kiszmthat fggvnyek pontos jellemzst. Ez a megfogalmazs kiss
problematikus, mert egy szmtsi procedrnak vagy egy hatkony eljrsnak a formlis defincijt valjban
lehetetlen megadni. ltalnosan elfogadott azonban, hogy a ChurchTuring-tzis, amely azt lltja, hogy a
Turing-automata (Turing, 1936) kpes minden kiszmthat fggvnyt kiszmtani, elegend defincit
szolgltat. Turing azt is kimutatta, hogy vannak olyan fggvnyek, amelyeket semmilyen Turing-automata nem
kpes kiszmtani. gy pldul nincs olyan automata, amely ltalnossgban el tudn dnteni, hogy egy adott
program egy adott bemenetre vlaszt fog-e adni, vagy pedig rkk futni fog.
mbr az eldnthetetlensg s a kiszmthatsg fontos fogalmak a szmtsok megrtshez, a
kezelhetetlensgnek (intractability) sokkal nagyobb hatsa volt. Durvn fogalmazva a problmk egy osztlyt
kezelhetetlennek mondjuk, ha az egyes problmapldnyok megoldshoz szksges id legalbb
exponencilisan n a problmapldnyok nagysgtl fggen. A bonyolultsg polinomilis s exponencilis
nvekedse kztti klnbsgre elszr az 1960-as vek kzepn hvtk fel a figyelmet (Cobham, 1964;
Edmonds, 1965). A ktfajta nvekeds kztti klnbsg fontos, mert az exponencilis nvekeds
kvetkezmnye, hogy kzepes nagysg problmapldnyokat sem lehet rtelmes idkorlton bell megoldani.
Az intelligens viselkeds generlsnak ltalnos problmjt teht inkbb kezelhet, mint kezelhetetlen
rszproblmkra kellene lebontanunk.
Hogyan lehet egy kezelhetetlen problmt felismerni? A Stephen Cook s Richard Karp ltal tjra indtott NPteljessg (NP-completness) elmlete megadja r a vlaszt (Cook, 1971; Karp, 1972). Cook s Karp a kanonikus
kombinatorikus keressi s kvetkeztetsi problmk nagy osztlyra beltta, hogy azok NP-teljesek. Brmilyen
problmaosztly, amire egy NP-teljes problmaosztly visszavezethet, minden bizonnyal kezelhetetlen lesz (s
br mg senkinek sem sikerlt bebizonytani, hogy az NP-teljes problmk szksgszeren nem kezelhetk,
kevs tuds van ms vlemnyen). Ezek az eredmnyek lesen eltnek a szmtgp megjelenst ksr
elektronikus szuperagy Einsteinnl gyorsabb lelkesedstl. Az egyre nvekv szmtsi sebessg ellenre az
intelligens rendszerekre mindig jellemz lesz az erforrsok vatos s knyes hasznlata. Durvn fogalmazva, a
vilg egy rendkvl nagy problmapldny! Az utbbi vekben az MI segtett megrteni, hogy az NP-teljes
problmk egyes pldnyai mirt nehezek, holott msok knnynek bizonyulnak (Cheeseman s trsai, 1991).
A logikn s a szmtsokon tlmenen a matematika harmadik nagy hozzjrulsa az MI-hez a valsznsgelmlet (probability). A valsznsg gondolatt a szerencsejtkok lehetsges kimeneteleivel lerva
elszr az itliai Girolamo Cardano (15011576) fogalmazta meg. A valsznsg hamarosan felbecslhetetlen
komponense lett az sszes kvantitatv elmletnek, segtsget adva a bizonytalan mrsek s hinyos elmletek
kezelshez. Pierre Fermat (16011665), Blaise Pascal (16231662), James Bernoulli (16541705), Pierre
Laplace (17491827) s msok az elmletet tovbb fejlesztettk, s j statisztikai mdszereket vezettek be. A
Az elsrend logika Frege javasolta felrsa soha nem terjedt el. A nyilvnval okt knnyen megrtjk, ha a bortn lv pldra
pillantunk.
5
7
Bevezets
valsznsgek felfrisstsi szablyt j tnyek hatsra Thomas Bayes (17021761) javasolta. A Bayesszably s az azon alapul Bayes-analzis az MI-rendszerekben alkalmazott bizonytalan kvetkeztets korszer
megkzeltsnek az alapja.
2.3. Gazdasgtan (1776-tl napjainkig)

Hogyan kell dntennk, hogy a hasznunk maximlis legyen?
Mit kell tennnk, ha msok esetleg nem segtkszek?
Hogyan kell dntennk, ha a haszonhoz csak a tvoli jvben jutunk el?
A kzgazdasgtan tudomnya 1776-ban kapott indt lkst, amikor is Adam Smith skt filozfus (17231790)
megjelentette az An Inquiry into the Nature and Causes of the Wealth of Nations c. mvt. Amg az kori
grgk s msok a kzgazdasgi gondolkodshoz jrultak hozz, addig Smith volt az els, aki a gazdasgtant
tudomnyknt kezelte, a gazdasgokat a sajt gazdasgi jltet maximlizl klnll gensekbl llknak
kpzelve. Az emberek tbbsge azt vli, hogy a gazdasg lnyege a pnz. A kzgazdk azonban azt fogjk
lltani, hogy k igazbl azt tanulmnyozzk, hogy az emberek hogyan dntenek, hogy kvnatos
eredmnyekhez jussanak. A kvnatos eredmnyek, avagy a hasznossg (utility) matematikai kezelst
elsknt Lon Walras (18341910) formalizlta. Ezt fejlesztette tovbb Frank Ramsey (Ramsey, 1931) s
ksbb a The Theory of Games and Economic Behavior c. mvben Neumann Jnos s Oskar Morgenstern
(Neumann s Morgenstern, 1944).
A dntselmlet (decision theory), amely a valsznsg-elmletet s a hasznossgi elmletet kapcsolja ssze,
a bizonytalansg melletti (gazdasgi vagy egyb) dntshozatalhoz ad formlis s teljes keretet azaz azokban
az esetekben, amikor a valsznsgi lers megfelelen rja le a dntshoz krnyezett. Ez a megkzelts a
nagy gazdasgokhoz j, ahol az genseknek nem kell ms gensek (mint entitsok) cselekvseit figyelembe
venni. Kis gazdasgokban a helyzet inkbb egy jtkra (game) hasonlt: az egyik jtkos cselekvsei
lnyeges befolyssal lehetnek a msik jtkos hasznossgra (akr pozitv, akr negatv rtelemben). A
Neumann s Morgenstern ltal kifejlesztett jtkelmlet (game theory) (lsd mg Luce s Raiffa, 1957) olyan
meglep eredmnyeket is tartalmaz, miszerint az egyes jtkokban a racionlis gensnek vletlenszeren kell
cselekednie, vagy legalbbis olyan mdon, hogy az az ellenfelek szmra vletlennek tnjn.
Harmadik krdsnkkel, vagyis, hogy hogyan kell racionlisan dnteni, ha a haszon nem azonnali, hanem tbb
egymst kvet cselekvs sorozatnak az eredmnye, a kzgazdszok tbbsge nem foglalkozott. Ezt a
feladatot az opercikutats (operational research) terletn vizsgltk, mely Angliban ltott napvilgot,
amikor a II. vilghborban a radarteleptst igyekeztk optimalizlni, s amely ksbb a komplex
menedzsment dntshozatal terletn tallt polgri alkalmazsokra. Richard Bellman (Bellman, 1957) a
Markov dntsi folyamatoknak (Markov decision processes) nevezett szekvencilis dntsi problmkat
formalizlta. Mi ezeket a 17. s 21. fejezetben tanulmnyozzuk.
A kzgazdasgtan s az opercikutats nagyban hozzjrult a racionlis gens felfogsunkhoz, mgis az MIkutats vekig egszen ms plyn haladt. Az egyik ok a racionlis dntshozatal ltszlag igen nagy
komplexitsa (complexity) volt. Herbert Simon (19162001), az MI-kutats egyik ttrje azzal nyerte meg
1978-ban a kzgazdasgi Nobel-djat, hogy egy korai munkjban kimutatta, a kielgt dntshozatalon
(satisfying), azaz az elegenden j dntseken alapul modellek a tnyleges emberi viselkeds jobb leri,
mint azok, amelyek hosszadalmas szmtsokkal meghatrozott optimlis dntsek eredmnyekpp szlettek
(Simon, 1947). Az 1990-es vekben az gensrendszerek terletn a dntselmleti technikk irnt fokozott
rdeklds mutatkozott (Wellman, 1995).
2.4. Neurlis tudomnyok (1861-tl napjainkig)

Hogyan dolgozza fel az informcit az agy?
A neurlis tudomnyok (neuroscience) az idegrendszert, de klnsen az agyat tanulmnyozzk. Annak
egzakt mdja, hogy hogyan keletkeznek a gondolatok az agyban, a tudomny egyik nagy feladvnya. vezredek
ta tudjuk, hogy az agy valahogy rszese a gondolatnak, hiszen egy ers fejbets a mentlis funkcik
krosodshoz vezethet. Hossz ideje azt is tudjuk, hogy az emberi agy valahogy ms. I. e. 335-ben
8
Bevezets
Arisztotelsz azt rta, hogy az sszes llat kzl mrethez kpest az ember agya a legnagyobb. 6 Ennek
ellenre csak a 18. szzad kzeptl ismertk fel szles krben, hogy a tudat az agyban lakozik. Korbbi jelltek
kztt szerepelt a szv, a lp s a tobozmirigy.
1.2. bra - Az idegsejt vagy neuron rszei. Minden neuron sejttestbl vagy szmbl ll,
amely sejtmagot tartalmaz. A sejttestbl gazik el nhny dendritnek nevezett s egy
hossz, axonnak nevezett szl. Az axon j messzire elr, sokkal messzebbre, mint ahogy
ezt a jelen bra sugallja. Az axonok tipikusan 1 cm hosszak (ez a sejttest tmrjnek
100-szorosa), de elrhetik az 1 m-t is. Egy neuron 10100 000 ms neuronnal tart
kapcsolatot a szinapszisoknak nevezett csatlakozsokon keresztl. A jeleket neuronrl
neuronra egy sszetett elektrokmiai reakci tovbbtja. A jelek rvid tvon
szablyozzk az agy aktivitst, hossz tvon pedig befolysoljk a neuronok helyzett
s a kapcsoldsi rendszerket. gy tartjk, e mechanizmusok kpezik az agyi tanuls
alapjt. Az informcifeldolgozs zme az agykregben trtnik, ami az agy kls
rtege. A feldolgozs szervezeti egysge, gy tnik, egy kb. 0,5 mm-es tmrj
szvetoszlop, amelynek magassga az egsz kregre kiterjed, ez az embereknl kb. 4
mm. Egy oszlop kb. 20 000 neuront tartalmaz.
Paul Broca (18241880) afzia (beszdzavar) kutatsa agysrlt pcienseknl 1861-ben lkst adott e
terletnek, s meggyzte az orvosi szakmt, hogy az agynak lteznek lokalizlt, konkrt kognitv funkcikrt
felels rszei. Konkrtan azt mutatta ki, hogy a beszd ellltsa a bal flteke, most Broca-fle terletnek
nevezett rszre korltozdik.7 Ekkor tudtk mr, hogy az agy idegsejtekbl neuronokbl (neuron) ll, de
1873-ig, amikor Camillo Golgi (18431926) kifejlesztett egy festsi mdszert, nem tudtk az agyban az egyedi
neuronokat megfigyelni (lsd 1.2. bra). Ezt a mdszert alkalmazta Santiago Ramon y Cajal (18521934) az agy
neurlis struktrit feltr ttr munkjban.8
Ma mr vannak adataink arrl, hogy az agy egyes terletei s az ltaluk kontrolllt, vagy a szenzorikus
bemeneteket generl test rszei kztt milyen lekpezsek vannak. Az ilyen lekpezsek hetek alatt kpesek
Azta sikerlt felfedezni, hogy az egyes delfin- s cetfajtknl az agy relatv nagysga mg nagyobb. Most gy tartjk, hogy az emberi agy
tekintlyes nagysgt htrendszernek fejlettsge teszi lehetv.
7
Sokan Alexander Hoodot (Hood, 1824) idzik, mint lehetsges elsdleges forrst.
8
Golgi kitartott abban a hiedelmben, hogy az agyi funkcik egy folytonos kzegben valsulnak meg, amibe a neuronok be vannak
gyazva. Ezzel ellenttben Cajal a neurondoktrnt kpviselte. 1906-ban mindketten (megosztott) Nobel-djban rszesltek, de a dj
tvtelekor meglehetsen ellensges hangnem beszdeket tartottak.
6
9
Bevezets
drasztikus vltozsokra, radsul egyes llatoknl gy tnik, tbbszrs lekpezseket tallhatunk. Azt azonban
mg nem teljesen rtjk, hogy az egyes terletek miknt veszik t ms rszek funkciit, ha azok megsrlnek.
Az egyedi emlkek trolsrl kis hjn semmilyen elmletnk nincs.
Az p agy aktivitsnak mrse 1929-ben kezddtt, amikor Hans Berger kidolgozta az elektroencefalogrfia
(EEG) elvt. A funkcionlis mgneses rezonancia (fMRI) kzelmltbeli kifejlesztse (Ogawa s trsai, 1990)
eddig nem ltott rszletessggel trja az idegsejtkutatk el az agy aktivitst, olyan mrsket is lehetv tve,
amelyek rdekes mdon korrellnak a zajl kognitv folyamatokkal. Az ismereteket kiegszti az egyedi sejt
szintjn trtn neuronaktivits rgztsnek fejldse. A nagymrtk fejlds ellenre mg messze vagyunk
attl, hogy megrtsk, hogy e kognitv folyamatok brmelyike valjban hogyan is mkdik.
1.3. bra - A szmtgpek szmtsi erforrsainak (2003 krl) s az agy

erforrsainak durva sszehasonltsa. A knyv els kiadsa ta a szmtgpekre
jellemz szmok legalbb egy 10-es szorzval megnttek, s vrhat, hogy ez a
nvekeds ebben az vtizedben is folytatdik. Az agyra jellemz szmok az utbbi
10 000 vben nem vltoztak.
Fontos
Az igazn csodlatos szrevtel az, hogy egyszer sejtek gyjtemnye elvezethet a gondolathoz, a
cselekvshez s a tudathoz, vagy ms szavakkal: az agytl eljutunk az elmhez (Searle, 1992). Az
egyedli elvi alternatva a miszticizmus: hogy ltezik egy misztikus vilg, ahol megvalsul az elme a
fizikai tudomnyok hatskrn tl.
Fontos
Az agy s a szmtgp igen eltr feladatokat vgeznek s eltr tulajdonsgokkal rendelkeznek. Az
1.3. bra azt mutatja, hogy az emberi agyban tipikusan 1000-szer tbb neuron van, mint ahny kapu
tallhat egy korszer szmtgp processzorban. A Moore-trvny9 alapjn meg lehet jsolni, hogy
egy processzorban lv logikai kapuk szma az agyi neuronok szmt 2020 krl ri el. Az ilyen
jslatokbl persze vajmi kevs kvetkeztetsre lehet jutni. Radsul a trolkapacitsbeli klnbsg
elenysz a kapcsolsi sebessgben s a prhuzamossgban mutatkoz klnbsgekhez kpest. Egy
szmtgpes chip nanomsodpercek alatt hajt vgre egy utastst, a neuronok ennl milliszor
lassabbak. Az agy ennl tbbet is kompenzl. Minden neuron s szinapszis egyidejleg aktv, holott a
legkorszerbb szmtgpeknek is csak egy vagy legfeljebb nhny processzora van. gy annak
ellenre, hogy a szmtgp a nyers kapcsolsi sebessgben milliszor gyorsabb, az agy
vgeredmnyben szzezerszer gyorsabban oldja meg a feladatait.
2.5. Pszicholgia (1879-tl napjainkig)

Hogyan gondolkoznak s cselekszenek az emberek s az llatok?
Azt mondhatjuk, hogy a tudomnyos pszicholgia Hermann von Helmholtz nmet fizikus (18211894) s
tantvnya, Wilhelm Wundt (18321920) munkssgval kezddtt. Helmholtz tudomnyos mdszereket
A Moore-trvny azt lltja, hogy az egy ngyzetcentimterre es tranzisztorok szma minden 11,5 vben megduplzdik. Az emberi agy
kapacitsa durvn 24 milli venknt duplzdik.
9
10
Bevezets
alkalmazott az emberi lts tanulmnyozsnl, s a Handbook of Physiological Optics c. mvt mg ma is gy

tekintik, mint az emberi lts fizikjnak s fiziolginak mig egyedli legfontosabb tanulmnyt (Nalwa,
1993, 15. o.). Wundt 1879-ben a Lipcsei Egyetemen nyitotta meg a ksrleti pszicholgia els laboratriumt.
Wundt ragaszkodott azon ksrletek szigor ellenrzshez, amelyekben munkatrsai rzkelsi, illetve
asszocicis feladatokat vgeztek, hogy kzben a ksrletet vgzk gondolkodsi folyamatait is meg lehessen
figyelni. A gondos felgyelet rvn a pszicholgia inkbb tudomnny vlt, de az adatok szubjektv volta miatt
valszntlen volt, hogy egy ksrletez kpes legyen valaha is a sajt elmleteit megcfolni. Ezzel szemben az
llati viselkedst tanulmnyoz biolgusok nem nmagukra vonatkoz adatokkal dolgoztak, s egy objektv
mdszertant dolgoztak ki, amit H. S. Jenkins (Jenkins, 1906) a Behavior of Lower Organisms c. nagy hats
mve mutat be. Ezt a nzpontot az emberekre kivettve a John Watson (18781958) vezette behaviorista
mozgalom (behaviorism) a mentlis folyamatok minden elmlett elutastotta, azzal rvelve, hogy
nelemzsbl lehetetlen megbzhat bizonytkot szerezni. A behavioristk ragaszkodtak ahhoz, hogy az llatot
r rzst (vagy ingert) s az eredmnyl kapott cselekvst (mskppen vlaszt) szigoran objektv mrck
szerint tanulmnyozzuk. Olyan gondolati konstrukcikat, mint a tudst, a hiedelmeket, a clokat s a
kvetkeztets lpseit elutastottk, ltudomnyos, npi pszicholginak tartva azokat. A behaviorizmus
eredmnyesnek bizonyult a patknyoknl s a galamboknl, de az emberek megrtsben kevsb volt sikeres.
A pszicholgira azonban klnskppen 1920 s 1960 kztt az Egyeslt llamokban ers hatst
gyakorolt.
Az a kognitv pszicholgit (cognitive psychology) jellemz alapvet nzet, miszerint az agy egy
informcifeldolgoz eszkz, egszen William James (18421910)10 munkihoz vezethet vissza. Helmholtz is
ragaszkodott ahhoz az elkpzelshez, hogy az rzkelsben egy tudat alatti logikai kvetkeztetsnek is van
szerepe. A kognitv llspontot az Egyeslt llamokban httrbe szortotta a behaviorizmus, de a Frederic
Bartlett (18861969) vezette Cambridge-i Alkalmazott Pszicholgiai Intzetben (Cambridges Applied
Psychology Unit) a kognitv modellezs virgozhatott tovbb. Kenneth Craiknek, aki Bartlett hallgatja, majd
utdja volt, a The Nature of Explanation c. mve (Craik, 1943) hatrozottan visszalltotta az olyan mentlis
fogalmak legitimcijt, mint a hiedelmek s a clok, azzal rvelve, hogy ezek ugyangy tudomnyos fogalmak,
mint a nyoms vagy a hmrsklet, amikor gzokrl beszlnk, mikzben tudjuk, hogy a gzok molekulkbl
llnak, s azoknak sem nyomsuk, sem hmrskletk nincs. Craik megfogalmazta a tudsalap gens
mkdsnek hrom kulcsfontossg lpst: (1) az ingert egy bels reprezentcira le kell fordtani, (2) e
reprezentcit kognitv folyamatok manipulljk, s j bels reprezentcikat szrmaztatnak belle, amelyek (3)
ismt cselekvsre fordtdnak vissza. Craik vilgosan megmagyarzta, hogy ez a megkzelts mirt j
elgondolsa egy gensnek:
Abban az esetben, ha egy szervezet magban hordja a kls valsg s a sajt lehetsges
cselekvseinek kismret modelljt, kpes klnfle alternatvkat kiprblni, a szmra
legjobb mellett dnteni, a jvbeli helyzetekre azok bekvetkezse eltt reaglni, a mltbeli
esemnyek ismerett a jelen s a jv kezelsben felhasznlni, s a felmerl
szksghelyzetekre minden vonatkozsban kimertbb, biztonsgosabb s kompetensebb
mdon reaglni.
(Craik, 1943)
Miutn Craik 1945-ben egy biciklibalesetben meghalt, munkjt Donald Broadbent folytatta. Mve, a
Perception and Communication (Broadbent, 1958) a pszicholgiai jelensgek nhny els informcifeldolgoz
modelljt rja le. Kzben, az Egyeslt llamokban, a szmtgpes modellezs fejldse elvezetett a kognitv
tudomny (cognitive science) kialakulshoz. Ez a terlet mondhatni egy tudomnyos tallkozval indult 1956
szeptemberben az MIT-n. (Ltni fogjuk, hogy ez ppen kt hnappal ksbb kvette azt a konferencit, ahol az
MI megszletett.) A tallkozn George Miller a The Magic Number Seven, Noam Chomsky a Three Models
of Language, Allen Newell s Herbert Simon pedig a The Logic Theory Machine c. eladsokat tartottk. Ez a
hrom befolysos elads azt mutatta, hogy a szmtgpes modelleket hogyan lehet bevetni a memria, a nyelv
s a logikai gondolkods pszicholgijba. Manapsg a pszicholgusok kzt teljesen elfogadott, hogy a
kognitv elmletnek olyannak kell lennie, mint egy szmtgpes programnak (Anderson, 1980). Ezen azt rtik,
hogy az elmletnek egy kognitv funkci megvalstshoz az informcifeldolgoz mechanizmust rszletesen
le kell rnia.
2.6. Szmtgpes tudomnyok (1940-tl napjainkig)

Hogyan lehet hatkony szmtgpet pteni?
William James Henry James r testvre volt. Azt mondjk, hogy Henry gy rt irodalmat, mintha pszicholgia lenne, William viszont a
pszicholgit rta gy, mintha irodalom lenne.
10
11
Bevezets
A mestersges intelligencia sikerhez kt dolog szksges: intelligencia s valamilyen mestersgesen ltrehozott

termk, mtermk. A vlasztott mtermk a szmtgp lett. A korszer digitlis szmtgpet, majdnem egy
idben s egymstl fggetlenl, hrom, a II. vilghborban harcol orszgban talltk fel. Az els
mkdkpes szmtgp az elektromechanikus Heath Robinson11 volt, amit Alan Turing munkacsoportja 1940ben ptett azzal a kizrlagos cllal, hogy a nmet zeneteket dekdolhassk. 1943-ban ugyanez a csoport
fejlesztette ki a Colossust, egy elektroncsves, nagy teljestmny, ltalnos cl gpet. 12 Az els mkdkpes
programozhat szmtgp a Z3, a nmet Konrad Zuse 1941-bl szrmaz tallmnya volt. A lebegpontos
szmokat is Zuse tallta ki, s volt az, aki az els magas szint programozsi nyelvet, a Plankalklt
kifejlesztette. Az Egyeslt llamokban az els elektronikus szmtgpet, az ABC-t, John Atanasoff s vgzs
hallgatja, Clifford Berry lltottk ssze 1940 s 1942 kztt az Iowai llami Egyetemen. Munkjukat
nemigen tmogattk, elismerst sem kaptak rte. A mai szmtgp elfutrai kzl a legnagyobb hats gp az
ENIAC volt, amelyet egy titkos katonai projekt rszeknt John Mauchly s John Eckert rszvtelvel a
Pennsylvaniai Egyetem egy csoportja fejlesztett ki.
Az azta eltelt fl vszzad sorn a szmtgphardver minden jabb genercija sebessgben s kapacitsban
nvekedst, rban esst hozott. A teljestkpessg mintegy 18 havonta megduplzdik, s ez gy mehet mg
egy vagy kt vtizedig. Utna molukulris gpekre vagy valamilyen ms technolgira lesz szksgnk.
Termszetesen voltak szmtberendezsek az elektronikus szmtgpek eltt is. A 17. szzadbl szrmaz
legkorbbi automatizlt gpekrl mr a filozfinl volt sz. Az els programozhat gp Joseph Marie Jacquard
1805-ben feltallt szvszke volt, amely lyukasztott krtykon trolta a szvminthoz szksges utastsokat.
A 19. szzad kzepe tjn Charles Babbage (17921871) kt gpet tervezett, de egyiket sem fejezte be. A
knyvnk bortjn is lthat Difference Engine rendeltetse matematikai tblzatok szmtsa lett volna
mrnki s tudomnyos feladatokhoz. Vgl is ezt a gpet 1991-ben megptettk, s a londoni Science
Museumban mkds kzben bemutattk (Swade, 1993). A Babbage-fle Analitikus Gp (Analytical Engine)
sokkal ambicizusabb terv volt. Cmezhet memrijval, trolt programjval s feltteles ugrsaival ez volt az
els, univerzlis szmtsokra alkalmas mtermk. Ada Lovelace, Babbage kollganje, Lord Byron klt lnya
volt taln a vilg els programozja. (Az Ada programozsi nyelv rla kapta a nevt.) Ada programokat rt a
befejezetlen Analitikus Gpre, st azon is spekullt, hogy a gp sakkjtkra vagy zenekomponlsra is kpes
lehet.
Az MI a szmtgp-tudomnyok szoftveroldalnak is adsa, hiszen ez szolgltatja az opercis rendszereket, a
programozsi nyelveket s a korszer programok rshoz szksges eszkzket (s a rluk szl cikkeket). Ez
azonban egy olyan terlet, ahol az adssgot trlesztettk is. Az MI-kutatsokban megjelent sok tlet
visszakerlt a szmtgpes tudomnyok f ramlatba, belertve az idosztsos (time-sharing) opercis
rendszereket, az interaktv rtelmezket, a szemlyi szmtgpeket ablakokkal s egrrel, a gyors fejlesztst
lehetv tev fejleszti krnyezeteket, a lncolt lists adatszerkezeteket, az automatikus trolkezelst s az
objektumorientlt, szimbolikus, funkcionlis s dinamikus programozs kulcsfontossg fogalmait.
2.7. Irnytselmlet s kibernetika (1948-tl napjainkig)

Hogyan mkdhet egy mtermk a sajt irnytsa mellett?
Az els nszablyoz gpezetet egy vzi rt, amely olyan szablyozval volt elltva, hogy a vz tfolyst
konstans, megjsolhat rtken tartotta az alexandriai Ktesibios (i. e. kb. 250) ptette. Ez a tallmny
megvltoztatta annak defincijt, hogy egy mtermk mire kpes. Korbban csak az l dolgokrl tartottk,
hogy kpesek a viselkedsket a krnyezeti vltozsok hatsra mdostani. Az nszablyoz visszacsatolt
szablyoz rendszerek tovbbi pldi a James Watt (17361819) ptette gzgpszablyoz vagy a Cornelis
Drebbel (15721633) ltal feltallt termosztt. Cornelius Drebbel volt az is, aki a tengeralattjrt feltallta. A
stabil visszacsatolt rendszerek elmlett a 19. szzadban fejlesztettk ki.
A ma irnytselmletnek (control theory) nevezett terlet keletkezsben Norbert Wiener (18941964)
jtszott kzponti szerepet. Wiener zsenilis matematikus volt, aki tbbek kzt Bertrand Russell-lel is
egyttmkdtt, mieltt az rdekldst a biolgiai s mechanikai szablyoz rendszereknek s ezek a kognitv
mechanizmusokkal val kapcsolatnak szentelte. Craikhoz hasonlan (aki szintn hasznlt szablyozsi
rendszereket mint pszicholgiai modelleket), Wiener s kollgi, Arturo Rosenblueth s Julian Bigelow kihvst
Heath Robinson karikatrarajzol volt, aki a mindennapi feladatokhoz, mint pldul a vajaskenyr-kenshez, kitallt szeszlyes s abszurd
mdon bonyolult szerkezeteirl volt hres.
12
A hbor utn Turing szerette volna ezeket a szmtgpeket az MI-kutatshoz pldul az egyik legels sakkprogramhoz (Turing s
trsai, 1953) felhasznlni. Erfesztseinek azonban a brit kormny vetett gtat.
11
12
Bevezets
jelentettek a behaviorista ortodoxia szmra (Rosenblueth s trsai, 1943). Nzetk szerint a clorientlt
viselkeds a hibt az aktulis llapot s a clllapot kztti klnbsget minimalizl szablyoz
mechanizmusbl fejldik ki. Az 1940-es vek vgn Wiener, Warren McCulloch-val, Walter Pittsszel s
Neumann Jnossal egytt egy sor konferencit szervezett, ahol a kognitv folyamatok j matematikai s
szmtsi modelljeivel foglalkoztak, s a behaviorista tudomnyok terletn sok tudsra voltak hatssal. Wiener
Cybernetics c. knyve (Wiener, 1948) bestseller lett, s rbresztette a szles publikumot az intelligens
mestersges gpek lehetsgre.
A korszer irnytselmlet, s klnsen ennek a sztochasztikus optimlis szablyozs nev ga olyan
rendszerek kifejlesztst tzte ki clul, amelyek egy clfggvnyt (objective function) maximalizlnak az
idben. Ez nagyjbl megegyezik az MI-rl alkotott kpnkkel: optimlisan viselked rendszereket fejleszteni.
Akkor mirt lett az MI s az irnytselmlet kt klnbz kutatsi terlet, hiszen megalkoti mg szoros
kapcsolatban is lltak egymssal? A vlasz forrsa az a szoros kapcsolat, amely a rsztvevk ltal ismert
matematikai technikk s az ezeknek megfelel, mindegyik vilgkpben megjelen problmk halmaza kztt
alakult ki. Az irnytselmlet eszkzei, a mtrixalgebra s az analzis folytonos vltozk rgztett halmazai
ltal lerhat rendszerekhez vezettek. Az egzakt analzis radsul tipikusan csak lineris rendszerek esetben
lehetsges. Az MI-t rszben azrt alkottk meg, hogy az irnytselmlet 1950-es vekbeli matematikjtl meg
tudjanak szabadulni. A logikai kvetkeztets s a szmts eszkzei lehetv tettk az MI-kutatk szmra,
hogy olyan problmkat is figyelembe vegyenek, mint a nyelv, a lts s a tervkszts, amelyek az
irnytselmleti clkitzseken teljesen kvl estek.
2.8. Nyelvszet (1957-tl napjainkig)

Mi a nyelv s a gondolat kapcsolata?
B. F. Skinner 1957-ben publiklta a Verbal Behavior c. mvt. A knyv e terlet egyik legjobb szakrtjnek
tollbl a nyelvtanuls behaviorista megkzeltsnek tfog s rszletes trgyalst adta. Furcsamd a
knyvismertet ugyanolyan hres lett, mint maga a knyv, s a behaviorizmus irnti rdekldst csaknem
kiirtotta. Az ismertet rja Noam Chomsky volt, aki pp akkor publiklta a sajt elmletrl szl Syntactic
Structures c. knyvt. Chomsky kimutatta, hogy a behaviorista elmlet nem kezeli a nyelvben meglev
kreativitst. Az elmlet nem tudta megmagyarzni, hogy egy gyerek miknt kpes olyan mondatokat megrteni
vagy megformlni, amilyeneket korbban soha nem hallott. Chomskynak, Pnini (kb. i. e. 350) indiai nyelvszig
viszszatekint, szintaktikai modellekre alapoz elmlete viszont magyarzatot tudott adni erre, s a korbbi
elmletekkel ellenttben kellen formlis volt ahhoz, hogy legalbb elvben programozhat is legyen.
A modern nyelvszet s az MI nagyjbl ugyanabban az idben szletett meg s egytt fejldtt, a nyelv
hasznlatra sszpontost szmtgpes nyelvszetnek (computational linguistics) vagy termszetes
nyelvfeldolgozsnak (natural language processing) nevezett hibrid terleten tallkozva egymssal. A nyelv
megrtsnek problmja rvidesen sokkal bonyolultabbnak bizonyult, mint ahogy ez 1957-ben ltszott. A
nyelv megrtshez meg kell rteni a tmt s a kontextust is, nem elegend ehhez a mondat struktrjnak a
megrtse. Ez persze trivilisnak tnhet, azonban az 1960-as vekig mgsem volt ltalnosan elfogadott. A
tudsreprezentcihoz (knowledge representation) amely annak a kutatsa, hogy a tudst hogyan fejezzk
ki a szmtgp ltal feldolgozhat formban tartoz kezdeti kutatsok zme a nyelvhez ktdtt s a
nyelvszeti kutatsokbl tpllkozott, azok viszont a nyelv vtizedes filozfiai elemzseivel voltak
kapcsolatban.
3. A mestersges intelligencia trtnete

A bevezet anyaggal a htunk mgtt most mr kszek vagyunk arra, hogy felvzoljuk a sz szoros rtelmben
vett mestersges intelligencia fejldst.
3.1. A mestersges intelligencia rleldse (19431955)

Az els olyan eredmnyt, amit ma ltalnosan MI-eredmnynek ismernek el, Warren McCulloch s Walter Pitts
rte el (McCulloch s Pitts, 1943). Hrom forrsbl mertettek: az alapszint fiziolgiai s az agyi neuronok
mkdsre vonatkoz ismeretekbl, az tletkalkulus Russell s Whitehead-fle formlis elemzsbl s
Turing szmtselmletbl. Egy mestersges neuron modellt javasoltak, ahol minden neuron vagy
bekapcsolt, vagy kikapcsolt llapotban lehet, s ahol az tkapcsols be llapotba akkor trtnik, amikor a
neuront kell szm szomszdos neuron stimullja. A neuron llapotrl azt tartottk, hogy tnylegesen azzal a
logikai lltssal ekvivalens, amely a megfelel ingert kivltotta. Kimutattk pldul, hogy sszekapcsolt
13
Bevezets
neuronok valamilyen hlzatval minden kiszmthat fggvny elllthat, s hogy egyszer

hlstruktrkkal az sszes logikai mveletet (S, VAGY, NEM stb.) is el lehet lltani. McCulloch s Pitts
azt is felvetette, hogy egy megfelelen kialaktott hl kpes lehet tanulni is. Donald Hebb egy olyan egyszer
rtkfrisst szablyt mutatott be a neuronok kztti sszekttetsek erssgnek mdostsra, amely lehetv
teszi a tanulst (Hebb, 1949). Tanulsi szablya, amit Hebb-tanulsnak (Hebbian learning) neveznk, mig
rvnyes hats modellnek bizonyult.
1951-ben a Princeton Egyetem matematika tanszkn kt vgzs hallgat Marvin Minsky s Dean Edmonds
megptette az els neurlis szmtgpet. A Snarc-nak elnevezett gpben 3000 elektroncs s a B24 bombz
automatapilta mechanizmusa egy 40 neuronbl ll hlzatot szimullt. Minsky PhD-bizottsga szkeptikus
volt, vajon egy ilyen munkt matematiknak lehet-e nevezni, de Neumann Jnos (aki tagja volt a bizottsgnak)
lltlag gy nyilatkozott, hogy ha ez nem is matematika most, valamikor az lesz. Minsky volt ksbb az, aki
nagy hats tteleivel kimutatta a neuronhls kutats korltait.
Sok kezdeti eredmnyt lehetne MI-nek nevezni, azonban egy teljes elkpzelst az MI-rl 1950-ben Alan Turing
fogalmazott meg a Computing Machinery and Intelligence c. cikkben. Itt vezette be a Turing-teszt, a gpi
tanuls, a genetikus algoritmusok s a megerstses tanuls fogalmakat.
3.2. A mestersges intelligencia megszletse (1956)

Princeton volt az otthona az MI egy msik befolysos szemlyisgnek, John McCarthynak. Az egyetem
befejezse utn McCarthy a Dartmouth College-ba kerlt, ami a tmakr hivatalos szlhelye lett. McCarthy
meggyzte Minskyt, Claude Shannont s Nathaniel Rochestert, hogy segtsenek neki azokat az amerikai
kutatkat sszehozni, akik rdekeltek az automataelmletben, a neurlis hlkban s az intelligencia
kutatsban. 1956 nyarn egy kt hnapos munkatallkozt szerveztek Dartmouthban. sszesen tz rsztvev
gylt ssze, belertve Trenchard More-t Princetonbl, Arthur Samuelt az IBM-tl, valamint Ray Solomonoffot
s Oliver Selfridge-et az MIT-bl.
A plmt a Carnegie Tech.13 kt kutatja, Allen Newell s Herbert Simon vitte el. Br msoknak is voltak
tletei, s nhny esetben konkrt alkalmazsra dmajtkra voltak programjaik is, Newell s Simon mr
egy kvetkeztet programmal, a Logic Theorist (LT)-vel rendelkezett.14 Errl Simon azt lltotta, hogy egy
olyan programot talltunk fel, amely kpes nemnumerikusan gondolkodni, s ezzel meg is oldottuk a tiszteletre
mlt anyag-szellem viszony problmjt. Nem sokkal a munkatallkoz utn a program kpes volt
bebizonytani a Russell s Whitehead Principia Mathematica c. mvnek 2. fejezetben foglalt ttelek
tbbsgt. Azt mondjk, Russell el volt ragadtatva, amikor Simon megmutatta neki, hogy az egyik ttel esetn a
program rvidebb bizonytssal llt el, mint amit a Principiban kzltek. A Journal of Symbolic Logic
szerkesztit kevsb hatotta meg a dolog. A Newell, Simon s a Logic Theorist szerzi hrmastl szrmaz
cikket elutastottk.
A dartmouthi munkatallkoz j ttrshez ugyan nem vezetett, de a fontos szemlyisgek bemutatkoztak
egymsnak. A kvetkez hsz vben k, tovbb hallgatik s kollgik az MIT-n, a CMU-n, a Stanfordon s
az IBM-nl lesznek azok, akik meghatroz szerepet tltenek be az MI terletn. A munkatallkoz taln
legtartsabb eredmnye az volt, hogy elfogadtk a terlet McCarthy ltal krelt j nevt, azaz a mestersges
intelligencit (artificial intelligence). A szmtsi racionalits taln jobb nv lett volna, de az MI nv azta
is megmaradt.
Ha bepillantunk a dartmouthi munkatallkozt javasl anyagba (McCarthy s trsai, 1955), ltjuk, mirt volt
szksgszer, hogy az MI egy kln terlett vljon. De mirt nem lehetett az MI-kutatst az irnytselmlet,
az opercikutats vagy a dntselmlet keretein bell tartani, amikor radsul ezek clkitzsei nagyon
hasonlk az MI clkitzseihez? Vagy az MI mirt nem lett a matematika egyik ga? Az els vlasz az, hogy az
MI a kezdetek ta sajtjnak tekintette az olyan emberi kpessgek dupliklst, mint a kreativits, az
nfejleszts s a nyelv hasznlata. Ezekkel a krdsekkel semmilyen ms terlet nem foglalkozott. A msik
vlasz a mdszertanban rejlik. Az emltett terletek kzl tisztn csak az MI tekinthet a szmtgpes
tudomnyok egy gnak (br az opercikutats szintn slyt helyez a szmtgpes szimulcikra). Az MI az
egyetlen olyan terlet, ahol bonyolult, vltoz krnyezetben autonm mdon mkd gpek ptse a cl.
Most Carnegie Mellon Egyetem (Carnegie Mellon University, CMU).

Az LT megrshoz Newell s Simon az IPL-t, a listakezel nyelvet is feltallta. Nem rendelkezvn fordtval, programjukat kzzel
fordtottk le gpi kdra. Hogy a hibkat elkerljk, prhuzamosan dolgoztak, s minden utasts megrsnl a binris szmokat egymsnak
tkiabltk, hogy gy biztosra menjenek.
13
14
14
Bevezets
3.3. Korai lelkeseds, nagy elvrsok (19521969)

Az MI korai vei bizonyos kereteken bell bvelkedtek a sikerekben. Ha figyelembe vesszk azoknak az
idknek a primitv szmtgpeit s programozsi eszkzeit, tovbb azt, hogy mg nhny vvel korbban is
csupn aritmetikai feladatok elvgzsre tartottk alkalmasnak a szmtgpet, megdbbent volt, hogy a
szmtgp akr csak tvolrl is okosnak tn dologra lehet kpes. rtelmisgi krkben, sszessgben, inkbb
azt szerettk volna hinni, hogy a gp X-re soha nem lesz kpes (az X-ek, Turing ltal kigyjttt hossz listja a
26. fejezetben tallhat). Az MI kutati termszetesen erre azzal vlaszoltak, hogy egyms utn demonstrltk
az X-eket. A modern MI-kutatk kzl nhnyan gy emltik ezt az idszakot, mint a Nzze uram, biz isten,
magtl megy! idejt.
Newell s Simon kezdeti sikert az ltalnos problmamegold program, a General Problem Solver, GPS
kvette. A Logic Theoristtal ellenttben ezt a programot eleve gy terveztk, hogy az emberi problmamegolds
protokolljait imitlja. Az derlt ki, hogy a program ltal kezelhet feladvnyok osztlyn bell, a rszclok s a
lehetsges cselekvsek megfontolsnak sorrendje tnyleg hasonltott ahhoz, mint ahogy a hasonl problmkon
dolgoz emberek cselekszenek. gy, a GPS volt taln az els, az emberi mdon gondolkodni megkzeltst
megtestest program. A GPS s az azt kvet programok sikere arra ksztette Newellt s Simont (Newell s
Simon, 1976), hogy megfogalmazzk hres fizikai szimblumrendszer hipotzisket (physical symbol
system), amely azt lltja, hogy a fizikai szimblumrendszerek az ltalnos intelligens cselekvs szksges s
elgsges eszkzeivel rendelkeznek. Arra gondoltak, hogy minden, intelligencit felmutat rendszernek
(legyen az ember vagy gp) kpesnek kell lennie arra, hogy szimblumokbl ll adatstruktrkat manipulljon.
Ksbb ltni fogjuk, hogy e hipotzist tbb irnybl is megtmadtk.
Az els nhny MI-programot az IBM-nl Nathaniel Rochester s kollgi fejlesztettk ki. Herbert Gelernter
egy olyan geometriai ttelbizonyt programot (Geometry Theorem Prover, Gelernter, 1959) rt, mely sok
matematikus hallgat ltal trkksnek tallt ttelt tudott bebizonytani. 1952-tl kezdve Arthur Samuel
dmajtkot jtsz programokat rt, amelyek vgl megtanultak egy ers amatr versenyzi szinten jtszani.
Ekzben sikerlt megcfolnia, hogy a szmtgp csak arra kpes, amire utastjk, hiszen programja gyorsan
megtanult nla is jobban jtszani. A program tv-bemutatsa 1956 februrjban igen nagy hatst keltett.
Turinghoz hasonlan Samuelnek is csak nehezen sikerlt gpidt szereznie. jszaka dolgozott, az IBM
szmtgpes zemben vgtesztelsre vr gpeket hasznlva. A ktszemlyes jtkokkal a 6. fejezet, a
Samuel ltal hasznlt tanul technikval s annak tovbbfejlesztsvel a 21. fejezet foglalkozik.
John McCarthy Dartmouth-bl tment az MIT-re, s ott egyetlen v alatt, a trtnelminek nevezhet 1958-as
vben, hrom kulcsfontossg eredmnyt rt el. Az 1. szm MIT AI Lab Memban definilta a Lispet, amely
elsdleges MI-programozsi nyelvv ntte ki magt. A Lisp a msodik legrgebbi nyelv, amely mg
hasznlatban van, a Fortrannl csak egy vvel fiatalabb. A Lisp esetn McCarthy rendelkezett mr a szksges
eszkzzel, de a ritka s drga szmtgpes erforrsokhoz val hozzfrs szmra is komoly problmt
jelentett. gy aztn az MIT-n McCarthy s msok kitalltk az idosztst. Szintn 1958-ban McCarthy
Programs with Common Sense cmen cikket publiklt, amelyben az Advice Takert rta le. Ez egy hipotetikus
program, amit az els teljes MI-rendszernek tekinthetnk. A Logic Theoristhez s a Geometry Theorem
Proverhez hasonlan McCarthy programja is tudst hasznlt fel egy problma megoldsnak megtallshoz.
Azonban msokkal ellenttben, ennek a programnak a vilgra vonatkoz ltalnos tudssal kellett rendelkeznie.
McCarthy megmutatta pldul, hogy nhny egyszer axima elegend ahhoz, hogy programja kpes legyen
terveket generlni arra vonatkozan, hogyan kell a repltrre kimenni ahhoz, hogy a replgpet le ne kssk.
A programot gy tervezte, hogy kpes legyen normlis mkds kzben j aximkat is elfogadni, s ennek
eredmnyeknt tprogramozs nlkl j terleteken is kompetencit mutatni. Az Advice Taker ily mdon a
tudsreprezentci s a kvetkeztets leglnyegesebb elveit testestette meg, miszerint hasznos, ha rendelkeznk
a vilgot s az gens cselekvseinek eredmnyt ler explicit s formlis reprezentcival, s kpesek vagyunk
ezt a reprezentcit deduktv mdon manipullni. Figyelemre mlt, hogy 35 v mltval mg mennyire
relevns maradt az 1958-as cikk.
1958 volt az az v is, amikor Marvin Minsky az MIT-re ment t. Kezdeti egyttmkdse McCarthyval nem
tartott sokig. McCarthy a reprezentcira s a formlis logikai kvetkeztetsre tette a hangslyt, Minskyt
inkbb az rdekelte, hogy a programok mkdkpesek legyenek, majd vgl logikaellenes llspontra
helyezkedett. 1963-ban McCarthy a Stanfordon megalaktotta az ottani MI-labort. Kutatsi programja amely
arra irnyult, hogy a logikt felhasznlja a legvgs Advice Taker ptsben lkst kapott, amikor J. A.
Robinson felfedezte a rezolcit, az elsrend logika teljes bizonytsi eljrst (lsd 9. fejezet). A Stanfordon a
kutats hangslyozottan a logikai kvetkeztets ltalnos mdszereire irnyult. A logika alkalmazsaihoz
tartoztak Cordellnek a Green krdst megvlaszol s tervkszt rendszerei (Green, 1969b), tovbb Shakey
15
Bevezets
robotikus projektje az j Stanfordi Kutatintzetben (Stanford Research Institute, SRI).15 Ez a projekt amit
rszletesebben a 25. fejezetben trgyalunk volt az els, amely a logikai kvetkeztetst s a fizikai aktivitst
teljes egszben integrlta.
1.4. bra - Egy konkrt problma, amelyet Evans ANALOGY programja megoldott
Minsky a hallgatk egsz sort irnytotta, akik a megoldsokhoz lthatan intelligencit ignyl, korltos
problmkkal foglalkoztak. Ezeket a korltos problmaterleteket ksbb mikrovilgoknak (microworlds)
neveztk el. James Slagle SAINT nev programja (Slagle, 1963a) kpes volt az elsves analzis tanfolyamra
jellemz, zrt alakra hozhat integrlszmtsi feladatokat megoldani. Tom Evans ANALOGY programja (Evans,
1968) az IQ-tesztekben elfordul (lsd 1.4. bra) geometriai analgia jelleg problmkat oldotta meg. Daniel
Bobrow STUDENT programja (Bobrow, 1967) olyan algebrai feladvnyokat oldott meg, mint pldul az albbi:
Ha Tams gyfeleinek a szma ktszerese az ltala kzztett hirdetsek 20%-a ngyzetnek,
s Tams 45 hirdetst adott kzz, akkor hny gyfele van Tamsnak?
Bobrow, 1967
A mikrovilgok legismertebbike a kockavilg lett, amely egy asztalra (vagy gyakrabban egy szimullt asztalra)
helyezett tmr geometriai testekbl ll (lsd 1.5. bra). Az ilyen vilgban rtelmezett feladat a kockk egy
bizonyos trendezse egy olyan robotkar segtsgvel, amely egyszerre egyetlenegy kockt kpes megfogni. A
kockavilg otthont adott David Huffman gpi ltsi projektjnek (Huffman, 1971), David Waltz gpi ltsi s
knyszerterjeszts-kutatsnak (Waltz, 1975), Patrick Winston tanulsi elmletnek (Winston, 1970), Terry
Winograd termszetes nyelvfeldolgozsi programjnak (Winograd, 1972) s Scott Fahlman tervkszt
programjnak (Fahlman, 1974).
1.5. bra - Egy elrendezs a kockavilgban. A SHRDLU robot (Winograd, 1972) ppen
sikeresen teljestette a keresd meg azt a blokkot, ami a kezedben tartottnl magasabb,
s tedd a dobozba utastst.
Az angol nyelvben a tervkszt tervezs (planning) s a termket kszt tervezs (design) szpen elklnl. Hogy a pontos jelentst
hangslyozzuk, az angol planning fordtsnl a tovbbiakban tervksztst hasznlunk. (A ford.)
15
16
Bevezets
A McCulloch s Pitts neurlis hlin alapul kezdeti kutats szintn virgzott. Winograd s Cowan eredmnyei
megmutattk, hogy a nagyszm elem hogyan kpes egyttesen egy egyedi fogalmat reprezentlni, mikzben
nveli a prhuzamossgot s a robusztussgot (Winograd s Cowan, 1963). Hebb tanulsi mdszereit Bernie
Widrow (Widrow s Hoff, 1960; Widrow, 1962) fejlesztette tovbb, aki a hlzatait adaline-oknak nevezte,
tovbb Frank Rosenblatt, aki a perceptronokat vezette be (Rosenblatt, 1962). Rosenblatt bebizonytotta
perceptron konvergencia ttelt (perceptron convergence theorem), kimutatva ezzel, hogy tanulsi
algoritmusa kpes a perceptron slyait gy mdostani, hogy az tetszleges bemeneti adatokhoz illeszkedjen,
feltve, hogy ilyen illeszkeds egyltaln lehetsges. Ezekrl a krdsekrl a 20. fejezetben runk majd.
3.4. Egy adag realits (19661973)

Az MI kutati mr a kezdetekben sem voltak szgyenlsek a vrhat sikereiket illeten. Gyakran idzik Herbert
Simonnak a kvetkez, 1957-bl szrmaz kijelentst:
Sem meglepni, sem sokkolni senkit nem clom de a legegyszerbben sszefoglalva azt
mondhatom, hogy a vilgban lteznek ma mr gondolkod, tanul s kreatv gpek. E
kpessgk rohamosan fog fejldni, s a kzeljvben az ltaluk feldolgozott problmk
kre sszemrhet lesz azokkal a problmkkal, amelyekkel az emberi elme eddig
megkzdtt.
Herbert Simon
Br vitathat, hogy kzeljvnek mi tekinthet, Simon nhny ms elrejelzse konkrtabb volt. Megjsolta,
hogy tz ven bell a szmtgp sakkvilgbajnok lesz, s hogy a gp fontos j matematikai tteleket fog
bebizonytani. Ezek a jslatok, ha nem is tz, hanem inkbb negyven v mltval (kzeltleg vagy teljesen), de
beigazoldtak. Simon magabiztossga a korai MI-programok egyszer pldaproblmkon felmutatott sikereibl
tpllkozott. Ezek a korai rendszerek azonban majdnem minden esetben sznalmasan csdt mondtak, ha
szlesebb krben vagy netn nehezebb problmkra akartk ket bevetni.
A nehzsg egyik forrsa az volt, hogy a korai programok az ltaluk kezelt problmkrl sokszor kevs vagy
szinte semmi tudst nem tartalmaztak, s csupn egyszer szintaktikai manipullssal rtek el sikereket. Egy
tipikusnak mondhat trtnet a korai gpi fordtssal kapcsolatos. A gpi fordtst a Nemzeti Kutatsi Alap
(National Research Council) bkezen finanszrozta azrt, hogy a Szputnyik 1957-es kilvst kveten
meggyorstsk az orosz tudomnyos cikkek fordtst. Kezdetben azt vltk, hogy az angol s az orosz
nyelvtanra alapoz egyszer szintaktikai transzformcik s az elektronikus sztrra alapoz szbehelyettests
elegend lesz a mondat pontos rtelmnek tadshoz. Valjban a fordtshoz a tma ltalnos ismerete
szksges, hogy feloldhassuk a ktrtelmsgeket, s a mondat jelentst megllaptsuk. A szellem kszsges,
de a test gyenge (the spirit is willing but the flesh is weak) hres visszafordtsa a vodka j, de a hs
romlott-ra (the vodka is good but the meat is rotten) a tapasztalt nehzsgeket vilgosan rzkeltette. Egy
17
Bevezets
tancsad bizottsg 1966-os jelentse azt llaptotta meg, hogy az ltalnos tudomnyos szveg fordtsa mg
nem megoldott, s a kzeljvben e tren gyors elrehalads nem is vrhat. Az egyetemi gpi fordtsi
projekteknek a kormny ltali finanszrozst Amerikban teljesen megszntettk. Manapsg a gpi fordts egy
nem tkletes, m szles krben alkalmazott eszkz mszaki, kereskedelmi, kormnyzati s
internetdokumentumok esetben.
Fontos
A msik nehzsget az jelentette, hogy sok olyan problma, amelyeket az MI ltal ksreltek
megoldani, kezelhetetlen volt. A korai MI-programok tbbsge gy dolgozott, hogy a problmra
vonatkoz alapvet tnyeket gpen reprezentlva, megold lpsszekvencikat prbltak ki, a
klnfle lpskombincikkal addig ksrletezve, amg nem leltek r a helyesre. A korai programok
azrt voltak hasznlhatk, mert a mikrovilgok csak kevs objektumot, s ebbl addan nagyon kevs
lehetsges cselekvst s nagyon rvid megoldsi sorozatokat tartalmaztak. Az NP-teljessg
elmletnek megfogalmazsa eltt ltalban azt tartottk, hogy a nagyobb problmkra felsklzni
csupn gyorsabb hardver s nagyobb memria krdse. A rezolcis ttelbizonyts kifejlesztst
ksr optimizmus pldul hamarosan lelohadt, amikor a nhny tucat tnynl tbbet ignyl tteleket
nem sikerlt bebizonytani. Az a tny, hogy egy program egy megolds megtallsra elvben alkalmas,
nem jelenti azt, hogy a program brmi olyan mechanizmust is tartalmaz, amely a megolds gyakorlati
megvalstshoz szksges.
A korltlan szmtsi kapacits illzija nem csak a problmamegold programokra korltozdott. A gpi
evolci (machine evolution), amelyet most genetikus algoritmusoknak (genetic algorithms) neveznk
(Friedberg, 1958; Friedberg s trsai, 1959), terletn vgzett korai ksrletek azon a ktsgtelenl helyes
feltevsen alapultak, amely szerint ha egy gpi kd programot megfelelen kicsi mutcik rvn vltoztatunk,
tetszleges, egyszer feladatot jl megold programhoz juthatunk el. Az tlet teht az volt, hogy vletlen
mutcikkal prblkozva, a program viselkedst javt mutcikat tartsuk meg. Azonban ezernyi ra gpid
ellenre sem sikerlt szinte semmilyen elrehaladst kimutatni. A korszer genetikus algoritmusok jobb
reprezentcikat hasznlnak, s tbb sikerre is vittk.
Az volt az MI ellen irnyul legfontosabb kritika a Lighthill-tanulmnyban (Lighthill, 1973), hogy nem kpes
lekzdeni a kombinatorikus robbanst. A tanulmny alapjn a brit kormny, kett kivtelvel az sszes
egyetemen minden MI-kutatsi tmogatst visszavont (a szbeszd kiss ms s sznesebb kpet fest a
nyomdafestket nem tr politikai ambcikrl s a szemlyes ellensgeskedsrl).
A harmadik nehzsg forrst az intelligens viselkeds generlshoz hasznlt alapvet struktrk
fundamentlis korltai jelentettk. Minsky s Papert Perceptrons c. knyve (Minsky s Papert, 1969) pldul azt
bizonytotta be, hogy br a perceptron (a neurlis hl egy egyszer formja) megtanulhat mindent, amit kpes
reprezentlni, vajmi keveset kpes reprezentlni. gy pldul a kt bemenet perceptront nem lehet megtantani
arra, hogy a bemeneteinek klnbzsgt felismerje. s br a szerzk eredmnyei bonyolultabb, tbbrteg
hlkra nem vonatkoztak, a neurlis hlk kutatsnak finanszrozsa rvidesen majdnem nullra esett vissza. A
sors irnija, hogy a tbbrteg neurlis hlk ksbbi, az 1980-as vekben trtn risi feltmadst hoz j
visszaterjesztses tanul algoritmust ppen 1969-ben fedeztk fel elszr (Bryson s Ho, 1969).
3.5. Tudsalap rendszerek: a hatalom kulcsa? (19691979)

A problmamegoldsnak az a kpe, amely az MI-kutats els vtizedben alakult ki, egy olyan ltalnos cl
keres mechanizmus volt, amely a teljes megolds megtallsnak rdekben szekvenciba fzte az elemi
kvetkeztetsi lpseket. Az ilyen megkzeltseket gyenge mdszereknek (weak methods) neveztk, mert
annak ellenre, hogy ltalnosak, a problmk nagy vagy nehz pldnyaira nem sklzhatk fel. A gyenge
mdszerek alternatvja az erteljesebb, terletspecifikus tuds hasznlata, amely lehetv teszi a nagyobb
granulltsg kvetkeztetsi lpsek megvalstst, s szkebb szakrti trgyterleteken a tipikus konkrt
problmk megoldst. Ahhoz, hogy egy nehz problmt megoldjunk, mondhatni majdnem ksz vlasszal
kellene rendelkeznnk.
E megkzelts egyik korai pldja a DENDRAL program volt (Buchanan s trsai, 1969). A programot a
Stanfordon fejlesztettk ki, ahol Ed Feigenbaum (Herbert Simon volt hallgatja), Bruce Buchanan (a
szmtgpes szakemberbl lett filozfus) s Joshua Lederberg (Nobel-djas genetikus) sszefogtak, hogy a
tmegspektromter ltal szolgltatott adatokbl a molekulris struktra kinyersnek problmjt megoldjk. A
program bemeneti adatai a molekula alapkplete (pldul C6H13NO2) s a tmegspektrum voltak. A spektrum
18
Bevezets
megadta a molekula bizonyos rszeinek a tmegt, amikor a molekult elektronsugrral bombztk. A

tmegspektrum tartalmazhatott pldul m = 15-nl egy cscsot, amit a metil (CH3) molekularsszel lehetett
azonostani.
A program naiv verzija a molekula kpletvel konzisztens minden lehetsges struktrt ellltott. Ezt
kveten minden egyes struktrhoz megjsolta a megfelel megfigyelhet tmegspektrumot, s ezt
hasonltotta ssze az aktulisan megfigyelt spektrummal. Ahogy vrhat volt, nagyobb molekulk esetn az
eljrs gyorsan kezelhetetlenn vlt. A DENDRAL kutati analitikus vegyszekhez fordultak segtsgrt. Azt
talltk, hogy a vegyszek a spektrumban a molekulban tallhat elterjedt rszstruktrkra utal, jl ismert
cscsmintkat keresik. gy pldul a keton (C = O) alcsoport (amely 28 sly) felismershez az albbi szably
volt hasznlatos:
ha kt olyan cscs, x1 s x2 ltezik, hogy
a. x + x = M + 28 (M a teljes molekula tmege);

1
b. x 28 egy magas cscs;

1
c. x 28 egy magas cscs;

2
d. x s x kzl legalbb egy cscs magas,

1
akkor ketoncsoport van jelen.
Azzal, hogy felismerjk, hogy egy konkrt rszstruktra a molekula rsze, a lehetsges struktrajelltek szma
nagyon nagy mrtkben cskken. A DENDRAL-rendszer hatkony volt, mert:
Az ilyen problmk megoldshoz szksges sszes elmleti tudst sikerlt (a rendszer
spektrumjsl komponensben) lekpezni az ltalnos formrl (elsdleges ismeretek) egy
hatkony specilis formra (szakcsknyv).
(Feigenbaum s trsai, 1971)
A DENDRAL fontossga abban rejlik, hogy vitathatatlanul ez volt az els sikeres tudsintenzv rendszer.
Szakrtelmt a nagyszm specilis rendeltets szably biztostotta. A ksbbi rendszerekben szintn
megjelent a McCarthy-fle Advice Taker egyik f gondolata a (szablyformj) tuds s a kvetkeztet
komponens hatrozott elklntse.
Okulva az ilyen leckn, Feigenbaum s msok a Stanfordon belekezdtek a heurisztikus programozsi projektbe
(Heuristic Programming Project, HPP) azzal a cllal, hogy megvizsgljk, a szakrtrendszereknek (expert
systems) ez az j mdszertana milyen mrtkben alkalmazhat az emberi szakrtelem ms terletein. A
kvetkez komoly erfeszts az orvosi diagnzis terletn szletett meg. Feigenbaum, Buchanan s dr. Edward
Shortliffe vrrel kapcsolatos fertzsek diagnosztizlsra fejlesztettk ki a MYCIN-rendszert. 450 szablyval a
MYCIN elrte az egyes szakrtk hatkonysgt s a kezd orvosoknl lnyegesen jobb teljestmnyt nyjtott. A
MYCIN kt f vonatkozsban klnbztt a DENDRAL-tl. Elszr is, a DENDRAL szablyaival ellenttben, a
MYCIN-szablyok szrmaztatshoz nem ltezett semmilyen ltalnos elmleti modell. A szablyokat a
szakrtk kiterjedt kikrdezse rvn kellett beszerezni, akik viszont a szablyokat knyvekbl, ms
szakrtktl s kzvetlen tapasztalatokbl mertettk. A msik klnbsg abbl eredt, hogy a szablyoknak
tkrznik kellett az orvosi ismeret bizonytalansgt. A MYCIN-ben bizonyossgi tnyezknek (certainty
factors) (lsd 14. fejezet) nevezett bizonytalansgkezel mechanizmust alkalmaztak, amelyrl akkortjt gy
tnt, jl tkrzi a tnylls diagnzisra gyakorolt hatsnak orvosi megtlst.
A trgytartomny ismeretnek fontossga nyilvnval volt a termszetes nyelvfelismers terleten is. Br
Winograd termszetes nyelvfelismer rendszere, a SHRDLU igen lnk rdekldst keltett, a szintaktikai
elemzstl val fggsge nhny, a kezdeti gpi fordtsban mr tapasztalt problmhoz vezetett. A program
kpes volt a ktrtelmsgen fellkerekedni, s a nvmsi szerkezeteket megrteni. Ez azonban azrt volt
lehetsges, mert a programot kifejezetten egy adott trgytartomnyhoz a kockavilghoz fejlesztettk ki.
Nhny kutat, kztk Eugene Charniak, Winograd vgzs trsa az MIT-rl, felvetette, hogy a termszetes
nyelv robusztus felismerse a vilgrl szl ltalnos ismereteket s ezen ismeretek ltalnos felhasznlsi
mdszereit ignyli.
A Yale-en, Roger Schank, a nyelvssz lett MI-kutat, ezt a nzetet mg jobban hangslyozta, azt lltvn, hogy
olyan dolog, mint a szintaxis pedig nincs, ami ugyan sok nyelvszt felhbortott, de egyben egy hasznos
19
Bevezets
eszmecsert is elindtott. Schank s hallgati a termszetes nyelvet felismer programok egsz sort ptettk
meg (Schank s Abelson, 1977; Wilensky, 1978; Schank s Riesbeck, 1981; Dyer, 1983). A hangslyt azonban
kevsb magra a nyelvre, sokkal inkbb a nyelv megrtshez szksges tuds reprezentlsra s a vele val
kvetkeztetsre helyeztk. E problmakrbe tartozott a sztereotip helyzetek reprezentlsa (Cullingford, 1981),
az emberi memria szervezsnek lersa (Rieger, 1976; Kolodner, 1983) s a clok, tervek megrtse
(Wilensky, 1983).
A vals alkalmazsok szles kr elterjedse a mkdkpes tudsreprezentcis smk irnti ignyek
nvekedshez vezetett. Szmos klnbz reprezentcis s kvetkeztet nyelvet fejlesztettek ki. Egyes
megoldsok a logikn alapultak pldul a Prolog nyelv, amely Eurpban, s a PLANNER nyelvcsald, amely
az Egyeslt llamokban lett npszer. Msok, a Minsky ltal bevezetett keretek (frames) (Minsky, 1975)
tlett kvetve, inkbb strukturlt megkzeltst vlasztottak. Egybegyjtttek bizonyos esemnytpusokra vagy
objektumokra jellemz tnyeket, majd azokat a biolgiai taxonmira hasonlt nagy taxonomikus
tpushierarchikba rendeztk.
3.6. Az MI iparr vlik (1980-tl napjainkig)

Az els zletileg sikeres szakrtrendszert, az R1-et a Digital Equipment Corporationnl (McDermott, 1982)
alkalmaztk. A rendszer az j szmtgpes rendszerek megrendelseit segtette konfigurlni, s 1986-ra vi
mintegy 40 milli dollr megtakartst jelentett a cgnek. 1988-ra a DEC MI-csoportja mr 40 szakrtrendszert
lltott zembe, s tbb ilyen rendszer zembe lltsa folyamatban volt. A DuPont cgnl 100 ilyen rendszer
zemelt, s folyamatban volt tovbbi 500 rendszer fejlesztse. Az ezekbl szrmaz becslt megtakarts elrte
az vi 10 milli dollrt. Majdnem minden nagyobb amerikai cg sajt MI-csoporttal rendelkezett, s vagy
hasznlta, vagy tanulmnyozta a szakrtrendszer technolgit.
1981-ben a japnok meghirdettk az tdik genercis (Fifth Generation) projektjket egy 10 ves tervet a
Prolog nyelvet gpi kdknt hasznl, intelligens szmtgpes rendszerek ptsre. Vlaszul az Egyeslt
llamokban ltrehoztk az MCC (Microelectronics and Computer Technology Corporation) kutattrsulatot,
amelynek clja a nemzeti versenykpessg biztostsa volt. Mindkt esetben az MI egy olyan ltalnosabb
erfeszts rsze lett, amely a chiptervezsre s az embergp interfsz kutatsra is irnyult. Az MCC s az
tdik Generci MI-komponensei azonban az ambicizus clkitzseket mgsem tudtk elrni. NagyBritanniban az Alvey-jelents visszalltotta a Lighthill-jelents kvetkeztben lelltott finanszrozst.16
Mindent egybevve az MI-iparnak az 1980-as nhny milli dollros forgalma 1988-ra 2 millird dollrra ntt.
Rvidesen ezutn az MI tele peridus kvetkezett be, amikor sok cg belebukott abba, hogy extravagns
greteit nem tudta teljesteni.
3.7. A neurlis hlk visszatrse (1986-tl napjainkig)

Br a szmtgp-tudomny az 1970-es vek vgn a neurlis hlk tmakrrl megfeledkezett, a kutats ms
terleteken folytatdott. A fizikusok, mint pldul Hopfield, a statisztikus mechanika mdszereit hasznltk,
hogy a hlk trolsi s optimalizlsi tulajdonsgait elemezzk (Hopfield, 1982), gy kezelve az egyszer
neuronok egyttest, mint atomok egyttest. A pszicholgusok, David Rumelhartot s Geoff Hintont is
belertve, folytattk a memria neurlis hls modelljnek kutatst. Mint ezt a 20. fejezetben megmutatjuk, az
igazi lks az 1980-as vek derekn trtnt, amikor legalbb ngy klnbz kutatcsoport jra feltallta a
visszaterjesztses tanul algoritmust, azt az algoritmust, amit elszr Bryson s Ho rtak le 1969-ben. Az
algoritmust szmos tanulproblmra alkalmaztk mind a szmtgpes tudomnyokban, mind a
pszicholgiban. Az eredmnyek szles kr bemutatsra a nagy rdekldst kelt Parallel Distributed
Processing c. (Rumelhart s McClelland, 1986) gyjtemnyes ktetben kerlt sor.
Az intelligens rendszereknek ilyen, n. konnekcionista (connectionist) modelljeit egyesek a Newell s Simon
javasolta szimbolikus modellek, valamint a McCarthy s msok ltal alkalmazott logicista megkzelts
kzvetlen versenytrsnak vltk (Smolensky, 1988). Hogy egy bizonyos szinten az ember szimblumokkal
operl, nyilvnvalnak tnhet. St Terrence Deakon The Symbolic Species c. mvben (Deakon, 1997) ezt a
kpessget az embereket definil jellemznek javasolja. A legmegrgzttebb konnekcionistk azonban krdre
vontk a tekintetben, hogy a kognitv folyamatok rszletes modelljben a szimbolikus manipulcinak van-e
egyltaln valamilyen vals magyarz szerepe. Ez a krds megvlaszolatlan maradt, s a jelenlegi llspont
az, hogy a konnekcionista s a szimbolikus megkzeltsek egyms kiegszti, nem pedig versenytrsak.
A knos helyzet elkerlsre intelligens tudsalap rendszerek (Intelligent Knowledge-Based Systems, IKBS) nven j kutatsi terletet
definiltak, hiszen a mestersges intelligencit hivatalosan trltk.
16
20
Bevezets
3.8. Az MI tudomnny vlik (1987-tl napjainkig)

A legutbbi vekben az MI-kutatsnak mind tartalmban, mind mdszertanban lnyeges vltozsok lltak be.17
Mostansg inkbb megszokott ltez elmletekre pteni, mint teljesen jakat javasolni, az lltsokat az intuci
helyett inkbb szigoran vett ttelekre, illetve komoly ksrleti bizonytkokra alapozni, tovbb a lnyeges
eredmnyeket nem jtkproblmkon, hanem vals feladatokon bemutatni.
Az MI-t rszben a ltez kutatsi terletek mint az irnytselmlet s a statisztika korltaival szembeni
kitrsi vgybl alaptottk meg. Most azonban az MI ezeket a terleteket igyekszik magban foglalni. David
McAllester szavaival:
Az MI korai szakaszban plauzbilisnak tnt, hogy a szimbolikus szmtsok j formi,
pldul a keretek s szemantikus hlk, a klasszikus elmletek nagyobb rszt elavultt tettk.
Ez egyfajta elszigeteldshez vezetett, ahol az MI a szmtsi tudomny tbbsgtl el lett
vlasztva. Ezzel az izolacionizmussal most szaktunk. Fel kell ismerni, hogy a gpi tanulst
nem szabad elszigetelni az informcielmlettl, hogy a bizonytalansg melletti
kvetkeztetst nem szabad elszigetelni a sztochasztikus modellezstl, hogy a keresst nem
szabad elszigetelni a klasszikus optimalizlstl s szablyozstl, s hogy az automatikus
kvetkeztetst nem szabad elszigetelni a formlis mdszerektl s a statikus elemzstl.
(McAllester, 1998)
Mdszertant tekintve az MI-ben vgre a tudomnyos megkzelts uralkodott el. Hogy egy hipotzist
elfogadhassunk, szigor empirikus ksrleteknek kell alvetni, s az eredmnyek relevancijt statisztikailag kell
verifiklni (Cohen, 1995). Manapsg a ksrletek reproduklhatsgt az internet s a megosztott tesztadat- s
programkdtrak szavatoljk.
Ez a folyamat a beszdfelismers terletn jl lthat. Az 1970-es vekben igen sok klnbz architektrt s
megkzeltst prbltak ki. Ezek kzl sok ad hoc jelleg s gyenge volt, amelyek mkdst csupn nhny,
erre a clra megvlasztott pldn demonstrltk. A legutbbi vekben a rejtett Markov-modelleken (hidden
Markov models, HMM) alapul megkzeltsek uraljk e terletet. A HMM-ek kt aspektusa lnyeges.
Elszr is szigor matematikai elmleten alapulnak. Ez lehetv tette, hogy a beszdkutatk a ms terleteken
kifejlesztett tbb vtizedes matematikai eredmnyekre ptsenek. Msodszor, e modelleket vals s nagymret
beszdgyjtemnyt felhasznl tanulsi folyamat sorn hozzk ltre. Ez biztostja robusztus mkdsket. A
szigor vaktesztek a rejtett Markov-modellek folyamatos javulst mutatjk. A beszdtechnolgia s a vele
rokon kzrs-felismers tban van a szles kr ipari s fogyaszti alkalmazsok fel.
Ez a trend a neurlis hlkra is igaz. Az 1980-as vekben a kutats tbbsge arra irnyult, hogy kitapasztaljk, a
hlkkal meddig mehetnek el, s hogy megtanuljk, a hlk a hagyomnyos technikktl miben klnbznek.
A jobb mdszertan s az elmleti httr rvn eljutottak ahhoz, hogy most a hlkat ssze lehet hasonltani a
megfelel statisztikai, alakfelismersi s gpi tanulsi technikkkal, s az adott alkalmazshoz meg lehet
vlasztani a leginkbb sikerrel kecsegtett. Az ilyen fejlds eredmnyekppen az adatbnyszat (data
mining) technolgia virgz j iparr ntte ki magt.
Judea Pearl Probabilistic Reasoning in Intelligent Systems c. mve a valsznsg- s a dntselmlet MI-n
belli jbli elfogadst jelezte (Pearl, 1988). Mindez azt kveten trtnt, hogy Peter Cheeseman In Defense of
Probability cikkben sszefoglalta az rdeklds jraledst (Cheeseman, 1985). A Bayes-hlk (Bayesian
networks) formalizmust a bizonytalan tnyek hatkony brzolsra s a velk trtn szabatos kvetkeztets
cljra talltk ki. Ez a megkzelts a valsznsgi kvetkeztet rendszerek 1960-as s 1970-es vekben
tapasztalt problmit nagyrszt megoldotta, s ma uralja a bizonytalan kvetkeztetsre s a szakrtrendszerekre
irnyul MI-kutatsokat. Ez a megkzelts teszi lehetv a tapasztalatbl val tanulst s ez kapcsolja ssze a
klasszikus MI s a neurlis hlk legfontosabb eredmnyeit. Judea Pearl, tovbb Eric Horvitz s David
Heckerman munkja tmogatta a normatv szakrtrendszer gondolatt, azaz egy olyan rendszert, amely a
dntselmleti trvnyeknek megfelelen racionlisan cselekszik, s nem ksrli meg az emberi szakrtket
imitlni (Pearl, 1982a; Horvitz s Heckerman, 1986; Horvitz s trsai, 1986). A Windows opercis rendszer
Vannak, akik ezeket a vltozsokat gy jellemeztk, mint az elegnsak (neats) gyzelmt a szakadtak (scruffies) felett. Az elegnsak
gy gondoljk, hogy az MI-elmleteknek szigor matematikai alapokon kell llniuk, mg a szakadtak inkbb sok tletet prblnnak ki,
programokat rnnak, s megnznk, mi mkdkpes ezekbl. Mindkt megkzelts fontos. Az elegancia fel trtn eltolds annak a
jele, hogy a terlet egy stabil s rett szintet rt el (ms krds persze, hogy ezt a stabilitst j szakadt gondolatok mennyire bolygatjk
fel).
17
21
Bevezets
tartalmaz nhny normatv szakrtrendszert a felmerl hibk javtsra. Errl az elgondolsrl szl a 1316.
fejezet.
Hasonl szeld forradalom kvetkezett be a robotika, a gpi lts s a tudsreprezentcik terletn. A
problmk s bonyolultsguk jobb megrtse, a nvekv matematikai httrrel sszefondva, robusztusabb
mdszerekhez s megvalsthat kutatsi menetrendekhez vezetett. Sok esetben a formalizls s a
specilizlds felaprzdst eredmnyezett. Az olyan tmk, mint a lts s a robotika az MI f vonaltl
egyre jobban elszigeteldnek. Az MI-nek a racionlis gensben megtesteslt egysgest kpe egy olyan
megkzelts, amely e divergl terleteken jra egysget teremthet.
3.9. Az intelligens gensek kialakulsa (1995-tl napjainkig)

Valsznleg az MI rszproblmiban elrt sikereken felbtorodva a kutatk elvettk a teljes gens
problmakrt. A teljes gensarchitektra legismertebb esete a SOAR, Allen Newell, John Laird s Paul
Rosenbloom munkja (Newell, 1990; Laird s trsai, 1987). Az n. begyazott mozgalom clul tzte ki a vals
krnyezetbe gyazott, folytonos szenzorikus adatokat fogad gensek mkdsnek a megrtst. Az intelligens
gensek szempontjbl az egyik legfontosabb krnyezet az internet. A vilghls alkalmazsokban az MIrendszerek annyira mindennaposak lettek, hogy a -bot szvgzds mr a mindennapi nyelvbe is beplt.
Radsul az MI-technolgik sok olyan internetes eszkznek kpezik az alapjt, amilyenek a keresgpek, az
ajnl rendszerek s a weboldalszerkeszt rendszerek.
E knyv els kiadsa (Russell s Norvig, 1995) mellett ms kurrens knyv is tvette az gensperspektvt (Poole
s trsai, 1998; Nilsson, 1998). A teljes genstervezs egyik kvetkezmnye, hogy fel kell ismerni, az MI eddig
elszigetelt terleteit minden bizonnyal valamelyest t kell szervezni, ha az eredmnyeiket ssze akarjuk
kapcsolni. Ma mr szles krben elfogadott, hogy az rzkel rendszerek (lts, szonr, beszdfelismers stb.)
nem kpesek a krnyezetrl tkletesen megbzhat informcit szolgltatni. A kvetkeztetsnek s a
tervksztsnek gy fel kell kszlnie a bizonytalansg kezelsre. Az gensperspektva msik lnyegi
kvetkezmnye, hogy az MI az gensekkel foglalkoz ms terletekkel, pldul az irnytselmlettel s a
gazdasgtannal, sokkal kzelebbi kontaktusba kerlt.
4. A mestersges intelligencia jelenlegi helyzete

Mit tehet az MI manapsg? Nehz erre tmr vlaszt adni, mert annyi minden trtnt, s olyan sok a mvelt
rszterlet. Az albbiakban bemutatunk nhny alkalmazst, msokrl a knyv tovbbi rszeiben sz lesz.
Autonm tervkszts s temezs: Tbb szz milli mrfldre a Fldtl a NASA Remote Agent programja
lett az els fedlzeti autonm tervkszt program, amely egy rhaj mveleteinek temezst felgyelte
(Jonsson s trsai, 2000). A Remote Agent a terveit a Fldrl kldtt magas szint clokbl generlta, s a
tervek vgrehajtsa kzben monitorozta az rhaj mkdst, hibkat detektlt, diagnosztizlt, s visszalltotta
a helyes mkdst, ha problmk lptek fel.
Ktszemlyes jtkok: Az IBM Deep Blue rendszere lett az els szmtgpes sakkprogram, amely legyzte a
vilgbajnokot, amikor egy bemutat mrkzsen 3,5 : 2,5 arnyban gyzedelmeskedett Garri Kaszparov felett
(Goodman s Keene, 1997). Kaszparov nyilatkozata szerint egy jfajta intelligencit rzett a sakktbla
mgtt. A Newsweek jsg a mrkzst az agy utols vdelmi vonalnak titullta. Az IBM rszvnyei 18
millird dollrral emelkedtek.
Autonm szablyozs: Az ALVINN szmtgpes ltrendszert arra tantottk, hogy egy gpkocsit egy
kzlekedsi svot kvetve vezessen. A rendszert a CMU NAVLAB szmtgp-vezrelt kis tehergpkocsijra
helyeztk, s arra hasznltk, hogy az Egyeslt llamokon keresztl elnavigljon. A 2850 mrfldes tvbl a
rendszer az id 98%-ban vezetett. A marad 2%-rt, fleg a sztrdalejratokon, az ember vllalta felelssget. A
NAVLAB videokamerkkal rendelkezik, amelyek az ALVINN szmra kzvettik az t kpeit. A tanulutakbl
szerzett tapasztalatok felhasznlsval az ALVINN szmtja ki a kormnykerk legjobb belltst.
Diagnzis: Valsznsgi elemzsen alapul orvosi diagnosztizl rendszerek az orvosi tudomnyok tbb
terletn szakrt orvosok szintjn voltak kpesek helytllni. Heckerman (Heckerman, 1991) ler egy esetet,
amikor a nyirokcsom-patolgia egyik vezet szakembere gnyold megjegyzst tesz egy pokolian nehz
esetet diagnosztizl program javaslatra. A rendszer fejlesztje azt javasolja, hogy krdezze meg a rendszertl
a diagnzis magyarzatt.
22
Bevezets
A gp rmutatott a dntst befolysol f tnyezkre, s megmagyarzta az adott esetben jelentkez tnetek

bonyolult klcsnhatst. A szakember vgl egyetrtett a programmal.
Logisztikai tervkszts: 1991-ben, az bl-vlsg idejn az amerikai hader automatikus logisztikai
tervksztsre s a szllts temezsre egy DART Dynamic Analysis and Replanning Tool nev rendszert
alkalmazott. A rendszer mkdse egyidejleg 50 ezer (teher- s szemlyszllt-) jrmre terjedt ki,
figyelembe vette a kiindulsi s clllomsokat, tvonalakat s az sszes paramter kztti konfliktusfeloldst
is. MI-technikk rvn a terv rk alatt ksz volt, szemben a heteket ignyl korbbi megoldsokkal. A Vdelmi
Kutatsi gynksg (Defense Advanced Research Project Agency, DARPA) kzlemnye szerint, csupn ezen
egyetlen alkalmazs kapcsn megtrlt a DARPA ltal 30 ven keresztl az MI-re fordtott befektets.
Robotika: A mikrosebszetben manapsg sok sebsz robotsegdekre tmaszkodik. A HipNav rendszer, miutn
szmtgpes ltsi technikk segtsgvel ltrehozta a pciens bels anatmijnak hromdimenzis modelljt,
robotszablyozssal irnytja a cspprotzis behelyezst (DiGioia s trsai, 1996).
Nyelvmegrts s problmamegolds: A PROVERB rendszer a legtbb embernl jobb keresztrejtvnyfejt
(Littman s trsai, 1999). Ehhez rendelkezik a lehetsges megfejt szavakra vonatkoz korltozsokkal, a
rgebbi keresztrejtvnyek nagy adatbzisval s sokfle informcis forrssal, sztrakat s az olyan online
adatbzisokat is belertve, mint mozicmlistk a bennk szerepl sznszekkel. gy pldul kpes megllaptani,
hogy a Nice Story meghatrozs megoldsa ETAGE, mert az adatbzisban Story in France/ETAGE
meghatrozs/megolds pr szerepel, s felismeri, hogy a Nice X s X in France mintknak sokszor azonos
a megoldsa. A program termszetesen nem tudta, hogy Nice egy vros Franciaorszgban, a keresztrejtvnyt
mgis kpes volt megoldani.18
Fentiek csupn pldk a ma ltez mestersges intelligencia rendszerekre. Nem mgia vagy sci-fi inkbb
tudomny, technika s matematika, amihez bevezett nyjt ez a knyv.
5. sszefoglals
Ebben a fejezetben definiltuk az MI-t s ttekintettk az MI fejldsnek kulturlis httert. A legfontosabb
gondolatok kzl nhny:
Az egyes emberek klnbz mdon vlekednek az MI-rl. A kt fontos felteend krds az, hogy: a
gondolkods vagy a viselkeds az, ami nt rdekli? Embereket akar modellezni, vagy egy idealizlt
megkzeltst vlaszt?
Ebben a knyvben azt a nzetet fogadjuk el, hogy az intelligencia lnyegben a racionlis cselekvssel
kapcsolatos. Egy intelligens gens, idelis esetben, az adott szituciban a legjobb cselekvshez folyamodik.
Az ilyen rtelemben vett intelligens gensek ptsi problmit fogjuk tanulmnyozni.
A filozfusok (i. e. 400-ig visszamenleg) tettk lehetv az MI kialakulst azltal, hogy felvetettk: az elme
bizonyos rtelemben gpszer, hogy valamilyen bels nyelvezetben kdolt tudsanyagon operl, s hogy a
gondolat a helyes cselekvs megvlasztsnak eszkze.
A matematikusok megadtk a logikailag biztos, valamint a bizonytalan valsznsgi lltsok
manipullsnak eszkzt. Megadtk annak az alapjait is, hogy megrtsk a szmtsokat s az
algoritmusokrl kvetkeztethessnk.
A kzgazdszok formalizltk a dntshozatal folyamatt, hogy a dntshoznak maximlis vrhat hasznot
biztostson.
A pszicholgusok megerstettk azt a gondolatot, hogy az ember s az llatok informciprocesszl
gpezetnek tekinthetk. A nyelvszek azt mutattk ki, hogy a nyelvhasznlat ezzel a modellel sszhangban
van.
A szmtgp-technika biztostotta az MI alkalmazst lehetv tev mtermket. Az MI-programok
nagyok, a mkdsk lehetetlen lenne a memrinak s a sebessgnek a szmtgpes ipar biztostotta
nagyfok fejldse nlkl.
Az ilyen s hasonl helyeken, ahol a knyv szerzje igazn csak angolul rtelmes szfordulatokkal illusztrlja a mondanivaljt, az zenet
rdekben meghagyjuk a szavak eredeti angol formjt. (A lektor)
18
23
Bevezets
Az MI trtnetben voltak sikeres idszakok, de megtallhatk a tves optimizmus s a lelkeseds, valamint a

finanszrozs elapadsa kvetkeztben bell hanyatls ciklusai is. Voltak idszakok, amelyek sorn j
kreatv megkzeltsek bevezetse s a legjobb tletek szisztematikus finomtsa trtnt meg.
Az MI fejldse az utols vtizedben a tudomnyos mdszereknek a ksrletezsben s a megkzeltsek
sszehasonltsban val szlesebb kr alkalmazsa kvetkeztben felgyorsult.
Az intelligencia elmleti alapjainak megrtsben bekvetkezett jelenlegi fejlds kz a kzben egytt jrt a
vals rendszerek kpessgeinek javulsval. Az MI egyes rszterletei jobban integrldtak, s az MI s ms
tudomnygak megtalltk a kzs alapjukat.
5.1. Irodalmi s trtneti megjegyzsek

Herb Simon a The Science of the Artificial c. mben trgyalja az MI mdszertani sttust (Simon, 1981). A m
azokat a kutatsi terleteket trgyalja, amelyek bonyolult mtermkekkel kapcsolatosak. Azt is bemutatja, hogy
hogyan lehet az MI-t mind matematiknak, mind tudomnynak ltni. Cohen (Cohen, 1995) ttekinti az MI
ksrleti technolgijt. Ford s Hayes (Ford s Hayes, 1995) pedig a Turing-teszt hasznossgrl fejtik ki a
vlemnyket.
Az MI filozfiai s gyakorlati problmirl olvasmnyos ttekintst ad John Haugeland Artificial Intelligence:
The Very Idea c. mve (Haugeland, 1985). A kognitv tudomnyrl nhny jkelet forrs (Johnson-Laird,
1988; Stillings s trsai, 1995; Thagard, 1996) s az Encyclopedia of the Cognitive Sciences (Wilson s Keil,
1999) adnak j lerst. A modern nyelvszet szintaktikai aspektust (Baker, 1989), szemantikai aspektust pedig
(Chierchia s McConnell-Ginet, 1990) mutatja be jl. A szmtgpes nyelvszettel Jurafsky s Martin
(Jurafsky s Martin, 2000) foglalkoznak.
Az MI-kutatsok kezdettl a Feigenbaum s Feldman Computers and Thought (Feigenbaum s Feldman, 1963)
s a Minsky Semantic Information Processing (Minsky, 1968) cm mvekben, tovbb a Donald Michie ltal
szerkesztett Machine Intelligence sorozatban lehet olvasni. Webber s Nilsson (Webber s Nilsson, 1981) s
Luger (Luger, 1995) nagy hats cikkekbl lltottak ssze antolgikat. A Neurocomputing (Anderson s
Rosenfeld, 1988) a neurlis hlkkal foglalkoz korai cikkek gyjtemnye. Az Encyclopedia of AI (Shapiro,
1992) majdnem minden MI-tmrl tartalmaz egy ttekint cikket. Ezek a cikkek ltalban j kiindulpontok az
egyes tmakrk kutatsval foglalkoz irodalomhoz.
A legfrissebb munkk a nagyobb MI-konferencik a ktvente megrendezett International Joint Conference on
AI (IJCAI), az venknti European Conference on AI (ECAI) s a tmogat szervezetrl AAAI-knt ismert
venknti National Conference on AI kiadvnyaiban tallhatk meg. Az MI ltalnos krdseivel foglalkoz
f folyiratok az Artificial Intelligence, a Computational Intelligence, az IEEE Transactions on Pattern Analysis
and Machine Intelligence, az IEEE Intelligent Systems s az elektronikus formban megjelen Journal of
Artificial Intelligence Research. Sok, specilis terletekkel foglalkoz folyirat s konferencia is ltezik, ezekrl
azonban a megfelel fejezetekben lesz sz. Az MI f szakmai szervezetei az American Association for Artificial
Intelligence (AAAI), az ACM Special Interest Group in Artificial Intelligence (SIGART) s a Society for
Artificial Intelligence and Simulation of Behaviour (AISB). Az AAAI AI Magazine-ja sok ttekint s tematikus
cikket publikl, az aaai.org weboldala pedig hreket s httrinformcikat tartalmaz.
5.2. Feladatok
Az albbi gyakorlpldknak az a rendeltetse, hogy vitt stimulljanak. Nhny kzlk flves hzi
feladatnak is alkalmas. E feladatokat mr most megksrelhetik megoldani s ksbb, a knyv olvasst
befejezve, e prblkozsokat megismtelhetik.
1.1.
Sajt szavaival definilja: (a) az intelligencia, (b) a mestersges intelligencia, (c) az gens fogalmakat.
1.2.
Olvasnival. Olvassa el Turing eredeti cikkt az MI-rl (Turing, 1950). A cikkben Turing a clkitzsvel s az
intelligenciatesztjvel kapcsolatos potencilis kifogsokat trgyalja. Melyik kifogsnak van mg ma is slya?
rvnyesek-e a cfolatai? El tud kpzelni ms kifogsokat is, amelyek a cikk megrst kvet fejldsbl
addnak? Turing a cikkben azt jsolja, hogy 2000-ben egy szmtgpnek 30%-os eslye lesz, hogy teljestsen
24
Bevezets
egy 5 perces Turing-tesztet egy nem kpzett krdezvel szemben. sszernek gondolja ezt? s mondjuk 50 v
mlva?
1.3.
Olvasnival. Minden vben Loebner-djjal jutalmazzk azt a programot, amely a Turing-teszt egy bizonyos
verzijt legjobban kpes teljesteni. Kutassa fel a Loebner-dj legjabb gyztest s szmoljon be rla. Milyen
technikkra tmaszkodik ez a megolds? Milyen hatssal lehet ez az MI jelenlegi helyzetre?
1.4.
A problmknak vannak olyan jl ismert osztlyai, amelyek egy szmtgp szmra kezelhetetlenl nehezek,
ms osztlyok viszont szmtgpen bizonythatan nem dnthetk el. Azt jelenti-e ez, hogy az MI lehetetlen?
1.5.
Tegyk fel, hogy Evans ANALOGY programjt gy fejlesztjk tovbb, hogy a standard IQ-tesztnl 200 pontot
rjen el. Lesz-e akkor egy olyan programunk, ami intelligensebb az embernl? Magyarzza meg a vlaszt!
1.6.
Hogyan lehetsges, hogy az nelemzs valakinek a sajt gondolatairl szl beszmolja pontatlan?
Tvedhetek arrl, amit gondolok? Vitassa meg!
1.7.
Olvasnival.
Tanulmnyozza az MI-irodalmat, hogy eldnthesse, az albbi feladatokat jelenleg meg lehet-e oldani
szmtgpen:
a) Egy sznvonalas tenisz- (pingpong-) jtszma.
b) Autvezets Kair kzpontjban.
c) Heti lelmiszer-vsrls a piacon.
d) Heti lelmiszer-vsrls a vilghln.
e) Elfogadhat bridzsparti versenyszinten.
f) j matematikai ttelek felfedezse s bizonytsa.
g) Szndkosan humoros trtnet rsa.
h) Kompetens jogi tancsads egy specializlt jogi terleten.
i) Beszlt angol nyelv vals idben trtn fordtsa beszlt svd nyelvre.
j) Egy bonyolult sebszeti beavatkozs levezetse.
A ma mg nem megvalsthat feladatok esetn prblja azonostani a nehzsgeket, s megbecslni, hogy
mikorra tervezhet azok megoldsa.
1.8.
Nhny szerz azt lltotta, hogy az rzkels s a motorikus kpessgek az intelligencia legfontosabb
komponensei, s hogy a magasabb szint kpessgek szksgszeren parazita jellegek adalkok az alattuk
lev kpessgekhez. Nyilvnval, hogy az evolci zme s az agy nagy rsze az rzkelssel s a motorikus
kpessgekkel foglalkozik. Az MI pedig a jtk vagy logikai kvetkeztets jelleg feladatokat a vals vilgban
val rzkelsnl s cselekvsnl sok szempontbl knnyebbnek tallta. Nem gondolja-e, hogy az MI-nek a
magasabb szint kognitv kpessgekre irnyul hagyomnyos sszpontostsa tves clkitzs?
1.9.
Az evolci mirt eredmnyezett racionlisan cselekv rendszereket? Milyen clokat hivatottak az ilyen
rendszerek teljesteni?
1.10.
25
Bevezets
Racionlisak-e a reflexszer cselekvsek (mint pldul a forr tzhelytl elrntani a kezet)? Intelligensek-e?
1.11.
Egy szmtgp nem lehet intelligens csak azt teszi, amit a programoz mond neki. Igaz-e az llts msodik
rsze, s vajon impliklja-e az elst?
1.12.
Az llatok nem lehetnek intelligensek csak azt teszik, amit a gnjeik mondanak nekik. Igaz-e az llts
msodik rsze, s vajon impliklja-e az elst?
1.13.
Az llatok, az emberek s a szmtgpek nem lehetnek intelligensek csak azt teszik, amit a rszket alkot
atomoknak a fizika trvnyei parancsolnak. Igaz-e az llts msodik rsze, s vajon impliklja-e az elst?
26
2. fejezet - Intelligens gensek

Ebben a fejezetben az gensek termszett, legyen az tkletes vagy sem, a krnyezetek klnbzsgt s az
genstpusok ezekbl szrmaz sokflesgt trgyaljuk.
Az 1. fejezet a racionlis gens (rational agent) fogalmt gy vezette be, mint a mestersges intelligencia
trgyalsnak ltalunk vlasztott kzponti mdszert. Ebben a fejezetben pontostjuk ezt a koncepcit. Ltni
fogjuk, hogy a racionalits koncepcija az gensek szles krre alkalmazhat mindenfle elkpzelhet
krnyezetben. Az a tervnk a knyvben, hogy ezt a koncepcit nhny olyan tervezsi elv megfogalmazshoz
hasznljuk, amelyekkel sikeres genseket pthetnk olyan rendszereket, melyek joggal hvhatk
intelligensnek.
gensek, krnyezetek s a kztk lv kapcsolatok vizsglatval kezdnk. Annak megfigyelse, hogy egyes
gensek jobban viselkednek, mint msok, a racionlis gens tlethez vezet majd olyan genshez, amelyik
olyan jl viselkedik, amennyire csak lehet. Az, hogy mennyire viselkedhet jl egy gens, a krnyezet
termszetn mlik; bizonyos krnyezetek sokkal nehezebbek, mint msok. A krnyezetek nagyjbli
csoportostsval megmutatjuk, hogy egy krnyezet tulajdonsgai hogyan befolysoljk a krnyezetnek
megfelel gensek tervezst. Bemutatunk szmos egyszer genstervezsi csontvzat, melyeket a knyv
htralev fejezeteiben tovbb rszleteznk.
1. Bevezets
Egy gens (agent) brmi lehet, amit gy tekinthetnk, mint ami az rzkeli (sensors) segtsgvel rzkeli a
krnyezett (environment), s beavatkozi (actuators) segtsgvel megvltoztatja azt. A 2.1. bra ezt az
egyszer elkpzelst szemllteti. Az emberi gensnek van szeme, fle s egyb szervei az rzkelsre, s keze,
lba, szja s egyb testrszei a beavatkozsra. A robotgens kamerkat s infravrs tvolsgi keresket
hasznl rzkelknt, s klnfle motorokat beavatkozknt. A szoftvergens billentyletseket,
fjltartalmakat s hlzati adatcsomagokat fogad rzkelinek bemeneteknt, s kpernyn trtn kijelzssel,
fjlok rsval, hlzati csomagok kldsvel avatkozik be a krnyezetbe. Azzal az ltalnos felttelezssel
fogunk lni, hogy minden gens kpes sajt akciinak rzkelsre (de nem mindig ltja azok hatst).
2.1. bra - Az gensek krnyezetkkel rzkelkn s beavatkozkon keresztl llnak

kapcsolatban
27
Intelligens gensek
Fontos
Az rzkels (percept) fogalmat hasznljuk az gens rzkel bemeneteinek lersra egy tetszleges
pillanatban. Egy gens rzkelsi sorozata (percept sequence) az gens rzkelseinek teljes
trtnete, minden, amit az gens valaha is rzkelt. ltalnossgban, egy adott pillanatban egy gens
cselekvse az addig megfigyelt teljes rzkelsi sorozattl fgghet. Ha az sszes lehetsges rzkelsi
sorozathoz meg tudjuk hatrozni az gens lehetsges cselekvseit, akkor lnyegben mindent
elmondtunk az gensrl. Matematikailag megfogalmazva azt mondhatjuk, hogy az gens viselkedst
az gensfggvny (agent function) rja le, ami az adott rzkelsi sorozatot egy cselekvsre kpezi le.
Elkpzelhetjk tblzatos formban az gensfggvnyt, amely forma mindenfle genst ler; az gensek
tbbsgre ez igen nagy tblzatot jelentene valjban vgtelen nagyot, hacsak nem korltozzuk a figyelembe
veend rzkelsi sorozatok hosszt. Ha adott egy gens, amivel ksrletezhetnk, akkor elmletileg
megalkothatjuk ezt a tblzatot az sszes lehetsges rzkelsi sorozat kiprblsval s az gens vlaszul
vgrehajtott cselekvseinek feljegyzsvel.1 Termszetesen a tblzat az gens kls jellemzse. Egy
mestersges gens belsejben az gensfggvnyt egy gensprogram (agent program) valstja meg. Fontos,
hogy megklnbztessk e kt dolgot. Az gensfggvny egy absztrakt matematikai lers, az gensprogram
egy konkrt implementci, amely az gens architektrjn mkdik.
Ezen tletek illusztrlsra egy igen egyszer pldt fogunk hasznlni a 2.2. brn lthat porszvvilgot. A
vilg annyira egyszer, hogy mindent le tudunk rni, ami megtrtnik, tovbb ez egy kitallt vilg, gy sokfle
varicit kitallhatunk. A vilgban csak kt helyszn van: az A s B ngyzetek. A porszvgens szleli, hogy
melyik ngyzetben van, valamint azt, hogy van-e ott piszok, vagy nincs. Lehetsges akcii: mozoghat balra
vagy jobbra, felszvhatja a port, valamint nem csinl semmit. Egy egyszer gensfggvny a kvetkez: ha az
aktulis ngyzet koszos, szvd fel a koszt, egybknt menj t a msik ngyzetbe. Ezen gensfggvny
tblzatnak egy rszlete a 2.3. brn lthat. Egy, az gensfggvnyt megvalst egyszer gensprogramot a
fejezet ksbbi rszben, a 2.8. brn mutatunk be.
2.2. bra - A porszvvilg mindssze kt helysznnel
2.3. bra - A 2.2. brn szerepl porszvvilg egy egyszer gensfggvnye rszleges
tblzatos formban
Amennyiben az gens cselekvsnek kivlasztsban a vletlennek is szerepe van, gy minden sorozatot tbbszr kellene kiprblnunk,
hogy az egyes cselekvsek valsznsgeit meghatrozhassuk. Ltszlag gy tnhet, hogy vletlenszeren cselekedni botorsg, a
ksbbiekben azonban ltni fogjuk, hogy ez lehet nagyon intelligens viselkeds is.
1
28
Intelligens gensek
Fontos
A 2.3. brra nzve lthatjuk, hogy sokfle porszvvilg-beli gens definilhat egyszeren a jobb
oldali oszlop klnbz kitltsvel. Ezek utn a nyilvnval krds a kvetkez: Mi a tblzat helyes
kitltsnek mdja? Ms szavakkal, mitl lesz egy gens j vagy rossz, intelligens vagy buta. Ezeket a
krdseket a kvetkez rszben fogjuk megvlaszolni.
Mieltt lezrnnk ezt a rszt, fontos megjegyeznnk, hogy az gens fogalom bevezetsnek a clja nem a vilg
gensekre s nem gensekre trtn felosztsa, hanem egy olyan eszkz megteremtse, amivel rendszereket
elemezhetnk. Egy kzi szmolgp is tekinthet gensnek, amely azt a cselekvst vlasztja, hogy 4-et r a
kijelzjre, ha 2 + 2 = rzkelsi sorozatot kap, de egy ilyen felfogs aligha segt minket a szmolgp
megrtsben.
2. J viselkeds: a racionalits koncepcija

Egy racionlis gens (rational agent) olyan, amely helyesen cselekszik elmletileg megfogalmazva az
gensfggvny tblzatban minden bejegyzs helyesen van kitltve. Helyesen cselekedni nyilvnvalan jobb,
mint helytelenl, de mit is jelent helyesen cselekedni? Els kzeltsben azt mondjuk, hogy a helyes cselekedet
az, amely az genst a legsikeresebb teszi. Teht szksgnk lesz egy mdszerre, amivel a sikeressg mrhet.
A krnyezetnek, valamint az gens rzkelinek s beavatkozinak lersval egytt ez az gens feladatt teljes
mrtkben specifiklja. Ezltal preczebben definilhatjuk, mit is jelent racionlisnak lenni.
2.1. Teljestmnymrtkek
A teljestmnymrtk (performance measure) testesti meg az gens sikeressgnek kritriumt. Ha egy
genst elhelyeznk a krnyezetben, akkor cselekvsek sorozatval vlaszol az rzkelseire. A cselekvsek
sorozatnak hatsra a krnyezet llapotok sorozatn halad vgig. Ha ez a sorozat kvnatos, akkor az gens jl
teljestett. Nyilvnvalan nincs egyetlen olyan rgztett mrtk, amely minden gens szmra megfelel lenne.
Megkrdezhetjk az gens szubjektv vlemnyt, hogy mennyire rzi magt elgedettnek a sajt
teljestmnyvel, de egyes gensek kptelenek lesznek vlaszolni, mg msok becsapjk magukat.2 Ezrt
valamilyen objektv teljestmnymrtkhez fogunk ragaszkodni, tipikusan egy olyanhoz, amit az gens tervezje
hatrozott meg.
Fontos
Pldaknt tekintsnk az elz rszben megismert porszv genst. Teljestmnymrtkknt
javasolhatjuk az egy nyolcrs mszakban feltakartott por mennyisgt. Egy racionlis genssel,
termszetesen, az ember azt kapja, amit kr. Azaz a racionlis gens azzal maximalizlhatja ezt a
teljestmnymrtket, hogy feltakarts utn kinti a szemetet, majd jra feltakartja s gy tovbb. Egy
finomtott mrtk a tiszta padl elrst djazn. Pldul minden tiszta ngyzet egy pontot rhet minden
idlpsben (taln valamilyen levonssal figyelembe vve az elfogyasztott elektromos energit, illetve
Az emberi gensekre klnsen jellemz a savany a szl effektus azaz hogy nem is akarjk igazn azt, amit nem sikerlt
megkapniuk, mint pldul: Nos, sebaj, nem is akartam annyira azt a buta Nobel-djat.
2
29
Intelligens gensek
a keltett zaj mennyisgt is). ltalnos szablyknt megfogalmazhat, hogy a teljestmnymrtket jobb
aszerint megllaptani, hogy mit akarunk elrni a krnyezetben, mint aszerint, hogy mikpp kellene az
gensnek viselkednie.
A teljestmnymrtk kivlasztsa nem mindig knny. Pldul a tiszta padl elz paragrafusbeli fogalma a
tisztasg idtlagn alapul. Mg ugyanaz az tlagos tisztasg is elrhet kt klnbz genssel, az egyik
kzepes aktivitssal dolgozik llandan, mg a msik energikusan rvid ideig, aztn hossz szneteket tart.
Hogy melyik a javasolt mdszer, az ltszlag a hzvezets tudomnynak krdse, valjban egy mly filozfiai
krds, messzibe mutat kvetkezmnyekkel. Mi a jobb: a tlzsok vakmer vilga vagy a biztonsgos, de
unalmas ltezs? Mi a jobb: egy gazdasg, ahol mindenki egyformn mrskelten szegny, vagy egy msik,
ahol vannak nagyon gazdagok s nagyon szegnyek? Ezen krdsek megvlaszolst hzi feladatknt bzzuk a
szorgalmas olvasra.
2.2. Racionalits
Ngy dolgon mlik az, hogy egy adott pillanatban mi racionlis. Ezek:
A siker fokt mr teljestmnymrtk.
Az gens eddigi tudsa a krnyezetrl.
A cselekvsek, amiket az gens kpes vgrehajtani.
Az gens rzkelsi sorozata az adott pillanatig.
Fontos
Ez elvezet a racionlis gens (rational agent) defincijhoz:
Az idelis racionlis gens minden egyes szlelsi sorozathoz a benne tallhat tnyek s a beptett
tudsa alapjn minden elvrhat dolgot megtesz a teljestmnymrtk maximalizlsrt.
Vizsgljuk meg az egyszer porszvgenst, amelyik megtiszttja a ngyzetet, ha az koszos, s tmegy a
szomszdos ngyzetbe, ha nem az! Az gensfggvnyt tblzatosan a 2.3. bra adja meg. Ez egy racionlis
gens? Attl fgg! Elszr is, meg kell mondanunk mi a teljestmnymrtk, mit tudunk a krnyezetrl, s
milyen rzkeli s beavatkozi vannak az gensnek. Tegyk fel a kvetkezket:
A teljestmnymrtk egy ponttal jutalmaz minden tiszta ngyzetet minden idpillanatban egy 1000
idpillanatbl ll lettartam alatt.
A krnyezet geogrfija a priori ismert (2.2. bra), de a piszok eloszlsa s az gens kezdeti pozcija nem.
A tiszta ngyzetek tisztk maradnak, a felszvs pedig megtiszttja az aktulis ngyzetet. A Balra s Jobbra
cselekvsek balra s jobbra mozgatjk az genst, kivve ha ezzel kikerlne a krnyezetbl, mely esetben az
gens nem mozdul.
A kvetkez cselekvsek lteznek: Balra, Jobbra, Szv s Semmittevs (azaz nem tesz semmit sem).
Az gens helyesen szleli jelenlegi helyzett s azt, hogy van-e ott kosz.
Azt lltjuk, hogy ezen felttelek mellett az gens igenis racionlis: a vrhat teljestmnye legalbb annyira j,
mint brmely ms gens. A 2.4. feladatban azt krjk majd, hogy ezt az lltst bizonytsa be.
Knnyen belthat, hogy ugyanez az gens ms krlmnyek kztt irracionlis lenne. Pldul ha minden koszt
feltakartott, akkor szksgtelenl oszcilllni fog ide-oda; ha a teljestmnymrtk tartalmaz egy bntetpontot
minden balra vagy jobbra trtn mozgsrt, akkor az gens egszen gyengn teljest. Egy jobb gens abban az
esetben, ha meggyzdtt arrl, hogy az sszes ngyzet tiszta, nem csinlna semmit. Ha a tiszta ngyzetek ismt
koszoss vlhatnak, az gensnek idnknt ellenriznie kellene ket, s kitakartania, ha szksges. Ha a
krnyezet geogrfija ismeretlen, az gensnek fel kell trkpeznie ahelyett, hogy az A s B ngyzetekhez kti
magt. A 2.4. feladatban azt krjk majd, hogy tervezzen ezekre az esetekre genseket.
30
Intelligens gensek
2.3. Mindentuds, tanuls s autonmia

gyelnnk kell a racionalits s a mindentuds (omniscience) klnvlasztsra. Egy mindentud gens tudja
cselekedetei valdi kimenetelt, s ennek megfelelen cselekedhet, de a gyakorlatban a mindentuds lehetetlen.
Vegyk a kvetkez pldt: egy nap a Nagykrton stlok s egy rgi bartomat ltom az t tloldaln
kzeledni. Az ton nincs forgalom, s rrek, gy racionlis lvn elindulok a msik oldalra. Mindekzben
5000 kilomter magasan egy utasszllt replgp raktrajtaja leesik,3 s mieltt mg trnk az t tloldalra,
rm esik s kilapt. Irracionlis voltam, amikor t akartam kelni az ton? Valszntlen, hogy a gyszjelentsem
gy fog szlni: egy idita megprblt keresztlmenni az utcn.
Ez a plda azt mutatja, hogy a racionalits nem azonos a tkletessggel. A racionalits az elvrt teljestmnyt
maximalizlja, mg a tkletessg a tnyleges teljestmnyt. Az, hogy elllunk az gensekkel szemben
tmasztott tkletessg kvetelmnytl, nem csak a velk szembeni mltnyossg krdse. Az a helyzet, hogy
ha azt a cselekvst vrjuk el egy genstl, ami a megtrtnte utn a legjobbnak bizonyul, akkor lehetetlen lesz
egy ilyen gens megalkotsa hacsak nem javtjuk a kristlygmbk vagy az idgpek teljestmnyt.
Ezek alapjn a racionalits defincink nem kvetel mindentudst, hiszen a racionlis vlaszts csak az adott
pillanatig felptett rzkelsi sorozattl fgg. Azt is biztostanunk kell, hogy tudtunk nlkl se engedjk meg az
gensnek, hogy tudatosan unintelligens cselekvsbe kezdjen. Pldul ha egy gens nem nz krl mindkt
irnyban, mieltt egy forgalmas utat keresztez, akkor az rzkelsi sorozata nem fogja neki megmondani, hogy
egy hatalmas kamion kzeledik nagy sebessggel. Azt mondja-e a racionalits defincink, hogy ebben az
esetben rendben tkelhet az ton? Egyltaln nem! Elszr is, az tkeresztezs nem lenne racionlis ezen
informciszegny szlelsi sorozat mellett: az tkels sztnzs nlkl tlsgosan riziks. Msodszor, egy
idelis racionlis gensnek a sztnzs cselekvst kellene vlasztania az tra lps eltt, mivel ez segti a
teljestmny maximalizlsban. A hasznos informcik beszerzse rdekben vghezvitt ltalban
informcigyjtsnek (information gathering) hvott cselekedetek a racionalits fontos rszt jelentik,
rszletesebben a 16. fejezetben lesz sz rluk. Az informcigyjts msik pldjt a felfedezs (exploration)
szolgltatja, amit egy porszvgensnek egy ismeretlen krnyezetben meg kell tennie.
Defincink nemcsak azt kveteli meg a racionlis genstl, hogy informcit gyjtsn, hanem azt is, hogy
amennyit csak lehet tanuljon (learn) a megfigyelseibl. Az gens kezdeti konfigurcija valamilyen elzetes
tudst tkrzhet a krnyezetrl, de ahogy az gens tapasztalatot szerez, ez a tuds mdosulhat s trtkeldhet.
Vannak szlssges esetek, amikor a krnyezet a priori teljesen ismert. Ilyen esetekben az gensnek nem kell
rzkelnie vagy tanulnia, egyszeren csak helyesen cselekszik. Termszetesen az ilyen gensek nagyon
srlkenyek. Vegyk pldul az egyszer ganajtr bogarat. Miutn kista a fszkt s elhelyezte a tojsait, a
kzeli halombl egy ganajlabdt kszt, hogy elzrja a fszek bejratt. Ha tkzben a labdt eltvoltjuk a fogi
kzl, a bogr folytatja tjt, s a nem ltez labdval is eljtssza a fszek lezrst, mikzben szre sem veszi,
hogy a labda hinyzik. Az evolci beptett egy felttelezst a bogr viselkedsbe, s amikor ez megsrl,
sikertelen viselkeds lesz az eredmnye. Kicsit intelligensebb a szcskel darzs. A nstny s egy lyukat,
keres s megcsp egy hernyt, elcipeli a lyukhoz, bemegy a lyukba megnzni, hogy minden rendben van-e, majd
bevonszolja a hernyt s lerakja a tojsait. A herny szolgl a tojsok kikelse utn tpllkul. Eddig j, de ha
egy rovarkutat pr centimterrel odbb rakja a hernyt, mikzben a darzs a lyukat ellenrzi, az visszalp a
herny odacipelse fzishoz, s a tervt vltoztats nlkl folytatja onnan, akr tucatnyi hernyelmozdt
kzbelps utn is. A darzs kptelen megtanulni, hogy rkltt terve hibs, gy nem fogja megvltoztatni.
A sikeres gensek hrom klnbz peridusra bontjk az gensfggvny kiszmtsnak feladatt: amikor az
genst tervezik, a szmts egy rszt tervezik vgzik; amikor megfontolja a kvetkez cselekvst, az gens
tovbbi szmtsokat vgez; s amikor tanul a tapasztalataibl, mg tovbbi szmtsokat vgez annak
eldntsre, hogy hogyan mdostsa a viselkedst.
Fontos
Addig a szintig, mg az gens a tervezi ltal beptett tudsra pt s nem sajt megfigyelseire, azt
mondjuk, hogy az gens nem autonm (autonom). Egy racionlis gensnek autonmnak kell lennie
mindent, amit csak megtanulhat, meg kell tanulnia ahhoz, hogy a hinyos vagy hibs elzetes tudst
kompenzlja. Pldul az a porszvgens, amelyik megtanulja elreltni, hogy hol s mikor tnik fel
3
Lsd N. Henderson: Srgsen j ajtzrakat a Boeing 747 jumbo jetek szmra. Washington Post, 1989. augusztus 24.
31
Intelligens gensek
tovbbi szemt, jobban fog dolgozni, mint amelyik nem. Praktikus okbl ritkn kell teljes autonmit
biztostani mr a kezdetektl: amikor egy gensnek nincs tapasztalata, vagy csak kevs van, akkor
vletlenszeren kellene cselekednie, hacsak a tervezje nem ad valamilyen segtsget. gy, mint ahogy
az evolci elltja az llatokat elegend beptett reflexszel a tllshez addig, mg sajt maguk is
megtanuljk mindazt, ami a tllshez szksges, a mestersges intelligens gensek kezd tudssal s
tanulsi kpessggel val elltsa is sszer lenne. Miutn elegend tapasztalatot szerzett a
krnyezetrl, a racionlis gens viselkedse gyakorlatilag fggetlenn vlhat a beptett elzetes
tudstl. Ily mdon a tanuls alkalmazsval olyan gens tervezhet, amely sokfle krnyezetben is
sikeres lesz.
3. A Krnyezetek termszete
Most, hogy mr rendelkeznk a racionalits defincijval, mr majdnem kszen llunk arra, hogy racionlis
gensek ptsrl gondolkodjunk. Elszr azonban meg kell vizsglnunk a feladatkrnyezeteket (task
environments), amelyek lnyegben a problmk, amelyekre a racionlis gensek jelentik a megoldsokat.
Elszr azt mutatjuk meg, hogyan kell a feladatkrnyezetet meghatrozni, tbb pldval illusztrlva a
folyamatot. Ezek utn megmutatjuk, hogy tbbfle feladatkrnyezet ltezik. A krnyezet tpusa kzvetlenl
befolysolja az gensprogram megfelel tervezst.
3.1. A krnyezet meghatrozsa

Az egyszer porszvgens racionalitsnak vizsglatakor specifiklnunk kellett egy teljestmnymrtket, a
krnyezetet s az gens beavatkozit s rzkelit. Mindezeket a feladatkrnyezet (task environment) cmsz
alatt fogjuk egyesteni. A betszavakban gondolkodk szmra ezt TKB Teljestmny, Krnyezet,
Beavatkozk, rzkelk (Performance, Environment, Actuators, Sensors) lersnak hvjuk. Egy gens
tervezse sorn az els lpsnek mindig a feladatkrnyezet lehet legteljesebb meghatrozsnak kell lennie.
2.4. bra - Egy automatizlt taxi feladatkrnyezetnek TKB-lersa
A porszvvilg egyszer plda volt, vegynk most egy bonyolultabbat: az automatizlt taxisofr pldjt. Ezt a
pldt fogjuk a fejezet htralev rszben hasznlni. Ki kell emelnnk, mieltt az olvas megrmlne, hogy a
teljesen automata taxisofr jelenleg valamelyest tlmutat a ltez technolgia lehetsgein. (A 4. szakasz - A
mestersges intelligencia jelenlegi helyzete tallhat egy ltez sofr robot lersa, de az Intelligent
Transportation Systems konferencia legutbbi kiadvnyait is rdemes megnzni.) A teljes autvezetsi feladat
rendkvl nyitott vg. Nincs hatra a lehetsgesen felbukkan krlmnyek jszer kombinciinak egy
msik ok arra, hogy ezt vlasszuk vizsglatunk trgyul. A 2.4. bra sszefoglalja a taxi feladatkrnyezetnek
TKB-lerst. A kvetkezkben rszletesen trgyaljuk az egyes elemeket.
Elsknt: mi az a teljestmnymrtk, amit az automata taxisofrnk el lltunk? Elvrt jellemzk a helyes
cllloms elrse; az zemanyag-fogyaszts s az elhasznlds minimalizlsa; az t kltsgnek s/vagy
idejnek minimalizlsa; a kzlekedsi szablyok megszegsnek s ms vezetk megzavarsnak
minimalizlsa; a biztonsg s utasknyelem maximalizlsa; a haszon maximalizlsa. Nyilvnvalan ezen
clok egy rsze konfliktusban van egymssal, kompromisszumokra lesz szksg.
A kvetkez: mi a taxi vezetsi krnyezete? Minden taxisofrnek tbb tpus ttal kell szembenznie, a vidki
s vrosi utaktl egszen a tizenkt svos autplykig. Az utak ms forgalommal, gyalogosokkal, kbor
32
Intelligens gensek
llatokkal, tkarbantartssal, rendrautkkal, tcskkal s gdrkkel is rendelkeznek. A taxinak a lehetsges s

a jelenlegi utasokkal is kapcsolatban kell llnia. Van tovbb nhny opcionlis lehetsg. Lehet, hogy a taxinak
Dl-Kaliforniban kell zemelnie, ahol a h ritkn jelent problmt, vagy Alaszkban, ahol ritkn nem.
Kzlekedhet mindig az t jobb oldaln, vagy szeretnnk, hogy elg rugalmas legyen ahhoz, hogy a bal oldalon
is vezessen abban az esetben, ha Nagy-Britanniban vagy Japnban akarjuk mkdtetni. Nyilvnvalan minl
korltozottabb a krnyezet, annl egyszerbb a tervezsi problma.
Az automata taxisofr rendelkezsre ll beavatkozk lnyegben ugyanazok lesznek, amelyek egy emberi
vezet szmra adottak: a motor vezrlse a gzpedl segtsgvel, kormnyzs s fkezs. Ezek mellett
szksges egy kperny vagy beszdszintetiztor a kimenet megjelentshez az utasok szmra, s
valsznleg valamilyen md arra, hogy ms jrmvekkel kommuniklhasson, udvariasan vagy mskpp.
A vezetsi krnyezetben lev cljai elrshez a taxinak tudnia kell, hogy hol van, mi ms van az ton, s hogy
milyen gyorsan halad. Alapvet rzkeli kztt lenni kell ezrt egy vagy tbb vezrelhet tv-kamernak,
sebessgmrnek s kilomterrnak. A jrm helyes irnytshoz klnsen a kanyarokban szksge lesz
gyorsulsmrre, ezenkvl ismernie kell a jrm mechanikai llapott, gy szksge lesz a szoksos motor- s
elektromosrendszer-rzkelk rendszerre is. Lehetnek olyan mszerei is, amelyek nem rhetk el az tlagos
emberi sofrk szmra: egy mholdas globlis pozicionl rendszer (GPS), amely megadja a pontos pozcijt
egy elektronikus trkpen, vagy infravrs- s hangradar-rzkelk ms auttl s trgyaktl val tvolsgok
rzkelsre. Vgl szksge lesz egy mikrofonra vagy billentyzetre, aminek a segtsgvel az utasok az ti
cljukat megadhatjk.
A 2.5. brn felvzoltuk az alapvet TKB-elemeket szmos tovbbi genstpusra. Tovbbi pldk a 2.5.
feladatban jelennek meg. Egyes olvasink szmra meglep lehet, hogy az genstpusok listjban olyan
programokat is szerepeltetnk, amelyek a billentyzet bemenetnek s a karakteres kperny kimenetnek
teljesen mestersges krnyezetben mkdnek. Igen, mondhatja valaki, ez nem egy valdi krnyezet,
ugye?. A tny az, hogy nem a valdi s a mestersges krnyezetek kztti klnbsgttel szmt, hanem az
gens viselkedse, a krnyezet keltette rzkelsi sorozat, valamint a teljestmnymrtk kztti viszony
komplexitsa. Egyes valdi krnyezetek valjban igen egyszerek. Pldul egy robot, amit a futszalagon
rkez alkatrszek vizsglatra terveztek, sok egyszerst feltevssel lhet: a vilgts lland, a futszalagon
csak ltala ismert alkatrszek vannak, s csak kt cselekvs ltezik (elfogad vagy elutast).
2.5. bra - Pldk genstpusokra s TKB-lersuk
Ezzel ellenttben bizonyos szoftvergensek (vagy szoftverrobotok, azaz szoftbotok) rszletgazdag, korltok
nlkli krnyezetekben lteznek. Kpzeljnk el egy szoftbotot, amelyik egy nagy utasszllt gp
szimultorval repl. A szimultor egy rszletgazdag, komplex krnyezet, amelyben ms replgpekkel
kapcsolatos s fldi mveletek is vannak, s a szoftvergensnek vals idben kell vlasztania az akcik szles
vlasztkbl. Vagy kpzeljnk el egy szoftbotot, amelyet internetes hrforrsok figyelsre terveztek, s az
33
Intelligens gensek
rdekes hreket megmutatja az gyfeleinek. A helyes mkdshez szksge lesz valamilyen termszetes nyelv
feldolgozsi kpessgre, meg kell tanulnia, hogy melyik gyfelt mi rdekli, s szksge lesz a tervei dinamikus
megvltoztatsra pldul amikor az egyik hrforrshoz megsznik a kapcsolata vagy amikor egy j forrs
ltesl. Az internet egy olyan krnyezet, amelynek komplexitsa versenyez a fizikai vilgval, s amelynek
laki kztt sok mestersges gens van.
3.2. A krnyezetek tulajdonsgai

Az MI-ben felmerl feladatkrnyezetek vlasztka nyilvnvalan hatalmas. Mindazonltal meghatrozhatunk
viszonylag kevs szm dimenzit, amelyek mentn a feladatkrnyezeteket kategorizlhatjuk. Ezek a dimenzik
nagymrtkben meghatrozzk a helynval genstervezst s az gensimplementcik alaptechnikinak
alkalmazhatsgt. Elszr felsoroljuk a dimenzikat, azutn tbb feladatkrnyezetet elemznk az elkpzelsek
bemutatsra. Az itt szerepl defincik informlisak a ksbbi fejezetek sokkal pontosabban fogalmazzk
meg a krnyezeteket, s mindegyik fajtra pldkat mutatnak majd.
Teljesen megfigyelhet (fully observable) vagy rszlegesen megfigyelhet (partially observable). Ha az
gens szenzorai minden pillanatban hozzfrst nyjtanak a krnyezet teljes llapothoz, akkor azt mondjuk,
hogy a krnyezet teljesen megfigyelhet.4 Egy krnyezet tnylegesen teljesen megfigyelhet, ha az rzkelk
minden olyan aspektust szlelik, amelyek a cselekvs kivlasztshoz relevnsak a relevancia pedig a
teljestmnymrtktl fgg. A teljesen megfigyelhet krnyezetek knyelmesek, mivel az gensnek nem kell
semmilyen bels llapotot nyilvntartania a krnyezet nyomon kvetshez. Egy krnyezet lehet rszlegesen
megfigyelhet a zajos s pontatlan szenzorok miatt, vagy mivel az llapot egyes rszei egyszeren nem
szerepelnek a szenzorok adatai kztt pldul egy helyi koszrzkel szenzorral rendelkez porszvgens
nem tudja megmondani, van-e piszok ms ngyzetekben, s egy automata taxi nem lthatja, hogy ms
vezetk mit gondolnak.
Determinisztikus (deterministic) vagy sztochasztikus (stochastic). Amennyiben a krnyezet kvetkez
llapott jelenlegi llapota s az gens ltal vgrehajtott cselekvs teljesen meghatrozza, akkor azt mondjuk,
hogy a krnyezet determinisztikus, egybknt sztochasztikus. Teljesen megfigyelhet, determinisztikus
krnyezetben az gensnek elvben nem kell a bizonytalansggal trdnie. Amennyiben azonban a krnyezet
rszlegesen megfigyelhet, gy sztochasztikusnak tnhet. Klnsen igaz ez, ha a krnyezet sszetett,
nehezen teszi lehetv nem megfigyelhet aspektusainak kvetst. gy gyakran jobb az gens szemszgbl
determinisztikusnak vagy sztochasztikusnak tekinteni egy krnyezetet. A taxivezets ebben az rtelemben
nyilvnvalan sztochasztikus, mivel senki sem tudja megjsolni a forgalmat pontosan, tovbb egy motor
minden figyelmeztets nlkl lerobbanhat, s a kerekek vratlanul kidurranhatnak. A porszvvilg, ahogy
lertuk, determinisztikus, de egyes varicik tartalmazhatnak sztochasztikus elemeket, pldul vletlenszeren
megjelen piszkot vagy megbzhatatlan szvsi mechanizmust (2.12. feladat). Ha a krnyezet ms gensek
cselekvseit leszmtva determinisztikus, akkor azt stratgiainak (strategic) nevezzk.
Epizdszer (episodic) vagy sorozatszer5 (sequential). Epizdszer krnyezetben az gens tapasztalata
elemi epizdokra bonthat. Minden egyes epizd az gens szlelseibl s egy cselekvsbl ll. Nagyon
fontos, hogy a kvetkez epizd nem fgg az elzben vgrehajtott cselekvsektl. Epizdszer
krnyezetekben az egyes epizdokban az akci kivlasztsa csak az aktulis epizdtl fgg. Sok osztlyozsi
feladat epizdszer. Pldul az sszeszerel soron lev hibs alkatrszeket szlel gens minden egyes
dntst az aktulis alkatrsz alapjn hozza, fggetlenl a korbbi dntsektl, tovbb az aktulis dnts
nem befolysolja, hogy a kvetkez alkatrsz hibs lesz-e. Msrszt, sorozatszer krnyezetekben az aktulis
dnts befolysolhat minden tovbbit. A sakk s a taxivezets sorozatszer: a rvid tv akcik mindkt
esetben hossz tv kvetkezmnyekkel jrhatnak. Az epizdszer krnyezetek sokkal egyszerbbek a
sorozatszereknl, hiszen az gensnek nem kell elre gondolkodnia.
Statikus (static) vagy dinamikus (dynamic). Ha a krnyezet megvltozhat, amg az gens gondolkodik,
akkor azt mondjuk, hogy a krnyezet az gens szmra dinamikus; egybknt statikus. A statikus
krnyezetekkel egyszer bnni, mivel az gensnek nem kell llandan a vilgot figyelnie, mikzben dnt a
cselekvs fell, s nem kell az id mlsval sem trdnie. Msrszt, a dinamikus krnyezetek llandan azt
krdezik az genstl, hogy mit akar tenni; ha mg nem dnttte el, az annak szmt, hogy gy dnttt, hogy
A knyv els kiadsa a hozzfrhet (accessible) s a nem hozzfrhet (inaccessible) kifejezseket hasznlta a teljesen s a
rszlegesen megfigyelhet (fully s partially observable) helyett; a nemdeterminisztikus (nondeterministic) a sztochasztikus
(stochastic) helyett, valamint a nem epizdszer (nonepisodic) a sorozatszer (sequential) kifejezs helyett szerepelt. Az j terminolgia
jobban illeszkedik az elterjedt gyakorlathoz.
5
A sorozatszer (sequential) szt a szmtstudomnyban a prhuzamos (parallel) ellentteknt is hasznljk. A kt jelents alapveten
fggetlen egymstl.
4
34
Intelligens gensek
nem tesz semmit. Ha a krnyezet nem vltozik az id elrehaladtval, de az gens teljestmnymrtke igen,
akkor azt mondjuk, hogy a krnyezet szemidinamikus (semidynamic). A taxivezets nyilvnvalan
dinamikus: a tbbi aut s a taxi tovbbhalad, mikzben a vezetsi algoritmus azon bizonytalankodik, hogy
mit is tegyen. Az rval jtszott sakk szemidinamikus. A keresztrejtvnyek statikusak.
Diszkrt (discrete) vagy folytonos (continuous). A diszkrt/folytonos feloszts alkalmazhat a krnyezet
llapotra, az idkezels mdjra, az gens szlelseire, valamint cselekvseire. Pldul egy diszkrt llapot
krnyezet, mint amilyen a sakkjtk, vges szm klnll llapottal rendelkezik. A sakkban szintn
diszkrt az akcik s cselekvsek halmaza. A taxivezets folytonos llapot s idej problma: a sebessg, a
taxi s ms jrmvek helye folytonos rtkek egy tartomnyt jrja vgig a folytonos idben. A taxivezets
akcii szintn folytonosak (pldul kanyarodsi szgek stb.). Szigoran vve a digitlis kamerktl rkez
bemenet diszkrt, de tipikusan gy kezeljk, mint amely folyamatosan vltoz mennyisgeket s helyeket
reprezentl.
Egygenses (single agent) vagy tbbgenses (multiagent). Az egygenses s tbbgenses krnyezetek
kztti klnbsgttel egyszernek tnhet. Pldul a keresztrejtvnyt megfejt gens nmagban
nyilvnvalan egygenses krnyezetben van, mg egy sakkoz gens egy ktgensesben. Vannak azonban
knyes krdsek. Elszr is: lertuk azt, hogy egy entits hogyan tekinthet gensnek, ugyanakkor nem
magyarztuk meg, mely entitsok tekintendk gensnek. Egy A gensnek (pldul a taxisofrnek) egy B
objektumot (egy msik jrmvet) gensnek kell tekintenie, vagy egyszeren egy sztochasztikusan viselked
dolognak, a tengerparti hullmokhoz vagy a szlben szll falevelekhez hasonlatosan? A vlaszts kulcsa az,
hogy vajon B viselkedse legjobban egy A viselkedstl fgg teljestmnymrtk maximalizlsval rhate le. Pldul a sakkban a B ellenfl sajt teljestmnymrtkt prblja maximalizlni, amely a sakk
szablyainak kvetkeztben A teljestmnymrtkt minimalizlja. gy a sakk egy verseng (competitive)
tbbgenses krnyezet. Msrszrl, a taxi vezetsi krnyezetben az tkzsek elkerlse az sszes gens
teljestmnymrtkt maximlja, gy az rszben kooperatv (cooperative) tbbgenses krnyezet. Emellett
rszben verseng is, hiszen pldul csak egy aut tud egy parkolhelyet elfoglalni. A tbbgenses
krnyezetekben felmerl genstervezsi problmk gyakran egszen msok, mint egygenses
krnyezetekben. Tbbgenses krnyezetekben pldul a kommunikci (communication) gyakran
racionlis viselkedsknt bukkan fel; egyes rszlegesen megfigyelhet verseng krnyezetekben a
sztochasztikus viselkeds racionlis, hiszen gy elkerlhetk a megjsolhatsg csapdi.
Ahogy vrhat, a legnehezebb a rszlegesen megfigyelhet, sztochasztikus, sorozatszer, dinamikus, folytonos
s tbbgenses eset. Az is kiderl, hogy a vals helyzetek legtbbje olyan bonyolult, hogy valdi
determinisztikussguk vitatott krds; gyakorlati okokbl sztochasztikusknt kezelendk. A taxivezets
mindezen szempontok szerint nehz.
A 2.6. bra ismers krnyezetek tulajdonsgait sorolja fel. Vegyk szre, hogy a vlaszok nem mindig
egyrtelmek. Pldul a sakkot teljesen megfigyelhetnek tntettk fel; szigoran vve ez hibs, mivel a
roslsra, menet kzbeni tsre s ismtlses dntetlenre vonatkoz egyes szablyok megkvetelik a jtk
menetvel kapcsolatos adatok megjegyzst, amelyek a tblzat llapotnak rszeknt nem figyelhetk meg. A
megfigyelhetsg ezen kivtelei persze cseklyek egy taxivezet, egy angol nyelvtanr vagy egy orvosi
diagnosztikai rendszerhez kpest.
A tblzatban bizonyos tovbbi vlaszok a feladatkrnyezet definilstl fggnek. Az orvosi diagnosztikai
feladatot egygensesnek tntettk fel, mivel a betegben zajl betegsgi folyamat eredmnyesen nem
modellezhet gensknt, de egy orvosi diagnosztikai rendszernek szksg esetn trdnie kell ellenszegl
betegekkel s szkeptikus munkatrsakkal, gy a krnyezetnek lehet tbbgenses aspektusa. Tovbb az orvosi
diagnosztika epizdszer, ha valaki a feladatot gy tekinti, mint a tnetek listja alapjn trtn diagnzis
kivlasztst; a problma sorozatszer, ha a feladat tartalmazhat egy vizsglatsorozat-javaslatot, az eredmnyek
kirtkelst a kezels folyamn s gy tovbb. Tovbb sok krnyezet epizdszer az gensek egyni akciinl
magasabb szinteken. Pldul egy sakktorna jtszmk sorozatt tartalmazza, minden jtk egy epizd, mivel
(nagyjbl) az gens adott jtszmabeli lpseinek hozzjrulsa az gens teljestmnyhez nem fgg a korbbi
jtszmkban vlasztott lpseitl. Msrszrl, az egy jtszmn belli dntshozatal biztosan sorozatszer.
2.6. bra - Pldk feladatkrnyezetekre s jellemzik
35
Intelligens gensek
A knyvhz tartoz pldaprogramtr (aima.cs.berkeley.edu) tartalmaz szmos krnyezetimplementcit, egy

ltalnos cl krnyezetszimultorral egytt, amely egy vagy tbb genst helyez el egy szimullt krnyezetben,
megfigyeli a viselkedsket az idben, s kirtkeli ket egy adott teljestmnymrtk szerint. Ilyen ksrleteket
gyakran nem egy, hanem tbb, egy krnyezetosztlybl (environment class) szrmaz krnyezetre hajtanak
vgre. Pldul egy taxisofr szimullt forgalomban trtn rtkelsre tbb szimulcit futtatnnk klnbz
forgalommal, vilgtssal, s idjrsi viszonyokkal. Ha az genst egyedi esetre terveztk, kihasznlhatjuk az
adott krnyezet specilis tulajdonsgait, de nem tallhatjuk meg a vezets ltalban j mdjt. Ezrt a
programtr tartalmaz egy krnyezetgenertort (environment generator) minden krnyezetosztlyra, amelyik
kivlaszt bizonyos krnyezeteket (bizonyos valsznsggel) az gens futtatsra. Pldul a porszv
krnyezetgenertor vletlenszeren lltja be a piszok mintzatt s az gens helyt. Ezek utn az gens tlagos
teljestmnyre vagyunk kvncsiak az adott krnyezetosztlyra nzve. Egy racionlis gens az adott
krnyezetosztlyra maximalizlja ezt az tlagos teljestmnyt. A 2.7. s 2.12. kztti feladatok vgigvisznek egy
krnyezetosztly kialaktsn s abban tbbfle gens kirtkelsn.
4. Az intelligens gensek struktrja

Az genseket eddig viselkedsk lersn keresztl vizsgltuk azon cselekvs alapjn, amelyet egy adott
szlelsi sorozat hatsra vgrehajtanak. Most neki kell esnnk a kemny dinak: hogyan mkdnek bell. A
mestersges intelligencia feladata az gensprogram (agent program) megtervezse: egy fggvny, amely
megvalstja az szlelsek s a cselekvsek kztti lekpezst. Felttelezzk, hogy ez a program valamifle
fizikai rzkelkkel s beavatkozkkal elltott szmteszkzn fog futni ezt architektrnak (architecture)
nevezzk:
gens = architektra + program
Nyilvnvalan a kivlasztott programunknak olyannak kell lennie, ami megfelel az architektra szmra. Ha a
program pldul Stl jelleg akcikat fog javasolni, akkor jobb, ha az architektrnak vannak lbai. Az
architektra lehet egyszer szmtgp, vagy lehet egy robotaut szmos fedlzeti szmtgppel, kamerval s
ms rzkelkkel. ltalnossgban az architektra a szenzoroktl rkez szlelseket elrhetv teszi a program
szmra, futtatja a programot, s cselekvseit ltrejttk pillanatban a beavatkozk fel tovbbtja. E knyv
tlnyom rsze az gensprogramok tervezsrl szl, br a 24. s 25. fejezet kifejezetten az rzkelkkel s a
beavatkozkkal foglalkozik.
4.1. gensprogramok
36
Intelligens gensek
A knyvben tervezett gensprogramok mindannyian azonos vzzal rendelkeznek: bemenetknt fogadjk az

aktulis szlelseket a szenzoroktl, s visszakldenek egy cselekvst a beavatkozkhoz. 6 Vegyk szre a
klnbsget az gensprogram, amely az aktulis szlelst veszi bemenetknt, s az gensfggvny kztt, amely
a teljes szlelsi trtnetet fogadja. Az gensprogram azrt fogadja csak az aktulis szlelst bemenetknt, mert
csak ez rkezik a krnyezettl ha az gens cselekedetei a teljes szlelsi sorozattl fggnek, az gensnek
emlkeznie kell az szlelsekre.
Az gensprogramot egy egyszer pszeudokd nyelv segtsgvel fogjuk lerni, amit a B) fggelk definil. (Az
interneten elrhet kdtr valsgos programozsi nyelveken rt megvalstsokat tartalmaz.) Pldul a 2.7. bra
egy egszen egyszer genst mutat, amely nyomon kveti az szlelsi sorozatot, s felhasznlja egy akcikat
tartalmaz tblzat megcmzsre annak eldntsre, hogy mit csinljon. A tblzat reprezentlja az
gensfggvnyt, amit az gensprogram testest meg. Ahhoz, hogy ily mdon egy racionlis genst ptsnk,
neknk, mint tervezknek, olyan tblzatot kell megalkotnunk, amely minden lehetsges szlelsi sorozathoz a
megfelel cselekvst tartalmazza.
2.7. bra - A TBLZAT-VEZRLS-GENS program minden egyes j szlelsre meghvdik,

s minden alkalommal visszaad egy cselekvst. Sajt adatstruktrjban kveti nyomon
az szlelsi sorozatot.
Pldartk annak megfontolsa, hogy az gensek tervezsnek tblzatvezrelt megkzeltse mirt van
kudarcra tlve. Legyen P a lehetsges szlelsek halmaza s T az gens lettartama (az ltala vett szlelsek
teljes szma). A tblzat
elemet fog tartalmazni. Vegyk pldaknt az automata taxit: az egyetlen
kamertl rkez vizulis bemenet krlbell 27 megabjt/msodperc sebessggel rkezik (30 kocka
msodpercenknt, 640 x 480 kppont 24 bit szninformcival). Ez alapjn egyrnyi vezetshez olyan
tblzatot kapunk, amely tbb mint 10250 000 000 000 bejegyzst tartalmaz. Mg a sakkhoz tartoz tblzat is amely
a val vilg egy kicsiny, jl viselked rszlete legalbb 10150 bejegyzst tartalmazna. Ezen tblzatok ijeszt
mrete (a megfigyelhet vilgegyetemben az atomok szma kevesebb mint 10 80) azt jelenti, hogy (a) ebben az
univerzumban egyetlen fizikai gensnek sem lesz elg helye a tblzat trolsra, (b) a terveznek nem lenne
elg ideje a tblzat elksztshez, (c) egyetlen gens sem lenne kpes a tblzat helyes bejegyzseit
megtanulni sajt tapasztalatbl, s (d) mg ha a krnyezet elgg egyszer is egy megvalsthat mret
tblzathoz, a terveznek mg akkor sincs segtsge ahhoz, hogyan tltse ki a tblzat bejegyzseit.
Mindezek ellenre, a TBLZAT-VEZRLS-GENS megteszi azt, amit akarunk: megvalstja a kvnt
gensfggvnyt. Az MI alapvet kihvsa, hogy hogyan rjunk olyan programot, amely a lehetsgek hatrain
bell nagyszm tblzatbejegyzsek helyett kismret programkddal produkl racionlis viselkedst. Sok
pldnk van arra, hogy ez ms terleteken megvalsthat: pldul az 1970-es vek eltt a mrnkk s az
iskols gyerekek ltal hasznlt hatalmas ngyzetgyktblzatokat ma mr egy elektronikus kalkultorokon fut
tsoros program vltotta fel, amely a Newton-mdszert alkalmazza. A krds az, hogy megteheti-e az MI azt az
ltalnos intelligens viselkedsre, amit Newton tett meg a ngyzetgykkre? Abban hisznk, hogy a vlasz igen.
E fejezet htralev rszben ngy alapvet gensprogramtpust vzolunk, amely megtestesti a szinte minden
intelligens rendszer mgtt meghzd alapelveket:
Egyszer reflexszer gensek.
Modellalap reflexszer gensek.
Vannak ms lehetsgek is az gensvz szmra, pldul lerhatjuk az gensprogramot korutinok (coroutines) formjban, amelyek a
krnyezethez kpest aszinkron mdon futnak. Minden ilyen korutin rendelkezik egy bemeneti s egy kimeneti porttal, s egy olyan ciklust
tartalmaz, amelyik beolvassa a bemeneti portrl az szlelseket, s kirja a cselekvseket a kimeneti portra.
6
37
Intelligens gensek
Clorientlt gensek.
Hasznossgorientlt gensek.
Ezek utn ltalnossgban elmagyarzzuk, hogyan alakthatjuk t ezeket tanul gensekk.
4.2. Egyszer reflexszer gensek

A legegyszerbb fajtj gens az egyszer reflexszer gens (simple reflex agent). Ezek az gensek az
aktulis szlels alapjn vlasztjk ki a cselekvseket, figyelmen kvl hagyva az szlelsi trtnet tbbi rszt.
Pldul a porszv gens, amelynek gensfggvnyt a 2.3. bra tblzatos formban mutatja, egy egyszer
reflexszer gens, mivel dntsei csak a jelenlegi helysznen s azon alapulnak, hogy ott van-e piszok. A 2.8.
bra mutatja ezen gens programjt.
Vegyk szre, hogy az gensprogram igen kicsi a megfelel tblzathoz kpest. A legnyilvnvalbb
mretcskkents az szlelsi trtnet figyelmen kvl hagysbl kvetkezik, amely a lehetsgek szmt 4T-rl
4-re cskkenti. Egy tovbbi, kisebb cskkens abbl a tnybl fakad, hogy amikor az aktulis ngyzet piszkos,
az akci nem fgg a helyszntl.
2.8. bra - Egy egyszer reflexszer gens programja a ktllapot

porszvkrnyezetben. A 2.3. brn megadott gensfggvnyt valstja meg.
Kpzeljk magunkat az automata taxisofr helybe! Ha az elttnk halad aut fkez, s a fklmpi
kigyulladnak, akkor szre kell vennnk, s el kell kezdennk fkezni. Ms szavakkal, valamilyen feldolgozs
zajlik a kpi bemeneten, hogy megllaptsunk egy felttelt, amit az elz aut fkez-nek hvunk; azutn ez
kivlt valamilyen kialaktott kapcsolatot az gens programjban a kezdj fkezni cselekvshez. Ezt a
kapcsolatot felttelcselekvs szablynak (conditionaction rule)7 hvjuk, s
ha az-elz-aut-fkez akkor kezdj-fkezni
formban rjuk. Az embereknek sok hasonl kapcsolatuk van, egy rszk tanult vlasz (ami a vezetst illeti),
mg ms rszk felttlen reflex (mint pldul a pislogs, amikor valami megkzelti a szemnket). A
ksbbiekben tbb klnbz mdot is ltni fogunk arra, hogy ilyen kapcsolatok hogyan tanulhatk s
valsthatk meg.
A 2.8. bra programja egy egyedi porszvkrnyezetre specifikus. Egy ltalnosabb s rugalmasabb
megkzelts az, hogy elszr egy ltalnos cl rtelmezt ptnk felttelcselekvs szablyokra, majd
szablyhalmazokat hozunk ltre specifikus feladatkrnyezetek szmra. A 2.9. bra ezen ltalnos program
struktrjt adja meg sematikus formban, megmutatva, hogy a felttelcselekvs szablyok hogyan teszik
lehetv az gens szmra az szlelsek s cselekvsek sszektst. (Ne aggdjon, ha ez tl egyszernek tnik:
hamarosan sokkal rdekesebb vlik.) Az gens dntsi folyamatnak aktulis bels llapott ngyszgekkel
jelljk, a folyamatban felhasznlt httrtuds reprezentlsra pedig ovlisokat hasznlunk. Az gensprogram,
amely szintn igen egyszer, a 2.10. brn lthat. A BEMENET-FELDOLGOZS fggvny a bemenetbl lltja el
az aktulis llapot absztrakt lerst, a SZABLY-ILLESZTS fggvny pedig az els olyan szablyt adja vissza a
szablyok halmazbl, amely illeszkedik az adott llapot lersra. Vegyk szre, hogy a szablyok s az
illeszkeds fogalmakkal trtn lers tisztn koncepcionlis egyedi megvalstsok akr egy logikai
ramkrt megvalst logikai kapu halmazbl is llhatnak.
2.9. bra - Egy egyszer reflexszer gens sematikus diagramja
A kapcsolatot szitucicselekvs (situationaction rule), produkcis (production rule) vagy haakkor szablynak (ifthen rule) is
nevezik.
7
38
Intelligens gensek
Fontos
Az egyszer reflexszer genseknek megvan az az rtkelend tulajdonsga, hogy egyszerek,
ugyanakkor igen korltozott intelligencijnak bizonyulnak. A 2.10. brn lthat gens csak akkor fog
mkdni, ha a helyes dnts kizrlag az aktulis szlels alapjn meghozhat azaz akkor, ha a
krnyezet teljesen megfigyelhet. Mr a megfigyelhetsg legkisebb hinya is komoly problmt
okozhat. Pldul a korbban bemutatott fkezsi szably felttelezi, hogy az elz-aut-fkez felttel
megllapthat az aktulis szlelsbl az aktulis videokpbl amennyiben az elz autnak
kzpre szerelt fklmpja van. Sajnlatos mdon, a rgebbi modelleken klnbzkppen
helyezkednek el a hts helyzetjelzk, a fklmpk s az indexlmpk, gy egyetlen kp alapjn nem
mindig lehetsges azt megllaptani, hogy az aut fkez-e. Egy egyszer reflexszer gens, amely egy
ilyen aut mgtt halad, vagy folyamatosan szksgtelenl fkezne, vagy ami mg rosszabb, sosem
fkezne.
2.10. bra - Egy egyszer reflexszer gens. A jelenlegi szitucira (amit az szlels
hatroz meg) illeszked felttel szably megkeressvel, majd a hozz tartoz cselekvs
vgrehajtsval mkdik.
Hasonl problmt lthatunk felbukkanni a porszvvilgban. Tegyk fel, hogy egy egyszer reflexszer genst
megfosztunk a helyzetrzkel szenzortl, s csak piszokrzkelje van. Egy ilyen gensnek csak kt szlelse
van: [Koszos] s [Tiszta]. Felszvhat vlaszul a [Koszos]-ra; de mit tegyen, ha [Tiszta] az szlels? A Balra
mozgs (mindrkre) sikertelen lesz, ha pldul az A ngyzetben kezd, a Jobbra mozgs pedig (mindrkre)
sikertelen, ha pldul a B ngyzetben kezd. A vgtelen ciklusok gyakran elkerlhetetlenek rszlegesen
megfigyelhet krnyezetben mkd egyszer reflexszer gensek szmra.
39
Intelligens gensek
Elkpzelhet menekvs a vgtelen ciklusokbl, ha az gens randomizlhatja (randomize) cselekvseit. Pldul

ha a porszv gens [Tiszt]-t szlel, feldobhat egy rmt a Bal s Jobb kztti vlasztshoz. Knny
megmutatni, hogy az gens el fogja rni a msik ngyzetet tlagosan kt lpsen bell. Ezutn, ha a ngyzet
piszkos, feltakartja, s a tiszttsi feladat befejezdik. Ily mdon egy randomizlt egyszer reflexszer gens
tlteljesthet egy determinisztikus egyszer reflexszer genst.
A 2.3. alfejezetben emltettk, hogy a helyes formj randomizlt viselkeds lehet racionlis bizonyos
tbbgenses krnyezetekben. Egygenses krnyezetekben a randomizci ltalban nem racionlis. Egy hasznos
trkk, amely segtheti az egyszer reflexszer genst bizonyos szitucikban, de a legtbb esetben ennl sokkal
jobbat rhetnk el kifinomultabb determinisztrikus gensekkel.
4.3. Modellalap reflexszer gensek

A rszleges megfigyelhetsg kezelsnek leghatkonyabb mdja, ha az gens nyomon kveti a vilg jelenleg
nem lthat rszt. Azaz, az gensnek nyilvn kell tartania valamifle bels llapotot (internal state), amely az
szlelsi trtneten alapul, s gy a jelenlegi llapot nem megfigyelt aspektusainak legalbb egy rszt tkrzi.
A fkezsi problma esetben a bels llapot nem tlsgosan terjedelmes csak a kamertl szrmaz elz
kpkocka, amely lehetv teszi az gens szmra annak megllaptst, hogy a jrm kt szln lev kt piros
lmpa egyszerre gyullad s alszik-e ki. Ms vezetsi feladatokhoz, mint pldul a svvltshoz, az gensnek
nyomon kell kvetnie hol tartzkodik a tbbi aut, amennyiben nem ltja mindegyiket egyszerre.
2.11. bra - Bels llapottal rendelkez reflexszer gens
2.12. bra - A modellalap reflexszer gens. Nyomon kveti a vilg jelenlegi llapott
egy bels modellben. Ezek utn a reflexszer genshez hasonlan vlaszt egy cselekvst.
40
Intelligens gensek
Ezen bels llapot frisstse az id elrehaladtval ktfle tuds beptst ignyli az gensprogramba. Elszr
is szksgnk van olyan informcira, hogy a vilg hogyan alakul az genstl fggetlenl pldul egy elz
aut ltalban kzelebb lesz most, mint egy pillanattal azeltt. Msodszor, szksgnk van valamilyen
informcira arrl, hogy az gens sajt cselekvsei hogyan vltoztatjk meg a vilgot pldul amikor az gens
a kormnyt az ramutat jrsnak megfelelen tekeri, az aut jobbra fordul, vagy t percig szaknak tart
vezets utn egy autplyn ltalban krlbell t mrflddel lesz szakabbra, mint ahol t perce volt. Ezt, a
vilg mkdsnek mikntjrl szl tudst akr egyszer logikai ramkrkkel, akr teljes tudomnyos
elmletekkel valstjuk meg a vilg modelljnek (model) hvjuk. Egy ilyen modellt hasznl genst pedig
modellalap gensnek (model-based agent).
A 2.11. bra szemllteti a bels llapottal rendelkez reflexszer gens struktrjt, megmutatva azt, ahogyan a
jelenlegi szlels a rgi bels llapottal kombinldva ltrehozza a jelenlegi llapot frisstett lerst. Az
gensprogram a 2.12. brn lthat. Az rdekes rsz az LLAPOT-FRISSTS eljrs, amely a bels llapot
lersnak ltrehozsrt felels. Az j szlelseknek az llapotrl szl tuds tkrben trtn rtelmezse
mellett az gensprogram nyomon kveti a vilg lthatatlan rszeit a vilg fejldst ler informci
segtsgvel, az gensprogramnak pedig azt is tudnia kell, hogy az gens cselekvsei milyen hatssal lesznek a
vilg llapotra. Rszletesebb pldk a 10. s 17. fejezetben tallhatk.
4.4. Clorientlt gensek

A krnyezet jelenlegi llapotnak ismerete nem mindig elg annak eldntshez, hogy mit tegynk. Pldul egy
keresztezdsben a taxi mehet egyenesen, de fordulhat jobbra vagy balra is. A helyes dnts attl fgg, hogy a
taxi hova szeretne eljutni. Ms szavakkal, a jelenlegi llapot lersa mellett az gensnek valamifle cl- (goal)
informcival is rendelkeznie kell, amely lerja a kvnatos helyzeteket pldul azt, hogy az utas jusson el a
clllomsig. Az gensprogram ezt sszevetheti a lehetsges cselekvsek eredmnyeirl szl informcikkal
(ugyanazokkal, amelyeket a reflexszer gens esetben a bels llapot frisstsekor hasznlt) annak rdekben,
hogy a cljhoz vezet cselekvst meghatrozza. A 2.13. bra bemutatja a clorientlt gens felptst.
2.13. bra - Egy modellalap, clorientlt gens. Nyomon kveti a vilg llapott s az
elrend clok halmazt is, s kivlaszt egy cselekvst, amely (vgs soron) cljainak
elrshez vezet.
41
Intelligens gensek
Nha a clorientlt cselekvs vlaszts egyszer, amikor a cl teljeslse azonnal egyetlen cselekvssel elrhet.
Mskor sokkal trkksebb, amikor az gensnek befordulsok s visszakanyarodsok sorozatt kell megfontolnia
a cl elrshez. A keress (search) (lsd 36. fejezet) s a tervkszts (planning) (lsd 1112. fejezet) a
mestersges intelligencia azon terletei, amelyek az gens cljait elr cselekvssorozat megtallsval
foglalkoznak.
Vegyk szre, hogy ez a fajta dntshozatal alapjaiban klnbzik az elzkben ismertetett felttelcselekvs
szablyoktl, ezek magukban foglaljk a jv figyelembevtelt mind a Mi fog trtnni, ha ezt s ezt
teszem?, mind a Boldogg tesz ez majd engem? krdseket. Reflexszer gensek tervezsben ezeket
explicit mdon nem hasznljuk, mivel a tervez klnbz esetekre elre meghatrozta a helyes cselekvst. A
reflexszer gens fkez, ha fklmpt lt kigyulladni. Clorientlt elmletben gondolkodhat gy, hogyha az
elz aut fklmpi gnek, akkor az le fog lassulni. Az alapjn, ahogy a vilg ltalban mkdik, az egyetlen
cselekvs, amely elri azt a clt, hogy ne koccanjon neki ms autknak, a fkezs.
Br a clorientlt gens kevsb tnik hatkonynak, sokkal rugalmasabb, mivel a dntseit altmaszt tuds
explicit mdon megjelenik, s gy mdosthat. Ha elkezd esni az es, frisstheti a tudst arrl, hogy a fkek
mennyire lesznek hatkonyak ez automatikusan az sszes relevns viselkeds olyan megvltozst
eredmnyezi, hogy azok az j krlmnyhez igazodjanak. Reflexszer gensek esetben ugyanakkor, a felttel
cselekvs szablyok nagy szmt kellene trnunk. Termszetesen a clorientlt gens klnbz ti clok
elrsben is rugalmasabb. Egyszeren egy j cl megadsval a clorientlt genstl egy j viselkeds
megjelenst kaphatjuk. A reflexszer gens mikor fordulj s mikor menj egyenesen szablyai csak egy cl
esetben fognak mkdni: ki kell ket cserlni ahhoz, hogy egy j helyre menjen.
4.5. Hasznossgorientlt gensek

A krnyezetek tbbsgben a clok nmagukban nem elegendek j minsg viselkeds ltrehozshoz.
Pldul tbbfle cselekvssorozat vezet a taxi vgllomsnak s gy a cljnak elrshez, de nmelyik
gyorsabb, biztonsgosabb, megbzhatbb vagy olcsbb, mint msok. A clok csak durva klnbsget tesznek
boldog s boldogtalan llapotok kztt, egy ltalnosabb teljestmnymrtk ezzel szemben a vilg
llapotainak (vagy llapotsorozatainak) megfelel sszehasonltst tehetn lehetv, azt megadva, hogy
pontosan mennyire tennk boldogg az genst, ha elrn azokat. Mivel a boldogsg nem hangzik tl
tudomnyosan, ezrt a szoksos terminolgia azt mondja, hogy a vilg egyik llapota elnysebb egy msikhoz
kpest, ha nagyobb a hasznossga (utility)8 az gens szmra.
A hasznossg sz itt a hasznossg minsge kifejezsre utal, nem az ram- vagy vzszolgltatkra. (Az angol utility sz tbbes
jelents, a szerz ezrt magyarzza meg helyes rtelmezst a lbjegyzetben. A ford.)
8
42
Intelligens gensek
A hasznossgfggvny (utility function) egy llapotot (vagy llapotok egy sorozatt) egy olyan vals szmra
kpezi le, amelyik a hozz rendelt boldogsg fokt rja le. A hasznossgfggvny teljes meghatrozsa ktfle
olyan helyzetben tesz lehetv racionlis dntseket, amikor a clok erre alkalmatlanok. Egyrszt, amikor
egymsnak ellentmond clok vannak, amelyeknek csak egy rsze rhet el (mint pldul a biztonsgossg s a
sebessg), akkor a hasznossgfggvny meghatrozza a helyes kompromisszumot. Msrszt, amikor tbb cl
van, amelyek elrsre az gens trekedhet, s egyikk sem rthet el teljes bizonyossggal, a hasznossg olyan
mdszert ad, amivel a siker valsznsge a clok fontossghoz mrhet.
A 16. fejezetben megmutatjuk, hogy minden racionlis gensnek gy kell mkdnie, mintha rendelkezne
hasznossgfggvnnyel, amelynek vrhat rtkt maximalizlni akarja. Egy gens, amelynek van egy explicit
hasznossgfggvnye, ily mdon racionlis dntseket hozhat, s ezt egy ltalnos algoritmussal teheti meg,
amely nem fgg a maximalizland specifikus hasznossgfggvnytl. Ezltal a racionalits globlis
defincija amely azon gensfggvnyeket tekinti racionlisnak, amelyek a legnagyobb teljestmnyt hozzk
tvltozik a racionlisgens-tervezs egy helyi knyszerv, amely kifejezhet egy egyszer programban.
A hasznossgalap gens struktrja a 2.14. brn lthat. Valdi hasznossgalap gens programok az V.
rszben szerepelnek, ahol olyan dntshoz genseket terveznk, amelyeknek a rszlegesen megfigyelhet
krnyezetekben elkerlhetetlen bizonytalansgot is kezelnik kell.
4.6. Tanul gensek

Lertunk tbbfle mdszert arra, hogy gensprogramok hogyan vlasztjk ki cselekvseiket. Nem magyarztuk
meg azonban eddig, hogy hogyan jn ltre az gensprogram. Hres korai cikkben Turing (Turing, 1950) azzal
az tlettel foglalkozik, hogy intelligens gpeit tnylegesen kzzel programozza. Megbecsli, mennyi munkt
vehet ez ignybe, s megllaptja, hogy valamilyen eredmnyesebb mdszer kvnatosnak ltszik. Az ltala
javasolt mdszer az, hogy ptsnk tanul gpeket, majd tantsuk ezeket. Az MI sok terletn ez ma a javasolt
mdszer korszer rendszerek ptsre. A tanulsnak van egy msik elnye is, ahogy megllaptottuk korbban:
lehetv teszi az gens szmra, hogy kezdetben ismeretlen krnyezetben mkdjn, s kompetensebb vljon,
mint ahogy azt kezdeti tudsa lehetv tette volna. Ebben a fejezetben rviden bemutatjuk a tanul gensek fbb
elveit. A knyv majdnem minden fejezetben rmutatunk a tanuls lehetsgeire s mdszereire az egyes
gensfajtkban. A VI. rsz merl el mlyebben a klnfle tanulsi algoritmusokban.
2.14. bra - Egy modellalap, hasznossgalap gens. A vilg modellje mellett egy
hasznossgfggvnyt is alkalmaz, amely a vilg llapotaihoz rendelt preferenciit mri.
Ezek utn olyan cselekvst vlaszt, amely a legjobb vrhat hasznossghoz vezet, amit
az sszes lehetsges vgllapot elfordulsi valsznsgvel slyozott tlagolsval
szmt ki.
43
Intelligens gensek
Egy tanul gens ngy koncepcionlis komponensre bonthat fel, ahogy azt a 2.15. bra mutatja. A
legfontosabb klnbsgttel a javtsokrt felels tanul elem (learning element) s a kls cselekvsek
kivlasztsrt felels vgrehajt elem (performance element) kztt van. A vgrehajt elem az, amit eddig a
teljes gensnek tekintettnk: ez vgzi az szlelseket, s ez dnt a cselekvsekrl. A tanul elem a kritikustl
(critic) kapott, az gens mkdsrl szl visszajelzst hasznlja annak megllaptsra, hogy a vgrehajt
elemet hogyan kell mdostani annak rdekben, hogy a jvben jobban mkdjn az gens.
A tanul elem tervezse nagyrszt a vgrehajt elem tervezstl fgg. Amikor egy olyan genst prblunk
tervezni, amely megtanul egy bizonyos kpessget, az els krds nem a hogyan fogom n ezt megtanulni?,
hanem a milyen teljestmnyelemre lesz az gensemnek szksge ennek vgrehajtshoz, ha mr megtanulta,
hogyan kell?. Ha adott egy megtervezett gens, tanul eljrsok az gens minden rsznek javtshoz
kszthetk.
2.15. bra - Tanul gensek egy ltalnos modellje
44
Intelligens gensek
A kritikus megmondja a tanul elemnek, hogy az gens milyen jl mkdik egy rgztett
teljestmnyszabvnyhoz viszonytva. A kritikus szksges, hiszen az szlelsek nmagukban nem jelzik az
gens sikeressgt. Pldul egy sakk program fogadhat egy olyan szlelst, hogy mattot adott az ellenfelnek, de
szksge van egy teljestmnyszabvnyra, hogy tudja, ez egy j dolog. Az szlels nmagban nem mondja meg
ezt. Fontos, hogy a teljestmnyszabvny rgztett legyen. Koncepcionlisan tekinthet gy, mintha az gensen
teljesen kvl lenne, mivel az gens nem mdosthatja azt sajt viselkedsnek megjavtsa rdekben.
A tanul gens utols komponense a problmagenertor (problem generator). Ennek feladata, hogy olyan
cselekvseket javasoljon, amelyek j s informatv tapasztalatokhoz vezetnek. Az a helyzet, hogy ha a
vgrehajt elem a sajt feje utn menne, akkor adott tudsa alapjn mindig a legjobb cselekvseket vlasztan.
De ha az gens hajland egy kis felfedezsre, s rvid tvon taln nhny szuboptimlis cselekvsre, hossz
tvon sokkal jobb cselekvseket fedezhet fel. A problmagenertor feladata, hogy ilyen felfedez cselekvseket
javasoljon. Ezt teszik a tudsok is, amikor ksrleteket vgeznek. Galilei nem gondolta, hogy a pisai torony
tetejbl kveket leejteni nmagban rtkes dolog. Sem a kveket nem prblta sszetrni, sem a szerencstlen
arra jrk agyt nem akarta megvltoztatni. Clja sajt agynak megvltoztatsa volt azltal, hogy az
objektumok mozgsnak egy jobb elmlett ismerje fel.
Hogy az ltalnos tervet konkrtabb tegyk, trjnk vissza az automata taxi pldjhoz. A vgrehajt elem
tartalmazza mindazon tudst s eljrsok halmazt, amelyek a taxivezets cselekvseinek kivlasztshoz
szksgesek. A taxi ezen vgrehajt elem segtsgvel megy ki az utakra s kzlekedik. A kritikus megfigyeli a
vilgot, s tovbbadja az informcit a tanul elemnek. Pldul miutn a taxi hrom forgalmi svon keresztl
egy gyors balkanyart vett, a kritikus megfigyeli a tbbi vezet ltal hasznlt sokkol nyelvezetet. Ebbl a
ksrletbl a tanul elem kpes egy szablyt formlni, miszerint ez egy rossz cselekvs volt, s a vgrehajt
elem mdosul az j szably beillesztsvel. A problmagenertor megfigyelheti a viselkeds bizonyos terleteit,
melyek javtsra szorulnak, s ksrleteket javasol, mint pldul a fkek kiprblst klnbz tfelszneken s
klnbz viszonyok kztt.
A tanul elem mdosthatja az gensdiagramokon (2.9., 2.11., 2.13. s 2.14. brk) tuds komponensek
brmelyikt. A legegyszerbb esetek magukban foglaljk az szlelsi szekvencibl trtn direkt tanulst. Az
egymst kvet krnyezeti llapot prok megfigyelse lehetv teszi az gens szmra annak megtanulst,
hogy a vilg hogyan vltozik, s cselekvsei eredmnyeinek megfigyelse lehetv teszi a mit okoznak a
cselekvseim megtanulst. Pldul ha a taxi vezetje adott ervel fkez, mikor a taxi nedves ton halad, akkor
hamarosan tapasztalni fogja, tnylegesen mekkora lassulst rt el. Vilgos, hogy ez a kt tanulsi feladat sokkal
nehezebb, ha a krnyezet csak rszlegesen figyelhet meg.
45
Intelligens gensek
Az elz bekezdsben szerepl tanulsi formk nem ignyelnek hozzfrst kls teljestmnyszabvnyhoz
bizonyos rtelemben a mrtk univerzlis: a ksrletekkel sszhangban lev elrejelzsek ksztse. A helyzet
nmikpp bonyolultabb egy hasznossgalap gens szmra, amelyik a hasznossginformcit szeretn
megtanulni. Pldul tegyk fel, hogy a taxisofr gens nem kap borravalt az utasoktl, akiket az t folyamn
teljesen sszerzott. A kls teljestmnyszabvnynak informlnia kell az genst, hogy a borraval elvesztse
egy negatv hozzjruls az ltalnos teljestmnyhez ezek utn az gens megtanulhatja, hogy a hirtelen
manverek nem jrulnak hozz a hasznossghoz. Bizonyos rtelemben a teljestmnyszabvny a berkez
szlels egy rszt elklnti jutalomknt (reward) (vagy bntetsknt penalty), amely az gens viselkedsi
minsgnek direkt visszacsatolsa. A rgztett teljestmnyszabvnyok, mint pldul llatokban a fjdalom
vagy hsg, ily mdon rtelmezhetk. Ezt a krdst a 21. fejezetben trgyaljuk.
sszegezve, az genseknek sokfle komponensk van, s ezen komponensek sokflekppen reprezentlhatk az
gensprogramban, gy gy tnik, sokfle tanulsi mdszer ltezik. Van ugyanakkor egy egyest motvum. A
tanuls az intelligens gensekben sszefoglalhat gy, mint egy folyamat, amely az gens minden komponenst
gy mdostja, hogy az sszhangba kerljn a rendelkezsre ll visszacsatolt informcival, ily mdon nvelve
az gens ltalnos teljestmnyt.
5. sszefoglals
Ebben a fejezetben szlsebesen vgigszaladtunk a mestersges intelligencin, amelyet gy tekintettnk, mint az
genstervezs tudomnyt. A kvetkez fontos pontokra kell emlkeznnk:
Egy gens (agent) olyan valami, amely szlel s cselekszik egy krnyezetben. Az gensfggvny (agent
function) meghatrozza, hogy egy tetszleges szlelsi sorozathoz milyen cselekvst hajtson vgre az gens.
A teljestmnymrtk (performance measure) rtkeli az gens viselkedst egy krnyezetben. Egy
racionlis gens (rational agent) gy cselekszik, hogy maximalizlja a teljestmnymrtk vrhat rtkt
az addigi szlelsi sorozat alapjn.
A feladatkrnyezet (task environment) lersa tartalmazza a teljestmnymrtk, a kls krnyezet, a
beavatkozk s a szenzorok meghatrozst. Egy gens tervezse sorn az els lps mindig a
feladatkrnyezet minl teljesebb lersa.
A feladatkrnyezetek szmos lnyeges dimenzi mentn klnbzhetnek. Lehetnek teljesen vagy rszben
megfigyelhetk, determinisztikusak vagy sztochasztikusak, epizdszerek vagy sorozatszerek, statikusak
vagy dinamikusak, diszkrtek vagy folytonosak, valamint egygensesek vagy tbbgensesek.
Az gensprogram (agent program) implementlja az gensfggvnyt. Tbbfle alapvet gensfelpts
ltezik attl fggen, hogy milyen informci jelenik meg s hasznldik fel a dntsi folyamatban. A
konstrukci klnbzhet hatkonysgban, kompaktsgban s rugalmassgban. Az gensprogram
megfelel konstrukcija a krnyezet termszettl fgg.
Az egyszer reflexszer gensek (simple reflex agents) azonnal vlaszolnak az szlelsekre, mg a
modellalap reflexszer gensek (model-based reflex agents) a vilg aktulis szlelsekbl nem
nyilvnval aspektusait bels llapotukban tartjk nyilvn. A clorientlt gensek (goal-based agents)
cljaik elrse rdekben cselekszenek, a hasznossgorientlt gensek (utility-based agents) pedig sajt
boldogsgukat prbljk meg maximalizlni.
Minden gens javthatja a teljestmnyt tanuls (learning) segtsgvel.

A cselekvs kzponti szerepe az intelligenciban a praktikus kvetkeztets fogalma egszen Arisztotelsz
Nikomakhoszi Etikjig vezethet vissza. A praktikus kvetkeztets McCarthy (McCarthy, 1958) nagy hats
cikknek is trgya volt: Programs with Common Sense (Jzan sszel br programok). A robotika s
szablyozselmlet terletei termszetknl fogva alapveten fizikai gensek tervezsvel foglalkoznak. A
vezrl (controller) koncepcija a szablyozselmletben megegyezik az MI gens fogalmval. Taln meglep,
hogy az MI trtnelmnek nagy rszben az gensek elklntett komponenseire krds-felelet rendszerek,
ttelbizonytk, ltrendszerek s gy tovbb koncentrlt inkbb, mint a teljes gensekre. Az gensek lersa
Genesereth s Nilsson (Genesereth s Nilsson, 1987) cikkben egy nagy hats kivtel volt. A teljes genskp
46
Intelligens gensek
ma mr szles krben elfogadott a szakmban, s ez lett az jabb rsok kzponti tmja (Poole s trsai 1998;
Nilsson 1998).
Az 1. fejezet a racionalits koncepcijnak gykereit a filozfira s kzgazdasgtanra vezette vissza. Az MIben a nyolcvanas vek kzepig ez a koncepci csak periferilis rdekldst kapott, amikor elkezdte elbortani a
terlet megfelel technikai megalapozsnak trgyalsait. Jon Doyle cikke azt jsolta, hogy a racionlis gensek
tervezse kpezi majd az MI f kldetst, mg ms npszer terletek levlnak j tudomnygakat formlva
(Doyle, 1983).
A krnyezetek tulajdonsgainak gondos figyelembevtele s hatsuk a racionlis gensek tervezsre leginkbb
a szablyozselmleti tradciban lthat pldul a klasszikus szablyoz rendszerek (Dorf s Bishop, 1999)
teljesen megfigyelhet, determinisztikus krnyezeteket kezelnek; a sztochasztikus optimlis vezrls (Kumar s
Varaiya, 1986) rszlegesen megfigyelhet, sztochasztikus krnyezeteket kezel; s a hibrid szablyoz
(Henzinger s Sastry, 1998) olyan krnyezetekkel foglalkozik, amelyek mind diszkrt, mind folytonos elemeket
tartalmaznak. A teljesen s a rszlegesen megfigyelhet krnyezetek kztti klnbsgttel az opercikutats
terletn kifejldtt dinamikus programozs (dynamic programming) irodalmban szintn kzponti krds
(Puterman, 1994), amit a 17. fejezetben fogunk trgyalni.
A reflexszer gensek voltak az elsdleges modellek a pszicholgiai behavioristk, mint pldul Skinner
(Skinner, 1953) szmra, aki megprblta az organizmusok pszicholgijt kizrlag bemenet/kimenet, avagy
inger/vlasz lekpezsekre visszavezetni. A pszicholgiban a behaviorizmustl a funkcionalizmusig jut
fejlds, amelyet legalbb rszben a szmtgp-metafora gensekre trtn alkalmazsa idzett el (Putnam,
1960; Lewis, 1966), az gens bels llapotnak a megjelenst eredmnyezte. Az MI munkinak nagy rsze az
llapottal rendelkez tiszta reflexszer gensek tlett tl egyszernek tartja ahhoz, hogy elrelpst jelentsen,
de Rosenschein (Rosenschein, 1985) s Brooks (Brooks, 1986) munkja megkrdjelezte ezt a felttelezst (25.
fejezet). Az elmlt vekben jelents munka zajlott annak rdekben, hogy hatkony algoritmusokat talljanak
komplex krnyezetek nyomon kvetsre (Hamscher s trsai, 1992). A Remote Agent program, amely a Deep
Space One rhajt vezrelte (lersa a 4. szakasz - A mestersges intelligencia jelenlegi helyzete tallhat) egy
klnsen meggyz plda (Muscettola s trsai, 1998; Jonsson s trsai, 2000).
A clorientlt genseket mindenhol feltteleztk, kezdve Arisztotelsz gyakorlati gondolkodsrl alkotott
nzettl McCarthy logikai MI-rl rt korai cikkeiig. A Shakey the Robot (Fikes s Nilsson, 1971; Nilsson,
1984) volt egy logikai, clorientlt gens els robot formj megtesteslse. A clorientlt gensek teljes logikai
elemzse Genesereth s Nilsson (Genesereth s Nilsson, 1987) cikkben jelent meg, s egy clorientlt
programozsi mdszertant, az gynevezett gensorientlt programozst Shoham (Shoham, 1993) dolgozott ki.
A clorientlt nzpont a kognitv pszicholgia hagyomnyban is dominns a problmamegolds terletn,
kezdve a jelents mrtkben meghatroz Human Problem Solving (Emberi problmamegolds) (Newell s
Simon, 1972) mvel, s folytatdva Newell ksbbi munkjban (Newell, 1990). A clok, tovbb bontva
vgyakra (ltalnos) s szndkokra (jelenleg kvetett), kzponti tmi a Bratman (Bratman, 1987) ltal
kifejlesztett genselmletnek is. Ez az elmlet hatssal volt mind a termszetes nyelv megrtsre, mind a
tbbgenses rendszerekre.
Horvitz kifejezetten azt javasolja, hogy az MI alapja a racionalits mint az elvrt hasznossg maximalizlsa
legyen (Horvitz s trsai, 1988). Pearl rsa (Pearl, 1988) volt az els az MI-ben, amely rszletesen trgyalta a
valsznsget s a hasznossgelmletet; az rs a bizonytalansg melletti kvetkeztets s dntshozatal
praktikus mdszereinek kifejtsvel valsznleg a legnagyobb nll tnyez volt a hasznossgorientlt
gensek fel trtn elmozdulsban a kilencvenes vekben (V. rsz).
A 2.15. brn bemutatott ltalnos tanul gens tervezs klasszikus a gpi tanuls irodalmban (Buchanan s
trsai, 1978; Mitchell, 1997). Ezen felpts programokban megtestesl pldi legalbb olyan messze nylnak
vissza, mint Arthur Samuel dmajtkot jtsz tanul programja (Samuel, 1959, 1967). A tanul genseket a VI.
rsz trgyalja rszletesen.
Az gensek s genstervezs irnti rdeklds gyorsan nvekedett az elmlt vekben, rszben az internet,
valamint az automatizlt s mobil szoftbotok irnti igny nvekedsvel (Etzioni s Weld, 1994). A relevns
cikkeket a Readings in Agentsben (Huhns s Singh, 1998), valamint a Foundations of Rational Agencyben
(Wooldridge s Rao, 1999) gyjtttk ssze. A Multiagent Systems (Weiss, 1999) nyjtja az genstervezs sok
aspektusnak egysges alapjt. Az genseknek szentelt konferencik kztt van az International Conference on
Autonomous Agents, az International Workshop on Agent Theories, Architectures, and Languages, s az
International Conference on Multiagent Systems. Vgezetl, a Dung Beetle Ecology (Ganajtr bogr kolgia)
47
Intelligens gensek
(Hanski s Cambefort, 1991) rdekes informcik gazdag vlasztkt knlja a ganajtr bogarak
viselkedsrl.
5.2. Feladatok
2.1.
Definilja sajt vilgait a kvetkez fogalmakkal: gens, gensfggvny, gensprogram, racionalits,
autonmia, reflexszer gens, modellalap gens, clorientlt gens, hasznossgorientlt gens, tanul gens!
2.2.
Mind a teljestmnymrtk, mind a hasznossgfggvny azt mri, hogy mennyire dolgozik jl egy gens.
Magyarzza el a kztk lev klnbsget!
2.3.
Ez a gyakorlat felfedi az gensfggvnyek s a programok kztti klnbsgeket.
a. Lehetsges tbb mint egy gensprogram, amely egy adott gensfggvnyt valst meg? Adjon meg egy
pldt vagy mutassa meg, mirt nem lehetsges!
b. Vannak olyan gensfggvnyek, amelyeket nem lehet programmal megvalstani?
c. Rgztve egy gparchitektrt, igaz-e, hogy minden egyes gensprogram pontosan egy gensfggvnyt
valst meg?
d. Lehetsges tbb mint egy gensprogram, amely egy adott gensfggvnyt valst meg?
2.4.
Vizsgljuk meg klnbz porszvvilg-beli gensfggvnyek racionalitst!
a. Mutassa meg, hogy a 2.3. brn lthat egyszer porszv gensfggvny igenis racionlis a 2.2. szakasz Racionalits felsorolt felttelezsekkel!
b. rjon le egy racionlis gensfggvnyt arra a mdostott teljestmnymrtkre, amely levon egy pontot
minden elmozdulsrt! Szksge van-e a fggvnynek megfelel gensprogramnak bels llapotra?
c. Mutasson lehetsges gensterveket olyan esetekre, amikor tiszta ngyzetek piszkoss vlhatnak, s a
krnyezet geogrfija ismeretlen! rtelmes dolog-e, hogy ezekben az esetekben az gens sajt
tapasztalataibl tanuljon? Ha igen, akkor mit kellene megtanulnia?
2.5.
Az albbi gensek mindegyikre dolgozza ki a feladatkrnyezetek TKB-lerst!
a. Robot focijtkos;
b. Internetes knyvvsrl gens;
c. Autonm Mars terepjr;
d. Matematikusok ttelbizonyt segtje.
2.6.
A 2.5. plda minden egyes genstpusra jellemezze a krnyezeteket a 2.3. fejezetben megadott tulajdonsgok
alapjn, majd vlasszon ki megfelel gensterveket!
A kvetkez feladatok mindegyike egy krnyezetnek s egy sor gensnek a megvalstsra vonatkozik a
porszvvilgban.
48
Intelligens gensek
2.7.
Valstson meg egy teljestmnymr krnyezetszimultort a 2.2. brn mutatott s 2.2. szakasz - Racionalits
specifiklt porszvvilgra! Implementcija legyen modulris, hogy knnyen megvltoztathassa az rzkelket,
a beavatkozkat s a krnyezeti jellemzket (mret, alak, piszok elhelyezkedse stb.). (Megjegyzs: Bizonyos
opercis rendszerekre s programozsi nyelvekre vannak ksz implementcik az internetes kdtrban.)
2.8.
Tervezzen s valstson meg egy tiszta reflexszer genst a 2.7. feladat krnyezetre! Minden lehetsges kezdeti
koszeloszlsra s genselhelyezkedsre futtassa le a krnyezetszimultort ezzel az genssel! Jegyezze fel az
gens teljestmnymrtkt minden egyes konfigurcira s az tlagos pontszmt is!
2.9.
Vizsglja meg a 2.7. gyakorlat egy mdostott krnyezett, amelyben az genst egy ponttal bntetik minden
egyes elmozdulsrt.
a. Lehet-e tkletesen racionlis egy egyszer reflexszer gens ebben a krnyezetben? Magyarzza meg,
mirt!
b. Mi a helyzet az llapottal rendelkez reflexszer gensekkel? Tervezzen egy ilyen genst!
c. Hogyan vltozna meg az (a) s (b) pontokra adott vlasza, ha az gens szlelsei a krnyezet sszes
ngyzetre megmondjk neki, hogy azok tisztk vagy piszkosak?
2.10.
Vizsglja meg a 2.7. feladat porszvkrnyezetnek egy mdostott vltozatt, amelyben a krnyezet alakja
mrete, hatrai s akadlyai ismeretlen, mint ahogy a kosz kezdeti elhelyezse is az! (Az gens mehet Fel s
Le, valamint Balra s Jobbra is.)
a. Lehet-e tkletesen racionlis egy egyszer reflexszer gens ebben a krnyezetben? Magyarzza meg,
mirt!
b. Egy randomizlt gensfggvnnyel rendelkez reflexszer gens jobban teljesthet egy egyszernl?
Tervezzen egy ilyen genst, s mrje meg a teljestmnyt klnbz krnyezetekben!
c. Tud olyan krnyezetet tervezni, ahol az n randomizlt gense igen rosszul fog teljesteni? Mutassa meg az
eredmnyeit!
d. Egy llapottal rendelkez reflexszer gens jobban teljesthet egy egyszernl? Tervezzen egy ilyen genst,
s mrje meg a teljestmnyt klnbz krnyezetekben! Tud ilyen tpus racionlis genst tervezni?
2.11.
Ismtelje meg a 2.10. feladatot egy olyan esetre, amikor az elhelyezkeds rzkelt egy tkzs rzkel
vltja fel, ami rzkeli az gens olyan elmozdulsi ksrleteit, amikor nekitkzik egy akadlynak vagy tlpi a
krnyezet hatrt! Tegye fel, hogy az tkzsrzkel mkdse lell! Hogyan kellene az gensnek
viselkednie?
2.12.
Az eddigi feladatok porszvkrnyezetei determinisztikusak
gensprogramokat a kvetkez sztochasztikus varicikra:
voltak.
Vizsgljon
meg
lehetsges
a. Murphy trvnye: az id 25%-ban a Felszvs mvelet nem tudja feltakartani a padlt, ha az piszkos,
illetve kinti r a koszt, ha az tiszta. Hogyan rinti az gens programjt az, ha a piszokrzkel az id 10%ban rossz vlaszt ad?
b. Kisgyerekek: minden idlpsben minden ngyzetnek 10% eslye van bekoszoldni. Tud javasolni egy
racionlis genstervet erre az esetre?
49
3. fejezet - Problmamegolds
keresssel
Ebben a fejezetben megnzzk, hogy egy gens hogyan tudja megtallni azt a cselekvssorozatot, amely elvezet
a clhoz, ha erre egyetlen egyedi cselekvs sem elegend.
A 2. fejezetben emltett legegyszerbb gensek a reflexszer gensek voltak, amelyek cselekvsei az llapotok
s a cselekvsek kztti kzvetlen lekpzsen alapulnak. Az ilyen gensek nem kpesek olyan krnyezetben
tevkenykedni, ahol e lekpzs trolsi ignye tl nagy lenne, vagy ahol a lekpezs megtanulsa tl sok idt
venne ignybe. A clorientlt gensek azonban sikerrel jrhatnak a jvbeli cselekvseknek s annak a
szmbavtelvel, hogy ezen cselekvsek kimenetelei mennyire kvnatosak.
Ebben a fejezetben a clorientlt gensek egyik tpust, a problmamegold genst (problem-solving agent)
ismertetjk. A problmamegold gensek gy hatrozzk meg, mit is kell tennik, hogy olyan
cselekvssorozatokat keresnek, amelyek a kvnt llapotokba vezetnek. Azzal kezdjk, hogy pontosan
megfogalmazzuk a problmt s a megoldst felpt alkotelemeket, s szmos pldval illusztrljuk
ezen defincikat. Ezek utn nhny ltalnos rendeltets keressi algoritmust mutatunk be, amelyek e
problmk megoldsra alkalmasak, majd az egyes algoritmusok elnyeit sszehasonltjuk. Az algoritmusok
nem informltak (uninformed) abban az rtelemben, hogy a problma defincijn tlmenen ms
informcival a problmrl nem rendelkeznek. A 4. fejezet informlt (informed) keressi stratgikat trgyal,
amelyek rendelkeznek valamilyen elkpzelssel arrl, hogy a megoldst merrefel is kell keresni.
Ebben a fejezetben az algoritmuselmlet terletn hasznlt fogalmakat alkalmazzuk. Az aszimptotikus
komplexits (azaz az O() jellsmd) s az NP-teljessg fogalomkrben nem jratos olvas szmra az A)
fggelk nyjt bvebb informcikat.
1. Problmamegold gensek
Az intelligens gensekrl feltesszk, hogy a teljestmnymrtkket maximalizljk. Mint azt a 2. fejezetben
lttuk, a feladat valamelyest leegyszersdik, ha az gens egy clt (goal) tud maga el tzni, s megprblja azt
elrni. Elszr vizsgljuk meg, hogy az gens hogyan s mirt teheti ezt meg.
Tegyk fel, hogy az gensnk a romniai Arad vrosban tartzkodik, s orszgjr trja vge fel kzeledik.
Az gens teljestmnymrtke szmos tnyezt tartalmaz: pldul szpen le szeretne barnulni, tkletesteni
szeretn a romn nyelvtudst, ltni szeretn az sszes nevezetessget, lvezni az jszakai letet (amilyen van),
kerlni a msnapossgot stb. A dntsi problma igen bonyolult, sok kompromisszummal s tiknyvek gondos
tanulmnyozsval jr. Ttelezzk most fel, hogy gensnk egy Bukarestbl rvnyes, vissza nem vlthat
repljeggyel rendelkezik msnapra. Ebben a helyzetben rtelmes clnak (goal) tnik, hogy eljusson
Bukarestbe. Mindazon cselekvseket tovbbi mrlegels nlkl el lehet dobni, amelyekkel nem lehet idben
Bukarestbe rni, amivel az gens dntsi problmja nagymrtkben egyszersdik. A clok segtik
megszervezni a viselkedst, mivel korltozzk az gens ltal elrend dolgok szmt. A pillanatnyi helyzeten s
az gens hasznossgmrtkn alapul clmegfogalmazs (goal formulation) a problmamegolds els lpse.
Clnak a vilg llapotainak egy halmazt tekintjk, pontosabban azon llapotok halmazt, amelyekben a cl
teljesl. Az gens feladata megkeresni, hogy amely cselekvsek sorozata juttatja el t egy clllapotba. Mieltt
azonban ezt megtehetn, el kell dntenie, hogy milyen cselekvseket s llapotokat vizsgljon meg.
Amennyiben olyan szint cselekvsekkel kellene dolgoznia, mint pldul a bal lbadat tedd elrbb fl
mterrel vagy a kormnykereket hat fokkal tekerd balra, az gens mg a parkolbl sem lenne kpes
kihajtani, nemhogy idben eljutni Bukarestbe, mivel az ilyen rszletek szintjn a vilgban tl sok a
bizonytalansg, s a megolds tl sok lpsbl llna. A problmamegfogalmazs (problem formulation) az a
folyamat, amely sorn eldntjk, hogy amely cselekvseket s llapotokat vegynk figyelembe, ha egy cl
adott. Ezt a folyamatot rszletesebben is trgyalni fogjuk. Egyelre ttelezzk fel, hogy az gens az egyik
nagyobb vrosbl egy msik nagyobb vrosba val autzs szintjn szemlli a cselekvseket. Ebbl addan a
figyelembe vett llapotok annak felelnek meg, hogy az gens ppen egy adott vrosban van. 1
Vegyk szre, hogy ezek az llapotok valjban a vilg llapotaibl kpezett nagy halmazoknak felelnek meg, mivel a vilg llapotai a
valsg minden aspektust meghatrozzk. Fontos szben tartani a problmamegolds llapotai s a vilg llapotai kztti klnbsget.
1
50
Problmamegolds keresssel
Az gensnk azt tzte ki clul, hogy Bukarestbe megy, s azt fontolgatja, hogy Aradrl hov menjen. Hrom t
vezet ki Aradrl: egy Nagyszeben fel, egy Temesvr fel s egy Nagyzernd fel. Ezek egyike sem ri el
kzvetlenl a clt, gy amennyiben gensnk nem ismeri ki magt tkletesen Romniban, nem fogja tudni,
hogy melyik ton induljon el.2 Ms szval az gens nem fogja tudni eldnteni, hogy a lehetsges cselekvsek
kzl melyik a legjobb, mert nincs elegend informcija a cselekvsek hatsra elll llapotokrl.
Amennyiben az gensnek nem ll rendelkezsre tovbbi tuds, akkor itt megakad. A legjobb amit tehet, hogy a
cselekvsekbl vletlenszeren kivlaszt egyet.
Fontos
Tegyk fel azonban, hogy gensnknek akr papron, akr a fejben van egy Romnia-trkpe. A
trkp jelentsge, hogy informcit nyjthat az gensnek azokrl az llapotokrl, ahova eljuthat,
illetve a vgrehajthat cselekvsekrl. Az gens ezen informcit felhasznlhatja egy hipotetikus
utazs megtervezsre ezeken a vrosokon keresztl, hogy megtallja a legjobb utat, amely vgl
elvezet Bukarestbe. Miutn a trkpen megtallt egy utat Aradrl Bukarestbe, a cljt el tudja rni, ha
az utazs egyes llomsaihoz tartoz vezetsi szakaszokat vgrehajtja. ltalnossgban: amennyiben
egy gens eltt kzvetlenl tbb ismeretlen rtk lehetsg ll, ki tudja vlasztani, hogy mit tegyen, ha
elszr megvizsglja a klnbz lehetsges cselekvssorozatokat, amelyek ismert rtk llapotokba
vezetnek, majd ezutn kivlasztja a legjobbat.
Az ilyen sorozat ellltsi folyamatt keressnek (search) nevezzk. A keressi algoritmus bemenete egy
problma, kimenete pedig egy cselekvssorozat formjban elll megolds (solution). Miutn elllt egy
megolds, az abban szerepl cselekvseket vgre lehet hajtani. Ezt vgrehajtsi (execution) fzisnak szoks
nevezni. gy elllt egy egyszer fogalmazd meg, keresd meg, hajtsd vgre genstervezsi sma. Az elllt
smt a 3.1. bra mutatja. A cl s a megoldand problma megfogalmazsa utn az gens egy keressi eljrst
hv meg. Ezek utn a megoldst hasznlja cselekvsei vezrlsre, azt teszi, amit a megolds a kvetkez
lpsnek javasol ez tipikusan a cselekvssorozat els lpse , s a vgrehajtott lpst trli a
cselekvssorozatbl. Miutn a megoldst vgrehajtotta, az gens j clt keres.
3.1. bra - Egy egyszer problmamegold gens. Elszr a clt s a problmt

fogalmazza meg, majd a problmt megold cselekvssorozatot keres, vgl a
cselekvseket egyenknt vgrehajtja. Amikor ksz vele, egy msik clt fogalmaz meg, s
az egszet jrakezdi. Jegyezzk meg, hogy a cselekvssorozata vgrehajtsa alatt az
gens az rzkelseivel nem foglalkozik. Felttelezi, hogy az ltala megtallt megolds
mindig mkdkpes.
Felttelezzk, hogy legtbb olvasnk ugyanebben a cipben jr, s knnyen t tudja rezni gensnk tancstalansgt. Ezton elnzst
krnk a romniai olvasktl, akik szmra ezen pedaggiai eszkz nem jelent segtsget.
2
51
Elszr a problmamegfogalmazs folyamatt rjuk le, majd a fejezet tovbbi rszeit a KERESS fggvny
klnbz vltozatainak ismertetsre fordtjuk. Ebben a fejezetben nem trgyaljuk rszletesen az LLAPOTFRISSTS s a CL-MEGFOGALMAZS fggvnyeket.
Mieltt a rszletekbe belemerlnnk, egy pillanatra lljunk meg s nzzk meg, hogy a problmamegold gens
hogyan illik bele a 2. fejezetben trgyalt gensek s krnyezetek sokasgba. A 3.1. brn lthat genstervezet
felttelezi, hogy a krnyezet statikus (static), mivel a problma megfogalmazsa s megoldsa semmilyen
vltozsrl nem vesz tudomst, amely esetleg a krnyezetben bell. Az genstervezet azt is felttelezi, hogy a
kezdeti llapot ismert. Ennek ismerete akkor a legknnyebb, amikor a krnyezet megfigyelhet (observable).
Az alternatv cselekvsek szmontartsa tulajdonkppen azt ttelezi fel, hogy a krnyezet diszkrt (discrete).
Vgl a legfontosabb: az genstervezet azt is felttelezi, hogy a krnyezet determinisztikus (deterministic). A
problmamegoldsok egyedi cselekvssorozatok, gy a vratlan esemnyeket nem is tudjk figyelembe venni. A
megoldsok vgrehajtsa radsul az rzkelsrl nem is vesz tudomst! Annak az gensnek, amely mondhatni
csukott szemmel hajtja vgre a terveit, elgg biztosnak kell lennie a dolgban (szablyozselmletben az ilyen
rendszereket nylt hurknak open-loop hvjk, mert az rzkelsek figyelmen kvl hagysa az gens s a
krnyezete kztti hurkot felbontja). E felttelezsek azt jelentik, hogy a krnyezetek lehet
legegyszerbbikvel foglalkozunk, s ez egyben indokolja azt is, hogy e fejezet mirt a knyv elejn tallhat.
A 3.6. alfejezet rvid bepillantst ad abba, hogy mi trtnik, amikor a megfigyelhetsg s a determinizmus
felttelezsrl lemondunk. Ezt a tmt sokkal mlyebben a 12. s a 17. fejezet trgyalja.
1.1. Jl definilt problmk s megoldsok

Egy problma (problem) formlis megragadshoz az albbi ngy komponensre van szksg:
A kiindul llapot (initial state), amibl az gens kezdi a cselekvseit. A romniai gensnk kezdeti
llapott pldul Benn(Arad)-knt lehetne lerni.
Az gens rendelkezsre ll lehetsges cselekvsek (actions) halmaza. A leginkbb hasznlatos lers3 az
llapottmenet-fggvnyt (successor function) alkalmazza. Egy adott x llapot esetn az
LLAPOTTMENET-FV (x) visszaadja a rendezett cselekvs, utdllapot prok halmazt, ahol minden
cselekvs az x llapotban leglis cselekvsek egyike, s minden utdllapotot egy cselekvsnek az x llapotra
val alkalmazsval nyernk. A Benn(Arad) llapotban az llapottmenet-fggvny a romniai problmra a
{ Menj(Nagyszeben),
Benn(Nagyszeben) ,
Menj(Nagyzernd), Benn(Nagyzernd) }
Menj(Temesvr),
Benn(Temesvr) ,
prokat adn vissza.

A kezdeti llapot s az llapottmenet-fggvny egyttesen implicit mdon definiljk a problma llapottert
(state space): azon llapotok halmazt, amelyek a kiindul llapotbl elrhetk. Az llapottr egy grfot alkot,
amelynek csompontjai az llapotok s a csompontok kztti lek a cselekvsek. (Romnia 3.2. brn lthat
trkpe llapottrknt rtelmezhet, ha minden tjt ktirny gpkocsi-vezetsi cselekvsknt fogjuk fel). Az
llapottr egy tja (path) az llapotok egy sorozata, amely llapotokat a cselekvsek egy sorozata kt ssze.
A clteszt (goal test), amely meghatrozza, hogy egy adott llapot clllapot-e. Nha ltezik a lehetsges
clllapotok egy explicit halmaza, s a teszt egyszeren megnzi, hogy az gens elrte-e ezek egyikt.
Romniban az gens clja a {Benn(Bukarest)} szingleton. Nha a cl valamilyen absztrakt tulajdonsggal
van definilva, nem pedig explicit mdon felsorolt llapothalmazzal. A sakkban pldul az gynevezett
sakk-matt llapot elrse a cl, amelyben az ellenfl kirlya az t rt tmads ell nem tud elmeneklni.
Egy tkltsg- (path cost) fggvny, amely minden thoz hozzrendel egy kltsget. A problmamegold
gens azt a kltsgfggvnyt fogja vlasztani, amely a sajt hatkonysgi mrtknek felel meg. A
Bukarestbe siet gens szmra az id a lnyeg, gy az tkltsg lehetne pldul az t a km-ben kifejezett
hossza. Ebben a fejezetben az t kltsgnek az utat alkot egyes cselekvsek kltsgnek sszegt fogjuk
tekinteni az t mentn. Az x llapotbl az y llapotba vezet cs cselekvs lpskltsge (step cost) legyen
lk(x, cs, y). Romniban a lpskltsgeket a 3.2. bra mutatja ttvolsgok formjban. Felttelezzk, hogy a
lpskltsgek nemnegatvak.4
Egy alternatv megfogalmazs az opertorok (operators) egy halmaza, amelyeket egy llapotra alkalmazva lehet az utdllapotokat
generlni.
4
A negatv kltsgek kvetkezmnyeivel a 3.17. feladatban foglalkozunk.
3
52
Az elbbi elemek definiljk a problmt s egy kzs adatstruktrba foghatk, amit a problmamegold
algoritmus bemenetnek tekintnk. A problma megoldsa (solution) nem ms, mint a kiindul llapotbl a
clllapotba vezet t. A megolds kvalitst az tkltsgfggvny mri, s egy optimlis megoldsnak
(optimal solution) a megoldsok kzt a legkisebb lesz az tkltsge.
1.2. A problmk megfogalmazsa

Az elbbi rszben a hogyan jutunk el Bukarestbe problma olyan megfogalmazst javasoltuk, amely a
kezdeti llapotbl, az llapottmenet-fggvnybl, a clllapottesztbl s az tkltsgbl ll. Ez a
megfogalmazs rtelmesnek tnik, a vals vilg szmos aspektust mgis figyelmen kvl hagyja. Hasonltsuk
csak ssze az ltalunk vlasztott egyszer llapotlerst, Benn(Arad), egy tnyleges orszgjr kirndulssal,
ahol a vilg llapota rengeteg mindent tartalmazhat: kivel utazunk, mit kzvett a rdi, milyen tjat ltunk az
ablakon t, van-e kzelben rendr, milyen messze van a kvetkez pihenhely, milyen az t llapota, milyen az
idjrs s sok-sok ms.
Ezeket a rszleteket kihagytuk az llapotlersokbl, mert nem lnyegesek a Bukarestbe vezet t
megkeressben. Egy reprezentcibl a rszletek eltvoltst absztrakcinak (abstraction) nevezzk.
Az llapotlers absztrahlsa mellett magukat a cselekvseket is absztrahlni kell. Egy vezetsi cselekvsnek
szmos hatsa van. Amellett, hogy megvltoztatja a gpkocsi s utasai helyt, idbe telik, zemanyagot
fogyaszt, szennyezi a levegt s megvltoztatja az genst (azt mondjk, hogy az utazs kiszlesti a ltkrt). A
mi megfogalmazsunkban csak a helyvltoztatst vesszk figyelembe. Van szmos olyan cselekvs, amit
teljesen elhagyunk: pldul a rdi bekapcsolst, az ablakon val kinzst, a lasstst, mert rendr van a
kzelben stb. s persze a fordtsd a kormnyt balra 3 fokkal szint cselekvsekkel sem foglalkozunk.
Lehetnk-e pontosabbak a megfelel absztrakcis szint meghatrozsban? A megvlasztott absztrakt
llapotokra s cselekvsekre gy gondolunk, hogy azok a rszletes vals llapotok s cselekvsek egsz
halmazaihoz tartoznak. Most tekintsk az absztrakt problma egy megoldst: pldul az Aradrl
Nagyszebenbe, majd Rimnicu Vilceba, Pitestibe s Bukarestbe vezet utat. Ez az absztrakt megolds rengeteg
rszletesebb tnak felel meg. Pldul Nagyszeben s Rimnicu Vilcea kztt vezethettnk bekapcsolt rdival,
majd az utazs tovbbi rszre kikapcsolhattuk a rdit. Az absztrakci rvnyes, ha az absztrakt megoldst
megoldss fejthetjk ki egy rszletesebb vilgban is. Elgsges felttel az, hogy minden olyan rszletes
llapothoz, mint az Aradon van, ltezik egy rszletes t valamelyik olyan llapothoz, mint a Nagyszebenben
van stb. Az absztrakci hasznos, ha a megoldsbeli cselekvsek vgrehajtsa az eredeti problmnl
egyszerbb. Ebben az esetben ezek elgg egyszerek ahhoz, hogy egy tlagos gpkocsivezet gens vgre
tudja azokat hajtani minden tovbbi keress vagy tervkszts nlkl. gy egy j absztrakci megvlasztsa
magban foglalja az rvnyessg megrzse mellett a lehet legtbb rszlet trlst, s annak biztostst, hogy
az absztrakt cselekvseket knny legyen vghezvinni. Ha nem lenne meg a hasznos absztrakcik
megalkotsnak kpessge, akkor az intelligens gensek a vals vilgban teljesen hasznavehetetlenek lennnek.
3.2. bra - Romnia egy rsznek sematikus orszgti trkpe
53
2. Pldaproblmk
A problmamegold megkzeltst rengeteg feladatkrben alkalmaztk. Nhnyat az albbiakban sorolunk fel,
megklnbztetve az gynevezett jtk- s a valsvilg-beli problmkat. A jtkproblmk (toy problems)
rendeltetse, hogy segtsgkkel a klnfle problmamegold mdszereket illusztrlni tudjuk vagy ki tudjuk
prblni. Az ilyen problmk egzakt tmr lersa megadhat. Ez azt jelenti, hogy klnbz kutatk gy
knnyszerrel hasznlhatjk az algoritmusok hatkonysgi sszehasonltshoz A valsvilg-beli problmk
(real-world problems) azok, amelyek megoldsa tnyleg rdekes az emberek szmra. Ezeknek nincs egyetlen
ltalnosan elfogadott megfogalmazsuk, mi azonban megprbltuk rzkeltetni az ltalnos megfogalmazsuk
jellegt.
3.3. bra - A porszvvilg llapottere. Az lek cselekvseket jelentenek: B = Balra, J =

Jobbra, S = Szv.
2.1. Jtkproblmk
54
Az els vizsglt plda a 2. fejezetben bevezetett porszvvilg (vacuum world) (lsd 2.2. bra). Ezt
problmaknt az albbi mdon definilhatjuk:
llapotok: az gens kt hely egyikben lehet. Mindegyik lehet piszkos, de lehet tiszta is. gy 2 2 2 = 8
lehetsges llapotrl beszlhetnk.
Kezdeti llapot: akrmelyik llapot lehet kezdeti llapot.
llapottmenet-fggvny: a hrom (Balra, Jobbra, Szv) cselekvs alkalmazsbl add leglis llapotokat
generlja. A teljes llapottr a 3.3. brn lthat.
Clteszt: ellenrzi, hogy minden ngyzet tiszta-e.
tkltsg: minden lps kltsge 1, gy az t kltsge megegyezik az t lpseinek a szmval.
A vals vilggal sszevetve e problma jellemzi a diszkrt lokcik, a diszkrt kosz, a megbzhat takarts,
valamint az, hogy takarts utn piszok soha nem keletkezik jra (a 3.6. alfejezetben ezeket a felttelezseket
feladjuk). Fontos megjegyezni, hogy az llapotot az gens s a kosz helyzete egyttesen hatrozza meg. Egy
nagyobb, n hely krnyezetben n 2n llapot van.
A 3.4. brn bemutatott 8-as kirakjtk (8-puzzle) egy 3 3-as tblbl, 8 szmozott kockbl s egy res
helybl ll. Az res hely melletti kockt be lehet cssztatni az res helyre. A cl egy meghatrozott lls, mint
pldul az bra jobb oldaln lthat lls elrse. A problma szoksos megfogalmazsa a kvetkez:
llapotok: az llapotlers meghatrozza mind a nyolc kocka s az res hely pozcijt a kilenc lehetsges
pozci egyikben.
Kezdeti llapot: akrmelyik lls lehet kezdeti llapot. Figyeljk meg, hogy minden egyes clt pontosan az
llapotok felbl lehet elrni (3.4. feladat).
llapottmenet-fggvny: a ngy cselekvs (res hely megy Balra, Jobbra, Fel, Le) alkalmazsbl add
leglis llapotokat generlja.
Clteszt: ellenrzi, hogy az llapot megegyezik-e a 3.4. brn mutatott clllapottal (ms clkonfigurci is
lehetsges).
tkltsg: minden lps kltsge 1, gy az t kltsge megegyezik az t lpseinek a szmval.
3.4. bra - A 8-as kirakjtk egy tipikus feladvnya
Milyen absztrakcikhoz folyamodtunk itt? A cselekvseket a kezdeti s vgllapotuk erejig absztrahltuk,

elmozdts kzben egy kocka kzbls helyzeteit figyelmen kvl hagytuk. Az olyan cselekvsektl is
55
elvonatkoztattunk, mint a tbla megrzsa, ha a kockk megakadtak, vagy a kockk kssel val kiszedse s
visszahelyezse. Amit kaptunk, az a jtk szablykszlete, a manipulcik fizikai rszleteitl eltekintve.
A kirakjtk a cssztats kirakjtkok (sliding-block puzzles) csaldjba tartozik, amelyeket gyakran j
keres algoritmusok tesztelsre alkalmaznak az MI-ben. Ez az ltalnos osztly NP-teljes, gy nem vrhat,
hogy lnyegesen jobb mdszert lehet tallni az itt s a kvetkez bekezdsben lert keressi algoritmusoknl. A
8-as kirakjtknak 9!/2 = 181 440 elrhet llapota van, s gy e jtk knnyen megoldhat. A 15-s
kirakjtknak (a 4 4-es tbln) kb. 10 billi llapota van, s a legjobb algoritmusok a vletlenl generlt
eseteket optimlisan nhny milliszekundum alatt oldjk meg. A 24-es jtknak (az 5 5-s tbln) kb. 1025
llapota van, s a vletlenszeren kivlasztott esetek optimlis megoldsa mg mindig kemny di a jelenlegi
gpek s algoritmusok szmra.
A 8-kirlyn problma (8-queens problem) clja, hogy 8 kirlynt gy helyezznk el egy sakktbln, hogy
egyltaln ne tmadjk egymst. (Egy kirlyn egy vele azonos sorban, oszlopban vagy tlban lv bbut
tmad.) A 3.5. bra egy sikertelen megoldsi ksrletet mutat: a jobb szls oszlopban lv kirlynt tmadja a
bal fels sarokban lv kirlyn.
3.5. bra - Egy majdnem j megolds a 8-kirlyn problmra. (A megolds

megkeresst az olvasra bzzuk.)
56
Br hatkony clalgoritmusok lteznek ezen problma s a teljes n-kirlyn problma megoldsra, a

kirlynfeladat mindamellett rdekes tesztproblmja marad a keressi algoritmusoknak. Kt f
megfogalmazsa ltezik. Az inkrementlis megfogalmazsban (incremental formulation) az opertorok az
llapotlerst bvtik, az res llapottl kezdve. A 8-kirlyn problma esetn ez azt jelenti, hogy a kirlynket
egyenknt helyezzk el a sakktbln. A teljes llapot lersban (complete-state formulation) elszr
felhelyezzk mind a 8 kirlynt, majd mozgatjuk ket. Az tkltsg mindkt esetben rdektelen szmunkra,
mert csak a vgs llapot szmt. A problma els inkrementlis megfogalmazsa lehet a kvetkez:
llapotok: egy llapot a 0 8 kirlyn, tetszleges elrendezse a tbln.
Kezdeti llapot: a tbln nincs egy kirlyn sem.
llapottmenet-fggvny: helyezz egy j kirlynt egy res mezre.
Clteszt: 8 kirlyn a tbln s egyik sincs tmads alatt.
Ebben a megfogalmazsban 64 63 57 1,8 10 14 lehetsges vizsgland sorozatunk van. Sokkal
sszerbb vlaszts lenne, ha figyelembe vennnk azt a tnyt, hogy egy mr eleve tmadt mezre nincs rtelme
letenni egy kirlynt:
llapotok: n (0 n 8) kirlyn olyan elrendezse a tbln, hogy az n bal oldali oszlopban oszloponknt egy
tallhat gy, hogy nem tmadjk egymst.
llapottmenet-fggvny: helyezz egy kirlynt a bal szls, mg res oszlopba gy, hogy azt ne tmadja
egyetlen kirlyn sem.
Ez a megfogalmazs a 8-kirlyn problma llapottert 1,8 1014-rl 2057 mret trr cskkenti, minekutna
megoldst knny megtallni. Msrszt 100 kirlyn a korbbi megfogalmazs 10 400 llapothoz vezet, mg a
javtottnl csak kb. 1052 llapotunk lesz (3.5. feladat). Ez risi redukci, a javtott eset azonban mg mindig tl
nagy az ebben a fejezetben ismertetett algoritmusok szmra. A teljes llapot lersrl a 4. fejezetben
olvashatunk, az 5. fejezet viszont egy olyan egyszer algoritmust kzl, amellyel a milli kirlynt szmll
problmt is knnyen meg lehet oldani.
2.2. Valsvilg-beli problmk

Mr korbban lttuk, hogy az tkeressi problmt (route-finding problem) hogyan definilhatjuk a megadott
helyek s a kzttk lv sszekttetsek segtsgvel. Az tkeres algoritmusokat szmos terleten
alkalmazzk. Hasznljk pldul szmtgp-hlzatokban tvonalkeressre, katonai mveletek tervezsnl s
lgi tvonaltervez rendszerekben is. ltalban nehz az ilyen problmkat specifiklni. Nzzk meg a lgi
tvonaltervezsi problma egy egyszerstett pldjt:
llapotok: minden llapotot egy hely (pldul egy repltr) s az aktulis idpont azonost.
Kezdeti llapot: a problma specifiklja.
llapottmenet-fggvny: azokat az llapotokat adja vissza, amelyek az aktulis repltrrl valamely
msikra olyan menetrendbeli jratok ignybevtelvel keletkeznek (esetleg tovbb pontostva, hogy mely
osztlyra s melyik konkrt lsre vonatkozik az utazs), amelyek ksbb indulnak, mint az aktulis idpont
plusz a repltri tranzit ideje.
Clteszt: elrtk-e a clllomst?
tkltsg: fgg a pnzgyi kltsgektl, vrakozsi idtl, replsi idtl, vmkezelsi s tlevl-vizsglati
procedrktl, az ls minsgtl, a nap idszaktl, a replgp tpustl, az utaskedvezmnyektl stb.
A kereskedelmi tvonaljavasl rendszerek a problma valami hasonl megfogalmazst hasznljk, sok tovbbi
bonyoltssal, hogy a repltrsasgok bonyolult viteldjstruktrit kezelni tudjk. Minden tapasztalt utas tudja
azonban, hogy nem minden replt zajlik a tervek szerint. Egy igazn j rendszernek eshetsgi tervekkel
pldul az alternatv jratokra trtn tartalk helyfoglalsokkal is tudnia kell foglalkozni, ameddig persze
ezeket a kltsg s az eredeti terv sszeomlsnak a valsznsge igazolja.
57
A krutazsi problmk (touring problems) az tkeressi problmk rokonai egy fontos klnbsggel.
Tekintsk pldul azt a problmt, hogy A 3.2. bra minden egyes vrosba ltogass el legalbb egyszer gy,
hogy Bukarestbl indulj, s az utat ott is fejezd be. Az tkeressi problmhoz hasonlan a cselekvs itt is kt
szomszdos vros kztti utazsnak felel meg. De ebben a problmban az llapottr alapveten ms. Az gens
helye mellett minden egyes llapotban trolni kell az gens ltal korbban megltogatott vrosokat is. gy a
kiindul llapot ebben az esetben a Bukarestben vagyok, eddig megltogattam {Bukarestet} llapot lenne,
mg egy tipikus kzbens llapot a Vasluiban vagyok, eddig megltogattam {Bukarestet, Csalnost, Vasluit}
llapot. A clteszt ellenrizn, hogy az gens Bukarestben van-e, s vgigltogatta-e mind a 20 vrost.
Az utaz gynk problma (Travelling Salesperson Problem TSP) egy krutazsi problma, amelyben
minden vrost pontosan egyszer kell megltogatni. A cl a legrvidebb t megkeresse. A problma NP-nehz,
de hatalmas erfesztsek trtntek a TSP-algoritmusok kpessgeinek javtsra. Ezen algoritmusokat az utaz
gynkk tjainak megtervezse mellett nyomtatott ramkrk furatainak ksztsnl a fr automata
mozgatsnak megtervezsre, tovbb ruhzak rakodgpeinek tvonaltervezsre is alkalmaztk.
A VLSI elhelyezsi (VLSI layout) problmban komponensek s sszekttetsek milliit egy chipen kell
elhelyezni, a terlet, az ramkri ksleltets s a szrt kapacitsok minimalizlsa s a gyrtsi kihozatal
maximalizlsa mellett. Az elhelyezsi problma a logikai tervezs fzist kveti, s ltalban kt rszbl ll:
cellaelrendezsbl (cell layout) s huzalozsbl (channel routing). A cellaelrendezs sorn az ramkr
primitv komponenseit cellkba rendezik, amelyek mindegyike valamilyen jl definilt funkcit lt el. Minden
egyes cellnak rgztett nyomtatsi kpe (mret s alak) van, s adott szm sszekttetst ignyel a tbbi
cellhoz. A cl az, hogy az egyes cellkat gy helyezzk el a chipen, hogy azok ne lapoldjanak t, s a cellk
kztt legyen megfelel hely az sszekt vezetkek szmra. A huzalozs sorn minden egyes vezetknek
megfelel vezetsi tvonalat keresnk a cellk kztt. Ezek a keressi problmk hihetetlenl sszetettek, de
mindenkppen rdemes a megoldsukat megtallni. A 4. fejezetben ltni fogunk nhny algoritmust, amelyek
kpesek megoldani ezeket a problmkat.
A robotnavigci (robot navigation) a korbban lert tkeressi problma ltalnostsa. Az utak diszkrt
halmaza helyett a robot egy folytonos trben mozog (elvben) vgtelen cselekvs- s llapothalmazzal. Egy
egyszer, sk felleten mozg kr alak robot esetn az llapot lnyegben ktdimenzis. Amennyiben a
robotnak karja s lba is van, akkor azokat is vezrelni kell, gy a keressi tr sokdimenziss vlik. Mr a
keressi tr vgess ttelhez is kifinomult technikkra van szksg. A 25. fejezetben megvizsglunk nhny
ilyen mdszert. A problma sszetettsge mellett a vals robotoknak foglalkozniuk kell az rzkelik ltal
szolgltatott jelek s a motorvezrlk hibival is.
sszetett objektumok robotok ltali automatikus sszeszerelst (automatic assembly sequencing) elszr a
FREDDY robot mutatta be (Michie, 1972). Azta lass, de biztos elrehalads tapasztalhat ezen a terleten. Ma
mr pldul villanymotorok automatikus sszeszerelse gazdasgossgi szempontbl is kivitelezhet. Az
sszeszerelsi feladatoknl a problma az alkatrszek sszeszerelsi sorrendjnek megkeresse. Amennyiben
rossz szerelsi sorrendet vlasztunk, valamikor a ksbbiek folyamn egy adott alkatrszt nem tudunk egy
msik alkatrsz kiszerelse nlkl beszerelni. Annak eldntse, hogy az sszeszerelsi sorrend egy lpse
megvalsthat-e vagy sem, a robotnavigcihoz hasonl sszetett geometriai keressi problma. gy az
sszeszerelsi sorrend megtervezsben a kltsges feladat egy kivitelezhet kvetkez lps megtervezse.
Minden gyakorlati fontossg algoritmusnak kerlnie kell az llapottr egy kis tredkn tlmen feltrst.
Egy msik fontos sszelltsi problma a fehrjetervezs (protein design), ahol a clkitzs olyan aminosavszekvencia megkeresse, amely valamilyen betegsg gygytsa szempontjbl lnyeges tulajdonsgokkal
rendelkezik s hromdimenzis fehrjv formlhat.
Az utbbi idben egyre nagyobb a kereslet az interneten keres (Internet searching) szoftverrobotok irnt,
amelyek krdsekre vlaszt, kapcsold informcikat, vagy kereskedelmi zletek lehetsgt kutatjk fel. A
keressi technikk szempontjbl ez igazn j alkalmazs, mert elgg nyilvnval, hogy az internethez egy
grfszer kp rendelhet, ahol a csompontok (weboldalak) linkekkel ssze vannak kapcsolva. Az
internetkeress teljes lerst a 10. fejezetre hagyjuk.
3. Megoldsok keresse
Az elzkben lttuk, hogyan kell egy problmt definilni. A htralv lps a megolds megkeresse az
llapottrben vgrehajtott keresssel trtnik. Ebben a rszben olyan keressi technikkkal foglalkozunk,
amelyek egy explicit keressi ft (search tree) hasznlnak, amelyet az llapotteret egyttesen definil kezdeti
llapotbl s az llapottmenet-fggvnybl generlnak. ltalnossgban, ha egy llapotot tbb ton is
58
elrhetnk, inkbb keressi grfrl, mint keressi frl beszlnk. Ezzel az igen fontos bonyoltssal ksbb a
3.5. alfejezetben foglalkozunk.
3.6. bra - Az Arad s Bukarest kztti tkeressi problma rszleges keressi fi. A
kifejtett csompontokat rnykoltuk, a legenerlt, de mg ki nem fejtett csompontok
vastagon keretezettek, a mg le nem generlt csompontokat pedig halvny szaggatott
vonalak jelzik.
A 3.6. brn lthatjuk az Arad s Bukarest kztti tkeres problma keressi fjnak egy kezdeti kifejtst. A
keressi fa gykere az a keressi csompont (search node), amely a Benn(Arad) kezdeti llapotnak felel meg.
Az els lps annak ellenrzse, hogy vajon ez clllapot-e. Nyilvnvalan nem az, de fontos ellenrizni, hogy
meg tudjuk oldani az olyan beugrat problmkat is, mint amilyen pldul az Aradrl indulva jussunk el
Aradra. Mivel ez nem clllapot, egyb llapotokat is meg kell vizsglnunk. Ezt az aktulis llapot kifejtsvel
(expanding) tesszk, azaz az llapottmenet-fggvnynek az aktulis llapotra trtn alkalmazsval, amivel
az llapotok egy j halmazt generljuk (generating). Ebben az esetben hrom j llapotot kapunk:
Benn(Nagyszeben), Benn(Temesvr) s Benn(Nagyzernd). Most el kell dntennk, hogy a hrom lehetsg
kzl melyik utat kvessk.
A keress lnyege a kvetkez: egy lehetsget kivlasztani, s a tbbit ksbbre halasztani arra az eshetsgre,
ha az els vlaszts nem vezetne megoldsra. Ttelezzk fel, hogy elsnek Nagyszebent vlasztjuk.
Ellenrizzk, hogy ez clllapot-e (nem az), majd kifejtjk, aminek hatsra a Benn(Arad), Benn(Fogaras),
Benn(Nagyvrad) s Benn(RimnicuVilcea) llapotokat kapjuk. Ezek utn e ngy kzl brmelyiket
vlaszthatjuk, vagy akr vissza is mehetnk s vlaszthatjuk Nagyzerndet vagy Temesvrt. Folytatjuk a
59
kivlasztst, a clllapot-ellenrzst s a kifejtst, mg egy megoldst nem tallunk, vagy amg el nem fogynak a
kifejtend llapotok. A kifejtend llapot kivlasztst a keressi stratgia (search strategy) hatrozza meg.
Az ltalnos fakeres algoritmus informlis megfogalmazst a 3.7. bra mutatja.
3.7. bra - Az ltalnos fakeressi algoritmus informlis lersa
Fontos megklnbztetni az llapotteret s a keressi ft. Az tkeressi problma esetben az llapottr csak 20
llapotbl ll, minden egyes vroshoz tartozik egy llapot. Ebben az llapottrben azonban vgtelen sok t
vezet, gy a keressi fa vgtelen sok csompontbl ll. Pldul az AradNagyszeben, AradNagyszebenArad,
Arad NagyszebenAradNagyszeben hrom t az els hrom a vgtelen szm tszekvencibl. (Egy j
keressi algoritmus nyilvnvalan elkerli az ilyen utak kvetst. A 3.5. alfejezetben megmutatjuk hogyan.)
A csompontokat sokfle mdon lehet reprezentlni, de mi felttelezzk, hogy egy csompont egy t
komponensbl ll adatszerkezet:
LLAPOT: az llapottrnek a csomponthoz tartoz llapota;
SZL-CSOMPONT: a keressi fa azon csompontja, amely a krdses csompontot generlta;
CSELEKVS: a csompont szl-csompontjra alkalmazott cselekvs;
T-KLTSG: a kezdeti llapotbl a krdses csompontig vezet t ltalban g(n)-nel jellt kltsge, ahogy
ezt a szlmutatk jelzik;
MLYSG: a kezdeti llapotbl vezet t lpseinek a szma.
Fontos visszaidznnk a csompontok s az llapotok kzti klnbsget. A csompont egy adatnyilvntartsra
hasznlt adatszerkezet, amit egy keressi fa lersra hasznlunk. Egy llapot a vilg egy konfigurcija. gy a
csompontok a SZL-CSOMPONT mutatk ltal definilt meghatrozott ton tallhatk, mg az llapotok nem.
Tovbb knnyen elfordulhat, hogy kt klnbz csompont egyazon llapotot tartalmaz, ha ezt az llapotot
kt klnbz cselekvssorozattal generltk le. A csompont-adatstruktrt a 3.8. bra mutatja.
3.8. bra - A keressi fa alapvet pt adatstruktri a csompontok. Minden

csompontnak van szlje, llapota s szmos adminisztrl adatmezeje. A nyilak a
gyerekektl a szlkig mutatnak.
60
Valahogy nyilvn kell tartanunk a legenerlt, kifejtsre vr csompontokat is ezt a gyjtemnyt, listt
peremnek (fringe) nevezik. A perem minden eleme egy levlcsompont (leaf node), azaz egy olyan
csompont, amelynek a fban nincsenek kveti. A 3.6. brn a fk pereme a vastagon bekeretezett
csompontokbl ll. A perem legegyszerbb reprezentcija egy csomponthalmaz lenne. A keressi stratga
ekkor olyan fggvny lenne, amely a kvetkez lpsben kifejtend csompontot ebbl a halmazbl vlasztan
ki. Br elvi szempontbl ez nyilvnval megolds, szmtsigny szempontjbl drga lenne, mert a keressi
stratgia fggvnynek a halmaz minden egyes elemt vgig kellene nznie, hogy ki tudja vlasztani a legjobb
csompontot. Ezrt a tovbbiakban feltesszk, hogy a csompontgyjtemny egy vrakozsi sorknt (queue)
van megvalstva. A soron vgezhet mveletek az albbiak:
SORT-LTREHOZ(elem, ) ltrehoz egy az adott elemeket tartalmaz sort.
RES?(sor) csak akkor ad vissza igaz rtket, ha a sor res.
ELS-ELEM(sor) visszaadja a sor els elemt.
TVOLTSD-EL-AZ-ELS-ELEMET(sor) visszaadja az ELS-ELEM(sor)-t s ezt eltvoltja a sorbl.
BESZR(elem, sor) egy elemet szr be a sorba.
BESZR-MIND(elemek, sor) egy elemhalmazt beszr a sorba.
Ezen defincik felhasznlsval az ltalnos fakeressi algoritmus egy formlisabb defincijt adhatjuk meg.
Ezt a 3.9. bra mutatja.
3.9. bra - Az ltalnos fakeressi algoritmus. (Vegyk szre, hogy a perem

argumentumnak egy res sornak kell lennie, s a sor tpusa befolyssal lesz a keress
sorrendjre.) A MEGOLDS fggvny a szlmutatk gykrig val kvetsvel kinyert
cselekvssorozatot adja vissza.
61
3.1. A problmamegold hatkonysg mrse

A problmamegold algoritmus kimenete vagy kudarc, vagy egy megolds (egyes algoritmusok vgtelen
hurokba kerlhetnek s soha nem trnek vissza vlasszal). Mi az algoritmusok hatkonysgt ngyfle mdon
fogjuk rtkelni:
Teljessg (completeness): az algoritmus garantltan megtall egy megoldst, amennyiben ltezik megolds?
Optimalits (optimality): a stratgia megtallja az optimlis megoldst, ahogy azt a 1.1. szakasz - Jl
definilt problmk s megoldsok rszben definiltuk?
Idigny (time complexity): mennyi ideig tart egy megolds megtallsa?
Trigny (space complexity): a keress elvgzshez mennyi memrira van szksg?
Az id- s trignyrl beszlve mindig a problma nehzsgnek valamilyen mrtkt tartjuk szem eltt. Az
elmleti szmtstudomnyban egy tipikus ilyen mrtk az llapottr grf nagysga, mivel a grf a keres
program bemenetre adott explicit adatstruktrnak tekinthet (erre egy plda Romnia trkpe). Az MI-ben,
ahol a grfot implicit formban a kezdeti llapottal s az llapottmenet-fggvnnyel reprezentljuk, s ahol a
grf sokszor vgtelen, a komplexitst hrom tnyezvel fejezzk ki. Ezek: b az elgazsi tnyez (branching
factor), vagyis a kvetk maximlis szma minden csompontban, d a legseklyebb clllapot mlysge s m
az llapottrben tallhat utak maximlis hossza.
Az idt gyakran a keress kzben generlt5 csompontok szmval, a trat pedig a memriban maximlisan
trolt csompontok szmval mrik.
A keress hatkonysgnak becslsnl gondolhatunk a keressi kltsgre (search cost), amely tipikusan az
idignytl fgg, de tartalmazhat egy trignyt jelz komponenst is; vagy hasznlhatjuk a keress sszkltsgt
(total cost), amely a megolds tkltsgt s a keressi kltsget kapcsolja ssze. Az Aradrl Bukarestbe vezet
tkeressi problma esetn a keressi kltsg a keress ideje, a megoldsi kltsg pedig a teljes t hossza kmben. gy amikor a teljes kltsget akarjuk kiszmtani, kilomtert s milliszekundumot kellene sszeadnunk. Ez
nem mindig egyszer, mert nem ltezik semmilyen hivatalos vltszm a kett kztt, ennl a problmnl
Egyes forrsok ehelyett az idt a kifejtett csompontok szmval mrik. A kt mrtk legfeljebb egy b tnyezben tr el. Neknk gy
tnik, hogy a csompontkifejts vgrehajtsi ideje n az adott kifejtsben generlt csompontok szmval.
5
62
azonban rtelmesnek tnhet a kilomtereket milliszekundumokra tszmtani a gpkocsi tlagsebessgt

hasznlva (mert az gensnek az id a fontos). Ez lehetv teszi, hogy az gens megtallja azt a
kompromisszumot, amikor a legrvidebb t keresst clz minden tovbbi szmts improduktvv vlik. A
klnbz javak kztti kompromisszum ltalnos problmjra a 16. fejezetben mg visszatrnk.
4. Nem informlt keress

Ez az alfejezet t keressi stratgit trgyal, amelyek a nem informlt (vaknak is nevezett) keress
(noninformed (blind) search) cm al sorolhatk. A kifejezs azt jelenti, hogy ezen stratgiknak semmilyen
informcijuk nincs az llapotokrl a problma defincijban megadott informcin kvl. Mkdsk sorn
mst nem tehetnek, mint a kvetkez llapotok generlsa s a clllapot megklnbztetse a nem
clllapottl. Azokat a stratgikat, amelyek tudjk, hogy az egyik kzbls llapot gretesebb, mint egy
msik kzbls llapot, informlt keressi (informed search) vagy heurisztikus keressi (heuristic search)
stratginak nevezzk. Ezeket majd a 4. fejezet trgyalja. A keressi stratgikat a csompontok kifejtsi
sorrendje klnbzteti meg egymstl.
4.1. Szlessgi keress

A szlessgi keress (breadth-first search) egy egyszer keressi stratgia, ahol elszr a gykrcsompontot
fejtjk ki, majd a kvetkez lpsben az sszes a gykrcsompontbl generlt csompontot, majd azok
kvetit stb. ltalnossgban a keressi stratgia minden adott mlysg csompontot hamarabb fejt ki, mieltt
brmelyik, egy szinttel lejjebbi csompontot kifejten.
A szlessgi keresst meg lehet valstani a FA-KERESS algoritmussal egy olyan res peremmel, amely egy
elszr-be-elszr-ki (first-in-first-out FIFO) sor, biztostva ezzel, hogy a korbban megltogatott
csompontokat az algoritmus korbban fejti ki. Ms szval a FA-KERESS (problma, FIFO-SOR ()) meghvsa
szlessgi keresst eredmnyez. A FIFO sor az sszes jonnan legenerlt kvett a sor vgre teszi, magyarn a
seklyebb csompontok korbban kerlnek kifejtsre, mint a mlyebben fekvk. A 3.10. bra illusztrlja a
keress elrehaladst egy egyszer binris fa esetn.
3.10. bra - Szlessgi keress egy egyszer binris fban. Minden lpsnl a kvetkez
kifejtend csompontot egy marker jelzi.
A szlessgi keress elemzshez az elbbi rszben trgyalt ngy jellemzt fogjuk hasznlni. Knny beltni,
hogy ez a keress teljes. Ha a legseklyebb clcsompont valamilyen vges d mlysgben fekszik, a szlessgi
keress eljut hozz az sszes nla seklyebben fekv csompontot kifejtve (feltve persze, hogy a b elgazsi
tnyez vges). A legseklyebb clcsompont nem szksgkppen optimlis. Pontosabban a szlessgi keress
optimlis, ha az tkltsg a csompont mlysgnek nem cskken fggvnye (pldul ha minden cselekvsnek
ugyanannyi a kltsge).
Eddig a szlessgi keressnek csak a j tulajdonsgait lttuk. Ahhoz, hogy megrtsk mirt nem mindig ezt a
stratgit vlasztjuk, meg kell vizsglnunk a keress vgrehajtshoz szksges id s memria mennyisgt.
Ehhez egy olyan hipotetikus llapotteret vesznk alapul, amelyben minden egyes llapotot kifejtve b j llapot
keletkezik. A keressi fa gykrcsompontja b csompontot generl az els szinten, amelyek mindegyike jabb
b csompontot, sszesen b2 csompontot generl a msodik szinten. Ezek mindegyike jabb b csompontot
generl, sszesen b3 csompontot a harmadik szinten s gy tovbb. Ttelezzk fel, hogy ezen problma
megoldsa d mlysgben tallhat. Ekkor a legrosszabb esetben a d-edik szinten az utolst kivve (mert a clt
magt nem fejtjk ki) a csompontok mindegyikt ki kell fejtennk, a (d + 1)-edik szinten bd+1 b csompontot
generlva. A generlt csompontok ssz-szma gy:
b + b2 + b3 + ... + bd + (bd+1 b) = O(bd+1)
63
Minden legenerlt csompontot a memriban el kell trolni, mert vagy a perem eleme, vagy egy perembeli
csompont se. A trigny gy az idignnyel azonos (meg egy tovbbi csompont a gykr szmra).
Azok, akik jratosak a komplexitselemzsben, kezdenek aggdni (vagy izgatottak lesznek, ha szeretik a
kihvsokat), amikor exponencilis komplexitst ltnak, mint amilyen pldul az O(bd+1). A 3.11. bra
megmutatja, hogy mirt. Az bra egy b = 10 elgazsi tnyezvel rendelkez szlessgi keresst mutat a d
megolds mlysg tbb rtkre. A tblban felttelezzk, hogy msodpercenknt 10 000 csompontot
generlunk, illetve egy csompont trolshoz 1000 bjtra van szksg. Szmos feladvny jelleg problma
felel meg ezeknek a felttelezseknek (egy 100-as tnyezvel ide vagy oda), ha azokat modern szemlyi
szmtgpeken futtatjuk.
Fontos
A 3.11. bra alapjn kt tanulsgot vonhatunk le. Elszr is a szlessgi keress esetn a trigny
nagyobb problmt jelent az idignynl. A legtbb ember, amennyiben rdekli a vlasz egy fontos
problmra, trelmesen ki tud vrni 31 rt, hogy egy 8 mlysg keress lefusson, de csak kevs
szmtgpnek van a keresshez szksges Tbjtnyi memrija. Szerencsre lteznek ennl kevesebb
memrit ignyl keressi algoritmusok is.
3.11. bra - A szlessgi keress id- s trignye. Az bra adatai b = 10-es elgazsi
tnyezt, 10 000 csompont/percet s 1000 bjt/csompontot feltteleznek.
Fontos
A msodik tanulsg, hogy az idigny mg mindig fontos tnyez. Ha a problmnk 12 mlysg,
akkor (a felttelezseink mellett) a szlessgi keressnek (vagy akrmlyik nem informlt keressi
algoritmusnak) 35 vbe telne a megolds megtallsa. ltalnossgban az exponencilis komplexits
keressi problmk kzl csak a legkisebb problmapldnyok oldhatk meg.
4.2. Egyenletes kltsg keress

A szlessgi keress optimlis, ha minden lps kltsge azonos, mert mindig a legseklyebb ki nem fejtett
csompontot fejti ki. Egyszer ltalnostssal egy olyan algoritmust tallhatunk ki, amely tetszleges
lpskltsg mellett optimlis. Az egyenletes kltsg keress (uniform cost search) mindig a legkisebb
tkltsg n csompontot fejti ki elszr, nem pedig a legkisebb mlysg csompontot. Egyszeren belthat,
hogy a szlessgi keress is egyenletes kltsg keress, amennyiben minden lpskltsg azonos.
Az egyenletes kltsg keress nem foglalkozik azzal, hogy hny lpsbl ll egy bizonyos t, hanem csak az
sszkltsgkkel trdik. Emiatt mindig vgtelen hurokba kerl, ha egy csompont kifejtse zrus kltsg
cselekvshez s ugyanahhoz az llapothoz val visszatrst eredmnyez (pldul a NoOp cselekvs). A
teljessget csak gy garantlhatjuk, hogy minden lps kltsge egy kis pozitv e konstansnl nagyobb, vagy
azzal egyenl. Ez a felttel egyben az optimalits elgsges felttele is. Ez azt jelenti, hogy egy t kltsge az t
mentn mindig nvekszik. Ebbl a tulajdonsgbl ltszik, hogy az algoritmus a csompontokat mindig a
nvekv tkltsg fggvnyben fejti ki. Azaz az els kifejtsre kivlasztott clcsompont egyben az optimlis
megolds is (emlkezznk arra, hogy a FA-KERESS a clllapottesztet csak a kifejtsre megvlasztott
csompontokra alkalmazza). Javasoljuk, hogy prbljk ki az algoritmust, hogy a Bukarestbe vezet
legrvidebb utat megtalljk.
64
Az egyenletes kltsg keresst nem a mlysg, hanem az tkltsg vezrli, gy komplexitst a b s a d

fggvnyben nehz jellemezni. Helyette legyen C az optimlis megolds kltsge, s ttelezzk fel, hogy
minden cselekvs kltsge legalbb e. Az algoritmus id- s trignye legrosszabb esetben
, ami
sokkal tbb lehet, mint bd. Ez azrt lehetsges, mert az egyenletes kltsg keress kpes (s sokszor ezt meg is
teszi) a kis lpsekbl ll nagy fkat felkutatni a nagy s felteheten hasznos lpseket tartalmaz utak eltt.
Amikor minden lps kltsge ugyanannyi, az
, persze azonos bd-nel.
4.3. Mlysgi keress

A mlysgi keress (depth-first search) mindig a keressi fa aktulis peremben a legmlyebben fekv
csompontot fejti ki. A keress lefolyst a 3.12. bra illusztrlja. A keress azonnal a fa legmlyebb szintjre
jut el, ahol a csompontoknak mr nincsenek kvetik. Kifejtsket kveten kikerlnek a perembl s a
keress visszalp ahhoz a kvetkez legmlyebben fekv csomponthoz, amelynek vannak mg ki nem fejtett
kveti.
Ez a stratgia egy olyan FA-KERESS fggvnnyel implementlhat, amelynek a sorballt fggvnye az
utolsnak-be-elsnek-ki (last-in-first-out, LIFO), ms nven verem. A mlysgi keresst szoks a FA-KERESS
fggvny alternatvjaknt egy rekurzv fggvnnyel is implementlni, amely a gyermekcsompontokkal
meghvja nmagt (mlysgkorlttal dolgoz rekurzv mlysgi keress algoritmust a 3.13. bra mutatja).
A mlysgi keress nagyon szerny trigny. Csak egyetlen, a gykrcsomponttl egy levlcsompontig
vezet utat kell trolnia, kiegsztve az t minden egyes csompontja melletti kifejtetlen csompontokkal. Egy
kifejtett csompont el is hagyhat a memribl, feltve, hogy az sszes leszrmazottja meg lett vizsglva. Egy
b elgazsi tnyezj s m maximlis mlysg llapottr esetn a mlysgi keress trignye bm + 1. A 3.11.
bra felttelezseivel lve s felttelezve, hogy a clcsompont mlysg csompontoknak nincsenek kvetik,
azt talljuk, hogy pldul d = 12 mlysg esetn a mlysgi keress 118 kbjtot ignyelne a 10 Pbjttal
szemben, ami tzmillirdos redukcit jelent a trignyben.
A mlysgi keress visszalpses keressnek (backtracking search) nevezett vltozata mg kevesebb
memrit hasznl. A visszalpses keress az sszes kvet helyett egyidejleg csak egy kvett generl.
Minden rszben kifejtett csompont emlkszik, melyik kvetje jn a legkzelebb. Ily mdon csak O(m)
memrira van szksg, O(bm) helyett. A visszalpses keress mg egy memria- (s id-) sprol trkkhz
folyamodik. Az tlet a kvet csompont generlsa az aktulis llapot mdostsval, anlkl hogy az
llapotot tmsolnnk. Ezzel a memriaszksglet egy llapotra s O(m) cselekvsre redukldik. Ahhoz, hogy
az tlet mkdjn, amikor visszalpnk, hogy a kvetkez kvett generljuk, mindegyik mdostst vissza kell
tudnunk csinlni. Nagy llapottrrel rendelkez problmk esetn, mint pldul robot-sszeszerels esetn, az
ilyen mdszerek lnyegesek a sikeressghez.
A mlysgi keress htrnyos tulajdonsga, hogy egy rossz vlasztssal egy hossz (akr vgtelen) t mentn
lefel elakadhat, mikzben pldul egy ms dnts elvezetne a gykrhez kzeli megoldshoz. A 3.12. brn
pldul a mlysgi keress kifejti az egsz bal oldali rszft, annak ellenre, hogy a C csompont a megolds.
Ha a J csompont szintn megolds lenne, a mlysgi keress azt adn vissza megoldsul, kvetkezskppen a
mlysgi keress nem optimlis. Ha a bal oldali rszfa korltlanul mly lenne s nem tartalmazna megoldst, a
mlysgi keress soha nem llna meg, kvetkezskppen a mlysgi keress nem teljes. A legrosszabb esetben a
mlysgi keress a keressi fban az sszes O(bm) csompontot generlni fogja, ahol m a csompontok
maximlis mlysge. Jegyezzk meg, hogy m sokkal nagyobb lehet, mint d (a legseklyebb megolds
mlysge), s korltlan fk esetn rtke vgtelen.
3.12. bra - Mlysgi keress egy binris keressi fban. A kifejtett csompontok,
amelyeknek a peremben nincsenek kvetik, el is hagyhatk a memribl. Ezeket
feketvel jelltk meg. A 3-as mlysg csompontokrl felttelezzk, hogy nincsenek
kvetik, valamint azt is feltesszk, hogy M az egyetlen clcsompont.
65
4.4. Mlysgkorltozott keress

A vgtelen fk problmjt a mlysgi keress azltal kszbli ki, hogy az utak maximlis mlysgre egy
korltot ad. Az mlysgben lv csompontokat gy kezeli, mintha nem is lennnek kvetik. A mdszer
neve a mlysgkorltozott keress, MKK (depth-limited search, DLS). A mlysgkorlt a vgtelen t
problmjt ugyan megoldja, de a nemteljessg egy jabb forrst hozza be, ha < d -t vlasztunk, azaz, ha a
legseklyebb clcsompont a mlysgkorlton tl van (ez nem is eslytelen, ha d eleve ismeretlen). A
mlysgkorltozott keress > d vlasztssal sem lesz optimlis. A keress idignye O(b), trignye O(b). A
mlysgi keress egy olyan specilis mlysgkorltozott keressnek tekinthet, amelynek mlysgkorltja =
.
A mlysgi korltot nha a problma ismeretre lehet alapozni. Pldul Romnia trkpn 20 vros tallhat,
gy tudjuk, hogy ha ltezik egy megolds, az maximlisan 19 lps hossz lehet, gy az = 19 egy lehetsges
vlaszts. Ha azonban a trkpet tzetesebben tanulmnyoznnk, felfedeznnk, hogy minden vros brmelyik
msik vrosbl legfeljebb 9 lpsben elrhet. Ez a szm, amit az llapottr tmrjnek (diameter) neveznk,
jobb mlysgkorltot ad, ami hatkonyabb mlysgkorltozott keresst eredmnyez. A legtbb problma esetn
azonban mindaddig nem tudunk j mlysgkorltot adni, amg meg nem oldottuk a problmt.
A mlysgkorltozott keresst az ltalnos fakeressi vagy a rekurzv mlysgi keressi algoritmus egyszer
mdostsval lehet implementlni. A 3.13. bra mutatja a rekurzv mlysgkorltozott keress pszeudokdjt.
Jegyezzk meg, hogy a mlysgkorltozott keress kudarccal ktfle mdon llhat le: a standard kudarc
csompont jelzi a megolds hinyt, a vgs rtk viszont jelzi a megolds mlysgkorlton belli hinyt.
3.13. bra - A mlysgkorltozott keress rekurzv implementcija
66
4.5. Iteratvan mlyl mlysgi keress

Az iteratvan mlyl keress (iterative deepening search) vagy iteratvan mlyl mlysgi keress egy
ltalnos stratgia, amit sokszor a mlysgi keresssel egytt alkalmaznak a legjobb mlysgkorlt
megtallsra. Az algoritmus kpes erre, mert fokozatosan nveli a mlysgkorltot legyen az elszr 0, majd
1, majd 2 stb. amg a clt meg nem tallja. Ez akkor kvetkezik be, ha a mlysgkorlt elri a d-t, a
legseklyebben fekv clcsompont mlysgt. Az algoritmust a 3.14. bra mutatja. Az iteratvan mlyl
keress tvzi a szlessgi s a mlysgi keress elnys tulajdonsgait. A mlysgi keresshez hasonlan
szerny, pontosabban O(bd) memriaignnyel rendelkezik. A szlessgi keresshez hasonlan teljes, ha
elgazsi tnyezje vges, s optimlis, ha az tkltsg a csompontok mlysgnek nem cskken fggvnye.
A 3.15. bra az ITERATVAN-MLYL-KERESS els ngy itercijt mutatja egy binris fn, ahol az
algoritmus a megoldst a negyedik iterciban tallja meg.
Az iteratvan mlyl keress tkozlnak tnhet, mert felettbb sok llapotot tbbszr is kifejt. Kiderl azonban,
hogy a kltsgtbblet nem lnyeges. Ennek az az oka, hogy egy olyan keressi fban, ahol minden szinten
ugyanaz (vagy kzel ugyanaz) az elgazsi tnyez, majdnem az sszes csompont a legmlyebb szinten
tallhat, gy nem tl sokat szmt, hogy a magasabb szinteket tbbszr is kifejtjk. Az iteratvan mlyl
keressben a legmlyebb szinten (d mlysg) tallhat csompontokat csak egyszer fejtjk ki, egy szinttel
feljebb ktszer stb. egszen a gykr gyerekeiig, amelyeket d-szer fejtnk ki. gy a kifejtett csompontok sszszma:
Cs(IMK) = (d)b + (d 1)b2 + ... + (1)bd
amely O(bd) idkomplexitst eredmnyez. sszehasonltsul nzzk meg a szlessgi keress ltal generlt
csompontok szmt:
Cs(SZK) = b + b2 + ... + bd + (bd+1 b)
Vegyk szre, hogy a szlessgi keress d + 1 mlysgben is generl csompontokat, az iteratvan mlyl
keresssel ellenttben. Ennek eredmnye, hogy az iteratvan mlyl keress a szlessgi keressnl gyorsabb,
annak ellenre, hogy a csompontokat tbbszr fejti ki. Konkretizlva, pldul b = 10 s d = 5 esetn ezek a
szmok:
Cs(IMK) = 50 + 400 + 3000 + 20 000 + 100 000 = 123 450
Cs(SZK) = 10 + 100 + 1000 + 10 000 + 100 000 + 999 990 = 1 111 100
Fontos
ltalnossgban nagy keressi trrel rendelkez problmk esetn s ha a megolds mlysge nem
ismert, a nem informlt mdszerek krbl az iteratvan mlyl keress a javasolt.
3.14. bra - Az iteratvan mlyl keressi algoritmus mlysgkorltozott keresst

alkalmaz ismtelten, nvekv mlysgkorlttal. Az algoritmus megll, ha a megoldst
67
megtallja, vagy ha a mlysgkorltozott keress kudarccal tr vissza, jelezve, hogy

megolds nem ltezik.
3.15. bra - Az iteratvan mlyl keressi algoritmus ngy itercija egy binris fn
Az iteratvan mlyl keress a szlessgi keresssel abban rokon, hogy minden iterciban a csompontok
teljes rtegt megvizsglja, mieltt a kvetkez rtegre trne r. Hasznosnak ltszik az egyenletes kltsg
keress iteratv vltozatnak kifejlesztse, amely rkln ez utbbi optimalitst, mellzve annak a
trkvetelmnyeit. Az tlet a nvekv tkltsgkorlt hasznlata a nvekv mlysgkorlt helyett. Az
eredmnyl kapott algoritmussal, amelynek neve iteratvan megnyl keress (iterative lengthening search)
a 3.11. feladat foglalkozik. Sajnos az derl ki, hogy az iteratvan megnyl keress overheadje tekintlyes az
egyenletes kltsg keresshez kpest.
68
4.6. Ktirny keress

A ktirny keress mgtt az az tlet hzdik, hogy egyszerre el lehet indtani egy keresst elrefel a kiindul
llapotbl, illetve htrafel a clllapotbl, s a keress akkor fejezdik be, ha a kt keress valahol tallkozik
(lsd 3.16. bra). Az rv az, hogy bd/2 + bd/2 sokkal kisebb, mint bd, illetve az brn szemllve, hogy a kt kisebb
kr sszterlete kisebb, mint annak a nagy krnek a terlete, amelynek kzppontja a kiindul llapot, s amely
a peremvel a clllapotot elri.
3.16. bra - A ktirny szlessgi keress sematikus brja. Az brn a kt keressi

irny majdnem tallkozik, amikor a kiindul csompontbl kinyl egyik g sszer
egy a clcsompontbl kinyl msik ggal.
A ktirny keresst gy implementljk, hogy az egyik vagy mindkt keress egy csompont kifejtse eltt
megvizsglja, hogy az nem rsze-e a msik keressi fa peremnek. Ha igen, megvan a cl. Ha a problma
pldul d = 6 megolds mlysg, s mindegyik irnyban a szlessgi keresst futtatjuk csompontonknt, a kt
keress a legrosszabb esetben akkor tallkozik, ha mindegyik algoritmus a 3-as mlysgben egy csompont
kivtelvel minden csompontot kifejtett. A b = 10 esetn ez 22 200 csompont generlst jelenti a standard
szlessgi keress ltal generlt 1 111 111 csomponthoz kpest. Annak ellenrzst, hogy egy csompont a
msik keressi fhoz tartozik-e, egy hash-tblval konstans idben meg lehet oldani. A ktirny keress
idkomplexitsa gy O(bd/2). Legalbb az egyik keressi ft a memriban kell tartani, hogy a tartozs
ellenrzse kivitelezhet legyen, a trkomplexits teht szintn O(bd/2). Ez a trkomplexits a ktirny keress
legnagyobb gyengje. Ha mindkt keress szlessgi keress, az algoritmus teljes s optimlis (egyenletes
kltsg esetn). Ms mdszerek kombincija vagy a teljessg, vagy az optimalits, vagy mindkett
elvesztshez vezethet.
Az idkomplexits mrsklse a ktirny keresst igen vonzv teszi, de mit is jelent a clllapotbl htrafel
keresni? Ez nem is olyan egyszer, mint amilyennek hangzik. Legyenek x csompont eldcsompontjai
(predecessors), az Eld(x)-ek azon csompontok, amelyek mindegyiknek x a kvet csompontja. A ktirny
keress felttelezi, hogy egy Eld(x) hatkonyan szmthat. Legegyszerbb az az eset, amikor az sszes
cselekvs az llapottrben reverzbilis, gy Eld(x) = Kvet(x). Ms esetben azonban igen nagy tletessgre
lehet szksg.
Nzzk most, hogy mit is jelent az, hogy cl, ha a clllapotbl htrafel kell keresni. A 8-as kirakjtk s a
romniai tkeress esetn egyetlenegy clllapot ltezik csak, gy a htrafel keress s az elrefel keress igen
hasonltanak egymsra. Amennyiben ltezik a clllapotoknak egy explicit listja, mint pldul a 3.3. bra kt
koszmentes clllapota, akkor megkonstrulhatunk egy olyan l-clllapotot, amelynek kzvetlen kveti az
aktulis clllapotok. Ms mdon, nhny redundns csompont-generls elkerlhet azzal, hogy a
clllapotok halmazt egyetlenegy clllapotnak tekintjk, amelynek minden eldje szintn egy llapothalmaz
konkrtan azon llapotok halmaza, amelyek kvetje a clllapothalmaz eleme (lsd mg 3.6. alfejezet).
69
A ktirny keress szempontjbl a legnehezebb eset, amikor a clllapottesztnl a felteheten nagy

clllapothalmazrl csak implicit lers ll rendelkezsnkre, pldul a sakkban az sszes llapot, ami kielgti a
matt clt. A htrafel keressnek az m1 cselekvs rvn a matt llapotba vezet sszes llapot tmr
lerst kellene tudnia megkonstrulni, s hasonl mdon folytatni. E lersokat az elrefel halad keress ltal
generlt llapotokkal kellene tesztelni. Ennek nincs ltalnosan hatkony mdja.
4.7. A keressi stratgik sszehasonltsa

A 3.17. bra a 3.4. alfejezetben megfogalmazott ngy kirtkelsi kritrium tkrben sszehasonltja a keressi
stratgikat.
3.17. bra - A keressi stratgik rtkelse. b az elgazsi tnyez, d a legseklyebb

megolds mlysge, m a keressi fa maximlis mlysge, a mlysgkorlt. A fels
indexszel jelzett kiktsek a kvetkezk: a teljes, ha b vges; b teljes, ha a lpskltsg
, pozitv -ra; c optimlis, ha a lpskltsgek mind azonosak; d ha mindkt irnyban
szlessgi keresst hasznlunk.
5. Az Ismtelt llapotok elkerlse

Eddig figyelmen kvl hagytuk a keress egyik legfontosabb megoldand problmjt: a mr korbban egy
msik ton megtallt s kifejtett llapotok ismtelt kifejtsbl add idpazarlst. Nhny problma esetn
ezen lehetsg soha nem merl fel, mert az llapottr egy fa, s minden llapotba csak egyetlen mdon lehet
eljutni. A 8-kirlyn problma hatkony megfogalmazsa amikor minden j kirlynt a bal szls szabad
oszlopba helyezzk nagyrszt pp ennek ksznheti hatkonysgt, vagyis hogy minden egyes llapotba csak
egyetlen ton lehet eljutni. Ha a 8-kirlyn problmt gy fogalmazzuk meg, hogy egy kirlynt bramelyik
oszlopban el lehet helyezni, akkor az n kirlynt tartalmaz minden llapotot n! klnbz ton el lehet rni.
Szmos problmnl azonban elkerlhetetlenek a megismtelt llapotok. Ezek kz tartozik az sszes olyan
problma, amelyben az opertorok reverzbilisek. Tbbek kztt ebbe a csoportba tartoznak az tkeressi
problmk s a cssz lapka fejtr jtkok. Az ezen problmkhoz tartoz keressi fk vgtelenek, de ha a
megismtelt llapotok egy rszt levgjuk, akkor a keressi ft vges mretre vghatjuk, ezltal a keressi
fnak csak az llapottr grfot kifeszt rszt generlva. Szlssges esetben egy d + 1 mret llapottrbl
(lsd 3.18. (a) bra) egy 2d level fa lesz (lsd 3.18. (b) bra). Egy lethbb plda a ngyzetrcs (rectangular
grid) (lsd 3.18. (c) bra). A rcsban minden llapotnak ngy kvetje van. Az ismtld llapotokat tartalmaz
fnak gy 4d levele van. Minden adott llapottl d lpsnyire azonban csak kb. 2d2 klnbz llapot van. d = 20
esetn ez kb. egybilli csompontot, de csak 800 klnbz llapotot jelent.
Az ismtld llapotok teht a megoldhat problmkat megoldhatatlan problmkk alaktjk, amennyiben az
algoritmus nem kpes ezeket az llapotokat detektlni. A detektls ltalban azt jelenti, hogy az j kifejtend
csompontot a mr kifejtett csompontokkal hasonltjuk ssze. Egyezs esetn az adott csomponthoz az
algoritmus kt utat tallt, s valamelyiket eldobhatja.
Fontos
A mlysgi keress csak a gykeret s az aktulis csomponttal sszekt ton fekv llapotokat
trolja. E csompontoknak az aktulis csomponttal val sszehasonltsa lehetv teszi a hurkok
felismerst, amiket ezek utn azonnal el lehet dobni. Ez meg is vd attl, hogy a hurkok rvn vges
llapotterekbl ne keletkezzenek vgtelen keressi fk. Sajnos azonban nem tud megvdeni a nem
70
hurkos utak exponencilis megsokszorozdstl az olyan problmkban, mint amilyenek a 3.18. brn
lthat. Ezt elkerlni csak gy lehet, hogy tbb csompontot tartunk a memriban. Az id s a
trigny kztt egy alapvet kompromisszum ltezik. Az az algoritmus, amely elfelejti a trtnett,
knytelen azt megismtelni.
Ha egy algoritmus minden megltogatott llapotra emlkszik, akkor kzvetlen mdon fedezi fel az llapotteret.
A FA-KERESS algoritmust mdosthatjuk gy, hogy egy zrt listnak (closed list) nevezett adatszerkezetet
tartalmazzon, amely minden kifejtett csompontot trol. (A mg ki nem fejtett csompontokbl ll peremet
nha nyitott listnak [open list] nevezik.) Ha az aktulis llapot egybeesik a zrt listn lv llapotok
egyikvel, akkor eldobhat, ahelyett hogy a kifejtsvel kellene foglalkozni. Az j algoritmus neve GRFKERESS (3.19. bra). Az ismtld llapotokat tartalmaz problmk esetn a GRF-KERESS sokkal
hatkonyabb, mint a FA-KERESS. Az algoritmus a legrosszabb esetre szmtott tr- s idkomplexitsa arnyos
az llapottr mretvel, ami sokkal kisebb lehet, mint O(bd).
A grfkeress optimalitsa mr trkks dolog. Korbban azt mondtuk, hogy egy ismtelt llapot detektlsval
az algoritmus kt utat tallt ugyanahhoz az llapothoz. A 3.19. brn lthat GRF-KERESS algoritmus mindig
az jonnan felfedezett utat dobja el. Nyilvnval, hogy ha az jonnan felfedezett t rvidebb, mint az eredeti, a
GRF-KERESS elvthet egy optimlis megoldst. Szerencsre ki tudjuk mutatni (lsd 3.12. feladat), hogy az
egyenletes kltsg s a konstans lpskltsg szlessgi keress esetn ez nem trtnhet meg. E kt optimlis
fakeressi stratgia egyben optimlis grfkeressi stratgia is. Az iteratvan mlyl keress azonban mlysgi
kifejtst hasznl s knnyen kerlhet egy csompont fel vezet szuboptimlis tra, mieltt megtalln a hozz
vezet optimlis utat. Az iteratvan mlyl grfkeressnl teht egy jonnan felfedezett tnl meg kell
vizsglni, hogy ez nem jobb-e, mint az eredeti. s ha igen, szksg lehet az adott csompont kvetinl a
mlysgek s az tkltsgek revzijra.
3.18. bra - Egy exponencilisan nagyobb keressi ft generl llapottr. (a) Egy olyan
llapottr, amelyben kt lehetsges cselekvs vezethet A-bl B-be, kett B-bl C-be s
gy tovbb. Ez az llapottr d+1 llapotot tartalmaz, ahol d a maximlis mlysg. (b) Az
(a) llapottr megfelel keressi fja, 2d ggal, amely az llapotr 2d tjnak felel meg.
(c) Egy ngyzetrcs. A kezdeti (A) llapottl ktlpsnyire fekv llapotokat szrke
sznnel jelltk.
3.19. bra - Az ltalnos grfkeres algoritmus. A zrt halmazt egy hash-tblval lehet
implementlni, hogy az ismtelt llapotokat hatkonyan ellenrizni tudjuk. Ez az
algoritmus felttelezi, hogy az s llapothoz vezet els t a legolcsbb (lsd szveg).
71
Jegyezzk meg, hogy a zrt lista hasznlata azt jelenti, hogy a mlysgi s az iteratvan mlyl keress
trignye mr nem lineris. Mivel a GRF-KERESS algoritmus minden csompontot a memriban megtart,
egyes keressi fajtk kivitelezhetetlenek a memriakorltok miatt.
6. Keress rszleges informci mellett

A 3.3. alfejezetben azt tteleztk fel, hogy a krnyezet teljesen megfigyelhet s determinisztikus, valamint
hogy az gens tisztban van minden cselekvsnek kvetkezmnyvel. Ebbl kifolylag az gens pontosan ki
tudja szmtani, hogy egy tetszleges cselekvsszekvencinak milyen llapot az eredmnye, s azt is tudja, hogy
maga melyik llapotban van. Az rzkelsei nem nyjtanak j informcit az egyes cselekvsek utn. Mi
trtnik, ha a cselekvsekrl s az llapotokrl alkotott tuds nem teljes? Azt talljuk, hogy a nemteljessg
klnbz formi hrom elklnl problmatpushoz vezetnek:
1. Szenzor nlkli (sensorless vagy conformant) problmk: ha az gensnek egyltaln nincsenek szenzorai,
akkor (a tudsnak megfelelen) a tbb lehetsges kezdeti llapot egyikben lehet, s minden cselekvse a
lehetsges kvet llapotok egyikhez vezethet.
2. Eshetsgi (contingency) problmk: ha a krnyezet rszben megfigyelhet, vagy ha a cselekvsek
bizonytalanok, akkor az gens rzkszervei j informcit nyjtanak minden cselekvs utn. Minden
lehetsges rzkels egy eshetsget hatroz meg, amire az gensnek terveznie kell. A problmt ellenfl
problmnak (adversarial) hvjk, ha a bizonytalansgot egy msik gens cselekvsei okozzk.
3. Felfedezses (explorational) problma: ha a krnyezet llapotai s cselekvsei nem ismertek, az gensnek
kln cselekednie kell, hogy azokat felderthesse. A felfedezses problmkat az eshetsgi problmk
szlssges vltozatnak lehet tekinteni.
Pldaknt a porszvvilg krnyezett vesszk. Emlkezznk vissza, hogy az llapottr nyolc llapotbl ll (lsd
3.20. bra). Hrom cselekvs van Jobbra, Balra s Szv , s a cl az sszes kosz felszedse (a 7. s 8.
llapot). Ha a krnyezet megfigyelhet, determinisztikus s teljesen ismert, akkor a problmt trivilisan
brmelyik ismertetett algoritmussal meg lehet oldani. gy pldul ha a kezdeti llapot az 5. llapot, akkor a
[Jobbra, Szv] cselekvsszekvencia a 8. clllapotot ri el. A fejezet tovbbi rszben e problma szenzor
nlkli s eshetsgi vltozatval foglalkozunk. A felfedezses problmkat a 4.5. alfejezet, az
ellenflproblmkat a 6. fejezet trgyalja.
6.1. Szenzor nlkli problmk

Tegyk fel, hogy a porszvgens ismeri az sszes cselekvsnek a hatst, de szenzorokkal nem rendelkezik.
Ekkor csak azt tudja, hogy kezdeti llapota az {1, 2, 3, 4, 5, 6, 7, 8} halmaz egyik eleme. Azt lehetne gondolni,
hogy az gens sorsa remnytelen, azonban gensnk igen jl feltallja magt. Mivel tudja, hogy cselekvsei
mire kpesek, kiszmthatja pldul, hogy a Jobbra cselekvs a {2, 4, 6, 8} llapotok egyikbe viszi, s a
Jobbra, Szv cselekvssorozat eredmnyekppen a {4, 8} egyikben kt ki. Vgl a Jobbra, Szv, Balra, Szv
sorozat garantltan elri a 7. clllapotot, fggetlenl a kezdeti llapottl. Azt mondjuk, hogy az gens a vilgot
a 7. llapotba bele tudja knyszerteni (coerce), akkor is, amikor nem is tudja, honnan indult. sszegezve: ha a
vilg nem teljesen megfigyelhet, az gensnek az egyedi llapotokkal szemben azon llapothalmazokra kell
tudnia kvetkeztetni, amely halmazok llapotaiba eljuthat. Minden ilyen llapothalmazt egy hiedelmi
72
llapotnak neveznk (belief state), amely az gens pillanatnyi hiedelmt fejezi ki, hogy maga vajon milyen
fizikai llapotban lehet most. (A teljesen megfigyelhet krnyezetben minden hiedelmi llapot egyetlen fizikai
llapotbl ll.)
3.20. bra - A porszvvilg nyolc lehetsges llapota
Ahhoz, hogy egy szenzor nlkli problmt megoldhassunk, a fizikai llapotok terben trtn keress helyett a
hiedelmi llapotok terben kell keresni. A kezdeti llapot egy hiedelmi llapot, s minden cselekvs egy
hiedelmi llapotbl egy hiedelmi llapotba kpez le. Egy cselekvst gy kell alkalmazni egy hiedelmi llapotra,
hogy a hozz tartoz minden fizikai llapotra kell azt alkalmazni, s az eredmnyek unijt kell kpezni. Egy t
most tbb hiedelmi llapotot kt ssze, a megolds pedig egy olyan utat jelent, amely csak clllapotokbl ll
hiedelmi llapotba vezet. A 3.21. bra mutatja a determinisztikus szenzor nlkli porszvvilg hozzfrhet
hiedelmi llapottert. Csak 12 hozzfrhet hiedelmi llapot ltezik, az egsz hiedelmi llapottr azonban
tartalmazza a fizikai llapotok minden lehetsges halmazt, azaz 2 8 = 256 hiedelmi llapotot. ltalban, ha a
fizikai llapottrnek S llapota van, a hiedelmi llapottr llapotainak szma 2S.
3.21. bra - A determinisztikus, szenzor nlkli porszvvilg hiedelmi llapotternek

hozzfrhet rsze. Minden rnyalt doboz egyetlenegy hiedelmi llapothoz tartozik.
Minden pillanatban az gens egy konkrt hiedelmi llapotban tartzkodik, azonban
nem tudja, hogy melyik fizikai llapotban van. A kezdeti hiedelmi llapot (a teljes
tudatlansg) legfell kzpen helyezkedik el. A cselekvseket a cmkzett nyilak jellik.
Az nhurkokat a nagyobb ttekinthetsg rdekben az brbl kihagytuk.
73
A szenzor nlkli problmk eddigi elemzsben determinisztikus cselekvseket tteleztnk fel. Az elemzs
lnyegben rvnyes marad, ha a krnyezet nemdeterminisztikus, azaz ha a cselekvseknek nhny lehetsges
kimenetele lehet. Ennek az az oka, hogy szenzorok nlkl az gens nem kpes megmondani, hogy milyen
kimenetel trtnt valjban. A klnbz lehetsges kimenetelek gy ptllagos fizikai llapotok a kvet
hiedelmi llapotban. Ttelezzk fel pldul, hogy a krnyezetben Murphy-trvny uralkodik: a Szv cselekvs
nha koszt is hagy a sznyegen, de csak akkor, ha ott elzetesen a kosznak nyoma sem volt.6 Ha a Szv
cselekvst teht a 4. fizikai llapotban alkalmazzuk (lsd 3.20. bra), a kt lehetsges kimenetel a 2. s a 4.
llapot. A kezdeti {1, 2, 3, 4, 5, 6, 7, 8} hiedelemllapotra alkalmazva a Szv olyan hiedelemllapothoz vezet,
ami a cselekvs eredmnyeinek unija a nyolc fizikai llapotra. Kiszmtva, azt kapjuk, hogy az j hiedelmi
llapot az {1, 2, 3, 4, 5, 6, 7, 8}. A Szv cselekvs a Murphy-trvny uralta vilgban egy szenzor nlkli gens
hiedelmi llapott teht nem vltoztatja meg! A problma valjban megoldhatatlan (lsd 3.18. feladat). Ennek
intuitv magyarzata az, hogy az gens nem kpes megmondani, hogy az aktulis mez koszos-e, ebbl
kifolylag nem kpes megmondani, hogy a Szv cselekvs takartani fog-e, vagy mg tbb koszt hagy maga
utn.
6.2. Eshetsgi problmk

Ha a krnyezet jellege olyan, hogy az gens a cselekvseit kveten szerezhet j informcit a szenzorai rvn,
eshetsgi problmrl (contingency problem) beszlnk. Egy eshetsgi problma megoldsa sokszor egy fa
alakjt veszi fel, ahol egy-egy gnak a kivlasztsa azon mlik, hogy odig az gens milyen rzkelsekhez
jutott. Tegyk fel, hogy az gens a Murphy-trvny vilgban rendelkezik helyzetrzkelvel s loklis
koszrzkelvel, nincs azonban olyan szenzora, amely kpes lenne koszt detektlni ms ngyzeteken. gy a [B,
Kosz] rzkels azt jelenti, hogy az gens az {1, 3} llapotok egyikben van. Az gens most a [Szv, Jobbra,
Szv] cselekvsi szekvencit fogalmazhatta meg. A szv cselekvs az {5, 7} llapotok egyikbe viszi az genst,
s jobbra elmozdulva az llapota a {6, 8} llapotok egyikre vltozik. A szv cselekvs alkalmazsa a 6.
Felttelezzk, hogy mr minden olvas kerlt hasonl helyzetbe, gy t tudjk rezni gensnk frusztrltsgt. Elnzst krnk a modern
hztartsi gpek tulajdonosaitl, akiknek ez a pedaggiai plda nem jelent segtsget.
6
74
llapotban, a 8. llapotot a clt eredmnyezi. Ha azonban a szv cselekvst a 8. llapotban alkalmazzuk, a 6.

llapotba trnk vissza (a Murphy-trvny jvoltbl), amely esetben tervnk kudarcba fullad.
A hiedelmi teret a problma e vltozatnl elemezve knnyen megllapthatjuk, hogy semmilyen rgztett
cselekvsszekvencia sem garantlja a problma megoldst. De lesz megoldsunk, ha a cselekvsek szigor
sorrendjrl lemondunk:
[Szv, Jobbra, ha [Jobbra, Kosz] akkor Szv]
A megoldsok tert gy azzal a lehetsggel bvtjk, hogy a cselekvseket a vgrehajts alatt megjelen
eshetsgek alapjn vlasztjuk. A vals fizikai vilg szmos problmja eshetsgi problma, hiszen pontos
elrejelzs lehetetlen. Sok ember ezrt tartja mindig nyitva a szemt sta s vezets kzben.
Az eshetsgi problmk nha rgztett cselekvsszekvencival is megoldhatk. Tekintsk pldul a teljesen
megfigyelhet Murphy-trvny vilgot. Eshetsggel llunk szemben, ha az gens a Szv cselekvst egy res
ngyzet felett hajtja vgre, hiszen a kosz akkor vagy meg fog jelenni, vagy sem. Ameddig az gens soha nem
teszi ezt, eshetsgek fel sem merlnek, s minden kezdeti llapotbl ltezik egy rgztett megoldsi szekvencia
(lsd 3.18. feladat).
Eshetsgi problmk esetn az algoritmusok az e fejezetben tallhat standard keressi algoritmusoknl
bonyolultabbak. Ezekkel a 12. fejezet foglalkozik. Az eshetsgi problmk egy kiss eltr gens tervezsi
smt is tmogatnak, amelyekben az gens egy garantlt terv megtallsa eltt is cselekedhet. Ez hasznos, mert
ahelyett, hogy a vgrehajts sorn elfordul minden eshetsget elre figyelembe venne, gyakran jobb
elkezdeni a vgrehajtst, s megnzni, hogy mely eshetsgek kvetkeznek be valjban. A jrulkos informci
megadsa utn az gens folytathatja a problma megoldst. A keress s a vgrehajts ily mdon trtn
sszefslse (interleaving) a feldertses problmk (lsd 4.5. alfejezet) vagy a jtkok (6. fejezet) esetn is
hasznos.
7. sszefoglals
Ez a fejezet olyan mdszereket ismertetett, amelyekkel az gens a cselekvseit vlaszthatja meg
determinisztikus, megfigyelhet, statikus s teljesen ismert krnyezetben. Ilyen esetekben az gens olyan
cselekvssorozatokat konstrulhat, amelyekkel a cljait elrheti. Ezt a folyamatot keressnek (search)
nevezzk.
A megolds keressnek megkezdse eltt az gensnek elbb meg kell fogalmaznia a clt (goal), majd a clt
fel kell hasznlnia a problma megfogalmazsra.
Egy problma (problem) ngy rszbl: a kiindul llapotbl (initial state), egy cselekvs- (action)
kszletbl, egy clteszt- (goal test) fggvnybl s egy tkltsg- (path cost) fggvnybl ll. A problma
krnyezett az llapottr (state space) rja le. Az llapottrben a kiindul llapotbl a clllapotba vezet t
(path) a problma egy megoldsa (solution).
Egyetlen ltalnos FA-KERESS algoritmus felhasznlhat brmilyen problma megoldsra. Az algoritmus
konkrt vltozatai eltr stratgikat valstanak meg.
A keressi algoritmusokat azok teljessge (completeness), optimalitsa (optimality), idignye (time
complexity) s trignye (space complexity) alapjn rtkeljk. A komplexitst a problma b elgazsi
tnyezje s a legseklyebben fekv megolds d mlysge hatrozza meg.
A szlessgi keress (breadth-first search) elszr a legseklyebben fekv csompontot fejti ki a keressi
fban. Ez a keress teljes, azonos kltsg opertorok esetn optimlis s O(bd) id- s trignnyel
rendelkezik. Trignye miatt a legtbb esetben nem clszer alkalmazni. Az egyenletes kltsg keress
(uniform-cost search) hasonl a szlessgi keresshez, de elszr a legkisebb g(n) tkltsg csompontot
fejti ki. Teljes s optimlis, ha minden lps kltsge valamilyen pozitv korltnl nagyobb.
A mlysgi keress (depth-first search) elszr a keressi fa legmlyebben fekv csompontjt fejti ki. Se
nem teljes, se nem optimlis, s idignye O(bm), trignye pedig O(bm), ahol m az llapottrbeli utak
maximlis mlysge.
75
A mlysgkorltozott keress (depth-limited search) egy korltot ad a mlysgi keress keressi

mlysgre.
Az iteratvan mlyl keress (iterative deepening search) a cl megtallsig egyre nvekv
mlysgkorlttal hvja meg a mlysgkorltozott keresst. Teljes s egysgnyi lpskltsg esetn optimlis,
idignye O(bd), trignye pedig O(bd).
A ktirny keress (bidirectional search) radiklisan cskkentheti az idignyt, de nem mindig
alkalmazhat, s a trignye tl nagy lehet.
Ha az llapotr inkbb egy grf, mint egy fa, kifizetd lehet az ismtld llapotokat megvizsglni. A GRFKERESS algoritmus az sszes dupliklt llapotot kikszbli.
Ha a krnyezet csak rszben megfigyelhet, az gens a keressi algoritmust a hiedelmi llapotok (belief
states) terben alkalmazhatja, vagyis olyan lehetsges llapotok terben, amelyekben az gens tartzkodhat.
Egyes esetekben egyetlen megoldsi szekvencia konstrulhat, ms esetekben az gensnek eshetsgi tervre
(contingency plan) van szksge, hogy a felmerl ismeretlen helyzetekkel megbirkzzon.

Az ebben a fejezetben elemzett llapottr-keressi problmk tbbsgnek hossz trtnete van az irodalomban,
s e problmk sokkal kevsb trivilisak, mint azt els rnzsre gondolnnk. A 3.9. feladatban emltett
hittrtk s kanniblok problmjt Amarel elemezte rszletesen (Amarel, 1968). A mestersges intelligencia
terletn Simon s Newell (Simon s Newell, 1961), mg a szmtstudomny s az opercikutats terletn
Bellman s Dreyfus mr korbban foglalkoztak e problmval (Bellman s Dreyfus, 1962). Az ilyen
tanulmnyok s Simon s Newell Logic Theoristra vonatkoz munkja (Simon s Newell, 1957), valamint a
GPS (Simon s Newell, 1962) hatsra vltak a keressi algoritmusok az 1960-as vekben az MI-kutatk
fegyvertrnak elsdleges eszkzeiv, illetve ezek hatsra vlt a problmamegolds kanonikus MI-feladatt.
Sajnos eddig nagyon kevs trtnt a problmamegfogalmazs lpseinek automatizlsa irnyban. A
problmareprezentci s -absztrakci frissebb trgyalst Knoblock adta meg (Knoblock, 1990), belertve
olyan MI-programok lerst is, amelyek (rszben) maguk vgzik el ezeket a feladatokat.
A 8-as kirakjtk a bonyolultabb 15-s kirakjtk kisebb rokona, amit a hres amerikai jtktervez, Sam
Loyd tallt ki az 1870-es vekben (Loyd, 1959). A jtk akkoriban gyorsan risi, Rubik bvs kockjhoz
mrhet npszersgre tett szert Amerikban. A matematikusok is felfigyeltek a problmra (Johnson s Story,
1879; Tait, 1880). Az American Journal of Mathematics szerkeszti megllaptottk: A 15-s kirakjtk az
elmlt hetekben teljesen lebilincselte az amerikai embereket 10 emberbl 9 nemre, korra s szrmazsra val
tekintet nlkl a jtk bvletbe kerlt. Ez azonban mg nem hatott volna a szerkesztkre olyan mrtkben,
hogy rvegye ket, errl a tmrl cikkeket jelentessenek meg az American Journal of Mathematics
folyiratban, de figyelembe vve azt a tnyt, hogy (itt a 15-s kirakjtk ltal felvetett rdekes matematikai
krdsek rvid taglalsa kvetkezett). A 8-as jtk esetn P. D. A. Schofield szmtgp segtsgvel elvgezte
a problma kimert elemzst (Schofield, 1967). Ratner s Warmuth megmutatta, hogy a legrvidebb megolds
megkeresse a 15-s jtk n n-es ltalnostsnl az NP-teljes problmk osztlyba tartozik (Ratner s
Warmuth, 1986).
A 8-kirlyn problmt elszr 1848-ban a Schach nmet sakkszaklapban nvtelenl publikltk, ksbb a
problmt Max Bezzel nevhez kapcsoltk. A problmt 1850-ben jra publikltk, ami akkor felkeltette a
kivl matematikus, Karl Friedrich Gauss figyelmt, aki megksrelte felsorolni az sszes megoldst, azonban
csak 72 megoldst tallt meg. Az sszes, 92 megoldst Nauck publiklta 1850-ben. A problmt Netto n
kirlyn esetre ltalnostotta (Netto, 1901), Abramson s Young pedig talltak egy O(n) algoritmust
(Abramson s Young, 1989).
A fejezetben emltett valsvilg-beli keressi problmk kzl mindegyik komoly kutatsi erfesztsek trgya
volt. Az optimlis repljrat megvlasztsnak mdszereit ltalban bizalmasan kezelik, azonban Carl de
Marcken kimutatta (magnkzls), hogy a repltrsasgok ltal alkalmazott jegytarifk s egyb korltozsok
annyira sszekuszldtak, hogy az optimlis jrat megvlasztsa formlisan eldnthetetlen. Az elmleti
szmtstudomnyban standard kombinatorikus problma az utaz gynk problmja (TSP) (Lawler, 1985;
Lawler s trsai, 1992). A problmrl Karp bizonytotta be, hogy NP-nehz (Karp, 1972), azonban
megoldsra hatkony heurisztikus kzelt mdszereket dolgoztak ki (Lin s Kernighan, 1973). Az euklideszi
trben zajl TSP-re Arora dolgozta ki a teljesen polinomilis kzelt smt (Arora, 1998). A VLSI-elrendezs
76
mdszereit Shahookar s Mazumder (Shahookar s Mazumder, 1991) tekintettk t, szmos optimalizcis cikk
VLSI-jsgokban jelent meg. Robotnaviglsi s szerelsi problmkkal a 25. fejezet foglalkozik.
A problmamegolds nem informlt keressi algoritmusai kzponti szerepet tltenek be a klasszikus
szmtselmletben (Horowitz s Sahni, 1978), az opercikutatsban (Dreyfus, 1969). Deo s Pang, tovbb
Gallo s Pallottino egy frissebb ttekintst adnak errl a terletrl (Deo s Pang, 1984; Gallo s Pallottino,
1988). A szlessgi keresst labirintusok megoldsra Moore (Moore, 1959) fogalmazta meg. A dinamikus
programozs (dynamic programming) mdszere (Bellman s Dreyfus, 1962), amely szisztematikusan jegyzi
meg az sszes nvekv nagysg rszproblma megoldst, egy grfokon fut szlessgi keressnek tekinthet.
A Dijkstra-fle ktpontos legrvidebb t algoritmus (Dijkstra, 1959) az egyenletes kltsg keress
kiindulpontja.
Az iteratvan mlyl algoritmus egy vltozatt Slate s Atkin hasznlta elszr a CHESS 4.5 sakkprogramjban
(Slate s Atkin, 1977), hogy a sakkrt hatkonyabban lehessen hasznlni. De az tletet grfokban a
legrvidebb t keressre elszr Korf hasznlta (Korf, 1985a). A Pohl bevezette ktirny keress (Pohl, 1969;
1971) bizonyos esetekben szintn igen hatkony lehet.
A rszben megfigyelhet s a nemdeterminisztikus krnyezeteket a problmamegoldsi megkzeltsen bell
nem tanulmnyoztk behatan. A hiedelmi llapotok terben trtn keress bizonyos hatkonysgi
problmival Genesereth s Nourbakhsh foglalkoztak (Genesereth s Nourbakhsh, 1993). Koenig s Simmons
(Koenig s Simmons, 1998) az ismeretlen kezdeti pozcibl indul robotnaviglst tanulmnyoztk. Erdmann
s Mason (Erdmann s Mason, 1988) pedig a szenzorok nlkli robot manipulci problmjt vizsgltk a
hiedelem llapottrbeli keress folytonos vltozatt hasznlva. Eshetsgi keresssel a tervkszts terleten
bell foglalkoztak (lsd 12. fejezet). A bizonytalan informcit felhasznl tervksztst s cselekvst a
valsznsg-elmlet s dntselmlet eszkztrval oldottk meg (lsd 17. fejezet).
Nilsson knyvei a klasszikus keressi algoritmusokkal kapcsolatban hasznos informcikat tartalmaznak
(Nilsson, 1971; 1980). Korf egy tfog, naprakszebb ttekintst ad a klasszikus keressi algoritmusokrl (Korf,
1988). Az j keressi algoritmusokrl amelyek feltrsa figyelemre mlt mdon folytatdik olyan
folyiratokban jelennek meg cikkek, mint pldul az Artificial Intelligence.
7.2. Feladatok
3.1.
Definilja sajt szavaival a kvetkez fogalmakat: llapot, llapottr, keressi fa, keressi csompont, cl,
cselekvs, llapottmenet-fggvny s elgazsi tnyez.
3.2.
Magyarzza meg, hogy a problmamegfogalmazsnak mirt kell a clmegfogalmazst kvetnie.
3.3.
Tegyk fel, hogy a LEGLIS-CSELEKVS(s) azon cselekvsek halmazt jelli, amelyek leglisak az s llapotban,
s az EREDMNY(a, s) pedig azt az llapotot, ami az s llapotban a vgrehajtott leglis cselekvs eredmnye.
Definilja az LLAPOTTMENET-FV-t a LEGLIS-CSELEKVS s az EREDMNY fggvnyben, s megfordtva.
3.4.
Mutassa meg, hogy a 8-as jtk llapottere kt diszjunkt rszbl ll, ahol egyik rszhez tartoz llapotot
semmilyen vges lpsszekvencival sem lehet a msik rszhez tartoz llapotba ttranszformlni. (Segtsg:
Berlekamp s trsai, 1982). Dolgozzon ki egy eljrst, amely el tudja dnteni, hogy az llapot melyik rszhez
tartozik, s magyarzza meg, hogy ez mirt hasznos, ha az llapotokat vletlen mdon generljuk.
3.5.
Gondolja t az n-kirlyn problmt a 2.1. szakasz - Jtkproblmk rszben ismertetett hatkony
inkrementlis megfogalmazst felhasznlva. Magyarzza meg, hogy az llapottr mrete mirt lesz legalbb
s becslje meg azt a legnagyobb n-et, amire a kimert feltrs mg elfogadhat. (Segtsg: szmolja ki az
77
elgazsi tnyez als korltjt figyelembe vve, hogy mekkora a kirlyn ltal tmadhat sakktblahelyek
maximlis szma egy tetszleges oszlopban.)
3.6.
Egy vges llapottr mindig vges keressi fhoz vezet-e? Mi a helyzet egy olyan vges llapottrrel, amely
maga is egy fa? Meg tudja-e preczebben fogalmazni, hogy milyen llapottrfajtk vezetnek mindig vges
keressi fkhoz? tvve (Bender, 1996)-bl.
3.7.
Az albbiak mindegyikhez adja meg a kiindul llapotot, a cltesztet, az llapottmenet-fggvnyt s az
tkltsgfggvnyt. Vlasszon meg egy olyan megfogalmazst, amely elegenden precz, hogy azt
implementlni lehessen.
a. Ngy szn felhasznlsval ki kell szneznie egy skbeli trkpet gy, hogy minden szomszdos tartomny
klnbz szn legyen.
b. Egy 1 m magas majom egy szobban tartzkodik, ahol van kt 1 m magas lda (amelyeket egymsra lehet
rakni, lehet mozgatni, s meg lehet mszni), s nhny bann lg a 2,5 m magas mennyezetrl. A majom el
szeretn rni a bannt.
c. Van egy olyan programja, amely illeglis input rekord zenetet ad, ha az input rekordok egy bizonyos
llomnyt dolgozza fel. n tudja, hogy egy-egy rekord feldolgozsa a tbbitl fggetlen. Szeretn az
illeglis rekordot megtallni.
d. Van hrom kancsja, egy 12 l-es, egy 8 l-es s egy 3 l-es s egy vzcsapja. A kancskat megtltheti, kintheti
bellk a vizet a fldre, vagy az egyikbl ttltheti a vizet egy msikba. Pontosan 1 l vizet kell kimrnie.
3.8.
Tekintsen egy olyan llapotteret, ahol a kezd llapot az 1-es szm s az llapottmenet-fggvny az n
sorszm llapotra kt llapottal, a 2n s a 2n + 1 sorszm llapotokkal tr vissza.
a. Rajzolja fel az llapottrnek az 1-es llapottl a 15-es llapotig terjed rszt.
b. Ttelezze fel, hogy a clllapot a 11-es. Listzza ki a csompontok kifejtsi sorrendjt szlessgi, 3-as
mlysgkorlttal rendelkez mlysgkorltos s iteratvan mlyl keress esetn.
c. J lenne-e a problma megoldsra a ktirny keress? Ha igen, magyarzza meg rszletesen, hogyan fog ez
mkdni.
d. Mennyi a ktirny keress elgazsi tnyezje mindkt irnyban?
e. Vajon a (c) pontra adott vlasz azt sugallja-e, hogy a problmnak lehetsges olyan tfogalmazsa, hogy az
1-es llapotbl egy adott clllapothoz majdnem keress nlkl el tudnnk jutni?
3.9.
A hittrtk s kanniblok problmjt ltalban az albbi mdon szoks megadni. Hrom hittrt s hrom
kannibl egy foly azonos oldaln tartzkodik. Rendelkeznek csnakkal, amely egy vagy kt embert br el.
Talljuk meg annak a mdjt, hogy mindenkit a foly msik oldalra tjuttassunk, arra gyelve, hogy a
hittrtk soha, sehol ne legyenek kisebbsgben a kanniblokkal szemben. Ez a problma hres az MI-ben, mert
ez volt tmja az els olyan publikcinak, ahol a problmamegfogalmazst analitikus szemszgbl ksreltk
meg (Amarel, 1968).
a. Fogalmazza meg preczen a problmt. Csak azokat a megklnbztetseket tegye meg, amelyek a helyes
megolds rdekben szksgesek. Rajzolja fel a teljes llapottr diagramjt.
b. Implementlja s oldja meg optimlis mdon a problmt, megfelel keressi algoritmust vlasztva. J tlete az ismtld llapotok ellenrzse?
78
c. Vlemnye szerint mirt nehz e feladvny az emberek szmra, annak ellenre, hogy az llapottr ilyen
egyszer?
3.10.
Implementlja az llapottmenet-fggvny kt vltozatt a 8-as jtk szmra. Az egyik az sszes kvett
egyszerre generlja a 8-as jtk adatstruktrjnak msolsval s editlsval. A msik hvsakor, csak egy
kvett generl, a szl llapot kzvetlen mdostsval (s szksg esetn a mdostsok visszalltsval). rja
meg az iteratvan mlyl keress olyan vltozatait, amelyek a fggvny fenti vltozatait hasznljk, s
hasonltsa ssze a megoldsok hatkonysgt.
3.11.
A 4.5. szakasz - Iteratvan mlyl mlysgi keress rszben az iteratvan megnyl keresst (iterative
lengthening search) emltettk, amely az egyenletes kltsg keress iteratv vltozata. Az tlet az tkltsgre
vonatkoz nvekv korlt hasznlata. Egy jonnan generlt csompontot eldobunk, ha az tkltsge a korltnl
nagyobb. A kvetkez iterciban a korltot az elz iterciban eldobott csompontok kzl a legkisebb
tkltsgre lltjuk be.
a. Mutassa meg, hogy ez az algoritmus ltalnos tkltsgek esetn optimlis.
b. Tekintsen egy homogn ft b elgazsi tnyezvel, d megoldsmlysggel s egysgnyi lpskltsggel.
Hny itercira lesz szksge az iteratvan megnyl keressnek?
c. Most tekintsen egy olyan lpskltsget, amit a [0, 1] folytonos tartomnybl sorsolnak, egy minimlis
pozitv kltsggel. Hny itercira lesz szksg a legrosszabb esetben?
d. Implementlja az algoritmust s alkalmazza a 8-as jtk s az utaz gynk problma konkrt eseteire.
Hasonltsa ssze az algoritmus hatkonysgt az egyenletes kltsg algoritmus hatkonysgval, s
rtelmezze az eredmnyeit.
3.12.
Bizonytsa be, hogy az egyenletes kltsg keress s a szlessgi keress konstans lpskltsg mellett
optimlisak, ha azokat a GRF-KERESS algoritmusval egytt alkalmazzuk. Mutasson egy olyan llapotteret
vltoz lpskltsggel, ahol a GRF-KERESS algoritmus, iteratv mlylst hasznlva, csak egy szuboptimlis
megoldst tall.
3.13.
Adjon meg egy olyan keressi teret, amelyben az iteratvan mlyl keressi algoritmus a mlysgi keressnl
lnyegesen rosszabb teljestmnyt nyjt (pldul O(n2) az O(n)-nel szemben).
3.14.
rjon egy olyan programot, amely bementknt kt weblap URL-jt kapja meg, s megoldsul megtallja az
azokat sszekapcsol hivatkozsi utat (linkeket). Mi a megfelel keressi stratgia? J tlet-e a ktirny
keress? Alkalmazhat-e egy keresgp az eldcsompont fggvny megvalstsra?
3.15.
Gondolja vgig egy sk kt pontja kztti legrvidebb t megtallsnak a problmjt, ha a skon konvex
sokszg akadlyok tallhatk (lsd 3.22. bra). Ez annak a problmnak egy idealizlt vltozata, amivel egy
robotnak kell szembeslnie, amikor egy zsfolt krnyezetben kell naviglnia.
3.22. bra - Egy elrendezs sokszgakadlyokkal
79
a. Tegyk fel, hogy az llapottr a sk sszes (x, y) pozcijbl ll. Hny llapotrl beszlhetnk ekkor? Hny
t vezet a clig?
b. Magyarzza el rviden, hogy egy sokszg cscst egy msikkal a skban sszekt legrvidebb tnak mirt
kell olyan egyenes vonalszakaszokbl llnia, amelyek az egyes sokszgek cscsait kapcsoljk ssze? Adjon
most egy j llapottr defincit. Milyen nagy ez a tr?
c. Definilja a keressi problma implementlshoz szksges fggvnyeket, belertve az llapottmenetfggvnyt, amely bemenetknt egy cscsot kap, s a belle egyenes vonalban elrhet cscsok halmazt adja
vissza (ne felejtsk ki a szomszdos cscsokat ugyanazon a sokszgn sem). Heurisztikus fggvnynek az
egyenes vonalbeli tvolsgot hasznlja.
d. Alkalmazzon a fejezetben ismertetett algoritmusok kzl egyet vagy tbbet a trgyterlethez tartoz
problmk megoldsra, s rtkelje azok teljestmnyt.
3.16.
A 3.15. feladat navigcis problmjt a kvetkezkppen transzformlja t egy krnyezetbe:
Az rzkels az gens ltal lthat sokszgcscsok az genshez viszonytott helyzetnek listja. Az rzkels
a robot pozcijt nem tartalmazza! A robotnak a sajt pozcijt a trkp alapjn kell megtanulnia. Azt is
ttelezzk fel ideiglenesen, hogy minden lokcinak eltr a panormja.
Minden cselekvs egy a kvetend egyenes utat ler vektor lesz. Ha az ton nincsenek akadlyok, a
cselekvs sikeres. Egybknt a robot azon a ponton megll, ahol az t az els akadlyt metszi. Ha az gens a
zrus mozgs vektort adja vissza s a clpozciban van (ami rgztett s ismert), akkor a krnyezetnek
teleportlnia kell az genst egy vletlen lokciba (de nem egy akadlyon bellre).
A hatkonysgi mrtk 1 pontot kr az genstl a megtett tvolsg minden egysgtvjrt s 1000 ponttal
djazza a cl mindenkori elrst.
a. Implementlja ezt a krnyezetet s egy erre a krnyezetre vonatkoz problmamegold genst. Minden
teleportls utn az gensnek j clt kell megfogalmaznia, belertve a sajt pozci felfedezst.
b. Dokumentlja az gens teljestmnyt (kommentlja az gens mozgst), s rjon egy jelentst az gens 100
epizdra vonatkoz teljestmnyrl.
c. Mdostsa a krnyezetet gy, hogy az gens az esetek 30%-ban ne a szndkolt helyen tallja magt (a helyet
a lthat sokszgcscsokbl sorsoljuk, ha van ilyen egyltaln, klnben nincs mozgs). Ez a vals robot
hibs mozgsnak egy durva modellje. Mdostsa genst gy, hogyha az ilyen hibt detektl, dertse ki, hol
van, s ksztsen tervet, hogy az eredeti pozciba visszakerlhessen, ahonnan az eredeti tervt folytatja.
80
Emlkezzen arra, hogy nha az eredeti pozciba val visszatrs is kudarccal vgzdhet! Mutasson egy
olyan genst, amely kt egyms utni hibs mozgssal is sikeresen megbirkzik, s elri a clt.
d. Most kt klnbz visszalltsi smval ksrletezzen egy hiba megtrtnte utn: (1) induljon az eredeti t
legkzelebb es cscsa fel, s (2) tervezze t az utat a cl fel az j pozcibl kiindulva. Hasonltsa ssze a
hrom visszalltsi sma teljestmnyt. Meg fogja-e vltoztatni az sszehasonlts eredmnyt a keressi
kltsgek figyelembevtele?
e. Most ttelezze fel, hogy vannak lokcik azonos panormval (ttelezzk fel pldul, hogy a vilg egy
ngyzetrcs ngyzetes akadlyokkal). Milyen problmkkal kell most az gensnek szembenznie? Milyenek
most a megoldsok?
3.17.
A 1.1. szakasz - Jl definilt problmk s megoldsok rszben azt mondtuk, hogy nem trgyaljuk a negatv
tkltsggel rendelkez problmkat. Ennek a feladatnak a kapcsn rszletesebben megvizsgljuk a krdst.
a. Tegyk fel, hogy a cselekvseknek tetszlegesen nagy negatv kltsgk lehet. Magyarzza meg, hogy ez a
lehetsg mirt knyszert minden optimlis algoritmust a teljes llapottr felkutatsra.
b. Segteni fog-e, ha ragaszkodunk ahhoz, hogy a lpskltsg egy negatv c konstansnl nagyobb vagy azzal
egyenl legyen? Mind a fkra, mind a grfokra gondoljon.
c. Ttelezzk fel, hogy cselekvsek egy halmaza ciklust alkot gy, hogy a halmaz cselekvseit valamilyen
sorrendben vgrehajtva az llapot nem vltozik. Milyen kvetkezmnyekkel jr egy ilyen krnyezetben
tevkenyked gens optimlis viselkedsre, ha ezen cselekvsek mindegyike negatv kltsg?
d. Knnyen el tudunk kpzelni nagy negatv kltsg opertorokat mg az tkeressi problma esetn is.
Pldul nhny tszakasz olyan gynyr tjakon halad, hogy az id s zemanyag tekintetben messze
tlszrnyalja a norml kltsgeket. Pontos megfogalmazsban magyarzza el, hogy az emberek mirt nem
kocsikznak a vgtelensgig a szp tjak krl, s hogyan lehetne az tkeressi problmhoz az llapotteret
s az opertorokat definilni, hogy a mestersges gens is el tudja kerlni a ciklusokat.
e. Tud olyan valdi problmakrt mondani, amelyben a lpsek kltsge ciklust okoz?
3.18.
Gondoljon a Murphy-trvny uralma alatt ll ktlokcij, szenzor nlkli porszvvilgra. Rajzolja fel az {1,
2, 3, 4, 5, 6, 7, 8} kezdeti hiedelmi llapotbl elrhet hiedelem-llapotteret, s magyarzza meg, hogy a
problma mirt megoldhatatlan. Mutassa meg azt is, hogy ha a vilg teljesen megfigyelhet, minden kezdeti
llapotbl ltezik egy megoldsi szekvencia.
3.19.
Tekintse a 2.2. brn lthat porszvvilgot.
a. A fejezetben ismertetett algoritmusok kzl amelyik lenne alkalmas e problma megoldsra? Szksges-e,
hogy az algoritmus ellenrizze az ismtelt llapotokat?
b. A 3 3 vilgban alkalmazza a megvlasztott algoritmust az optimlis cselekvsi szekvencia kiszmtsra
egy olyan kezdeti llapottal, ahol a fels hrom ngyzet mindegyikben tallhat piszok, s az gens a
kzps ngyzetben tartzkodik.
c. ptsen keres genst, s rtkelje a teljestmnyt egy olyan 3 3 porszvvilg halmaz szmra, ahol
minden ngyzetben 0,2 a kosz valsznsge. A teljestmny mrsnl mind az tkltsget, mind a keressi
kltsget vegye figyelembe, egy rtelmes tszmtsi tnyezt hasznlva.
d. Hasonltsa ssze az eddigi legjobb keres gens viselkedst egy olyan egyszer, randomizlt reflexszer
gensvel, amely koszt szv, ha azt megtallja, klnben vletlen mdon mozog.
e. rtkelje, hogy mi trtnne, ha a vilgot n n-re nagytannk. Hogyan vltozna a keres s a reflexszer
gens teljestmnye n nvelsvel?
81
4. fejezet - Informlt keressi s

felfedez mdszerek
Ebben a fejezetben ltni fogjuk, hogy az llapottrrel kapcsolatos informci segtsgvel az algoritmusok
hogyan kerlhetik el a sttben val tapogatzst.
A 3. fejezetben lttuk, hogy a nem informlt keressi stratgik oly mdon kpesek problmk megoldsait
megtallni, hogy szisztematikusan j llapotokat generlnak s sszehasonltjk azokat a clllapottal. Sajnos
ezek a stratgik a legtbb esetben hihetetlenl rossz hatkonysggal dolgoznak. Ezen fejezet megmutatja, hogy
egy problmaspecifikus tudst alkalmaz informlt keressi stratgia hatkonyabban kpes a megoldst
megtallni. A 4.1. alfejezet bemutatja a 3. fejezetben tanulmnyozott algoritmusok informlt vltozatait, a 4.2.
alfejezet pedig elmagyarzza, hogy a szksges problmaspecifikus informci hogyan szerezhet meg. A 4.3.
s a 4.4. alfejezet olyan algoritmusokkal foglalkozik, amelyek az llapottrben tisztn loklis keresst (local
search) hajtanak vgre, egy vagy tbb aktulis llapotot rtkelve s mdostva ahelyett, hogy szisztematikusan
trnk fel az utat a kezdeti llapottl indulva. Ezek az algoritmusok olyan problmk esetn jk, ahol az
tkltsg kzmbs, s az egyetlen, ami szmt, hogy megtalljuk-e a megoldst. A loklis keressi
algoritmusok csaldjba a statisztikai fizika inspirlta mdszerek (szimullt lehts, simulated annealing) s
az evolcis biolgia sugallta mdszerek (genetikus algoritmusok, genetic algorithms) is beletartoznak. A
4.5. alfejezet vgl az online keresssel (online search) foglalkozik, ahol az gens egy teljesen ismeretlen
llapottrrel tallja magt szembe.
1. Informlt (heurisztikus) keressi stratgik

Ez a fejezet megmutatja, hogy az informlt keressi (informed search) stratgia amely a problma
defincijn tlmenen problmaspecifikus tudst is felhasznl hogyan kpes hatkonyabban megtallni a
megoldst.
Az ltalunk vizsglt ltalnos megkzeltst a legjobbat-elszr keressnek (best-first search) nevezzk. A
legjobbat-elszr keress az ltalnos FA-KERESS vagy GRF-KERESS algoritmusok olyan specilis esete,
ahol egy csompont kifejtsre val kivlasztsa egy f(n) kirtkel fggvnytl (evaluation function) fgg.
Hagyomnyosan a legkisebb rtk csompontot vlasztjuk kifejtsre, mert a kirtkel fggvny a cltl val
tvolsgot mri. A legjobbat-elszr keress az eddigi ltalnos keressi eljrsok keretein bell egy prioritsi
sor segtsgvel implementlhat, ami egy olyan adatstruktra, mely a peremet a nvekv f-rtkek szerint
rendezi.
A legjobbat-elszr keress egy nagy mlt, azonban pontatlan elnevezs. Amenynyiben valban kpesek
lennnk a legjobb csompontot kifejteni, akkor egyltaln nem kellene keresnnk, nylegyenesen elmasroznnk
a clhoz. Ezzel szemben csak a kirtkel fggvny szerint legjobbnak tn csompontot tudjuk kivlasztani.
Ha kirtkel fggvnynk mindentud, akkor a kivlasztott csompont egyben a legjobb csompont is. A
valsgban azonban a kirtkel fggvny nha pontatlan, s flrevezetheti a keresst. Azonban a tovbbiakban
is ragaszkodni fogunk a legjobbat-elszr keress elnevezshez, mert a legjobbnak tnt elszr keress egy
kicsit furcsn hangzana.
A LEGJOBBAT-ELSZR-KERESS algoritmus tulajdonkppen egy keressi algoritmus csald, amelynek az
elemeit az eltr kirtkel fggvnyek1 klnbztetik meg. Ezeknek az algoritmusoknak a kulcseleme a h(n)nel jellt heurisztikus fggvny2 (heuristic function):
h(n) = az n csomponttl a clig vezet legolcsbb t becslt tkltsge
Pldul Romniban az Arad s Bukarest kztti legolcsbb t kltsgt az Arad s Bukarest kztti
lgvonaltvolsggal meg lehetne becslni.
A heurisztikus fggvny a leginkbb megszokott mdja annak, hogy a problmra vonatkoz ptllagos tudst a
keressi algoritmusba be tudjuk injektlni. A heurisztikus fggvnyekkel rszletesen a 4.2. alfejezetben
foglalkozunk. Egyelre tetszleges, m problmaspecifikus fggvnyeknek fogjuk ket tekinteni, egy
1
2
A 4.3. feladatban azt krjk ntl, hogy mutassa ki, hogy ez a csald nhny jl ismert nem informlt keresst is tartalmaz.
A h(n) heurisztikus fggvny bemenete ugyan egy csompont, a fggvny rtke azonban a csomponthoz tartoz llapottl fgg.
82
Informlt keressi s felfedez

mdszerek
kiktssel: ha n egy clllapot, akkor h(n) = 0. A jelen fejezet htralv rsze kt olyan utat mutat be, ahol a
heurisztikus informcit a keress irnytsra hasznljuk fel.
1.1. A moh legjobbat-elszr keress

A moh legjobbat-elszr keress3 (greedy best-first search) azt a csompontot fejti ki a kvetkez lpsben,
amelyiknek az llapott a legkzelebbinek tli a clllapothoz, abbl kiindulva, hogy gy gyorsan megtallja a
megoldst. A csompontokat az algoritmus teht az f(n) = h(n) heurisztikus fggvnnyel rtkeli ki.
Nzzk meg, hogy hogyan mkdik ez a romniai tkeressnl a lgvonalban mrt tvolsgot (straight-line
distance) felhasznlva, amit hLMT-vel fogunk jellni. Ha a cl Bukarest, szksgnk lesz Bukarest lgvonalbeli
tvolsgaira, amelyeket a 4.1. bra ad meg. Pldul hLMT(Benn(Arad)) = 366. Vegyk szre, hogy a hLMT rtkeit
magnak a problmnak a lersbl kiszmtani nem lehet. Tovbb egy kis tapasztalat is szksges ahhoz,
hogy rjjjnk, hogy a hLMT az ton megtett tnyleges tvolsggal korrell, s gy szmunkra hasznos heurisztika
lehet.
4.1. bra - A hLMT rtkei a lgvonalbeli tvolsgok Bukarestig
A 4.2. bra egy Aradrl Bukarestbe vezet t moh legjobbat-elszr keresst mutatja, hLMT-t alkalmazva.
Aradbl az els kifejtett csompont Nagyszeben, mert ez kzelebb van Bukaresthez, mint Nagyzernd vagy
Temesvr. A kvetkez kifejtend csompont pedig Fogaras, mert az van a legkzelebb. Fogaras majd generlja
Bukarestet, ami egyben a clllapot. Erre a konkrt problmra a hLMT -t alkalmaz moh legjobbat-elszr
keress gy tall megoldst, hogy soha sem fejt ki olyan csompontot, ami nem a megoldsi ton fekszik.
Kvetkezskppen minimlis a keressi kltsge. Azonban nem optimlis: a Nagyszebenen s Fogarason
keresztl Bukarestbe vezet t 32 kilomterrel hosszabb a Rimnicu Vilcen s Pitetin keresztl vezet tnl.
Ebbl ltszik, hogy az algoritmus mirt moh minden lpsben igyekszik annyira kzel kerlni a clhoz,
ahogy csak lehet.
4.2. bra - A moh legjobbat-elszr keress lpsei Bukarest esetn a lgvonalban mrt
tvolsgot (hLMT) alkalmazva. A csompontok a sajt h-rtkeikkel vannak felcmkzve.
A knyv els kiadsban ennek moh keress (greedy search) volt a neve. Ms szerzk ezt legjobbat-elszr keressnek (best-first
search) nevezik. A msodik vltozat ltalunk vlasztott ltalnosabb hasznlata Pearlt (Pearl, 1984) kveti.
3
83

mdszerek
A h(n) minimalizlsa rzkeny a hibs kezd lpsekre. Tekintsk pldul azt az esetet, amikor Iairl
Fogarasra akarunk eljutni. A heurisztika alapjn Neamtot kellene elszr kifejteni, hiszen ez fekszik Fogarashoz
a legkzelebb, azonban ez zskutca. A megolds, hogy elszr elmegynk Vasluira egy olyan lpst tesznk,
ami a heurisztika szerint a cltl tvolabb visz s aztn elmegynk Csalnosra, Bukarestre, majd Fogarasra.
Ebben az esetben a heurisztika szksgtelen csompontok kifejtst eredmnyezi. Tovbb, ha nem gyelnk
arra, hogy felismerjk az ismtld llapotokat, akkor soha nem talljuk meg a megoldst a keress Neamt s
Iai kztt fog oszcilllni.
A moh legjobbat-elszr keress a mlysgi keressre hasonlt abbl a szempontbl, hogy egyetlen t
vgigkvetst preferlja a clig, azonban zskutcba jutva visszalp. Ugyanazokkal a problmkkal kszkdik,
mint a mlysgi keress nem optimlis s nem teljes (mert elindulhat egy vgtelen ton s soha sem tr vissza
jabb lehetsgeket kiprblni). A moh keress legrosszabb esetre szmtott (worst-case) id- s trignye
O(bm), ahol m a keressi tr maximlis mlysge. Jl megvlasztott heurisztikus fggvnnyel a komplexits
azonban jelentsen cskkenthet. A cskkens mrtke az adott problmtl s a heurisztikus fggvny
minsgtl fgg.
1.2. A* keress: a teljes becslt tkltsg minimalizlsa

A legjobbat-elszr keress leginkbb ismert vltozata az A* keress (a kiejtse A csillag). A csompontokat
gy rtkeli ki, hogy sszekombinlja g(n) rtkt az aktulis csompontig megtett t kltsge s h(n)
rtkt vagyis az adott csomponttl a clhoz vezet t kltsgnek becsljt:
f(n) = g(n) + h(n)
84

mdszerek
Mivel g(n) megadja a kiindul csomponttl az n csompontig szmtott tkltsget, s h(n) az n csomponttl
a clcsompontba vezet legolcsbb kltsg t kltsgnek becslje, gy az albbi sszefggst kapjuk:
f(n) = a legolcsbb, az n csomponton keresztl vezet megolds becslt kltsge.
gy amennyiben a legolcsbb megoldst keressk, sszer elszr a legkisebb g(n) + h(n) rtkkel rendelkez
csompontot kifejteni. Ezen stratgia kellemes tulajdonsga, hogy ez a stratgia tbb mint sszer: amennyiben
a h fggvny eleget tesz bizonyos feltteleknek, az A* keress teljes s optimlis.
Az A* optimalitst knny elemezni, ha az algoritmust a FA-KERESS-sel egytt alkalmazzuk. Ilyenkor A*
optimlis lesz, ha h(n) egy elfogadhat heurisztika (admissible heuristic), azaz ha h(n) soha nem becsli fell
a cl elrshez szksges kltsget. Az elfogadhat heurisztikk termszetkbl addan optimistk, mivel
gy gondoljk, hogy a problma megoldsa kisebb kltsggel jr, mint amekkora kltsget a megolds
valjban ignyel. Mivel g(n) az n csompont elrsnek pontos kltsge, azonnali kvetkezmnyknt addik,
hogy f(n) soha sem becsli tl az n csomponton keresztl vezet legjobb megolds valdi kltsgt.
Az elfogadhat heurisztikus fggvnyek taln egyik legnyilvnvalbb pldja a Bukarestbe trtn utazs sorn
felhasznlt hLMT lgvonalban mrt tvolsg. A lgvonalban mrt tvolsg elfogadhat, mert brmely kt pont
kztt a legrvidebb tvolsg a lgvonalban mrt tvolsg, gy a lgvonalbeli tv soha nem becslhet tl. A 4.3.
bra a Bukarestet keres A* fakeress elrehaladst mutatja. A g rtkeket a 3.2. brn lthat
lpskltsgekbl szmtjuk ki, a hLMT rtkei a 4.1. brn adottak.
Fontos
Vegyk szre, hogy Bukarest elszr az (e) lps peremben jelent meg, azonban kifejtsre nem kerlt,
mert Bukarest f-rtke (450) magasabb, mint Piteti (417). Ezt gy lehetne megmagyarzni, hogy
lehet, hogy Pitetin keresztl ltezik egy 417 kltsg olcs megolds, gy az algoritmus egy 450
kltsg megoldst nem fog vlasztani. Ebbl a pldbl megalkothatjuk annak az ltalnos
bizonytst, hogy a FA-KERESS-t hasznl A* algoritmus optimlis, ha h(n) elfogadhat. Tegyk fel,
hogy a peremen egy G2 szuboptimlis clcsompont jelenik meg, s az optimlis megolds kltsge
legyen C*. gy mivel G2 szuboptimlis s h(G2) = 0 (ami minden clllapotra igaz), tudjuk, hogy:
f(G2) = g(G2) + h(G2) = g(G2) > C*
Gondoljunk most egy perembeli n csompontra, amely a megoldsi tvonalon fekszik (ilyennek mindig lteznie
kell, ha a megolds ltezik). Ha h(n) nem becsli tl a megoldshoz vezet t folytatst, akkor tudjuk, hogy:
f(n) = g(n) + h(n) C*
Kimutattuk teht, hogy f(n) C* < f(G2), gy G2 nem kerl kifejtsre, s az A* egy optimlis megoldssal tr
vissza.
A bizonyts sszeomlik, ha a FA-KERESS helyett a 3.19. bra szerinti GRF-KERESS algoritmust hasznljuk.
Az algoritmus visszatrhet szuboptimlis megoldssal, mert a GRF-KERESS algoritmus elvetheti az ismtld
llapothoz vezet optimlis utat, ha az nem elsnek kerlt kiszmtsra (lsd 4.4. feladat). A problmt ktfle
mdon lehet megoldani. Az els megolds a GRF-KERESS olyan kiterjesztse, hogy az az ugyanahhoz a
csomponthoz vezet kt t kzl a drgbbat fogja elvetni (lsd az rtkelst a 3.5. alfejezetben). A ptllagos
adminisztrls nem egyszer, de az optimalitst garantlni fogja. A msodik megoldsnl azt kell biztostani,
hogy a brmelyik ismtld csomponthoz vezet optimlis t mindig az, amit az algoritmus elsnek kvet
mint ahogy ez az egyenletes kltsg keressnl volt. Ez a tulajdonsg akkor ll fenn, ha a h(n) fggvnyre
extra kvetelmnyeket fogalmazunk meg, megkvetelve annak konzisztencijt (consistency), mskppen
monotonitst (monotonicity). A h(n) heurisztikus fggvny konzisztens, ha minden n csompontra s annak
egy tetszleges a cselekvssel generlt minden n utdcsompontjra az n csomponttl elrt cl becslt
kltsge nem kisebb, mint az n -be kerls lpskltsge s az n csomponttl elrt cl becslt kltsge:
h(n) c(n, a, n) + h(n)
Ez az ltalnos hromszg egyenltlensg (triangle inequality) egy formja, amely azt fejezi ki, hogy egy
hromszg egy oldala sem lehet hosszabb, mint a kt msik oldal sszege. Itt a hromszget az n, az n s az nhez legkzebbi cl hatrozza meg. Knny megmutatni (4.7. feladat), hogy minden konzisztens heurisztika
egyben elfogadhat is.
85

mdszerek
Fontos
A konzisztencia legfontosabb kvetkezmnye az, hogy: a GRF-KERESS-t hasznl A* algoritmus
optimlis, ha h(n) konzisztens.
4.3. bra - Az A* keress lpsei Bukarest keresse sorn. A csompontok az f = g + h

rtkekkel vannak felcmkzve. A h-rtkek a Bukaresttl lgvonalban mrt
tvolsgokat jellik, melyeket a 4.1. brbl vettnk t.
86

mdszerek
87

mdszerek
Br a konzisztencia az elfogadhatsgnl szigorbb kvetelmny, igazn nehz olyan elfogadhat heurisztikt

tallni, ami nem lenne egyben konzisztens. Az ebben a fejezetben trgyalt sszes elfogadhat heurisztika mind
konzisztens. Vegyk pldul a hLMT-t. Tudjuk, hogy az ltalnos hromszg egyenltlensg teljesl, ha az
oldalakat egyenes vonal tvolsgokkal mrjk, s hogy az n s n kztti egyenesvonal tvolsg c(n, a, n)-nl
nem nagyobb. A hLMT gy egy konzisztens heurisztika.
Fontos
A konzisztencia egy msik fontos kvetkezmnye az, hogy ha h(n) konzisztens, akkor az f(n) rtkek
akrmilyen t mentn nem cskkennek. A bizonyts bizonyos a mellett kzvetlenl kvetkezik a
konzisztencia defincijbl. Tegyk fel, hogy n az n utdja, ekkor:
g(n) = g(n) + c(n, a, n)
s
f(n) = g(n) + h(n) = g(n) + c(n, a, n) + h(n) g(n) + h(n) = f (n)
A GRF-KERESS-t hasznl A* algoritmus ltal kifejtett csompontok sorozata teht f(n)-ben nem cskken. A
kifejtsre vlasztott els clcsompont gy egy optimlis megolds is egyben, mert minden utna kvetkez
csompont legalbb ilyen kltsges lenne.
Ha az f-kltsgek sohasem cskkenek, brmilyen utat vlasztunk, akkor az llapottrben hatrvonalakat
(contour) hzhatunk be, hasonlan egy topografikus trkp kontrjaihoz. A 4.4. bra erre mutat egy pldt. A
400-zal felcmkzett hatrvonalon bell az sszes csompont f(n) rtke nem nagyobb 400-nl, s hasonl
rvnyes a tbbire is. Mivel az A* keressi algoritmus a legkisebb f rtkkel rendelkez levlcsompontot fejti
ki elszr, lthatjuk, hogy az A* keressi algoritmus a gykrcsompontbl legyezszeren halad kifel,
nvekv f rtkekhez tartoz koncentrikus svokban hozzadva a csompontokat.
Az egyenletes kltsg keress esetn (A* keress h = 0 mellett) a csompontsvok a kiindul csompont kr
hzott koncentrikus krket alkotnak. Pontosabb heurisztikus fggvny alkalmazsval a svok a clllapot
fel elnylnak, s keskenyebben fkuszldnak az optimlis t krl. Ha C* az optimlis megoldsi t kltsgt
jelli, akkor az albbiakat jelenthetjk ki:
Az A* keressi algoritmus kifejti az sszes f(n) < C* rtkkel rendelkez csompontot.
Ezek utn az A* keressi algoritmus egy clcsompont kivlasztsa eltt mg kifejthet nhny csompontot a
clhatrvonalon, amelyekre f(n) = C*.
Intuitven nyilvnval, hogy az els megtallt megoldsnak optimlis megoldsnak kell lennie, hiszen a
kvetkez hatrvonalakon az sszes csomponthoz nagyobb f kltsg, ebbl addan nagyobb g kltsg
tartozik (mivel minden clllapotra h(n) = 0). Intuitven az is nyilvnval, hogy az A* keressi algoritmus teljes.
Ahogy egyre nvekv f rtk svokat adunk a keresshez, elbb-utbb elrnk egy svot, amelyhez tartoz f
rtk megegyezik egy clllapothoz vezet t kltsgvel.4
4.4. bra - Romnia trkpe. Az bra Arad mint kiindul llapot esetn az f = 380, f =
400 s f = 420 rtkekhez tartoz hatrvonalat mutatja. Egy adott hatrvonalon belli
csompontokhoz a hatrvonal rtknl kisebb f kltsg tartozik.
A teljessg megkvnja, hogy a C* kltsgnl kisebb vagy azzal egyenl kltsg csompontokbl vges sok legyen. Ez a felttel akkor
lesz igaz, ha minden lpskltsg egy vges -nl nagyobb s b vges.
4
88

mdszerek
Vegyk szre, hogy az A* nem fejt ki f(n) > C* tulajdonsg csompontokat. A 4.3. brn pldul Temesvr nem
kerl kifejtsre annak ellenre, hogy ez a gykrnek egy utdcsompontja. Azt mondjuk, hogy a Temesvr alatti
ft lenyestk (pruned). Mivel hLMT elfogadhat, az algoritmus biztonsgosan figyelmen kvl hagyhat egy ilyen
ft, mikzben az optimalitst garantlja. A nyess gondolata a lehetsgek eliminlsa anlkl, hogy
megvizsglnnk azokat igen fontos az MI sok terletn.
Egy vgs szrevtel, az ilyen tpus a gykrbl kiindul utakat bvt optimlis algoritmusok kzl az A*
keressi algoritmus brmely adott heurisztikus fggvny mellett optimlis hatkonysg (optimally efficient).
Ez azt jelenti, hogy egyetlen ms optimlis algoritmus sem fejt ki garantltan kevesebb csompontot, mint az A*
(kivve taln az f(n) = C* tpus csompontok krt, ahol holtverseny alakulhat ki). Ez azrt van, mert az sszes
olyan algoritmus, amelyik nem fejti ki az sszes csompontot, melyre f(n) < C*, kockztatja az optimlis
megolds elkerlst.
Felettbb rmteli hr szmunkra, hogy az A* keressi algoritmus teljes, optimlis s az sszes ilyen jelleg
algoritmus kztt optimlisan hatkony. Sajnos ez azonban nem jelenti azt, hogy az A * algoritmus megoldja az
sszes keresssel kapcsolatos problmnkat. A buktat a dologban az, hogy a legtbb problma esetn a
csompontok szma a keressi tr clhatrvonalon belli rszn a megolds hossznak mg mindig
exponencilis fggvnye. Br az eredmny bizonytsa tlmutat ezen knyv keretein, megmutathat, hogy az
exponencilis nvekedssel mindenkpp szembe kell nznnk, kivve, ha a heurisztikus fggvnynk hibja
legfeljebb az aktulis tkltsg logaritmusval n. Az exponencilisnl lassabb nvekeds felttele matematikai
megfogalmazsban:
|h(n) h*(n)| O(log h*(n))
ahol h*(n) az n csompontbl a clcsompontba val eljuts valdi kltsgt jelli. Majdnem minden, a
gyakorlatban hasznlt heurisztikus fggvny esetn a hiba legalbb arnyos az tkltsggel, s az ebbl add
exponencilis nvekedssel egyetlen szmtgp sem tud megbirkzni. Ezrt ahhoz ragaszkodni, hogy egy
optimlis megoldst talljunk, gyakran nem is praktikus. Hasznlhatjuk az A* olyan vltozatt, amely a
szuboptimlis megoldsokat gyorsan megtallja, vagy pedig dolgozhatunk pontosabb, de nem elfogadhat
heurisztikkkal. Egy jl megvlasztott heurisztikus fggvny ettl fggetlenl a nem informlt keressi
algoritmusokhoz kpest jelents megtakartst eredmnyezhet. A 4.2. alfejezetben megvizsgljuk, hogy hogyan
is lehet j heurisztikus fggvnyt tervezni.
Az A* algoritmusnak azonban nem a szksges szmtsi id a nagy problmja. Mivel az sszes legenerlt
csompontot a memriban trolja (ahogy ezt az sszes GRF-KERESS algoritmus teszi), ezrt az algoritmus
ltalban lnyegesen hamarabb felemszti a rendelkezsre ll memrit, mintsem kifutna az idbl. Ezrt az
A* sok nagymret problmhoz nem praktikus. A kzelmltban kifejlesztett algoritmusok a vgrehajtsi id
89

mdszerek
kismrtk nvekedse mellett a memriaproblmt megoldottk, anlkl hogy felldoznk az optimalitst vagy
a teljessget. Ezekkel az algoritmusokkal fogunk most foglalkozni.
1.3. Memriakorltozott heurisztikus keress

Az A* memriaignynek mrsklsre a legegyszerbb mdszer az iteratvan mlyl algoritmus adaptlsa
heurisztikus keress krnyezetre. Ennek eredmnye az iteratvan mlyl A* algoritmus IMA* (iterative
deepening A*, IDA*). Az IMA* s a kznsges iteratvan mlyl algoritmus kztti f klnbsg az, hogy a
vgsi mechanizmus nem a mlysgen, hanem az f kltsgen (g + h) alapul. Ezltal minden egyes iterciban a
vgsi rtk az a legkisebb f kltsg, ami az elbbi iterciban hasznlt vgsi rtknl nagyobb. Az IMA*
praktikus megolds szmos olyan problma esetn, ahol egysgnyi a lpskltsg s elkerli a rendezett
csompontsor memriban val tartsnak jelents overheadjt. Sajnos, az IMA* algoritmus a vals rtk
kltsgektl ugyangy szenved, mint az egyenletes kltsg keress iteratv vltozata, amit a 3.11. feladatban
rtunk le. Ebben a fejezetben megvizsglunk a memriakorltozott algoritmusok krbl kt frissebb tletet az
RLEK-t s az MA*-t.
A rekurzv legjobbat-elszr keress, az RLEK (recursive best-first search, RBFS) egy egyszer rekurzv
algoritmus, amely megksrli a rendes legjobbat-elszr algoritmus mkdst mmelni, de csak lineris trat
hasznlva. Az algoritmust a 4.5. bra mutatja. A struktrja hasonlt a rekurzv mlysgi keressre, azonban
ahelyett, hogy az algoritmus egy utat a vgtelensgig folytatna az aktulis plya mentn, figyeli az aktulis
csomponthoz az eldeitl vezet eddigi legjobb alternatv t f-rtkt. Ha az aktulis csompont ezt az rtket
tlhaladja, a rekurzi az alternatv tra lp vissza. Ahogy a rekurzi visszalp, az RLEK minden csompont frtkt a plya mentn a gyerekeinek legjobb f-rtkvel helyettesti. Ily mdon az RLEK emlkszik a legjobb
levlrtkre az elfelejtett alfban, s eldntheti, vajon rdemes-e ezt a ft valamikor ksbb jra kifejteni. A 4.6.
bra azt mutatja, hogy hogyan ri el Bukarestet az RLEK.
Az RLEK valamivel hatkonyabb, mint az IMA*, azonban mg mindig tlsgosan szenved a csompontok
tlzott jbli generlsa miatt. A 4.6. brn lthat pldban az RLEK elszr a Rimnicu Vilcen tmen utat
kveti, majd meggondolja magt s Fogarassal ksrletezik, majd jra meggondolja magt. Ezek a
meggondolsok azrt trtnnek meg, mert amikor az aktulis legjobb utat tovbb fejtjk, nagy az esly arra,
hogy az f-rtk nni fog h ltalban kevsb optimista a clhoz kzeli csompontok esetn. Amikor ez
megtrtnik, klnskppen nagy keressi terekben, a msodik legjobb t a legjobb tt vlhat, s a keressnek
vissza kell lpnie, hogy ezt az utat tudja kvetni. Minden meggondols megfelel az IMA* egy-egy itercijnak
s az elfelejtett csompontok szmos jbli kifejtst teszi szksgess, hogy a keress kpes legyen a legjobb
utat visszalltani, s azt egy csomponttal meghosszabbtani.
4.5. bra - A rekurzv legjobbat-elszr keress algoritmusa
Az A*-hoz hasonlan az RLEK is optimlis algoritmus, feltve, hogy a h(n) heurisztikus fggvny elfogadhat.
Trkomplexitsa O(bd), az idkomplexitst azonban nehezebb meghatrozni. Ez fgg a heurisztika
pontossgtl s attl is, mennyire gyakran vltozik a csompontok kifejtse kzben a legjobb t. Mind az
IMA*, mind az RLEK elvileg ki vannak tve a grfokban val keresssel kapcsolatos exponencilis
90

mdszerek
komplexitsnvekedsnek (lsd 3.5. alfejezet), tekintettel arra, hogy az ismtld llapotok jelenltt csak az
aktulis ton kpesek ellenrizni. Elfordulhat gy, hogy ugyanazt az llapotot tbbszr is kifejtik.
Az IMA*-nak s az RLEK-nek az a baja, hogy tl kevs memrit hasznl. Az egyes itercik kztt az IMA*
egyetlen szmot, az aktulis f-kltsg korltot trolja el. Az RLEK tbb informcit trol el a memriban,
azonban csak O(bd) memrit hasznl. Mg ha tbb memria is llna a rendelkezsre, az RLEK-nek nincs
mdja ezt kihasznlni.
sszernek tnik teht az sszes, rendelkezsre ll memrit hasznlni. Az erre kpes kt algoritmus az MA*
(memriakorltozott A*) s az EMA* (egyszerstett MA*). Itt az EMA*-t rjuk le, ami mitagads az
egyszerbb. Az EMA* az A* mdjra halad a legjobb levelet kifejtve, amg a memria be nem telik. Ezen a
ponton a keressi fhoz j csompontot hozzadni nem kpes, hacsak egy rgit nem trl ki. Az EMA * mindig a
legrosszabb a legmagasabb f-rtk csompontot hagyja ki. Majd, mint az RLEK, az elfelejtett csompont
rtkt a szljhez tovbbtja. Ily mdon egy elfelejtett rszfa eldje tudja a rszfa legjobb tjnak az rtkt.
Ezzel az informcival az EMA* csak akkor fejti ki jra a ft, ha kimutatta, hogy minden ms t rosszabbnak
tnik, mint az elfelejtett t. Ms szval, ha az n csompont minden utdjt elfelejtjk, nem tudjuk, hogy n-bl
merrefel lehetne menni, tudni fogjuk azonban, hogy mennyire rdemes egyltaln brhov is menni az n-bl
kiindulva.
4.6. bra - Az RLEK lpsei, mikzben a legrvidebb utat keresi Bukarest fel. A
mindenkori rekurzv hvs f-korlt rtke a mindenkori aktulis csompont felett
lthat. (a) A Rimnicu Vilcen t vezet utat az algoritmus addig kveti, amg az
aktulis legjobb levl (Piteti) rtke nem lesz rosszabb, mint a legjobb alternatv t
rtke (Fogaras). (b) A rekurzi visszalp s az elfelejtett alfa legjobb levlrtkt (417)
Rimnicu Vilcenl feljegyezzk. Majd Fogaras kifejtse kvetkezik 450-nel, mint a
legjobb levlrtkkel. (c) A rekurzi visszalp. Az elfelejtett alfa legjobb levlrtkt
(450) Fogarasnl jegyezzk fel. Kvetkezik Rimnicu Vilcea kifejtse. Ezttal, mivel a
legjobb alternatv t (Temesvron keresztl) 447-be kerl, a kifejts folytatdik
Bukarest fel.
91

mdszerek
A teljes algoritmus tlsgosan bonyolult, hogy itt rjunk rla, 5 azonban egy finom vonst rdemes megemlteni.
Azt mondtuk, hogy az EMA* a legjobb levelet fejti ki s a legrosszabb levelet felejti el. Mi van akkor, ha minden
levlnek ugyanaz az f-rtke? Az algoritmus ekkor ugyanazt a csompontot kifejtsre is, s elhagysra is
kivlaszthatn. Az EMA* ezt a problmt gy oldja meg, hogy a kifejtsre a legjabb csompontot vlasztja, s
a legrgebbi csompontot trli. Ez a kett ugyanaz a csompont csak akkor lehet, ha csak egy levl van. Ebben
az esetben az aktulis keressi fa egyetlen tbl ll a gykrtl a levlig, ami kitlti a teljes memrit. Ha a levl
nem egy clcsompont, akkor mg ha a clhoz vezet optimlis ton fekszik is, ez a cl az adott memrival
nem rhet el. Kvetkezskppen a csompontot ugyangy el lehet dobni, mintha nem is lenne kvetje.
Az EMA* teljes, ha van egyltaln elrhet megolds azaz ha D, a legseklyebb clcsompont mlysge
kevesebb, mint a memria nagysga (csompontokban kifejezve). Optimlis, ha van elrhet optimlis
megolds, mskppen az algoritmus a legjobb elrhet megoldssal tr vissza. Gyakorlatilag az EMA *-t messze
a legjobb ltalnosan hasznlatos algoritmusnak lehet tekinteni az optimlis megoldsok megkeressre,
klnskppen ha az llapottr egy grf, a lpskltsg nem egyenletes, s a csompontkifejts drga a nyitott
s zrt listk karbantartsnak ptllagos overheadjhez kpest.
Fontos
5
Az algoritmus vzlatos lersa a knyv els kiadsban megtallhat.
92

mdszerek
Nagyon nehz problmk esetn azonban az EMA* sokszor knytelen folyamatosan oda-vissza
kapcsolgatni a lehetsges megoldsi utak kztt, amelyekbl csak kevs fr be a memriba (hasonl
ez a diszkalap memria lapoz rendszer vergdsi (thrashing) problmjra). Az ugyanazon
csompontok ismtelt jrakifejtshez szksges extra id azt jelenti, hogy azok a problmk,
amelyeket a vgtelen memrij A* gyakorlatilag meg tudna oldani, az EMA* szmra kezelhetetlenek.
Ez azt jelenti, hogy memriakorlt a problmt a szmtsi id szempontjbl kezelhetetlenn teheti.
Br a memria s az id kztti kompromisszum magyarzatra nincs elmlet, gy tnik, hogy ettl a
problmtl megmeneklni nem lehet. Egyetlen kit elvetni az optimalits kvetelmnyt.
1.4. Tanuljunk, hogy jobban keressnk!

Az eddigiekben nhny rgztett stratgit mutattunk be szlessgi, moh legjobbat-elszr stb. keress ,
amelyeket szmtgpes szakemberek terveztek. Meg tudn-e tanulni egy gens, hogy jobban keressen? A
vlasz igen, s a mdszer alapjt egy fontos fogalom, a metaszint llapottr (metalevel state space) adja. A
metaszint llapottr minden llapota az objektumszint llapottrbeli (object-level state space) amilyen
pldul Romnia keresprogram egy bels (szmtsi) llapotnak felel meg. Az A* algoritmus bels llapota
pldul az aktulis keressi fa. A metaszint llapottr minden cselekvse egy szmtsi lps, amely a bels
llapotot vltoztatja meg. Az A* esetn pldul minden szmtsi lps kifejt egy levelet, s a kvetit a fhoz
adja hozz. A 4.3. bra, amely az egyre nvekv keressi fk sorozatt mutatja, rtelmezhet lehetne gy, hogy
a metaszint llapottrben egy utat mutat, ahol az t minden llapota egy objektumszint keressi fa.
A 4.3. brn az t t lpsbl ll, Fogaras kifejtst is beleszmtva, ami nem volt valami hasznos. Nehezebb
problmk esetn sok ilyen tves lpsre lehet szmtani, s a metaszint tanulsi algoritmus (metalevel
learning) ilyen tapasztalatokbl tanulhat, hogy elkerlje a haszontalan rszfk kifejtst. Az ilyen tanulshoz
alkalmas mdszereket a 21. fejezetben trgyaljuk. A tanuls clja a problmamegolds totlis kltsgnek
(total cost) a minimalizlsa, kompromisszumot ktve a szmtsi kiadsok s az tkltsg kztt.
2. Heurisztikus fggvnyek
Ebben a rszben a 8-as kirakjtkhoz keresnk heurisztikus fggvnyeket, hogy rvilgtsunk a heurisztikus
fggvnyek ltalnos termszetre.
A 8-as kirakjtk a legrgebbi heurisztikus keressi feladatok egyike. Mint azt a 3.2. alfejezetben lttuk, a jtk
lnyege, hogy a szmozott lapkkat vzszintesen s fgglegesen az res helyre tolva a kiindulllsbl a
clllsba jussunk (lsd 4.7. bra).
Egy tlagos megolds vletlen mdon generlt 8-as kirakjtk pldnyok esetn kb. 22 lpsbl ll. Az
elgazsi tnyez nagyjbl 3 (amikor az res lapka kzpen van, akkor ngy, amikor a sarokban van, akkor
kett, s amikor valamelyik szls kzps pozciban van, akkor pedig hrom mozgats lehetsges). Ebbl
addan egy 22 mlysgig men kimert keress kzeltleg 322 3,1 1010 llapotot vizsglna meg. Az
ismtld llapotok nyilvntartsval ezt a szmot 170 000-ed rszre le lehet cskkenteni, mert csak 9!/2 =
181 440 klnbz elrhet elrendezs ltezik (lsd 3.4. feladat). Ez egy kezelhet szm, azonban ugyanez a
szm a 15-s kirakjtk esetn mr durvn 1013, gy a kvetkez teend egy j heurisztika megkeresse.
Amennyiben a legrvidebb megoldsokat akarjuk megtallni A* bevetsvel, olyan heurisztikus fggvnyre van
szksgnk, ami soha sem becsli tl a clllapot elrshez szksges lpsek szmt. Az ilyen heurisztikk
keressnek a 15-s kirakjtk esetn nagy a mltja. me kt lehetsges fggvny:
h1 = a rossz helyen lv lapkk szma. A 4.7. brn a 8 lapkbl egyik sincs a helyn, gy a kiindul
llapotban h1 = 8 lenne. h1 elfogadhat heurisztikus fggvny, mivel nyilvnval, hogy minden rossz helyen
lv lapkt legalbb egyszer mozgatni kell.
h2 = a lapkknak a sajt clhelyeiktl mrt tvolsgaik sszege. Mivel a lapkkat nem lehet tlk mentn
mozgatni, az ltalunk kiszmtott tvolsg a vzszintes s fggleges tvolsgok sszege lesz. Ezt nha
hztmb- (city block distance) vagy Manhattan-tvolsgnak (Manhattan distance) is szoks nevezni. h2
szintn elfogadhat heurisztikus fggvny, mivel minden egyes mozgatssal egy lapkt csak egy lpssel
lehet kzelebb vinni a clhoz. A kiindul llapotban az 18 lapkkra szmtott Manhattan-tvolsg:
h2 = 3 + 1 + 2 + 2 + 2 + 3 + 3 + 2 = 18
Ahogy remltk, egyik sem becsli tl a megolds igazi kltsgt, ami 26.
93

mdszerek
4.7. bra - A 8-as kirakjtk egy tipikus feladata. A megolds 26 lps hossz.
2.1. A heurisztikus fggvny pontossgnak hatsa a megolds

hatkonysgra
A heurisztikus fggvny minstsnek egyik lehetsges mdja a b* effektv elgazsi tnyez (effective
branching factor) megadsa. Amennyiben az A* algoritmus ltal kifejtett sszes csompont szma egy adott
problmra N, s a megolds mlysge d, akkor b* annak a d mlysg kiegyenslyozott fnak az elgazsi
tnyezjvel egyezik meg, amely N + 1 csompontot tartalmazna. Ebbl addan:
N + 1 = 1 + b* + (b*)2 + + (b*)d
Pldul ha az A* algoritmus egy 5 mlysgben fekv megoldst 52 csompont kifejtsvel tall meg, akkor az
effektv elgazsi tnyez 1,92. Az effektv elgazsi tnyez a problmaesetek fggvnyben vltozhat,
megfelelen nehz problmk esetn azonban ltalban nagyjbl lland. gy a b* kisszm problmahalmazon
vgzett ksrleti mrse j fogdzt adhat a heurisztikus fggvny ltalnossgban vett hasznlhatsgrl. Egy
jl megtervezett heurisztikus fggvny effektv elgazsi tnyezje 1 krli rtk, ami lehetv teszi felettbb
nagy problmk megoldst is.
A h1 s a h2 heurisztikus fggvnyek tesztelshez vletlenszeren generltunk 1200 problmapldnyt, 224
mlysg megoldssal (100-100 pldnyt minden pros szm esetre), s megoldottuk azokat a h1 s a h2
heurisztikus fggvnyeket alkalmazva az A* fakeres algoritmussal, illetve a nem informlt iteratvan mlyl
keressi algoritmussal is. A 4.8. bra minden egyes stratgira megadja az tlagosan kifejtett csompontok
szmt s az effektv elgazsi tnyezt. Az eredmnyek azt mutatjk, hogy h2 jobb, mint h1, s hogy a nem
informlt keress mindkettnl sokkal rosszabb. A 14 hosszsg megoldsok esetn az A * h2-vel 30 000-szer
hatkonyabb, mint a nem informlt iteratvan mlyl keress.
4.8. bra - A keressi kltsg s az effektv elgazsi tnyez sszehasonltsa

ITERATVAN-MLYL-KERESS s A* esetn h1 s h2 hasznlatval. Az adatokat klnbz
hosszsg megoldsokra a 8-as kirakjtk 100 egyedt megoldva tlagolva kaptuk.
94

mdszerek
Feltehetjk magunknak a krdst, hogy vajon a h2 mindig jobb-e, mint a h1? A vlasz: igen. A kt heurisztikus
fggvny defincijbl jl ltszik, hogy minden n csompontra h2(n) h1(n). Azt mondjuk, hogy h2 dominlja
h1-et. A dominci kzvetlenl tvihet a hatkonysgra: a h2-t hasznl A* algoritmus kevesebb csompontot
fog kifejteni, mint a h1-et hasznl (taln csak az f(n) = C* tulajdonsg nhny csompontot kivve). Ezt az
albbi egyszer gondolatmenettel mutathatjuk meg. Idzzk fel a 1.2. szakasz - A* keress: a teljes becslt
tkltsg minimalizlsa rszben tett szrevtelnket, miszerint minden csompont kifejtsre kerl, amelyre f(n)
< C*. Ezzel egyenrtk az az llts, mely szerint minden csompont kifejtsre kerl, amelyre h(n) < C* g(n).
Mivel azonban h2 minden csompontra legalbb akkora, mint h1, gy minden olyan csompontot, amit kifejt a
h2-t alkalmaz A* algoritmus, kifejti a h1-et alkalmaz A* algoritmus is, de h1 alkalmazsa ms csompontok
kifejtst is okozhatja. Ebbl addan mindig jobb nagyobb rtkeket ad heurisztikus fggvnyeket
alkalmazni, amg nem becsljk tl a valdi kltsget, s a heurisztika szmtsi ideje nem tlsgosan nagy.
2.2. Elfogadhat heurisztikus fggvnyek kitallsa

Lttuk, hogy mind h1 (a nem a helykn lv lapkk szma), mind pedig h2 (Manhattan-tvolsg) egsz j
heurisztikus fggvnyek a 8-as kirakjtk problmjhoz, s hogy h2 jobbnak bizonyult. De hogyan is llt el a
h2? Egy szmtgp szmra vajon lehetsges-e mechanikusan megalkotni ilyen heurisztikus fggvnyeket?
A h1 s h2 a 8-as kirakjtkban a fennmarad t hosszt becslik, azonban a jtk egyszerstett vltozatnl a
tkletesen pontos thossz rtkt adjk meg. Ha a jtk szablyait gy mdostannk, hogy egy lapka brhov
thelyezhet legyen, nemcsak a szomszdos mezkre, akkor h1 pontosan megadn a legrvidebb megoldshoz
vezet lpsek szmt. Hasonlan, ha egy lapkt brmelyik szomszdos mezre tmozgathatnnk, mg akkor is,
ha az adott mezn mr van egy msik lapka, akkor h2 megadn a legrvidebb megolds pontos lpsszmt.
Fontos
Az olyan problmt, amelyben az opertorokra kevesebb megktst tesznk, mint az eredeti
problmban, relaxlt problmnak (relaxed problem) nevezzk. A relaxlt problma optimlis
megoldsnak kltsge egy elfogadhat heurisztika az eredeti problmra. A heurisztika elfogadhat,
mert az eredeti problma optimlis megoldsa definciszeren megoldsa a relaxlt problmnak is, s
gy legalbb olyan kltsges, mint a relaxlt problma optimlis megoldsa. Mivel a szmtott
heurisztika a relaxlt problmra egy pontos kltsg, teljestenie kell a hromszg egyenltlensget, s
ebbl kifolylag konzisztens 1.2. szakasz - A* keress: a teljes becslt tkltsg minimalizlsa
rszben.
95

mdszerek
Amennyiben a problma megfogalmazsa formlis nyelven adott, akkor a relaxlt problmkat automatikusan is
el lehet lltani.6 Pldul ha a 8-as kirakjtk opertorait az albbi mdon rjuk le:
Egy lapka az A mezrl a B mezre mozgathat,
ha A s B szomszdosak, s a B mez res
egy vagy tbb felttel trlsvel hrom relaxlt problmt hozhatunk ltre:
a. Egy lapka az A mezrl a B mezre mozgathat, ha A s B szomszdosak.
b. Egy lapka az A mezrl a B mezre mozgathat, ha a B mez res.
c. Egy lapka az A mezrl a B mezre mozgathat.
Az (a)-bl a h2 (Manhattan-tvolsg) vezethet le. A magyarzat az, hogy h2 helyes eredmnyt adna, ha minden
lapkt sorra elmozgatnnk a sajt clhelyre. A (b)-bl szrmaztatott heurisztikval a 4.9. feladatban
foglalkozunk. A (c)-bl a h1 (a nem a helykn lv lapkk szma) vezethet le, mert ez lenne a helyes
eredmny, ha a lapkkat a clpozcijukba egy lpsben el lehetne mozgatni. Vegyk szre, hogy lnyeges,
hogy e mdszer ltal generlt relaxlt problmkat lnyegben keress nlkl meg lehet oldani, mert a relaxlt
szablyok a problma 8 fggetlen rszproblmv trtn dekompozcijt teszik lehetv. Ha a relaxlt
problmt nehz megoldani, akkor a kapcsolatos heurisztikus rtkek szmtsa drgnak fog bizonyulni.7
Az ABSOLVER nev program a relaxlt problma mdszer s ms egyb mdszer alkalmazsval (Prieditis,
1993), kpes a problma defincijbl automatikusan heurisztikus fggvnyeket generlni. Az ABSOLVER egy,
az eddigieknl jobb heurisztikus fggvnyt hozott ltre a 8-as kirakjtk megoldsra, s ez a program tallta
meg az els hasznlhat heurisztikus fggvnyt a hres Rubik-kocka kirakshoz.
Az j heurisztikus fggvnyek ellltsnak egyik problmja, hogy felettbb nehz felismerni a
nyilvnvalan legjobb heurisztikus fggvnyt. Ha egy problmhoz adottak a h1, ..., hm elfogadhat
heurisztikus fggvnyek, s egyik sem dominlja a tbbit, melyiket kell vlasztanunk? Mint az majd kiderl,
nem kell vlasztanunk. Az albbi formulval a lehet legjobbat kaphatjuk meg:
h(n) = max{h1(n), ..., hm(n)}
Az gy megkonstrult sszetett heurisztikus fggvny mindig azt a fggvnyt hasznlja, amelyik az adott
csompontra a legpontosabb. Mivel az alkotelemknt felhasznlt heurisztikus fggvnyek mind elfogadhatk,
ezrt h is elfogadhat. Ugyancsak knny bizonytani, hogy h konzisztens. Tovbb h dominlja az sszes,
benne alkotelemknt felhasznlt heurisztikus fggvnyt.
Elfogadhat heurisztikus fggvnyeket szrmaztathatunk az adott problma rszproblmjnak (subproblem)
megoldsi kltsgbl is. A 4.9. bra pldul a 4.7. brn lthat 8-as kirakjtk egy rszproblmjt mutatja.
A rszproblma lnyege az 1, 2, 3 s 4 lapkk helykre val mozgatsa. Vilgos, hogy e rszproblma optimlis
megoldsnak kltsge a teljes problma megoldsnak kltsgt alulrl korltozza. Bizonyos esetekben ez a
fggvny a Manhattan-tvolsgnl sokkal pontosabb.
A mintaadatbzisok (pattern databases) htterben hzd tlet az, hogy troljuk el az egyes
rszproblmaesetekhez tartoz pontos megoldsi kltsgeket ebben az esetben a ngy lapka s az res hely
minden konfigurcijhoz (jegyezzk meg, hogy a msik ngy lapka helye a rszproblma megoldsa
szempontjbl kzmbs, mozgsaik azonban a kltsgbe bele fognak szmtani). A problma teljes
llapothoz tartoz elfogadhat hAB heurisztikus fggvnyt ezek utn keress kzben gy szmtjuk ki, hogy a
megfelel rszproblma-konfigurcit az adatbzisbl kikeressk. Maga az adatbzis gy lett megtervezve,
hogy a clllapottl visszafel keresve minden j minta kltsgt feljegyeztk. Ennek a keressnek a kltsge a
sok egyms utn jv problmaesetre kivettve amortizldik.
A 8. s a 11. fejezetben erre a feladatra alkalmas formlis nyelveket runk le. Manipullhat formlis lersokkal a relaxlt problmk
konstrulsa automatizlhat. Egyelre termszetes nyelvet hasznlunk.
7
Vegyk szre, hogy a tkletes heurisztikt knnyszerrel megkaphatnnk, ha megengednnk h-nak a teljes szlessgi keress lefuttatst
stikban. A heurisztikus fggvny pontossga s szmtsi ideje kztt gy kompromisszumot kell ktni.
6
96

mdszerek
4.9. bra - A 4.7. brn lthat 8-as kirakjtk eset egy rszproblmja. A feladat az,
hogy 1, 2, 3 s 4 lapkt a helyes pozcikba juttassuk el, nem trdve azzal, hogy a tbbi
lapkval mi fog trtnni.
Az 1-2-3-4 lapka megvlasztsa nyilvn tetszleges, az adatbzist az 5-6-7-8 s a 2-4-6-8 stb. lapkkra is meg
tudnnk konstrulni. Minden adatbzis egy elfogadhat heurisztikt szolgltat, s ahogy korbban
elmagyarztuk, ezen heurisztikkat kombinlni lehet, maximlis rtkkkel szmolva. Egy ilyen tpus
kombinlt heurisztika a Manhattan-tvolsgnl sokkal pontosabb. A 15-s kirakjtk vletlenszeren generlt
egyedeire a kifejtett csompontok szmt egy 1000-es tnyezvel lehet cskkenteni.
El lehetne tndni azon, hogy az 1-2-3-4 s az 5-6-7-8 adatbzisokbl kinyert heurisztikus fggvnyeket nem
lehetne-e sszeadni, mivel gy tnik, a kt rszproblmban nincs feds. A vlasz nemleges, mert egy adott
llapotban az 1-2-3-4 s az 5-6-7-8 rszproblmk megoldsai majdnem biztosan osztoznak kzs lpseken
igen valszntlen, hogy az 1-2-3-4 lapkkat a helykre el lehet mozdtani, anlkl hogy az 5-6-7-8-hoz ne
nylnnk hozz, s fordtva. s mi lenne, ha ezeket a lpseket nem is szmolnk be? Azaz nem az 1-2-3-4
rszproblma teljes kltsgvel szmolnnk, hanem csak az 1-2-3-4 lapka lpseit vennnk figyelembe. Knny
ilyenkor rjnni, hogy a kt kltsg sszege mg mindig a teljes problma megoldsi kltsgnek egy als
korltja. Ez a diszjunkt mintaadatbzis (disjoint pattern database) htterben hzd tlet. Az ilyen
adatbzisok hasznlatval lehetsgess vlik a 15-s kirakjtkot milliszekundumok alatt megoldani, a
Manhattan-tvolsghoz kpest a generlt csompontok szma egy 10 000-es tnyezvel kisebb. A 24-es
kirakjtk esetn kb. egymillis gyorstst lehet elrni.
A diszjunkt mintaadatbzisok jl mkdnek a csszlapka-jtkok esetn, mert a problmt gy lehet
felbontani, hogy egy-egy lps csak egy rszproblmra van hatssal, hiszen egyszerre csak egy lapkt
mozgatunk. A Rubik-kocka problmra ilyen bontst elvgezni nem lehet, mert minden mozgs 8, 9 vagy 26
kockt rint. Nem tudjuk egyelre, hogy az ilyen problmk szmra a diszjunkt mintaadatbzisokat hogyan
lehetne definilni.
2.3. A heurisztikus fggvny tanulsa tapasztalatbl

A h(n) heurisztikus fggvnytl elvrjuk, hogy az n csompontbeli llapottl kezdve becslje a megolds
kltsgt. Hogyan lenne kpes egy gens egy ilyen fggvny megalkotsra? Egy megoldst az elbbi rszben
adtunk meg ami nevezetesen egy olyan relaxlt problmnak a kitallsa, amihez egy optimlis megoldst
knny tallni. Egy msik megolds a tapasztalatbl val tanuls. A tapasztalaton itt azt rtjk, hogy nagyon
sok 8-as kirakjtkot kell megoldani. A 8-as jtk minden optimlis megoldsa egy pldt jelent, amibl h(n)
tanulhat. Minden plda egy, a megoldsi ton elhelyezked llapotbl s az onnan szmtott vals megoldsi
kltsgbl ll. Ilyen pldk alapjn induktv tanulsi algoritmus (inductive learning) segtsgvel egy olyan
h(n) fggvnyt konstrulhatunk, amely (szerencsvel) kpes megjsolni a megolds kltsgt a keress sorn
felbukkan ms llapotok esetn is. Ennek mdszertant, legyenek ezek neurlis hlk, dntsi fk vagy ms
mdszerek, a 18. fejezet mutatja be (a 21. fejezetben lert megerstses tanuls szintn alkalmazhat).
97

mdszerek
Az induktv tanulsi mdszerek akkor mkdnek a legjobban, ha nem az llapot nyers lerst, hanem inkbb az
llapot kirtkelshez relevns jellemzket (feature) kapjk bemenetknt. A nem a helyn lv lapkk
szma jellemz segtsg lehet, ha az aktulis llapotnak a cltl vett tvolsgt szeretnnk megjsolni. Hvjuk
ezt a jellemzt x1(n)-nek. Vehetnnk a 8-as kirakjtk 100 vletlenszeren generlt konfigurcijt, s
gyjthetnnk statisztikkat a megolds aktulis kltsgrl. Esetleg azt tallnnk, hogy ha x1(n) rtke 5, akkor a
megolds tlagos kltsge 14 s gy tovbb. Ilyen adatok birtokban x1(n) rtkbl jsolni lehetne h(n) rtkt.
Persze tbb jellemzt is lehetne hasznlni. Egy msik jellemz, x2(n) lehetne pldul azon szomszdos
lapkaprok szma, melyek a clllapotban is szomszdosak. Hogyan lehetne x1(n)-et s x2(n)-et
sszekombinlni h(n) jslsa rdekben? Egy szoksos tlet a lineris kombinci hasznlata:
h(n) = c1x1(n) + c2x2(n)
A c1 s c2 konstansokat mdostani lehet, hogy a megoldsi kltsg aktulis adataira legjobban illeszkedjenek.
Felttelezheten c1-nek pozitvnak, c2-nek pedig negatvnak kellene lennie.
3. Loklis keres algoritmusok s optimalizcis

problmk
Az eddig ltott keressi algoritmusokat arra terveztk, hogy a keressi tereket szisztematikusan trjk fel. A
szisztematikussgot gy rik el, hogy egy vagy tbb utat tartanak a memriban, s azt is feljegyzik, hogy
minden pontban az t mentn melyik alternatvt vizsgltk mr meg, s melyiket nem. Amikor megtalljk a
clt, a clhoz vezet t egyben a problma megoldst is jelenti.
Szmos problmban azonban a clhoz vezet t rdektelen. A 8-kirlyn problmban pldul 2.1. szakasz Jtkproblmk a kirlynk vgleges konfigurcija szmt, s nem az a sorrend, ahogy az jabb kirlynket
felhelyezzk. A problmk ezen osztlyba olyan fontos problmk tartoznak, mint a VLSI-tervezs, a gyri
gpelrendezs, a gyrtsi mveletek temezse, az automatikus programozs, a hrkzlsi hlzatok
optimalizlsa, a gpkocsitvonal-tervezs s a portflimenedzsment.
Ha a clhoz vezet t nem szmt, ms algoritmusokra is gondolhatunk, amelyek az utakkal egyltaln nem
foglalkoznak. A loklis keressi algoritmusok (local search) csak egy aktulis llapotot (current state)
vesznek figyelembe (a tbbszrs utak helyett) s ltalban csak ennek az llapotnak a szomszdjaira lpnek
tovbb. A keress ltal kvetett utat tipikusan nem is troljk el. Br a loklis keressi algoritmusok nem
szisztematikusak, kt kulcsfontossg elnyk van: (1) igen kevs ltalban konstans mennyisg memrit
hasznlnak, s (2) sokszor nagy vagy vgtelen (folytonos) keressi trben elfogadhat megoldst produklnak
ott, ahol a szisztematikus algoritmusok alkalmatlanok lennnek.
A cl megfogalmazsn tl, a loklis keressi algoritmusok a tisztn optimalizcis problmk (optimization
problems) megoldsban is hasznosak, ahol a cl a legjobb llapot megtallsa egy clfggvny (objective
function) rtelmben. Szmos optimalizcis problma nem felel meg a 3. fejezetben bevezetett standard
keressi modellnek. gy pldul a termszet elllt egy clfggvnyt a szaporodsi fitnesst amit gy tnik, a
darwini evolci igyekszik optimalizlni, e problma esetn nem beszlhetnk azonban sem cltesztrl, sem
tkltsgrl.
A loklis keress megrtshez igen hasznosnak talljuk az llapottrfelsznt (state space landscape) (mint
amilyen a 4.10. brn ltszik). A felsznnek van pontja (amit az llapot definil) s magassga (amit a
heurisztikus vagy a clfggvny rtke hatroz meg). Ha a magassg a kltsggel arnyos, akkor a cl a
legalacsonyabban fekv vlgyet a globlis minimumot megtallni. Ha a magassg a clfggvnynek felel
meg, akkor a cl a legmagasabb cscs a globlis maximum megtallsa (az egyikrl a msikra eljel
vltsval knnyen ttrhetnk). A loklis keress ezt a felletet vizsglja. Egy teljes loklis keress mindig
tall megoldst, ha az egyltaln ltezik. Egy optimlis algoritmus mindig megtallja a globlis minimumot
vagy maximumot.
4.10. bra - Egy egydimenzis llapottrfelszn, ahol a magassg a clfggvnynek felel

meg. A cl a globlis maximum megtallsa. A hegymsz keress az aktulis llapotot
mdostja a javuls irnyban, ahogy ezt a nyl is mutatja. A klnbz topografikus
jellemzkkel a szvegben foglalkozunk.
98

mdszerek
3.1. Hegymsz keress

A hegymsz keressi algoritmust (hill-climbing) a 4.11. bra mutatja. A keress egyszeren csak egy ciklus,
ami mindig javul rtkek fel azaz felfel lp. Az algoritmus megll, amikor felr a cscsra, ahol nincsenek
mr magasabb rtk szomszdjai. Az algoritmus nem tart nyilvn keressi ft, ezrt a csompontot ler
adatszerkezetnek csak az llapotot s a clfggvny rtkt kell nyilvntartania. A hegymsz keress nem nz
elre az aktulis llapotot kzvetlenl kvet szomszdokon tl. Egy kicsit arra hasonlt, mintha a Mount
Everest cscst szeretnnk megtallni sr kdben s emlkezetkihagysban szenvedve.
4.11. bra - A hegymsz keressi algoritmus (a legmeredekebb emelked (steepest

ascent) vltozat) a loklis keress alapvet mdszere. Minden lpsben az aktulis
csompontot a legjobb szomszdjval cserli le, ami ebben a vltozatban a legmagasabb
RTK- szomszdot jelenti. Ha azonban egy h heurisztikus kltsgbecslst alkalmazunk,
ez akkor a legalacsonyabb h-j szomszd lenne.
A hegymsz keress illusztrlsra a 2.1. szakasz - Jtkproblmk bevezetett 8-kirlyn problmt (8queens problem) fogjuk hasznlni. A loklis keressi algoritmusok tipikusan a teljes llapot lerssal
(complete-state formulation) lnek, ahol minden llapotban a tbln 8 kirlyn helyezkedik el, oszloponknt
egy. Az llapottmenet-fggvny minden olyan lehetsges llapotot visszaad, amit gy kapunk, hogy egy
kirlynt ugyanabban az oszlopban egy msik mezre mozgatunk (gy minden llapotnak 8 7 = 56 kvetje
van). A h heurisztikus fggvny a kzvetlenl vagy kzvetett mdon egymst tmad kirlynprok szma. E
fggvny globlis minimuma 0, ami csak a tkletes megoldsban rhet el. A 4.12. (a) bra egy h = 17 rtk
99

mdszerek
llapotot mutat. Az bra az sszes kvetnek az rtkt is mutatja, ahol a legjobb kvet h = 12. Ha a legjobbl
tbb van, a hegymsz algoritmusok tipikusan vletlen mdon sorsolnak bellk egyet.
A hegymsz keresst nha moh loklis keressnek (greedy local search) is hvjk, mert egy j kvet
llapotot megragad, anlkl hogy megfontoln, merre lenne rdemes tovbbmenni. Br a mohsg a ht fbn
egyike, a moh algoritmusok sokszor igen jl teljestenek. A hegymszs gyakran igen gyorsan halad a
megolds fel, mert egy rossz llapoton ltalban nagyon knny javtani. gy pldul a 4.12. (a) brn lthat
llapotbl indulva t lps elegend, hogy elrjk a 4.12. (b) brn lthat llapotot, melynek kltsge h = 1, s
amely igen kzel van egy megoldshoz. Sajnos a hegymszs gyakran megakad az albbi problmk miatt:
4.12. bra - (a) A 8-kirlyn problma h = 17 heurisztikus kltsgbecsls llapota, ahol

minden olyan kvet llapot h rtkt megadtuk, amikor a kirlynt a sajt oszlopban
mozgatjuk. A legjobb lpseket bejelltk. (b) Egy loklis minimum a 8-kirlyn
trben. Az llapot h rtke egysgnyi, azonban minden kvetnek magasabb a kltsge.
Loklis maximumok: egy loklis maximum egy cscs, amely minden szomszdjnl magasabb, de a
globlis maximumnl alacsonyabb. A hegymsz algoritmusok, ha egy loklis maximum kzelbe rnek,
knytelenek a cscs fel tartani, ott azonban nincs tovbb, s megakadnak. Ezt a problmt sematikusan a
4.10. bra mutatja. Konkrtabban, a 4.12. (b) bra llapota egy tnyleges loklis maximum (azaz egy loklis
minimum a h kltsgre nzve), brmely kirlyn brmilyen lpse csak ront a helyzeten.
Hegygerincek (ridges): egy hegygerincet a 4.13. bra mutat. A hegygerinc egy olyan loklis maximum
sorozatot eredmnyez, ahol egy moh algoritmusnak igen nehz naviglnia.
Fennsk (plateaux): a fennsk az llapottrnek egy olyan terlete, ahol a kirtkel fggvny gyakorlatilag
lapos. Lehet ez egy lapos loklis maximum, amelybl nincs tovbb felfel, de lehet egy vll (shoulder),
ahonnan mg lehetsges az elrehalads (lsd 4.10. bra). Egy hegymsz keress kptelen lehet arra, hogy
egy fennskrl megtallja a kivezet utat.
Az algoritmus minden esetben elr egy pontot, ahonnan mr nem tud tovbblpni. Egy vletlen mdon generlt
8-kirlyn llapotbl kiindulva a legmeredekebb emelked hegymsz algoritmus az esetek 86%-ban
megakad, a problmaeseteknek csupn 14%-t oldja meg. Az algoritmus gyorsan dolgozik, tlagosan 4 lpst
tesz, amikor sikerrel jr, s 3 lpst, amikor megakad. Ez egyltaln nem is olyan rossz a 8 8 17 milli llapotot
tartalmaz llapottrben.
A 4.11. bra algoritmusa megll, ha fennskra r, ahol a legjobb kvetnek is ugyanaz az rtke, mint az aktulis
llapotnak. Nem lenne-e j tlet mozgsban maradni oldallpseket (sideways move) megengedve annak
remnyben, hogy a fennsk igazbl egy vll, mint amilyent a 4.10. bra mutat? A vlasz ltalban igen,
azonban vatosan kell eljrnunk. Ha oldallpseket mindig megengednk, akkor ha felfel halads nincs,
vgtelen hurokba kerlnk minden olyan esetben, amikor az algoritmus olyan lapos loklis maximumot tall,
100

mdszerek
amely nem vll. Gyakori megolds az egyms utn alkalmazott oldallpsek szmt korltozni. A 8-kirlyn
problmban pldul megengednk 100 egyms utni oldallpst. Ezzel a hegymszs ltal megoldott esetek
arnyt 14%-rl 94%-ra emelhetjk. A sikernek azonban ra van. tlagosan 21 lps hossz minden sikerrel
megoldott eset, s 64 lps hossz a kudarc.
4.13. bra - Annak illusztrlsa, hogy a gerinc mirt jelent nehzsget a hegymsz
keress szmra. Az llapotok rcshlzata (stt krk) r van illesztve a balrl jobbra
emelked gerincre, egy olyan loklis maximum sorozatot eredmnyezve, ahol a
maximumok nincsenek kzvetlen mdon egymssal sszekapcsolva. Minden egyes
loklis maximumbl az sszes lehetsges cselekvs a lejtn lefel mutat.
A hegymsz algoritmus szmos vltozatt fejlesztettk ki. A sztochasztikus hegymsz keress (stochastic
hill climbing) a felfel mutat irnyokbl vletlen mdon vlaszt. A vlaszts valsznsge a felfel mutat
irny meredeksgvel vltozhat. Az algoritmus ltalban a legmeredekebb emelked mdszernl lassabban
konvergl, egyes llapotfelszneken azonban kpes jobb megoldst tallni. Az elsnek-vlasztott hegymsz
algoritmus (first-choice hill climbing) sztochasztikus hegymsz keresst hasznl, a kvetket vletlen mdon
addig generlva, amg az az aktulis llapotnl nem lesz jobb. Ez j stratgia, ha egy llapotnak sok (pldul
tbb ezer) kvetje van. Ennek vizsglatra invitl a 4.16. feladat.
Az eddig lert hegymsz algoritmusok nem teljesek sokszor kudarcot vallanak a cl megkeressben, mert
egy loklis maximumba beragadnak. A vletlen jraindts hegymszs (random-restart hill-climbing) az
101

mdszerek
ismert kzmonds szerint jr el: Ha nem megy elsre, csinld jra. Vletlenl generlt kiindul llapotokbl 8
hegymsz keresst vgez, amg clba nem r. Az algoritmus 1-hez tart valsznsggel teljes annl a trivilis
oknl fogva, hogy elbb-utbb a clllapotot kezdllapotknt is fogja generlni. Ha minden hegymsz keress
p valsznsggel sikeres, a vletlen jraindtsok vrhat szma 1/p. A 8-kirlyn problmban, ha
oldallpseket nem engednk meg, p 0,14, gy a cl megtallshoz tlagosan 7 itercira van szksg (6
kudarc s 1 siker). A vrhat lpsszm a sikeres iterci kltsge valamint (1 p)/p-szerese a kudarc
kltsgnek, durvn 22 lps. Ha oldallpseket is engednk, tlagosan 1/0,94 1,06 itercira s (1 21) +
(0,06/0,94) 64 25 lpsre van szksg. A 8-kirlyn problma szmra a vletlen jraindts hegymsz
keress valban hatkony. Mg hrommilli kirlyn mellett is ez a megkzelts egy percen bell tall
megoldst.9
A hegymszs sikere nagyban fgg az llapottr felsznnek alakjtl: ha azon csak nhny loklis maximum
s fennsk tallhat, akkor a vletlen jraindts hegymsz algoritmus gyorsan meg fog tallni egy j
megoldst. Egy valdi problmhoz egy olyan felszn tartozik, ami leginkbb egy sndiszncsaldhoz hasonlt
egy sima padln, ahol minden sndiszntske cscst egy tovbbi miniatr sndiszn lakja s gy a
vgtelensgig. Ha a problma NP-teljes, akkor minden bizonnyal exponencilisan sok loklis maximummal
rendelkezik, melyekben beragadhatunk. Ennek ellenre ltalban kisszm jraindts utn mr elfogadhatan
j megoldst lehet tallni.
3.2. Szimullt lehts

A hegymsz keress, amely soha nem indul lefel a lejtn a kisebb rtk (vagy nagyobb kltsg) llapotok
fel, garantltan nem teljes, mert egy loklis maximumban beragadhat. Ezzel ellenttben a tisztn vletlen
vndorls azaz a kvetk halmazbl egyenletesen vletlen mdon sorsolt kvetre val tlps teljes, de
hihetetlenl nem hatkony. rtelmes dolognak tnik a hegymszs s a vletlen vndorls valamifle tvzse,
hogy mind a teljessget, mind a hatkonysgot megtarthassuk. Egy ilyen algoritmus a szimullt lehts
(simulated annealing). A kohszatban a lehts (annealing) a fmeket, illetve az veget edz, kemnyt
folyamat, amikor azokat magas hmrskletre felmelegtjk, majd fokozatosan lehtjk, lehetv tve, hogy az
anyag alacsony energij kristlyos llapotba kerljn. Hogy a szimullt lehtst megrtsk, a hegymszsrl
trjnk t a gradiens leereszkedsre (gradient descent) (azaz a kltsg minimalizlsra), s kpzeljk el,
hogy az a feladatunk, hogy egy hepehups asztalon egy pingponglabdt a legmlyebb szakadkba juttassunk. Ha
a labdt gurulni hagyjuk, egy loklis minimumba kerl. Ha a felletet megrzzuk, a labdt kiugraszthatjuk a
loklis minimumbl. A trkk az, hogy olyan ersen kell megrzni a felletet, hogy a labda a loklis
minimumbl kikerljn, de mgsem annyira ersen, hogy a labda a globlis minimumbl kiugorjon. A szimullt
lehts olyan megolds, hogy elszr ersen rzunk (azaz egy magas hmrskleten), majd fokozatosan
cskkentjk a rzs intenzitst (vagyis cskkentjk a hmrskletet).
A szimullt lehts legbels ciklusa (lsd 4.14. bra) nagyon hasonlt a hegymszshoz. A legjobb lps
megttele helyett azonban egy vletlen lpst tesz. Ha a lps javtja a helyzetet, akkor az mindig vgrehajtsra
kerl. Ellenkez esetben az algoritmus a lpst csak valamilyen 1-nl kisebb valsznsggel teszi meg. A
valsznsg exponencilisan cskken a lps rosszasgval azzal a E mennyisggel, amivel a kirtkel
fggvny rtke romlott. A valsznsg a T hmrsklet cskkensvel is cskken. A rossz lpsek az
indulsnl T magasabb rtkeinl valsznbbek, T cskkensvel egyre valszntlenebb vlnak. Be lehet
bizonytani, hogy ha a htsi karakterisztika T rtkeit kellen lassan cskkenti, az algoritmus 1-hez tart
valsznsggel a globlis minimumban kt ki.
4.14. bra - A szimullt lehts keressi algoritmus. A hegymsz keress egy olyan
vltozata, ahol lefel tart lpsek is megengedettek. A lefel tart lpseket a lehtsi
terv elejn inkbb, az id mlsval egyre kevsb fogadjuk el. A lehtsi terv, mint az
eljrs bemenete, a T rtkeit mint idfggvnyt adja meg.
Vletlen llapotot generlni egy implicit mdon specifiklt llapottrben azonban nmagban is igen kemny problma lehet.
Luby (Luby s trsai, 1993) azt bizonytotta be, hogy egyes esetekben az a legjobb, ha a vletlen keresst egy konkrt rgztett idtartam
letelte utn jraindtjuk, s ez sokkal hatkonyabb lehet annl, mintha mindegyik keresst a vgtelensgig hagynnk folytatdni. Az
oldallpsek kitiltsa vagy a szmuk korltozsa ennek egy pldja.
8
9
102

mdszerek
A szimullt lehtsi algoritmust elszr elterjedten VLSI-elrendezsi problmk megoldsra hasznltk a 80as vek elejn. Azta szles krben alkalmazzk ipari termels temezsre s egyb nagy volumen
optimalizcis feladatokra. A 4.16. feladat a szimullt lehtsi algoritmus s a vletlen jraindts hegymsz
algoritmus teljestmnynek sszehasonltst kri az n-kirlyn problmn.
3.3. Loklis nyalb keress

Mindssze egyetlen csompontot tartani a memriban elgg extrm reaglsnak tnik a memriakorlt
problmjra. A loklis nyalb keress (local beam search) algoritmus10 nem egy, hanem k llapotot kvet
nyomon. Az algoritmus k vletlen mdon generlt llapottal indul. Minden lpsben a k llapot mindegyiknek
sszes kvetit kifejti. Ha ezek valamelyike egy cl, az algoritmus lell. Egybknt a teljes listbl kivlasztja a
legjobb k kvett, s ezt az eljrst ismtli.
Fontos
Els ltsra a k llapot loklis nyalb keress nem tnik msnak, mint a k vletlen jraindts parallel
futtatsa a szekvencilis futtats helyett. Valjban a kt algoritmus igen klnbz. A vletlen
jraindts algoritmusban minden keressi folyamat a tbbitl fggetlenl fut le. A loklis nyalb
keressi algoritmusban a k parallel keressi szl megosztja az informcit. Pldul ha az egyik llapot
szmos j kvett generl, s a tbbi k 1 mind rosszabbat, akkor az eredmny az, mintha az els
llapot megzenn a tbbinek: Gyertek t ide, itt zldebb a f! Az algoritmus gyorsan abbahagyja az
eredmnytelen keresseket, s az erforrsait oda viszi, ahol a legnagyobb elrehalads rzkelhet.
A loklis nyalb keress a legegyszerbb formjban a k llapot kztti vltozatossg hinytl szenvedhet. Az
llapotok gyorsan koncentrldhatnak a tr egy kicsi rszben, amitl a keress csak kevssel lesz tbb, mint a
hegymsz keress egy drga vltozata. A problmt a sztochasztikus nyalb keress (stochastic beam
search) segti megoldani, ami analg a sztochasztikus hegymsz keresssel. A k legjobb kvet megvlasztsa
helyett az algoritmus a k kvett vletlen mdon vlasztja ki, ahol egy adott kvet kivlasztsnak
valsznsge az llapot rtknek nvekv fggvnye. A sztochasztikus nyalbkeress egy kicsit hasonlt a
termszetes kivlasztdsra, ahol egy llapot (szervezet) kveti (utdjai) a kvetkez genercit az llapot
rtke (fitness) alapjn npestik be.
3.4. Genetikus algoritmusok

A genetikus algoritmus, GA (genetic algorithm) a sztochasztikus nyalb keress egy olyan varinsa, ahol a
kvet llapotokat nem egy llapot mdostsval, hanem kt szl llapot sszekombinlsval lltjuk el. A
termszetes kivlasztds analgija itt is ugyanaz, mint a sztochasztikus nyalb keress esetn, azzal a
klnbsggel, hogy most az utdltrehozsnak a szexulis s nem az aszexulis mechanizmusrl van sz.
10
A loklis nyalb keress a nyalbkeress (beam search) algoritmus egy adaptcija, ami viszont egy talap algoritmus.
103

mdszerek
A nyalbkeresshez hasonlan, a GA is k vletlen mdon generlt llapottal indul, aminek populci
(population) a neve. Minden llapotot vagy egyedet (individual) egy vges bc fltt rtelmezett fzr
kpvisel leggyakrabban egy 0-bl s 1-ekbl ll fzr. A 8-kirlyn llapotnak pldul a 8 kirlyn
pozcijt kell specifiklnia, mindegyik egy 8 ngyzetet tartalmaz oszlopban, gy 8 log 28 = 24 bitre van
szksg. Az llapotot 8 szmjeggyel is lehetne jellemezni, melyek mindegyike az 1 8 tartomnybl val
(ksbb ltni fogjuk, hogy a kt kdols viselkedse eltr). A 4.15. (a) bra egy olyan populcit mutat be,
mely ngy, a 8-kirlyn llapotait reprezentl 8 szmjegyes fzrbl ll.
4.15. bra - A genetikus algoritmus. Az (a)-beli kezdeti populcit (b)-ben fitnessfggvny alapjn rangsoroljuk, aminek eredmnyt a (c)-ben lthat reprodukl
prok adjk. A ltrehozott utdok a (d)-ben lthatk, melyekre mg hat a mutci (e).
Az llapotok kvetkez genercijnak az ellltsa a 4.15. (a)(e) brn kvethet. A (b)-ben minden
llapotot a kirtkel fggvny vagy (GA-terminolgiban) a fitness-fggvny (fitness function) alapjn
rangsoroljuk. Egy fitness-fggvnynek a jobb llapotokra magasabb rtkeket kell visszaadnia, gy a 8-kirlyn
problmban fitness-fggvnyknt a nemtmad kirlynprok szmt hasznljuk. Ennek rtke egy megolds
esetn 28. A ngy llapot rtke 24, 23, 20 s 11. A genetikus algoritmus e konkrt vltozatban a szaporodsra
val kivlaszts valsznsge a fitness-rtkkel egyenesen arnyos. A szzalkos mennyisgeket a fitnessrtkek mellett adjuk meg.
A (c)-ben kt prt vletlenszeren vlasztunk ki reprodukcira, a (b)-beli valsznsgeknek megfelelen.
Figyeljk meg, hogy egy egyedet ktszer, egy msikat viszont egyszer sem vlasztottunk ki.11 Minden
keresztezend prnl egy keresztezsi (crossover) pontot vlasztunk a fzrbeli pozcik kzl. A 4.15. brn a
keresztezdsi pontok az els prnl a harmadik szmjegy utn, a msodik prnl az tdik szmjegy utn
vannak.12
4.16. bra - A 4.15. (c) brn lthat els kt szlnek s a 4.15. (d) brn lthat kt
utdnak megfelel 8-kirlyn llapotok. Az rnyalt oszlopok a keresztezds sorn
elvesznek, a nem rnyalt oszlopok megmaradnak.
A (d)-ben az utdok generlst ltjuk, a szl fzreket a keresztezsi pontoknl keresztezve. Az els pr els
gyereke pldul az els szltl az els hrom szmjegyt kapja s a msik szltl a tbbit. A msodik gyerek
Ennek a kivlasztsi szablynak szmos vltozata van. Kimutathat, hogy a selejtezs (culling) mdszere, ahol egy kszb al es minden
egyedet eldobunk, a vletlen vltozatnl gyorsabban konvergl (Baum s trsai, 1995).
12
Itt szmt a kdols. Ha a 8 szmjegyes kdols helyett a 24 bites kdolst hasznljuk, a keresztezdsi pontnak 2/3-ad eslye van, hogy
egy szmjegy belsejbe essen, ami ennek a szmjegynek lnyegben tetszleges mutcijt eredmnyezi.
11
104

mdszerek
pedig az els hrom szmjegyt a msodik szltl kapja s az els szltl a tbbit. Az ennl a reprodukcis
lpsnl szerepl 8-kirlyn llapotokat a 4.16. bra mutatja. A plda azt a tnyt szemllteti, hogy ha a kt szl
llapot igen klnbz, a keresztezs eredmnye mindkt szltl igen tvol eshet. Sokszor elfordul, hogy a
keressi folyamat elejn a populci elgg vltozatos, s a keresztezs (a szimullt lehtshez hasonlan) nagy
lptekkel halad elre, majd ksbb, ha az egyedek tbbsge mr igen hasonlt egymsra, kisebb lpsek jnnek.
Vgl az (e)-ben a fzr minden elemt valamilyen kis fggetlen valsznsggel mutcinak (mutation)
vetjk al. Az els, a harmadik s az tdik utdban egy-egy szmjegyet mutltunk. A 8-kirlyn problmban
ez annak felel meg, hogy egy kirlynt vletlen mdon kivlasztunk, s egy, az oszlopban szintn vletlen
mdon kivlasztott mezre thelyeznk. Az ezeket a lpseket implementl algoritmust a 4.17. bra mutatja.
4.17. bra - Egy genetikus algoritmus. Ez az algoritmus ugyanaz, mint amelyet a 4.15.
brn mutattunk, egy kivtellel. Ebben a jobban elterjedt vltozatban a kt szl
reprodukcija nem kt, hanem csak egy utdot hoz ltre.
A sztochasztikus nyalb keresshez hasonlan a genetikus algoritmus is kombinlja a hegymsz tendencit, a

vletlen feltrst s a parallel keressi szlak kztti informcicsert. A genetikus algoritmus elsdleges
elnye, ha ilyen egyltaln ltezik, a keresztezstl szrmazik. Matematikailag azonban kimutathat, hogy ha
kezdetben a genetikus kd pozciit vletlen sorrendben permutljuk, a keresztezs semmilyen elnyt nem
jelent. Intuitve, az elny a keresztezs azon kpessgbl jn, hogy a keresztezs kpes hasznos funkcikat
teljest nagy betblokkok kombinlsra, melyek egymstl fggetlenl alakultak ki, emelve ezzel a keressnl
a granulltsg szintjt. Az els hrom kirlynt pldul a 2, 4 s 6 pozciba helyezve (ahol nem tmadjk
egymst), egy hasznos blokk alakul ki, amit ms blokkokkal kombinlva egy megolds nyerhet.
Ennek mkdst a genetikus algoritmusok elmlete a sma (schema) fogalommal magyarzza. A sma egy
olyan rszfzr, amelyben bizonyos pozcik nem specifikltak. gy pldul a 246***** sma az sszes olyan
8-kirlyn llapotot lerja, ahol az els hrom kirlyn a 2., 4. s 6. pozciban van. A smra illeszked
fzrek, mint pldul a 24613578 fzr, a sma pldnyai (instances). Kimutathat, hogy ha egy sma
pldnyainak tlagos fitness-rtke az tlag felett van, akkor idvel a populciban a smhoz tartoz pldnyok
szma nni fog. Vilgos, hogy ez a hats elenysz lesz, ha a szomszdos biteknek semmi kzk egymshoz,
mert kevs olyan tmr blokk lesz, ami konzisztens mdon elnyt fog jelenteni. A genetikus algoritmus a
legjobban akkor mkdik, ha a smk a megolds rtelmes komponenseinek felelnek meg. Ha pldul a fzr
egy antenna reprezentcija, akkor a smk kpviselhetik az antenna egyes komponenseit, pldul a
reflektorokat s a deflektorokat. Egy j komponensnek nagy valsznsggel klnbz konstrukcik
105

mdszerek
sokasgban is jnak kell lennie. Ez azt sugallja, hogy a genetikus algoritmusok sikeres alkalmazsa a
reprezentci gondos kialaktst ignyli.
A gyakorlatban a genetikus algoritmusoknak nagy hatsa volt az olyan optimalizcis problmkra, mint
pldul az ramkr elrendezstervezs s a gyrtsor-temezs. Jelenleg nem vilgos, hogy a genetikus
algoritmusok vonzereje a hatkonysguk vagy az evolci elmletben rejl eszttikus eredetk eredmnye. Sok
munka van mg htra, hogy azokat a krlmnyeket azonostsuk, amikor a genetikus algoritmusok igazn jl
teljestenek.
4. Loklis keress folytonos terekben

A 2. fejezetben bemutattuk a diszkrt s a folytonos krnyezet kztti klnbsget, arra is rmutatva, hogy a
valsvilg-beli krnyezetek tbbsge folytonos. Az eddig lert algoritmusok kzl azonban egyik sem kpes a
folytonos llapottereket kezelni. Az llapottmenet-fggvny az esetek tbbsgben vgtelen szm llapottal
trne vissza! Ez a rszfejezet egy nagyon rvid bevezett ad nhny olyan loklis keressi technikhoz, melyek
folytonos trben keresik az optimlis megoldst. A tma irodalma risi. Sok alaptechnika mr a 17. szzadban
napvilgot ltott, Newton s Leibniz kalkulusnak kifejldst13 kveten. E technikkhoz a knyvben tbb
helyen fogunk folyamodni, belertve a tanulsrl, a ltsrl s a robotikrl szl fejezeteket. Rviden,
mindenhol, ahol a vals vilggal foglalkozunk.
Fontos
Evolci s keress
Az evolci elmlett Charles Darwin az On the Origin of Species by Means of Natural Selection c.
mvben (Darwin, 1859) dolgozta ki. A kzponti gondolat igen egyszer: a reprodukciban
(mutciknt ismert) eltrsek fordulnak el, s azokat a kvetkez genercik nagyjbl a
reprodukcis fitnessre gyakorolt hatsuk arnyban megtartjk.
A darwini elmletet annak ismerete nlkl dolgoztk ki, hogy a szervezetek tulajdonsgai hogyan
rkldnek s mdosulnak. E folyamatokat irnyt valsznsgi trvnyeket els zben Gregor
Mendel szerzetes azonostotta (Mendel, 1866), aki borsval ksrletezett, sajt szavaival mestersges
megtermkenytst alkalmazva. Sokkal ksbb Watson s Crick feltrtk a DNS-molekula szerkezett
s bcjt AGTC (adenin, guanin, timin, citozin) (Watson s Crick, 1953). A standard modellben a
betszekvenciban vltozs pontmutci s keresztezs rvn ll be (ahol az utd DNS-e a szli
DNS-ek hossz rszleteinek kombinlsval jn ltre).
A loklis keressi algoritmus analgijrl rtunk mr. A sztochasztikus nyalb keress s az evolci
kztti alapvet klnbsg a szexulis reprodukci hasznlata, ahol az utdokat tbb egyedbl hozzuk
ltre, s nem csak egybl. Az evolci tnyleges mechanizmusai azonban sokkal gazdagabbak, mint
amit a genetikus algoritmus lehetv tenne. A mutcihoz pldul az tfordts, a duplikls, a DNS
nagy szegmenseinek a mozgatsa is hozztartozik. Egyes vrusok a DNS-t az egyik szervezetbl veszik
s egy msik szervezetbe beillesztik. Vannak tvihet gnek is, amelyek nem tesznek mst, csak egy
gnllomnyon bell tbbezerszer lemsoljk magukat. Olyan gnek is vannak, amelyek a potencilis
reprodukcis partnereknl ezeket a gneket nem tartalmaz sejteket megmrgezik, nvelve gy a
sokszorozds eslyt. A legfontosabb tny, hogy maguk a gnek tartalmazzk annak a
mechanizmusnak a kdjt, amely ltal a gnllomny reprodukldik, s egy szervezett alakul t. A
genetikus algoritmusokban ezek a mechanizmusok klnll programok rszei, vagyis a manipullt
fzrekben nem jelennek meg.
A darwini evolci igencsak kis hatkonysg mechanizmusnak tnhet, hiszen vakon ltrehozott kb.
1045 szervezetet, anlkl hogy a keressi heurisztikin egy csppet is javtott volna. Darwin eltt 50
vvel a klnben neves francia termszettuds Jean Lamarck egy olyan evolci elmletet javasolt
(Lamarck, 1809), ahol egy szervezet az lete sorn, adaptcija rvn megszerzett tulajdonsgokat is
kpes az utdoknak tadni. Az ilyen mechanizmus hatkony lenne, de gy tnik, a termszetben nem
fordul el. Sokkal ksbb James Baldwin ltszlag hasonl elmlettel llt el (Baldwin, 1896), hogy a
szervezet lete alatt megtanult viselkeds nvelhetn az evolci sebessgt. Lamarck elmletvel
ellenttben a Baldwin-elmlet a darwini evolcival teljesen konzisztens, hiszen alapja egy szelekcis
13
A tbbvltozs kalkulus s a vektoraritmetika ismerete hasznos ennek a rszfejezetnek az olvasshoz.
106

mdszerek
nyoms, amely olyan egyedekre hat, amelyek loklis optimumokat talltak a genetikus felptsk ltal
engedlyezett viselkedsek kztt. A korszer szmtgpes szimulcik altmasztjk a Baldwineffektus vals voltt, feltve, hogy a kznsges evolci olyan szervezeteket kpes kialaktani,
amelyeknl a bels hatkonysgi mrtk a sajt tnyleges fitness-rtkkkel valahogy korrell.
Kezdjk egy egyszer pldval. Tegyk fel, hogy valahol Romniban hrom j replteret szeretnnk
ltesteni gy, hogy a vrosoknak (lsd 3.2. bra) a hozzjuk legkzelebb es repltrhez val
tvolsgsszegk legyen minimlis. Az llapotteret ekkor a replterek (x1, y1), (x2, y2) s (x3, y3) koordinti
definiljk. Ez egy hatdimenzis tr, azt is mondhatjuk, hogy az llapotokat hat vltoz (variable) definilja
(ltalnossgban az llapotokat a vltozk n-dimenzis x vektora definilja). Ebben a trben val mozgs a
trkpen a replterek thelyezsnek felel meg. Az f(x1, y1, x2, y2, x3, y3) clfggvnyt, ha a legkzelebbi
vrosok mr megvannak, brmely llapot esetre viszonylag knny kiszmtani, ltalnossgban azonban igen
nehz ezt lerni.
A folytonossg problmi egyszeren elkerlhetk, ha az egyes llapotok szomszdsgt diszkretizljuk.
Egyszerre pldul csak egy replteret, csak x vagy y irnyban egy rgztett lpssel lehet thelyezni. Ez 6
vltoz mellett, minden llapotban 12 kvett eredmnyez. Ehhez az elbb megismert brmelyik loklis
keressi algoritmust alkalmazhatjuk. A sztochasztikus hegymsz keresst s a szimullt lehtst kzvetlenl, a
tr diszkretizlsa nlkl is alkalmazhatjuk. Ezek az algoritmusok a kvetket vletlen mdon vlasztjk ki,
amelyek megvalstsa hosszsg vletlen vektorok generlsval lehetsges.
Sok mdszer tallhat, melyek megksrlik a felszn gradienst (gradient) felhasznlni a maximum
megtallshoz. A clfggvny gradiense egy f vektor, amely a legmeredekebb emelked nagysgt s irnyt
adja meg. Problmnk esetn:
Egyes esetekben a maximumot a f = 0 egyenlet megoldsval tallhatjuk meg (ezt megtehetnnk pldul
akkor, ha csak egy replteret helyeznnk el; a megolds az sszes vros koordintinak szmtani kzepe lesz).
Sok esetben azonban ezt az egyenletet zrt alakban nem lehet megoldani. Hrom repltr esetn pldul a
gradiens kifejezse attl fgg, hogy az adott llapotban mely vrosok esnek legkzelebb az egyes
replterekhez. Ez azt jelenti, hogy a gradienst loklisan, s nem globlisan tudjuk szmtani. Ennek ellenre
mg mindig folyamodhatunk a legmeredekebb emelked hegymszshoz a pillanatnyi llapotot az
x x + (x)
kplettel frisstve, ahol egy kis konstans. Ms esetekben nem biztos, hogy a clfggvny differencilhat
formban ll a rendelkezsnkre pldul a replterek helyeit egy konkrt esetben esetleg egy nagymret
gazdasgi szimulcis szoftvercsomag futtatsval hatrozhatjuk meg. Az ilyen esetekben az n. empirikus
gradiens (empirical gradient) meghatrozshoz folyamodhatunk, minden koordinta mentn egy kis pozitv
s negatv vltozshoz kiszmtva a vlaszt. Az empirikus gradiens keress ugyanaz, mint a legmeredekebb
emelked hegymszs az llapottr diszkretizlt vltozatban.
Az egy kis konstans kifejezs mgtt az -t bellt mdszerek risi vlasztka rejlik. Az alapproblma az,
hogyha tl kicsi, tlsgosan sok lpsre van szksg. Ha tl nagy, a keress knnyszerrel tll a
maximumon. A vonalkeress (line search) mdszere e problmt gy ksrli megoldani, hogy a pillanatnyi
gradiens irnyt ltalban ismtelt megduplzsval meghosszabbtja, amg f nem kezd jra cskkeni. Az a
pont, ahol ez megtrtnik, lesz az j aktulis llapot.
Sok problma esetn a legjobb algoritmus a j reg NewtonRaphson-mdszer (Newton, 1671; Raphson,
1690). Ez a gykhelykeress, azaz a g(x) = 0 alak egyenletek megoldsnak ltalnos mdszere. Mkdsnek
alapja az x gyk j becslsnek szmtsa a Newton-formula szerint:
x x g(x)/g(x)
f maximumnak vagy minimumnak megkeresshez olyan x-et kell megkeresni, amire a gradiens nulla (azaz
f (x) = 0). A Newton-formula g(x)-e gy f (x) lesz, s a frisstsi egyenlete az albbi mtrixos formban
107

mdszerek
rhat fel, ahol Hf (x) a msodik derivltak mtrixa (Hesse-mtrix), melynek Hij elemeit a 2f /xixj msodik
derivltak adjk meg. Mivel a msodik derivltak mtrixnak n2 eleme van, a NewtonRaphson-mdszer
sokdimenzis terekben drga lesz, ami szmos kzelt mdszer kifejlesztshez vezetett.
A loklis keressi mdszerek szmra a loklis maximumok, a gerincek s a fennskok folytonos terekben
ugyangy gondot jelentenek, mint diszkrt terekben. A vletlen jraindts s a szimullt lehts alkalmazhat
(itt is), s gyakran segt. A sokdimenzis folytonos terek azonban tereblyes helyek, ahol knny elveszni.
Az utols tma, amivel rdemes fut ismeretsget ktni a korltozott optimalizls (constrained
optimization). Egy optimalizlsi problma korltozott, ha a megoldsnak minden vltozjnak rtkeire nzve
valamilyen kemny korltozst kell teljestenie. A replteres problmnkban korltozhatjuk pldul a
helyszneket, hogy a replterek Romnin bell s szrazfldn (nem tavak kzepn) helyezkedjenek el. A
korltozott optimalizls nehzsgei a korltozsok s a clfggvny termszetn mlnak. A legismertebb
kategrit a lineris programozsi (linear programming) problmk jelentik, ahol a korltozsok lineris
egyenltlensgek, amelyek egy konvex rgit kpeznek, s ahol a clfggvny szintn lineris. A lineris
programozsi problmkat vltoz szmban polinomilis idben meg lehet oldani. Olyan problmkat is
tanulmnyoztak, ahol ms tpus korltozsok s clfggvnyek fordulnak el. Ilyen problmk pldul a
kvadratikus programozsi feladat, a msodrend knikus programozsi feladat stb.
5. Online keres gensek s ismeretlen krnyezetek

Eddig olyan gensekre sszpontostottunk, amelyek offline keressi (offline search) algoritmusokat
hasznlnak. Egy teljes megoldst szmtanak ki mieltt a vals vilgba beteszik a lbukat (lsd 3.1. bra), majd
a megoldst az rzkelsek megvizsglsa nlkl vgrehajtjk. Ezzel ellenttben az online keres (online
search)14 gensek mkdsben a szmts s a vgrehajts tlapoldik (interleaving): elszr vgrehajtanak
egy cselekvst, majd megfigyelik a krnyezetket s kiszmtjk a kvetkez cselekvst. Az online keress j
tlet a dinamikus s a szemidinamikus krnyezetekben olyan krnyezetekben, ahol bntetik a semmittevst s
a tlsgosan hossz szmtsokat. Az online keress mg jobb tlet sztochasztikus krnyezetekben.
ltalnossgban egy offline keressnek egy exponencilisan nagy, minden lehetsges trtnst figyelembe vev
eshetsgi tervvel kellene elllnia, mg az online keress csak az aktulisan megtrtnteket veszi figyelembe.
Pldul ajnlatos, ha egy sakkoz gens elbb megteszi az els lpst s csak ezutn szmtja ki a jtszma teljes
lefolyst.
Az online keress szksgszer tlet a felfedezsi problmk (exploration problems) esetn, ahol az llapotok
s a cselekvsek ismeretlenek az gens szmra. Egy ilyen tudatlan llapotban az gensnek a cselekvseit
ksrletekknt kell hasznlnia, hogy megllapthassa, mit tegyen a kvetkez pillanatban, gy a szmts s a
cselekvs szksgszeren tlapoldik.
Az online keress kanonikus pldja egy j pletben elhelyezett robot, melynek fel kell trnia a krnyezett,
hogy felpthesse azt a trkpet, amit majd arra hasznl, hogy A-tl B-ig eljusson. A labirintusbl val
meneklsi mdszerek az kori hsk elengedhetetlen kpessge szintn pldi az online keressnek. A
trbeli feltrs azonban nem az egyedli formja a feltrsnak. Gondoljunk egy jszlttre: sok lehetsges
cselekvssel rendelkezik, de egyiknek sem tudja a hatst, s csak nhny kzvetlenl elrhet llapotrl van
tudomsa. Az, ahogy egy jszltt fokozatosan felfedezi, hogy hogyan mkdik a vilg, rszben egy online
keressi folyamat.
5.1. Online keressi problmk

Egy online keressi problmt egy tisztn csak szmtst vgz folyamat helyett csak egy olyan gens tud
megoldani, amely a cselekvseit vgrehajtja. Felttelezzk, hogy az gens csak az albbiakat tudja:
CSELEKVSEK (s), amely az s llapotban engedlyezett cselekvsek listjt adja vissza,
A lpskltsg c(s, a, s) fggvny jegyezzk meg, hogy ez nem hasznlhat addig, amg az gens nem
tudja, hogy s az eredmny, s
CL-TESZT (s).
Az online kifejezst srn hasznljk a szmtgpes tudomnyokban olyan folyamatok megjellsre, amelyek a bemeneti adatokat
azok bejvetelekor dolgozzk fel, s nem vrnak addig, amg a teljes bemeneti adathalmaz hozzfrhetv vlik.
14
108

mdszerek
Vegyk szre azt is, hogy az gens nem kpes egy llapot kvetit mskppen elrni, mint gy, hogy az adott
llapotban az sszes cselekvst kiprblja. A 4.18. brn lthat labirintusproblmban az gens nem tudja,
hogy a Fel cselekvs (1,1)-bl elvezeti t az (1,2)-be, valamint ennek vgeztvel, hogy a Le cselekvs
visszaviszi t az (1,1)-be. Bizonyos alkalmazsokban a tudatlansg ezen szintje mrskelhet egy felfedez
robot ismerheti a mozgsi cselekvseinek mechanizmust, s csak az akadlyok holltrl nincs tudomsa.
Felttelezzk, hogy az gens mindig kpes felismerni azt az llapotot, amiben mr jrt, s hogy a cselekvsei
determinisztikusak (e kt felttelezstl a 17. fejezetben eltekintnk). Vgl az gens hozzfrhet egy h(s)
elfogadhat heuriszitikus fggvnyhez, amely a pillanatnyi llapot s a clllapot tvolsgt becsli. A 4.18.
brn pldul az gens tudhatja a clpozcijt, s kpes lehet a Manhattan-tvolsgi heurisztika hasznlatra.
Az gens clja tipikusan az, hogy elrjen egy clllapotot, s ekzben minimalizlja a kltsgeket (egy msik
lehetsges cl egyszeren az egsz krnyezet feltrsa). A kltsg az gens ltal megtett tnyleges t teljes
kltsge. Szoksos ezt a kltsget azzal az tkltsggel sszehasonltani, amit az gens kvetne, ha az egsz
keressi teret elre ismern azaz az aktulis legrvidebb ttal (vagy a legrvidebb teljes feltrssal). Az online
algoritmusok nyelvn ezt kompetitv arnynak (competitive ratio) nevezzk, s azt szeretnnk, ha ez a lehet
legkisebb lenne.
Br ez sszer kvetelmnynek tnik, knny beltni, hogy egyes esetekben a legjobb elrhet kompetitv arny
a vgtelen. Ha pldul bizonyos cselekvsek irreverzbilisek, az online keress esetleg egy olyan zskutcba
kerlhet, ahonnan a clllapot nem elrhet.
4.18. bra - Egy egyszer labirintusproblma. Az gens S-nl kezd s C-t kell elrnie, a
krnyezetrl azonban semmit sem tud.
109

mdszerek
4.19. bra - (a) Kt olyan llapottr, amely az online keres genst egy zskutcba
viheti. (b) Egy ktdimenzis krnyezet, amely arra ksztetheti az online keres genst,
hogy a clhoz legkevsb hatkony utat kvesse. Akrmit is vlaszt az gens, az ellensg
eltorlaszolja az tjt egy msik hossz, vkony fallal gy, hogy a kvetett t sokkal
hosszabb lesz, mint a legjobb lehetsges t.
110

mdszerek
Fontos
Lehet, hogy az esetleg megfogalmazst nem tallja kellen meggyznek vgl is ltezhetne olyan
algoritmus, amely feltrs kzben a zskutckban nem kt ki. A kijelentsnk pontosabban
megfogalmazva az, hogy nincs olyan algoritmus, amely brmilyen llapottrben el tudn kerlni a
zskutckat. Nzzk meg kzelebbrl a 4.19. (a) bra kt zskutcs llapottert. Egy olyan online
keres algoritmus szmra, amely az S s az A llapotokat mr megltogatta, a kt llapottr azonosnak
tnik, teht mindkettben ugyanolyan dntshez kell folyamodnia. Ez az ellensg rv (adversary
argument) egy pldja el tudunk kpzelni egy ellensget, amely mdostja az llapotteret, mikzben
az gens feltrja azt, s a clokat s a zskutckat tetszs szerint trendezi.
A zskutck a robotfeltrs igazi nehzsgei lpcshzak, felhajtk, szakadkok s a termszetes terep minden
fajtja irreverzbilis cselekvsekhez vezethetnek. Hogy elrehaladhassunk, egyszeren felttelezzk, hogy az
llapottr biztonsgosan feltrhat (safely explorable) bizonyos clllapotok az sszes elrhet llapotbl
elrhetk. A visszafordthat cselekvseket tartalmaz llapottereket, mint amilyenek a labirintusok s a
kirakjtkok, irnytatlan grfoknak lehet tekinteni, s nyilvn biztonsgosan feltrhatk.
Mg a biztonsgosan feltrhat krnyezetekben sem biztosthat korltozott kompetitv arny, ha lteznek
benne korltlan kltsg utak. Ezt knny kimutatni irreverzbilis cselekvseket tartalmaz krnyezetekben, de
igaz marad visszafordthat cselekvsek esetn is, ahogy ezt a 4.19. (b) bra mutatja. Emiatt ltalnos, hogy az
online algoritmusok hatkonysgt nem a legseklyebben fekv clllapot mlysgvel, hanem az egsz
llapottrrel jellemezzk.
5.2. Online keres gensek

Egy online keres gens minden cselekvs utn rzkeli, hogy milyen llapotba kerlt. Ebbl az informcibl
felptheti krnyezetnek trkpt. Az aktulis trkp alapjn eldnti, hogy legkzelebb merre menjen. Ez az
tlapold tervkszts s vgrehajts azt jelenti, hogy az online keres algoritmusok egszen msok, mint az
elbb megismert offline algoritmusok. Az olyan offline algoritmusok, mint pldul az A* kpesek egy
csompont kvetit kiszmtani a tr egy rszben, majd azonnal egy msik csomponttal foglalkozni a tr egy
msik rszben, mert a csompontkifejts inkbb szimullt, mint valdi cselekvseket takar. Egy online
algoritmus ezzel szemben csak azt a csompontot fejtheti ki, amelyben fizikailag tartzkodik. Hogy a kvetkez
csompont kifejtse rdekben a fa keresztl-kasul val vgignzst elkerljk, clszerbbnek tnik a
csompontokat loklis sorrendben kifejteni. Ezzel a tulajdonsggal ppen a mlysgi keress rendelkezik, mert
(a visszalpst kivve) a kvetkez kifejtend csompont az elbb kifejtett csompont gyereke.
4.20. bra - Egy mlysgi feltrst hasznl online keres gens. Az gens csak a
ktirny keressi terekben alkalmazhat.
111

mdszerek
Egy online mlysgi keres genst a 4.20. bra mutat. Ez az gens a trkpt egy eredmny[a, s] tblzatban
trolja, amely az s llapotban vgrehajtott a cselekvs hatsra elll llapotot tartalmazza. Ha az aktulis
llapotban marad mg ki nem hasznlt cselekvs, az gens ezzel prblkozik. A nehzsg akkor ll be, ha az
gens egy llapotban mr minden cselekvst kiprblt. Offline mlysgi keressnl ezt az llapotot a sorbl
egyszeren elhagyjuk. Online keressnl az gensnek fizikailag kell visszalpnie. A mlysgi keressnl ez azt
jelenti, hogy abba az llapotba kell visszakerlnie, amelybl az gens legutbb belpett a vizsglt llapotba. Ezt
egy olyan tblzat karbantartsval lehet megoldani, amely minden llapot szmra azokat az sllapotokat
listzza, melyekhez az gens mg nem lpett vissza. A keress teljes, ha az gens a viszszalphet llapotokbl
kifut.
Azt javasoljuk, hogy az olvas kvesse vgig az ONLINE-MLYSGI-GENS elrehaladst a 4.18. brn
mutatott labirintus esetn. Knny szrevenni, hogy az gens a trben minden csatlakozst legrosszabb esetben
pontosan ktszer fog vgigpsztzni. Feltrs esetben ez optimlis eredmny. Egy cl megtallsa
szempontjbl azonban az gens kompetitv arnya tetszlegesen rossz lehet, ha egy hossz trra indul, holott
a cl a kezdeti llapot kzvetlen szomszdsgban fekszik. Ezt a problmt az iteratvan mlyl algoritmus
online vltozata oldja meg. Egy homogn ft eredmnyez krnyezetben egy ilyen gens kompetitv arnya egy
kis konstans.
Az alkalmazott visszalpsi mdszer miatt az ONLINE-MLYSGI-GENS csak olyan terekben mkdik, ahol
minden cselekvs visszafordthat. Az ltalnos llapotterekhez egy kicsit bonyolultabb algoritmusok lteznek,
azonban ezek egyike sem garantl korltozott kompetitv arnyt.
5.3. Online loklis keress

A mlysgi keresshez hasonlan a hegymsz keressre (hill-climbing search) jellemz a csompontkifejts
lokalitsa. A tny az, hogy mivel a hegymsz keress a memriban csak egy aktulis llapotot tart, ez az
algoritmus mr egy online keressi algoritmus! A legegyszerbb formjban azonban nemigen hasznlatos,
mert az genst a loklis maximumokban bennrekedve hagyja, ahonnan nincs hov mennie. Radsul a vletlen
jraindtst sem lehet hasznlni, mert az gens nem kpes magt egy j llapotba thelyezni.
A vletlen jraindtsok helyett, a krnyezet feltrsra a vletlen vndorlst (random walk) hasznlhatjuk. A
vletlen vndorls egyszeren vletlen mdon vlaszt egy lehetsges cselekvst az aktulis llapotban.
Elsbbsget lvezhetnek az eddig mg nem kiprblt cselekvsek. Knny bebizonytani, hogy a vletlen
112

mdszerek
vndorls valamikor megtallja a clt, vagy feltrja a krnyezetet, feltve, hogy a tr vges. 15 Msfell a
folyamat igen lass lehet. A 4.21. bra egy olyan krnyezetet mutat, ahol a vletlen vndorlsnak
exponencilisan sok lpsre van szksge a cl megtallshoz, mert minden lpsnl a visszafel halads
ktszer olyan valszn, mint az elrehalads. A plda persze kitallt, azonban sok olyan vals llapottr ltezik,
melynek topolgija ilyenfajta csapdt llt a vletlen vndorls el.
4.21. bra - Egy krnyezet, amelyben a vletlen vndorlsnak exponencilisan sok

lpsre lesz szksge, hogy a clt megtallja
Sokkal hatkonyabb megkzelts, ha a hegymszst nem vletlen mkdssel, hanem memrival ltjuk el. Az
alaptlet az, hogy a cl minden megltogatott llapotbl val elrsi kltsgnek egy H(s) aktulis legjobb
becslst eltroljuk. H(s) a h(s) heurisztikus becslsbl indul, s ahogy az gens egyre tbb tapasztalatot gyjt
az llapottrben, rtke folyamatosan frissl. A 4.22. bra egy egyszer pldt mutat egydimenzis llapottrre.
Az (a)-ban gy tnik, az gens egy lapos loklis minimumban, az rnyalt llapotban bennragadt. Ahelyett hogy
ott maradna, ahol volt, az gensnek kvetnie kellene azt az utat, ami a szomszdos llapotok aktulis
kltsgbecslsei alapjn a clhoz vezet legjobb tnak nz ki. Annak becslt kltsge, hogy a clt az s
szomszdon keresztl rjk el az s elrsnek kltsge, valamint a cl elrsnek becslt kltsge az s
llapotbl, azaz c(s, a, s) + H(s). A pldban kt cselekvs van, 1 + 9 s 1 + 2 becslt kltsgekkel,
legclszerbbnek tnik teht jobbra menni. Most vilgos, hogy az rnykolt llapot kltsgnek becslsre a
kettes rtk tl optimista. Mivel a legjobb cselekvs kltsge 1, s ez elvezet a cltl legalbb ktlpsnyire lv
llapothoz, az rnyalt llapot legalbb hromlpsnyire van a cltl. A H fggvnyt gy ennek megfelelen
frissteni kell, ahogy a 4.22. (b) bra mutatja. Ezt a folyamatot folytatva az gens mg ktszer mozdul el elrehtra, a H-t frisstve s a loklis minimumot lapostva, amg jobbra nem tud elmeneklni.
4.22. bra - A TRTA* t itercija egydimenzis llapottrben. Minden llapotot H(s)sel, a cl elrsnek aktulis becslsvel, s minden lt a lpskltsggel cmkztnk. Az
rnyalt llapot az gens helyt jelli meg, s a frisstett rtkeket minden iterciban
bekarikztuk.
A vgtelen eset sokkal trkksebb. A vletlen vndorls teljes egy- s ktdimenzis vgtelen rcsban, de nem a hromdimenzisban!
Ebben az utbbi esetben annak a valsznsge, hogy a vndorls valamikorra a kiindulpontba visszatr, csak 0,3405 krli. Egy ltalnos
bevezet: (Hughes, 1995).
15
113

mdszerek
Ezt a smt, aminek tanul vals idej A* (TRTA*) a neve, a 4.23. brn lthat gens implementlja. Ez az
gens az ONLINE-MLYSGI-GENS-hez hasonlan az eredmny tblzat felhasznlsval krnyezetnek egy
trkpt pti meg. Felfrissti az ppen elhagyott llapot kltsgbecslst, s az aktulis kltsgbecsls szerint a
ltszlag legjobb cselekvst vlasztja. Fontos rszlet, hogy az s llapotban mg ki nem prblt cselekvsekrl
mindig azt ttelezi fel, hogy a lehet legkisebb h(s) kltsggel kzvetlenl a clhoz vezetnek. Ez a
bizonytalansg melletti optimizmus (optimism under uncertainty) felbtortja az genst, hogy j, felteheten
gymlcsz utakat trjon fel.
Egy TRTA* gens garantltan megtallja a clt akrmilyen vges, biztonsgosan feltrhat krnyezetben. Az A*gal ellenttben azonban nem teljes a vgtelen llapotterekben vannak olyan esetek, amikor az genst
remnytelenl flre lehet vezetni. Egy n llapotbl ll krnyezetet legrosszabb esetben O(n2) lpsben tr fel,
de sokszor jval hatkonyabb ennl. A TRTA* gens a cselekvskivlasztsi s a frisstsi szablyokkal
klnbz mdon definilhat online gensek nagy csaldjnak egy partikulris tagja. Ezzel a csalddal, melyet
eredetileg sztochasztikus krnyezetekhez talltak ki, a 21. fejezetben foglalkozunk.
5.4. Tanuls online keress sorn

Az online keres gens kezdeti tudatlansga tbb lehetsget teremt a tanulsra. Elszr az gens a
krnyezetnek trkpt pontosabban minden llapotban minden cselekvs kimenetelt tanulja meg
egyszeren regisztrlva a tapasztalatt. (Jegyezzk meg, hogy a determinisztikus krnyezet felttelezse azt
jelenti, hogy egy-egy cselekvs esetn egy tapasztals elg lesz.) Msodszor a loklisan keres gensek loklis
frisstsi szablyok segtsgvel pontosabb rtkbecslsekre tesznek szert minden llapot esetn, ahogy ez a
TRTA*-nl trtnt. Ltni fogjuk a 21. fejezetben, hogy ezek a frisstsek elbb-utbb minden llapot egzakt
rtkhez fognak konverglni, feltve, hogy az gens az llapotteret megfelel mdon trja fel. Amikor az
egzakt rtkek mr ismertek, az optimlis dntsek egyszeren a legmagasabb rtk utdllapotba val
tmenetekkel hozhatk meg ilyenkor teht a tiszta hegymszs az optimlis stratgia.
4.23. bra - A TRTA* gens a cselekvseit a krnyez llapotok rtkei alapjn

vlasztja ki, mely az llapotokat az llapottrben mozogva folyamatosan frissti
Ha elfogadta a javaslatunkat, hogy az ONLINE-MLYSGI-GENS viselkedst kvesse nyomon a 4.18. brn

bemutatott krnyezetben, szreveheti, hogy az gens nem valami lngsz. gy pldul, miutn mr ltta, hogy a
Fel cselekvs az (1,1)-bl az (1,2)-be visz, mg mindig fogalma sincs, hogy a Le cselekvs az (1, 1)-be visz
vissza, vagy hogy a Fel cselekvs a (2,1)-bl a (2,2)-be, a (2,2)-bl a (2,3)-ba stb. visz. ltalnossgban azt
szeretnnk, ha az gensnk megtanuln, hogy a Fel nveli az y koordintt, hacsak egy fal nincs tban, a Le a
koordintt cskkenti stb. Hogy ez megtrtnhessen, kt dologra van szksg. Elszr az ilyen ltalnos
114

mdszerek
szablyokhoz szksgnk van egy formlis s manipullhat reprezentcira. Az informcit egyelre az
llapottmenet-fggvny nev fekete dobozba rejtettk. Ezzel a tmval a III. rsz foglalkozik. Msodszor
szksgnk van egy algoritmusra, amely kpes a megfelel szablyokat az gens ltal megtett konkrt
megfigyelsekbl konstrulni. Ezzel pedig a 18. fejezet foglalkozik.
6. sszefoglals
Ebben a fejezetben ttekintettk, hogyan lehet a keressi kltsget heurisztikus fggvnyek hasznlatval
cskkenteni. Megvizsgltunk szmos heurisztikus fggvnyt alkalmaz algoritmust, s lttuk, hogy az
optimalitsrt a keressi kltsg viszonylatban drga rat kell fizetnnk, mg akkor is, ha sikerlt j
heurisztikus fggvnyt tallnunk.
A legjobbat-elszr keress (best-first search) egyszeren egy olyan GRF-KERESS, ahol elszr
(valamilyen mrtk szerint) a legkisebb kltsg, mg ki nem fejtett csompontokat fejtjk ki. A legjobbatelszr algoritmusok tipikusan egy h(n) heurisztikus (heuristics) fggvnyt hasznlnak, amely a cl
kltsgt becsli az n llapotbl kiindulva.
A moh legjobbat-elszr keress (greedy best-first search) a minimlis h(n) rtk csompontokat fejti
ki. Nem optimlis, azonban sokszor hatkony.
Az A* keressi algoritmus (A* search) a minimlis f(n) = g(n) + h(n) rtk csompontokat fejti ki. Az A*
algoritmus teljes s optimlis, feltve, hogy garantlni tudjuk, hogy h(n) elfogadhat (a FA-KERESS szmra)
vagy konzisztens (a GRF-KERESS szmra). Az A* algoritmus trkomplexitsa mg mindig elfogadhatatlan.
A heurisztikus algoritmusok hatkonysga a heurisztikus fggvny minsgtl fgg. J heurisztikus
fggvnyek kszthetk nha pldul a problma defincijnak relaxlsval, a mintaadatbzis
rszproblmihoz tartoz megoldsi kltsgek elzetes kiszmtsval vagy a problmaosztlyon bell a
tapasztalatbl val tanulssal.
Az RLEK (RBFS) s az EMA* (SMA*) robusztus, optimlis keressi algoritmusok, amelyek korltozott
mennyisg memrit hasznlnak. Ha elegend id ll rendelkezsre, olyan problmkat is megoldanak,
melyeket az A* algoritmus nem kpes megoldani, mert elfogy a memrija.
A loklis keressi mdszerek, mint pldul a hegymsz keress (hill climbing) teljes llapotlersokkal
dolgoznak, de a memriban csak csekly szm csompontot tartanak. Tbb sztochasztikus algoritmust is
kifejlesztettek, belertve a szimullt lehtst (simulated annealing), amely megfelel htsi karakterisztika
esetn optimlis megoldssal tr vissza. A folytonos trbeli problmkra szmos loklis keressi algoritmus is
hasznlhat.
A genetikus algoritmus (genetic algorithm) egy olyan sztochasztikus hegymsz keress, ahol az llapotok
nagy populcijval dolgozunk. j llapotokat mutcival (mutation) s a populcibeli llapotprokat
sszekombinl keresztezssel (crossover) generlunk.
Felfedezsi problmkrl (exploration problems) akkor van sz, ha az gensnek fogalma sincs krnyezete
llapotairl s cselekvseirl. Biztonsgosan feltrhat krnyezetek esetn az online keres (online search)
gens felptheti a krnyezetek trkpt, s megtallja a clt, ha az ltezik. A heurisztikus becslsek
tapasztalat alapjn trtn frisstse hatkony mdszer, az gens loklis minimumokbl val
kimeneklshez.

A heurisztikus informci alkalmazsa a problmamegoldsban Simon s Newell egy korai rsban jelenik
meg (Simon s Newell, 1958). A heurisztikus keress frzis s a clhoz val tvolsgot becsl heurisztikus
fggvny hasznlata azonban valamivel ksbbrl szrmazik (Newell s Ernst, 1965; Lin, 1965). Doran s
Michie rszletesen, ksrleti alapon tanulmnyoztk a heurisztikus keressi algoritmusok alkalmazst szmos
problmra, nagy hangslyt fektetve a 8-as s a 15-s kirakjtkra (Doran s Michie, 1966). Habr Doran s
Michie a heurisztikus keressnl elmleti thossz s behatols (az thossz s az eddig vizsglt csompontok
szmnak arnya) elemzseket vgzett, gy tnik, figyelmen kvl hagytk az aktulis thossz nyjtotta
informcit. A heurisztikus keressbe az aktulis thosszt is beszmt A* algoritmust Hart, Nilsson s Raphael
115

mdszerek
dolgoztk ki (Hart s trsai, 1968), nhny ksbbi korrekcival (Hart s trsai, 1972). Az A * algoritmus
optimlis hatkonysgt Dechter s Pearl (Dechter s Pearl, 1985) mutattk ki.
Az eredeti A* algoritmust ismertet cikk bevezette a heurisztikus fggvnyek konzisztencijnak felttelt. A
heurisztikk monotonitsi felttelt a konzisztenciafelttelnek egy egyszerbb felttellel val kivltsra Pohl
vezette be (Pohl, 1977), de Pearl megmutatta, hogy a kt felttel ekvivalens (Pearl, 1984). Az A*-ot megelz
szmos algoritmus hasznlta a nyitott s a zrt listval ekvivalens fogalmakat. Ezek kz tartozik a szlessgi, a
mlysgi s az egyenletes kltsg keress (Bellman, 1957; Dijkstra, 1959). Klnskppen Bellman munkja
mutatta meg az additv tkltsg fontossgt az optimalizlsi problmk egyszerstsben.
Pohl elsknt tanulmnyozta az A* algoritmus heurisztikahibja s idignye kztti sszefggst (Pohl, 1970;
1977). Annak bizonytsa, hogy az A* algoritmus lineris idben fut, ha a heurisztikus fggvny hibja egy
lland korlt alatt van, Pohl s Gaschnig cikkben tallhat (Pohl, 1977; Gaschnig, 1979). Pearl ennek az
eredmnynek egy ersebb megfogalmazst adta meg, amely megengedte a hiba logaritmikus nvekedst
(Pearl, 1984). A heurisztikus keress hatkonysgt jellemz effektv elgazsi tnyez mrtket Nilsson
javasolta (Nilsson, 1971).
Az A* algoritmusnak rengeteg vltozata ltezik. Pohl javasolta a dinamikus slyozsi technikt, amelyben
kirtkel fggvnyknt az A*-ban hasznlatos egyszer f(n) = g(n) + h(n) helyett az aktulis thossz s a
heurisztikus fggvny albbi slyozott sszege szerepel: fw(n) = wgg(n) + whh(n) (Pohl, 1973). Ez a mdszer a
keress elrehaladtval dinamikusan lltja a wg s wh slyokat. Kimutathat, hogy a Pohl-fle algoritmus elfogadhat azaz garantlja a megolds megtallst az optimlis megoldshoz kpest 1 + tnyezn bell. Itt
az algoritmus egy bemeneti paramtere. Ugyanilyen tulajdonsg a A* algoritmus (Pearl, 1984), amely a
perem minden olyan csompontjt kivlaszthatja, amely a perembeli minimlis f-kltsg csomponttl fkltsgben (1 + )-os tnyezn bell van. A kivlasztst gy lehet lebonyoltani, hogy ez a keressi kltsgeket
minimalizlja.
Az A* keressi algoritmus s ms llapottrben keres algoritmusok nagyban hasonltanak az opercikutats
terletn elterjedten alkalmazott elgazik-s-korltoz (branch-and-bound) technikkhoz (Lawler s Wood,
1966). Az llapottrbeli keress s az elgazik-s-korltoz algoritmus kztti kapcsolatot rszletesen vizsgltk
Dana Nau, Laveen Kanal s Vipin Kumar (Kumar s Kanal, 1983; Nau s trsai, 1984; Kumar s trsai, 1988).
Martelli s Montanari megmutattk a kapcsolatot a dinamikus programozs (lsd 17. fejezet) s bizonyos tpus
llapottrbeli keressek kztt (Martelli s Montanari, 1978). Kumar s Kanal CDP sszetett dntsi
folyamat nven megprblta egysges alapokra hozni a heurisztikus keresst, a dinamikus programozst s
az elgazik-s-korltoz technikkat (Kumar s Kanal, 1988).
Mivel az 1950-es vek vgn, az 1960-as vek elejn a szmtgpek mg csak legfeljebb pr szz sznyi
memrival rendelkeztek, gy a memriakorltozott keress mr a kezdeti idkben is intenzven kutatott terlet
volt. Doran s Michie Graph Traverser programja (Doran s Michie, 1966) az egyik legkorbbi keresprogram,
a memriakorlt ltal megengedett mrtkben legjobbat-elszr keresst hajt vgre, majd kivlaszt egy
opertort. Az IMA* algoritmus (Korf, 1985a, 1985b) volt az els szles krben alkalmazott optimlis,
memriakorltozott heurisztikus keressi algoritmus; ennek szmos vltozatt ki is dolgoztk. Az IMA *
algoritmus hatkonysgnak rszletes elemzse s az algoritmus vals rtk heurisztikkkal kapcsolatos
nehzsgeinek trgyalsa a (Patrick s trsai, 1992)-ben jelent meg.
Az RLEK (Korf, 1991, 1993) valjban egy kicsit bonyolultabb, mint a 4.5. brn bemutatott algoritmus, amely
kzelebb ll a fggetlenl kifejlesztett n. iteratvan kifejt (iterative expansion) vagy IK (IE) (Russell,
1992) algoritmushoz. Az RLEK fels s als korltot hasznl. A kt algoritmus viselkedse azonos elfogadhat
heuriszitikk esetn. Az RLEK azonban a csompontokat a legjobbat-elszr sorrendben akkor is kifejti, ha a
heurisztika nem elfogadhat. A legjobb alternatv t szmontartsnak gondolata korbban jelent meg Bratknl
(Bratko, 1986) az A* elegns Prolog implementcijban s a DTA* algoritmusban (Russell s Wefald, 1991).
Ez utbbi a metallapotterekkel s a metaszint tanulssal is foglalkozik.
Az MA* algoritmus elszr Chakrabartinl jelent meg (Chakrabarti s trsai, 1989). Az EMA * vagy
Egyszerstett MA* az MA* implementcis ksrleteibl szletett meg, mint az IK egy sszehasonlt
algoritmusa (Russell, 1992). Kaindl s Khorsand az EMA* felhasznlsval megalkottak egy ktirny keressi
algoritmust, amely jelentsen gyorsabb, mint a korbbi algoritmusok (Kaindl s Khorsand, 1994). Korf s
Zhang az oszd-meg-s-uralkodj megkzeltst rjk le (Korf s Zhang, 2000). Zhou s Hansen pedig bevezettk
a memriakorltozott A* grfkeresst (Zhou s Hansen, 2002). Korf ttekintst ad a memriakorltozott keressi
technikkrl (Korf, 1995).
116

mdszerek
Held s Karp (Held s Karp, 1970) nagy hats cikke a minimlis-fesztfa alkalmazst (lsd 4.8. feladat)
taglalja az utaz gynk problmra, megmutatva, hogy a relaxlt problma vizsglatval hogyan lehet
elfogadhat heurisztikkra jutni.
Prieditis a Jack Mostow-val vgzett korbbi kutatsokra ptve (Mostow s Prieditis, 1989) sikeresen
automatizlta a problma relaxlsi folyamatt (Prieditis, 1993). A mintaadatbzisok hasznlatt az elfogadhat
heurisztikk ellltsra Gasser, valamint Culberson s Schaeffer kezdemnyeztk (Gasser, 1995; Culberson s
Schaeffer, 1998). A diszjunkt mintaadatbzisokat Korf s Felner rjk le (Korf s Felner, 2002). A heurisztikk
valsznsg-alap rtelmezst Pearl s Hansson s Mayer mlyrehatan vizsgltk (Pearl, 1984; Hansson s
Mayer, 1989).
A heurisztikus keressi algoritmusok messze legtfogbb irodalma Pearl Heuristics c. knyve (Pearl, 1984). Ez
a knyv klnsen j ttekintst nyjt szmos oldalhajtsrl s az A* klnfle vltozatairl, s azok
tulajdonsgainak szigor bizonytsait is tartalmazza. Kanal s Kumar elksztettk az alapvet s lnyeges
heurisztikus keresssel foglalkoz cikkek antolgijt (Kanal s Kumar, 1988). A keressi algoritmusokkal
kapcsolatos j eredmnyek rendszeresen az Artificial Intelligence folyiratban jelennek meg.
A loklis keressi technikknak a matematikban s a szmtgpes tudomnyokban hossz trtnetk van.
Valban, a NewtonRaphson-mdszert (Newton, 1671; Raphson, 1690) egy igen hatkony loklis keressi
mdszernek lehet tekinteni folytonos terekben, ahol a gradiens informci rendelkezsre ll. Az ilyen
informcit nem ignyl optimalizl algoritmusok klasszikus forrsa Brent munkja (Brent, 1973). A
nyalbkeress, melyet loklis keressi algoritmusknt mutattunk be, a beszdfelismersi clokra alkalmazott
dinamikus programozs korltozott szlessg vltozataknt indult a HARPY rendszerben (Lowerre, 1976). A
megfelel algoritmust rszletesen Pearl vizsglta (Pearl, 1984, 5. fejezet).
A loklis keress tmakre a nagy knyszerkielgtsi problmk, mint pldul az n-kirlyn (Minton s trsai,
1992) s a logikai kvetkeztets (Selman s trsai, 1992) terletn elrt meglepen j eredmnyeknek s a
vletlensg, a tbbszrs egyidej keress s ms javts beptsnek ksznheten az utbbi vekben
meglnklt. Az ilyen algoritmusok renesznsza, melyeket Christos Papadimitriou New Age algoritmusoknak
nevez, felkeltette az elmleti szmtgp-tudomnyokkal foglalkoz kutatk rdekldst is (Koutsoupias s
Papadimitriou, 1992; Aldous s Vazirani, 1994). Az opercikutats terletn npszersgnek rvend a
hegymsz keress egy vltozata, amit tabukeressi algoritmusnak (tabu search) hvnak (Glover, 1989; Glover
s Laguna, 1997). Az emberi rvid tv memriamodellre alapozva ez az algoritmus karbantartja az elbb
megltogatott k llapot tabulistjt, melyeket jra megltogatni nem szabad. Ezltal az algoritmus hatkonysga
megntt a grfkeressben, s kpes egyes loklis minimumokbl kimeneklni. A hegymsz keress msik
hasznos javtsa a STAGE algoritmus (Boyan s Moore, 1998). Az tlet az, hogy hasznljuk a vletlen
jraindts hegymsz keress rvn nyert loklis maximumokat a tjfelszn ltalnos alakjnak feldertsre.
Az algoritmus a loklis maximumokra sima felletet illeszt, s a globlis maximumot analitikusan szmtja ki.
Ez lesz az j jraindtsi pont. Az algoritmus a gyakorlatban mkdkpesnek bizonyult nehz problmk
esetn. Gomes (Gomes s trsai, 1998) azt mutatta meg, hogy a futsi id eloszlsa a szisztematikusan
visszalp algoritmusok esetn sokszor lassan lecseng eloszls (heavy-tail distribution), ami azt jelenti, hogy
a nagyon hossz futsi idk valsznsge nagyobb, mint amit a normlis eloszls alapjn jsolni lehetne. Ez
megadja a vletlen jraindtsi mechanizmus elmleti igazolst.
A szimullt lehtst elszr Kirkpatrick s szerztrsai rtk le (Kirkpatrick s trsai, 1983), akik az algoritmust
kzvetlenl a statisztikus fizika terletn sszetett rendszerek szimullsra hasznlt Metropolis-algoritmustl
klcsnztk (Metropolis s trsai, 1953). A Metropolis-algoritmust lltlag Los Alamosban egy estly sorn
talltk ki. A szimullt lehts mra mr klnll kutatsi rszterletet alkot, ahol vente tbb szz cikket
publiklnak.
Optimlis megoldsok keresse folytonos trben tbb terlet alapfeladata, az optimalizls elmletet, az
optimlis szablyozs elmletet s a varicikalkulust (optimization theory, optimal control theory,
calculus of variations) belertve. Ezekrl alkalmas (s gyakorlati) ttekintst Press (Press s trsai, 2002) s
Bishop (Bishop, 1995) adnak. A lineris programozs (LP, linear programming) a szmtgpek egyik els
alkalmazsa volt. A szimplex algoritmust (simplex-algorithm) (Wood s Dantzig, 1949; Dantzig, 1949) mg
mindig alkalmazzk annak ellenre, hogy a legrosszabb esetben exponencilis komplexits. Az LP egy
gyakorlati polinomilis idej algoritmust Karmarkar (Karmarkar, 1984) dolgozta ki.
A genetikus algoritmusok fejldsnek fontos elfutra volt Sewall Wright munkja a fitness tjfelszn (fitness
landscape) fogalmrl. Nhny statisztikus, Boxot (Box, 1957) s Friedmant (Friedman, 1959) is belertve, az
50-es vekben hasznlt mr evolcis technikkat optimalizlsi problmkra, e megkzelts azonban csak
117

mdszerek
akkor kezdett npszerv vlni, amikor Rechenberg (Rechenberg, 1965; 1973) az evolcis stratgikat
(evolution strategies) a szrnyprofilok optimalizlsi problminak megoldsba bevezette. Az 1960-as s
1970-es vekben John Holland (Holland, 1975) killt a genetikus algoritmusok mellett, azt tartva, hogy a
genetikus algoritmusok hasznos eszkznek bizonyulnak s segtenek abban, hogy jobban megrtsk a biolgiai
s egyb adaptcit (Holland, 1995). A mestersges let (artificial life) mozgalom (Langton, 1995) ezt a
gondolatot egy lpssel tovbb viszi, a genetikus algoritmusokkal ltrehozott eredmnyeket nem
problmamegoldsok, hanem inkbb szervezeteknek tekintve. Hinton s Nowlan (Hinton s Nowlan, 1987),
valamint Ackley s Littman (Ackley s Littman, 1991) munkja ezen a terleten sokban hozz jrult, hogy a
Baldwin-hats kvetkezmnyeit feltrjuk. Smith s Szathmry (Smith s Szathmry, 1990) munkjt mint az
evolci ltalnos httert bemutat munkt ajnljuk.
A legtbb sszehasonlts a genetikus algoritmusok s ms megkzeltsek (klnskppen a hegymsz
keress) kztt azt tallta, hogy a genetikus algoritmusok lassabban konverglnak (OReilly s Oppacher, 1994;
Mitchell s trsai, 1996; Juels s Wattenberg, 1996; Baluja, 1997). Az ilyen eredmnyek a GA kzssgben
nem nagyon npszerek, azonban e kzssgen bell a legutbbi olyan ksrletek, hogy a populcialap
keresst a Bayes-tanuls egy formjaknt rtelmezzk (lsd 20. fejezet) taln segt, hogy e terlet s a kritikusai
kztti szakadk eltnjn (Pelikan s trsai, 1999). A GA hatkonysgra magyarzatot adhat a kvadratikus
dinamikus rendszerek (quadratic dynamical systems) elmlete (Rabani s trsai, 1998) is, lsd pldul Lohn
s trsainak (Lohn s trsai, 2001) a GA antennatervezsre alkalmazott pldjt s Larraaga (Larraaga s
trsai, 1999) munkjt, ahol a GA-t az utaz gynk problmra alkalmaztk.
A genetikus programozs (genetic programming) a genetikus algoritmusokkal kzeli rokonsgban van. Az
elsdleges klnbsg az, hogy a mutlt s az sszekombinlt reprezentcik nem bitfzrek, hanem programok.
A programokat kifejezsfk alakjban reprezentljuk. A kifejezseket valamilyen standard nyelvbl merthetjk,
mint pldul a Lispbl, de lehetnek egy olyan nyelv elemei, melyet kifejezetten ramkrk, robotszablyozk
stb. reprezentlsra terveztnk. A keresztezs a rszfk s nem a rszfzrek sszeillesztst jelenti. A mutci
ezen formja garantlja, hogy az utdok jl definilt kifejezsek lesznek, ami nem biztos, hogy sikerlne, ha a
programok manipulcijt fzrszinten oldannk meg.
A genetikus programozst vez jelenlegi rdekldst John Koza (Koza, 1992) munkja vltotta ki, a mdszer
azonban visszavezethet Friedbergnek (Friedberg, 1958) a gpi kddal folytatott korai ksrleteihez s Fogelnek
(Fogel s trsai, 1996) a vges llapot automatkkal folytatott vizsglataihoz. Mint a genetikus algoritmusok
esetn itt is vita folyik a mdszer hatkonysgt illeten. Koza (Koza s trsai, 1999) sok olyan ksrletet r le,
amelyeket genetikus programozs felhasznlsval az automatizlt ramkrtervezs terletn vgzett.
A genetikus algoritmusokrl s a genetikus programozsrl az Evolutionary Computation s az IEEE
Transactions on Evolutionary Computation folyiratok rnak. Idevg cikkeket mg a Complex Systems, az
Adaptive Behavior s az Artificial Life folyiratokban is tallunk. A legfontosabb konferencik az International
Conference on Genetic Algorithms s a Conference on Genetic Programming, amelyek a kzelmltban Genetic
and Evolutionary Computational Conference nven fuzionltak. A terlet j ttekintst adjk Melanie Mitchell
s David Fogel rsai (Mitchell, 1996; Fogel, 2000).
Az ismeretlen llapottereket feltr algoritmusokkal vszzadok ta foglalkoztak. Egy labirintusban val
mlysgi keress implementlhat pldul gy, hogy bal keznket folyamatosan a falon tartjuk. A hurkokat
elkerlhetjk, ha a keresztezseket megjelljk. A mlysgi keress kudarcba fullad, ha a cselekvsek nem
visszafordthatk. Az Euler-grfok (Eulerian graphs) (azaz olyan grfok, ahol minden csompontban
ugyanannyi l megy be, mint ki) feltrsnak ltalnosabb problmjt Hierholzer (Hierholzer, 1873)
algoritmusa oldotta meg. A tetszleges grfok feltrsnak els rszletes algoritmikus vizsglatt Deng s
Papadimitriou (Deng s Papadimitriou, 1990) vgeztk, akik egy teljesen ltalnos algoritmushoz jutattak el,
azonban kimutattk, hogy az ltalnos grf feltrsra nem adhat korltos kompetitv arny. Papadimitriou s
Yannakakis (Papadimitriou s Yannakakis, 1991) azt a krdst vizsgltk, hogy hogyan tallhat meg a clhoz
vezet t geometriai ttervez krnyezetben (ahol minden cselekvs visszafordthat). Kimutattk, hogy
ngyzet alak akadlyok esetn kis kompetitv arny rhet el, az ltalnos tglalap alak akadlyok esetn
azonban korltos arny nem rhet el (lsd 4.19. bra).
A TRTA* algoritmust, a vals idej keress (real-time search) vizsglatnak rszeknt olyan krnyezetekben,
ahol az gensnek cselekednie kell egy rgztett idej keresst kveten (a ktjtkos jtkokban egy
megszokottabb helyzet) Korf (Korf, 1990) fejlesztette ki. A TRTA* valjban a megerstses tanulsi
algoritmus egy specilis esete sztochasztikus krnyezetekben (Barto s trsai, 1995). Az optimizmus
bizonytalansg melletti stratgija mindig a legkzelebbi mg nem megltogatott llapotok fel tartani olyan
feltrsi mintt eredmnyezhet, amely a nem informlt esetben kevsb hatkony, mint az egyszer mlysgi
118

mdszerek
keress (Koenig, 2000). Dasgupta (Dasgupta s trsai, 1994) kimutatta, hogy egy kiegyenslyozott fban a cl
megkeressre, amikor heurisztikus informci nincs, az online iteratvan mlyl keress optimlisan
hatkony. A TRTA* szmos informlt vltozatt is kifejlesztettk, klnbz mdszereket alkalmazva, a grf
mr ismert rszein belli keressre s frisstsre (Pemberton s Korf, 1992). Egyelre mg nem sikerlt
megrteni, hogy heurisztikus informci alkalmazsa esetn hogyan kell a clokat optimlis hatkonysggal
megkeresni.
A fejezet azrt nem foglalkozott a prhuzamos keressi (parallel search) algoritmusokkal, mert ezek
trgyalshoz a prhuzamos architektrk terjedelmes ismertetsre lett volna szksg. A prhuzamos keress
egyre fontosabb tmakrr vlik mind az MI, mind pedig az elmleti szmtgp-tudomny terletn. Egy az MI
idevg irodalmba trtn rvid bevezet Mahanti s Daniels cikkben (Mahanti s Daniels, 1993) tallhat.
6.2. Feladatok
4.1.
Kvesse vgig az A* mkdst a Lugasbl Bukarestbe utazs problmjra alkalmazva, lgvonalban mrt
tvolsg heurisztikt alkalmazva. Azaz adja meg az algoritmus ltal megvizsglt csompontok szekvencijt az
f-, g- s h-rtkkkel egytt.
4.2.
A heurisztikus talgoritmus (heuristic path algorithm) egy olyan legjobbat-elszr keress, ahol a
clfggvny f(n) = (2 w)g(n) + wh(n). Milyen w rtkekre garantlhat az algoritmus optimalitsa?
(Felttelezheti, hogy h elfogadhat.) Milyen keressrl van sz, amikor w = 0? Amikor w = 1? s amikor w = 2?
4.3.
Bizonytsa be az albbi lltsokat:
a. A szlessgi keress az egyenletes kltsg keress egy specilis esete.
b. A szlessgi keress, a mlysgi keress s az egyenletes kltsg keress a legjobbat-elszr keress
specilis esetei.
c. Az egyenletes kltsg keress az A* keress egy specilis esete.
4.4.
Tervezzen meg egy olyan llapotteret, ahol az A* a GRF-KERESS felhasznlsval egy szuboptimlis
megoldssal tr vissza egy elfogadhat, de nem konzisztens h(n) fggvny mellett.
4.5.
A 1.1. szakasz - A moh legjobbat-elszr keress rszben lttuk, hogy a lgvonalban mrt tvolsgheurisztika
a moh legjobbat-elszr keresst flrevezeti, amikor Iairl Fogarasra szerettnk volna eljutni. Az ellenkez
problmra azonban, vagyis amikor Fogarasrl Iaira szeretnnk eljutni, a heurisztika tkletes. Lteznek olyan
problmk, amelyek esetben a heurisztika mindkt irnyban flrevezet bennnket?
4.6.
Talljon ki a 8-as kirakjtkra olyan heurisztikus fggvnyt, ami nha tlbecsl, s mutassa meg, hogy egy
konkrt problma esetn ez hogyan vezethet szuboptimlis megoldshoz (hasznlhat szmtgpet, ha ez segt).
Bizonytsa be, hogy ha h soha nem becsl tl c-nl jobban, az A* algoritmus, h-t felhasznlva, olyan
megoldssal tr vissza, melynek kltsge az optimlis megolds kltsgt legfeljebb c-vel haladja meg.
4.7.
Bizonytsa be, hogy ha a heurisztikus fggvny konzisztens, akkor elfogadhat. Szerkesszen egy elfogadhat
heurisztikus fggvnyt, amely nem konzisztens.
4.8.
119

mdszerek
Az utaz gynk problmt (TSP) meg lehet oldani a minimlis feszt fa (MFF) heurisztika alkalmazsval,
ami felttelezve, hogy mr egy rsztvonalat megterveztnk, megbecsli az tvonal befejezsnek kltsgt. A
vrosok egy halmaznak MFF-kltsge az sszes vrost sszekt fk minimlis lkltsgsszege.
a. Mutassa meg, hogy ez a heurisztikus fggvny hogyan szrmaztathat a TSP relaxlt vltozatbl!
b. Mutassa meg, hogy az MFF-heurisztika dominlja a lgvonalban mrt tvolsgheurisztikt!
c. rjon egy problmagenertort a TSP-problmra, amely olyan problmaegyedeket generl, amelyben a
vrosokat az egysgngyzeten belli vletlen mdon generlt pontok reprezentljk!
d. Keressen hatkony mdszert az irodalomban az MFF megszerkesztsre, s hasznlja azt egy elfogadhat
keressi algoritmussal a TSP-problma egyedeinek a megoldsra!
4.9.
A 2.1. szakasz - A heurisztikus fggvny pontossgnak hatsa a megolds hatkonysgra rszben a 8-as
kirakjtk olyan relaxcijt definiltuk, ahol a lapka az A mezrl a B mezre mozdulhat el, ha B res. E
problma egzakt megoldsa az n. Gaschnig-heurisztikt (Gaschnigs heuristics) definilja (Gaschnig, 1979).
Magyarzza meg, hogy mirt lesz a Gaschnig-heurisztika legalbb olyan pontos, mint h1 (a rossz helyen lv
lapkk szma), s mutasson olyan eseteket, amikor mind h1-nl mind h2-nl pontosabb (Manhattan-tvolsg).
Tud ajnlani a Gaschnig-heurisztikra egy hatkony szmtsi mdszert?
4.10.
A 8-as kirakjtkra adtunk kt egyszer heurisztikus fggvnyt: a Manhattan-tvolsgot s a rossz helyen lv
lapkk szmt. Az irodalomban szmos heurisztikrl azt lltjk, hogy azok mindkt elbbinl jobbak. Lsd
pldul Nilsson (Nilsson, 1971), Mostow (Mostow s Prieditis, 1989) s Hansson (Hansson s trsai, 1992)
cikkt. Ellenrizze ezeket az lltsokat a heurisztikk implementlsval s a futsi eredmnyek
sszevetsvel.
4.11.
Nevezze meg azokat az algoritmusokat, amelyek az albbi specilis esetekbl szrmaznak:
a. Loklis nyalb keress k = 1 mellett.
b. Loklis nyalb keress egy kezdeti llapottal s korltlan szm visszatartott llapottal.
c. Szimullt lehts, ha T = 0 minden idpillanatra (s kihagyva a lellsi tesztet).
d. Genetikus algoritmus N = 1 nagysg populcival.
4.12.
Nha egy adott problmhoz nem ltezik j kirtkel fggvny, azonban ltezik j sszehasonltsi mdszer:
vagyis el lehet dnteni, hogy egy csompont egy msik csompontnl jobb-e anlkl, hogy valamilyen
szmrtket rendelnnk hozzjuk. Mutassa meg, hogy ez elgsges a legjobbat-elszr (best-first) keress
vgrehajtshoz. Ltezik-e ilyen analgia az A* esetre is?
4.13.
Hozza kapcsolatba a TRTA* idkomplexitst az algoritmus trkomplexitsval.
4.14.
Tegyk fel, hogy egy gens a 4.18. brn lthat 3 3 labirintus krnyezetben tartzkodik. Az gens tudja,
hogy a kezdeti pozcija az (1,1), a cl a (3,3)-n van, s hogy a ngy Fel, Le, Balra, Jobbra cselekvsnek a
szoksos hatsa van, hacsak egy fal nincs tban. Az gens nem tudja a bels falak helyt. Minden egyes
llapotban az gens a leglis cselekvsek halmazt kpes rzkelni. Azt is meg tudja mondani, hogy az llapotot
megltogatta-e mr korbban, vagy pedig egy j llapotban van.
120

mdszerek
a. Magyarzza meg, hogy ezt az online keressi problmt hogyan lehet offline keressnek tekinteni egy olyan
hiedelmi llapotrben, ahol a kezdeti hiedelmi llapot a krnyezet minden lehetsges konfigurcijt
tartalmazza. Milyen nagy a kezdeti hiedelmi llapot? Milyen nagy a hiedelmi llapottr?
b. Hnyfle klnbz megfigyels lehetsges a kezdeti llapotban?
c. rja le e problma esetn az eshetsgi terv nhny els gt. Milyen nagy (nagyjbl) az egsz terv?
Jegyezze meg, hogy ez az eshetsgi terv az adott lerst kielgt minden lehetsges krnyezet szmra
megolds. A keress s a vgrehajts tlapoldsa teht egy ismeretlen krnyezetben nem szigoran szksges.
4.15.
Ebben a feladatban a 4.8. feladatban lert tpus TSP-problma megoldsra loklis keressi mdszerekkel
ksrleteznk.
a. Tervezze meg a TSP megoldsra a hegymsz keresst. Az eredmnyeket az MFF-heurisztikval (4.8.
feladat) dolgoz A* algoritmus optimlis megoldsaival hasonltsa ssze.
b. Tervezzen meg a TSP megoldsra egy genetikus algoritmust. Az eredmnyeket ms megkzeltsekkel
hasonltsa ssze. Esetleg szksge lehet a (Larraaga s trsai, 1999) cikk egyes reprezentcis javaslataira.
4.16.
Generljon sok 8-as kirakjtk- s 8-kirlyn feladat-pldnyt, s oldja meg ezeket (ha lehetsges) a
hegymsz keresssel (legmeredekebb emelked s az els-vlaszts vltozatok), vletlen jraindts
hegymsz keresssel s szimullt lehtssel. Mrje meg a megoldsi kltsgeket, s szzalkosan adja meg a
megoldsok arnyt. Mindezeket brzolja egy grafikonon az optimlis kltsg fggvnyben. Fzzn
kommentrt az eredmnyekhez.
4.17.
Ebben a feladatban a hegymsz keresst a robotnavigci kontextusban fogjuk vizsglni, pldnak hasznlva
a 3.22. brn lthat krnyezetet.
a. Ismtelten oldja meg a 3.16. feladatot a hegymsz keress segtsgvel. Le fog-e ragadni az gens
valamikor egy loklis maximumban? Lehetsges, hogy leragadjon az gens konvex akadlyok esetn?
b. Hozzon ltre olyan konkv krnyezetet, amiben az gens leragad!
c. Mdostsa gy a hegymsz algoritmust, hogy az az 1 mlysg keress helyett k mlysg keresst
hasznljon annak eldntsre, hogy a kvetkez lpsben hov menjen. Meg kell keresnie a legjobb k lpses
utat, e mentn egy lpst megtenni, majd az eljrst megismtelni.
d. Ltezik k-nak olyan rtke, ami mellett az j algoritmus garantltan elkerli a loklis maximumokat?
e. Magyarzza meg, hogy ebben az esetben a TRTA* algoritmus hogyan teszi lehetv az gens szmra, hogy
a loklis minimumokbl kimenekljn.
4.18.
Hasonltsa ssze az A* s a RLEK keress hatkonysgt vletlen mdon generlt problmahalmazokon a 8-as
kirakjtk (Manhattan-tvolsggal) s a TSP-(MFH-vel, lsd 4.8. feladat) problmakrben. rtelmezze az
eredmnyeket. Mi trtnik az RLEK hatkonysgval, ha a 8-as kirakjtk problmakrben a heurisztika
rtkeihez egy kis vletlen szmot adunk hozz?
121
5. fejezet - Knyszerkielgtsi
problmk
Ebben a fejezetben megmutatjuk azt, hogy ha az llapotokat nem egyszeren kis fekete dobozoknak tekintjk,
akkor j hatkony keressi mdszerek egsz sorhoz jutunk, valamint jobban megrtjk a problma struktrjt
s komplexitst.
A 3. s a 4. fejezetben azt az elkpzelst jrtuk krbe, hogy a problmkat llapottrbeli keresssel lehet
megoldani. A trgyterletre jellemz heurisztikk segtsgvel rtkelhetjk ezeket az llapotokat s
ellenrizhetjk, hogy nem jrunk-e clllapotban. A keressi algoritmus szempontjbl azonban mindegyik
llapot egy megklnbztets nlkli bels struktrj fekete doboz (black box). Az llapotokat egy
tetszleges adatstruktra reprezentlja, amelyhez a problmra jellemz rutinokkal lehet hozzfrni: az
llapottmenet- s a heurisztikafggvnnyel, valamint a clllapotteszttel.
A fejezetben a knyszerkielgtsi problmkkal (constraint satisfication problems) foglalkozunk, amikor az
llapotok s a clteszt illeszkedik egy szablyos, strukturlt s elg egyszer reprezentcihoz (lsd 5.1.
alfejezet). Az llapotstruktra segtsgvel keressi algoritmusokat lehet definilni, s nem problmaspecifikus,
hanem ltalnos cl heurisztikk hasznlatval nagy problmk megoldsa is lehetv vlik (lsd 5.2. s 5.3.
alfejezet). Taln a legfontosabb azonban az, hogy a clteszt szablyos reprezentcija feltrja magnak a
problmnak a struktrjt (lsd 5.4. alfejezet). Ez pedig mdszereket ad a keznkbe a problma
dekompozcijra, s lehetv teszi, hogy megrtsk a problma struktrja s a megolds nehzsge kztti
szoros kapcsolatot.
1. Knyszerkielgtsi problmk
A knyszerkielgtsi problmk (angol rvidtssel CSP) formlis defincijt vltozk (variables), X1, X2,
, Xn, s knyszerek (constraints), C1, C2, , Cm halmazaival adhatjuk meg. Minden egyes Xi vltoz esetn
adott a lehetsges rtkek egy nem-res Di tartomnya. Minden egyes Ci knyszer a vltozk valamely
rszhalmazra vonatkozik, s meghatrozza a rszhalmaz megengedett rtkkombinciit. Egy
problmallapotot az definil, hogy vagy nhny, vagy mindegyik vltozhoz rtkeket rendelnk hozz {Xi =
vi, Xj = vj, ...}. Egy hozzrendelst konzisztensnek (vagy megengedettnek) neveznk, ha egyetlen knyszert sem
srt meg. Teljes az a hozzrendels, amelyben mindegyik vltoz szerepel, s egy teljes hozzrendels a
knyszerkielgtsi problmnak megoldsa, ha mindegyik knyszert kielgti. Nhny knyszerkielgtsi
problma azt is ignyli, hogy a megolds egy clfggvnyt maximalizljon.
Mit is jelent mindez? Tegyk fel, hogy Romniba beleunva Ausztrlia trkpt tanulmnyozzuk, s a trkpen
az 5.1. (a) brn feltntetett llamokat s terleteket ltjuk, feladatunk pedig az, hogy vrssel, zlddel s
kkkel minden egyes rszt sznezznk ki gy, hogy a szomszdos rszeknek ne legyen azonos a szne. Ahhoz,
hogy ezt knyszerkielgtsi problmaknt fogalmazhassuk meg, vltozkat kell bevezetnnk az egyes
rszekhez: NyA, T, Q, DW, V, DA s T. Mindegyik vltoz tartomnya a {vrs, zld, kk} halmaz.
Knyszerek rjk el, hogy a szomszdos rszek klnbz sznek legyenek, pldul NyA s T esetn a
megengedhet kombincik az albbi prok lehetnek:
{(vrs, zld), (vrs, kk), (zld, vrs), (zld, kk), (kk, vrs), (kk, zld)}
(A knyszert tmrebben is ki lehet fejezni a NyA T egyenltlensggel, feltve persze, hogy a

knyszermegold algoritmus valamikppen ki tudja rtkelni az ilyen kifejezseket.) Sok lehetsges megolds
addik, mint pldul az
{NyA = vrs, T = zld, Q = vrs, DW = zld, V = vrs, DA = kk, T = vrs}
Gyakran hasznos lehet, ha felrajzoljuk a knyszerkielgtsi problma knyszergrfjt (constraint graph),

amint az az 5.1. (b) brn is lthat. A grf csompontjai a problma vltozinak, lei pedig a knyszereknek
felelnek meg.
Sok elnnyel jrhat, ha egy problmt knyszerkielgtsi problmaknt tekintnk. Az llapotok reprezentcija
miatt a knyszerkielgtsi problmk egy standard mintra illeszkednek (ez a minta a hozzrendelt rtkekkel
rendelkez vltozk halmaza), az llapottmenet-fggvnyt s a clllapottesztet pedig az sszes
122
Knyszerkielgtsi problmk
knyszerkielgtsi problmra rvnyes ltalnos mdon meg lehet rni. St ltrehozhatk hatkony, ltalnos
heurisztikk minden kiegszt, trgyterlet-specifikus szakrtelem nlkl. Vgl pedig a knyszergrf
struktrjnak segtsgvel lervidthet a megoldsi folyamat, s ez nhny esetben exponencilisan cskkenti
a problma komplexitst. A knyszerkielgtsi problma reprezentcija a legels (s a legegyszerbb) a
knyv menete sorn bemutatott reprezentcis smk sorban.
5.1. bra - (a) Ausztrlia llamai s terletei. A trkp kisznezse tekinthet

knyszerkielgtsi problmnak is. A cl az, hogy minden egyes rszhez olyan sznt
talljunk, amely nem azonos egy szomszdos rsz sznvel sem. (b) A trkpsznezsi
problma knyszergrfknt reprezentlva.
Knny szrevenni, hogy egy knyszerkielgtsi problmra adhat egy inkrementlis megfogalmazs
(incremental formulation), amely a knyszerkielgtsi problmt szablyos keressi problmaknt tekinti:
Kiindul llapot (initial state): az res hozzrendels {}, ahol egyik vltoznak sincs rtke.
llapottmenet-fggvny (successor function): brmelyik hozzrendels nlkli vltoz rtket kaphat,
amennyiben ez nem tkzik a korbbi rtkadsokkal.
Clteszt (goal test): az aktulis hozzrendels teljes.
Az t kltsge (path cost): egy konstans kltsg (pldul 1) mindegyik lpsre.
Fontos
Mindegyik megoldsnak egy teljes hozzrendelsnek kell lennie, teht n vltoz esetn az n-edik
mlysgi szinten jelenik meg. A keressi fa pedig csak n mlysg. Emiatt a korltkielgtsi
problmk esetn a mlysgi keressi algoritmusok npszerek (lsd 5.2. alfejezet). Az is igaz, hogy a
megoldshoz vezet t nem lnyeges. Ezrt hasznlhat a teljes llapotlers (complete-state
formulation) is, amelyben minden egyes llapot egy teljes vltoz-hozzrendels, akr kielgti a
knyszereket, akr nem. Ebben a felrsban a loklis keressi eljrsok is hasznlhatk.
A knyszerkielgtsi problmk legegyszerbb esetben a vltozk diszkrtek s vges tartomnyak. A
trkpsznezsi problmk is ehhez az esethez tartoznak. A 3. fejezetben bemutatott 8-kirlyn problmt is
felfoghatjuk vges tartomny knyszerkielgtsi problmaknt, ahol a Q1, , Q8 vltozk a kirlynk 1, , 8
oszlopokban betlttt pozciit jellik, s mindegyik vltoz tartomnya {1, 2, 3, 4, 5, 6, 7, 8}. Amennyiben
maximum d a knyszerkielgtsi problma brmely vltozjhoz tartoz tartomny mrete, akkor a lehetsges
teljes hozzrendelsek szma O(dn), azaz a vltozk szmnak exponencilis fggvnye. A vges tartomny
knyszerkielgtsi problmk kz tartoznak a Boole-problmk is, ahol a vltozk rtke vagy igaz, vagy
hamis. A Boole knyszerkielgtsi problmk specilis esetknt tartalmaznak nhny NP-teljes problmt,
pldul a 3SAT-ot (lsd 7. fejezet). Legrosszabb esetben teht nem lehetsges, hogy exponencilisnl kevesebb
id alatt meg tudunk oldani egy vges tartomny knyszerkielgtsi problmt. A legtbb gyakorlati
123
alkalmazsban azonban az ltalnos cl CSP algoritmusok megbirkznak a 3. fejezetben bemutatott ltalnos

cl keressi algoritmusokkal megoldhatknl tbb nagysgrenddel nagyobb problmkkal is.
A diszkrt vltozk lehetnek vgtelen tartomnyak is: pldul ilyen az egsz szmok halmaza vagy a fzrek
halmaza. Pldul amikor egy ptkezsi munka naptrt temezzk, minden feladat kezdsi ideje egy vltoz,
amelyeknek lehetsges rtkei az aktulis dtum napjait megad egsz szmok. Vgtelen tartomnyok esetn
mr nem lehet a knyszereket a megengedett rtkkombincik felsorolsval lerni. Ehelyett egy
knyszernyelvet (constraint language) kell hasznlni. Pldul ha Munka1 t napig tart, s meg kell elznie
Munka3-t, akkor knyszernyelvknt az algebrai egyenltlensgek nyelvre van szksgnk, mint pldul
KezdMunka1 + 5 KezdMunka3. Tovbb az ilyen knyszereket tbb mr nem lehet megoldani az sszes
lehetsges hozzrendels felsorolsval, mert vgtelen sok van bellk. Klnleges megold algoritmusok
(melyekre itt nem trnk ki) lteznek egsz rtk vltozk lineris knyszereire, azaz olyan knyszerekre,
mint a fenti, ahol mindegyik vltoz csak lineris mveletekben jelenik meg. Megmutathat, hogy nem ltezhet
algoritmus egsz rtk vltozk ltalnos nemlineris knyszereinek megoldsra. Nhny esetben az egsz
rtk knyszerproblmk egyszeren azzal visszavezethetk vges tartomnyakra, hogy korltozzuk az sszes
vltoz rtkeit. Egy temezsi problmban pldul egy fels korltot szabhatunk az sszes temezend
munka teljes hosszra.
A folytonos tartomny knyszerkielgtsi problmk elg gyakoriak a vals alkalmazsokban, s az
opercikutatson bell is tanulmnyoztk ezeket a problmkat. Pldul a Hubble rteleszkp ksrleteinek
temezse a megfigyelsek nagyon pontos idztst ignyli, a megfigyelsek s a manverek kezdeti s
befejezsi idpontjai folytonos rtk vltozk s csillagszati, precedencia-, valamint teljestmnyknyszerek
sokasga vonatkozik rjuk. A folytonos tartomny knyszerkielgtsi problmk legismertebb vlfaja a
lineris programozsi problmk csoportja, ahol a knyszerek konvex tartomnyt alkot lineris
egyenltlensgek. A lineris programozsi feladatokat meg lehet oldani a vltozk szma szerinti polinomilis
idben. Ms tpus knyszerekkel s clfggvnyekkel rendelkez problmkat is tanulmnyoztak, pldul
ilyennel foglalkozik a kvadratikus programozs, a msodrend knikus programozs s hasonl trsaik.
Azon tl, hogy megvizsglhatjuk a knyszerkielgtsi problmkban megjelen vltozk tpust, hasznos lehet
a knyszerfajtkat is tanulmnyozni. A legegyszerbb fajta az unris knyszer (unary constraint), amely egy
vltoz rtkre tesz megktst. Elkpzelhet pldul, hogy a dlausztrlok lnken tiltakoznak a zld szn
ellen. A hivatkozott vltoz tartomnynak elfeldolgozsval mindegyik unris knyszer kikszblhet: ki
kell venni a knyszert srt sszes rtket. A binris knyszer (binary constraint) kt vltozt kt ssze.
Pldul a DA DW egy binris knyszer. A csak binris knyszerekkel rendelkez knyszerkielgtsi
problmt binrisnak nevezzk, amit az 5.1. (b) brn lthathoz hasonl knyszergrffal lehet reprezentlni.
A magasabb rend knyszerek hrom vagy tbb vltozra vonatkoznak. Ennek egy ismers pldja a
betrejtvny (lsd 5.2. (a) bra). A betrejtvnyben ltalban mindegyik bet klnbz szmot jell. Ez a
megkts az 5.2. (a) bra betrejtvnye esetn pldul a hatvltozs MindKl(F,T,U,W,R,O) knyszerrel adhat
meg. Egy msik megolds lehet, ha a megktst binris knyszerek (mint pldul FT) gyjtemnyvel adjuk
meg. A rejtvny ngy oszlopban az sszeadsknyszerek tbb vltozt is tartalmazhatnak, amelyek a
kvetkezkppen rhatk fel:
O + O = R + 10 X1
X1 + W + W = U + 10 X2
X2 + T + T = O + 10 X3
X3 = F
ahol X1, X2 s X3 a kvetkez oszlopba tvitt szmjegyet (0 vagy 1) reprezentl segdvltozk (auxiliary
variables). A magasabb rend knyszereket egy knyszerhipergrffal (constraint hyprergraph) lehet
brzolni, amelynek egy pldja az 5.2. (b) brn lthat. Az les szem olvasnak feltnhet, hogy a MindKl
knyszer felbonthat binris knyszerekre: F T, F U stb. Az 5.11. feladat ppen annak bizonytst kri,
hogy elegend segdvltoz bevezetsvel mindegyik magasabb rend vges tartomny knyszer trhat
binris knyszerek halmazv. Ebbl kiindulva ebben a fejezetben csak binris knyszerekkel foglalkozunk.
Az eddig emltett knyszerek mind abszolt knyszerek voltak: egy knyszer megszegse kizr egy
megoldsjelltet. A vals alkalmazsok sorn azonban sok knyszerkielgtsi problma tartalmaz
preferenciaknyszereket, melyek jelzik, hogy mely megoldsok preferltak. Egy egyetemi rarend
meghatrozsakor pldul X professzor taln inkbb reggel tantana, mg Y professzor a dlutni rkat
124
rszesten elnyben. Egy olyan rarend, amely szerint X professzornak dlutn kettkor kellene tantania, mg
megolds lenne (persze csak ha X professzor ppensggel nem a tanszkvezet), de ez nem lenne optimlis
megolds. A preferenciaknyszerek gyakran az egyedi vltoz-hozzrendelsek kltsgeknt brzolhatk:
pldul ha X professzor egy dlutni idpontot kap, az kt pontot ront az ltalnos clfggvnyen, mg a reggeli
raidpont csak egy pontba kerl. gy megfogalmazva a preferencikkal kiegsztett knyszerkielgtsi
problmk (tvonalalap vagy loklis) optimalizcis keressi mdszerekkel megoldhatk. Az ilyen
knyszerkielgtsi problmkkal a fejezetben tbbet nem foglalkozunk, de az irodalomjegyzkben megadunk
nhny kiindulsi pontknt hasznlhat hivatkozst.
5.2. bra - (a) Egy betrejtvny. Mindegyik bet klnbz szmjegyet jell, a rejtvny
clja olyan szmjegyeket helyettesteni a betk helyre, amelyekkel a kiadd sszeg
aritmetikailag helyes lesz (azzal a kln megktssel, hogy nem kezd nullk nem
megengedettek). (b) A betrejtvny knyszerhipergrfja a MindKl knyszer s az
oszloponknti sszeadsi knyszerek feltntetsvel. A knyszereket ngyzet alak
dobozok jellik. Minden doboz azzal a vltozval van sszektve, amelyre a doboz ltal
jelzett knyszer vonatkozik.
2. A visszalpses keress alkalmazsa

knyszerkielgtsi problmkra
Az elz alfejezetben keressi problmaknt fogalmaztuk meg a knyszerkielgtsi problmkat. Ezt a
megfogalmazst felhasznlva a 3. s a 4. fejezetben bemutatott brmely keressi eljrssal megoldhatk a
knyszerkielgtsi problmk. Tegyk fel, hogy alkalmazzuk a szlessgi keresst az elz fejezetben
megadott ltalnos CSP-megfogalmazsra. Hamarosan valami szrnysg tnik fel: a fa tetejn az elgazsi
tnyez nd, mert a d rtk brmelyike hozzrendelhet az n vltoz brmelyikhez. A kvetkez szinten az
elgazsi tnyez (n 1)d s gy tovbb az n szint sorn. Egy n! dn level ft ptnk fel, noha csupn dn
lehetsges teljes hozzrendels van!
Fontos
Ltszlag racionlis, valjban naiv problmamegfogalmazsunk elhanyagolta az sszes
knyszerkielgtsi problma egy dnt kzs tulajdonsgt: a kommutativitst (commutativity).
Egy problma akkor kommutatv, ha a vgeredmny szempontjbl kzmbs, hogy cselekvsek egy
adott sorozatt milyen sorrendben alkalmazzuk. Ilyenek a knyszerkielgtsi problmk is, mert a
vltozk hozzrendelse sorn a sorrendtl fggetlenl ugyanazt a parcilis hozzrendelst kapjuk.
Ezrt teht mindegyik knyszerkielgtsi problmamegold a kvetkez llapot generlsakor a
keressi fa minden csompontjban csak egyetlen vltoz lehetsges hozzrendelseit veszi tekintetbe.
Az ausztrliai trkpsznezsi problma keressi fjnak gykrcsompontjban vlaszthatunk a DA =
125
vrs, a DA = zld s a DA = kk kzl, de sohasem merl fel vlasztsi lehetsgknt a DA = vrs

vagy az NyA = kk. A levelek szma ezzel a megszortssal mr a remlt dn.
5.3. bra - Egy egyszer visszalpses keressi algoritmus knyszerkielgtsi

problmkhoz. Az algoritmus a 3. fejezet rekurzv mlysgi keresjn alapul. A
HOZZRENDELETLEN-VLTOZ-KIVLASZTSA s a TARTOMNY-RTKEK-SORRENDEZSE fggvnyek
hasznlhatk a szvegben bemutatott ltalnos cl heurisztikk megvalstsra.
5.4. bra - Rszlet a keressi fbl, amelyet az egyszer visszalpses keress generlt az
5.1. brn bemutatott trkpsznezsi problmhoz
A visszalpses keress (backtracking search) kifejezst olyan mlysgi keressekre hasznljuk, melyek
egyszerre csak egy vltozhoz rendelnek rtket, s visszalpnek, ha mr nincs megengedett hozzrendelsi
lehetsg. Az algoritmus az 5.3. brn lthat. Vegyk szre, hogy az algoritmus lnyegben a 115116.
oldalon lert egyenknti mdszert hasznlja az inkrementlis kvetkez llapot generlsra. Tovbb a
kvetkez llapot generlsakor kifejti az aktulis llapotot, nem pedig egyszeren msolja. A
knyszerkielgtsi problmk szoksos reprezentcija miatt nincs szksg a VISSZALPSES-KERESS
algoritmus kiegsztsre trgyterlet-specifikus kezdeti llapottal, llapottmenet-fggvnnyel vagy clteszttel.
Az 5.4. brn lthat egy rszlet az ausztrliai sznezsi problmhoz generlt keressi fbl (a vltozhozzrendelsek sorrendje NyA, T, Q, ).
Az egyszer visszalpses keress a 3. fejezet terminolgija szerint nem informlt algoritmus, teht nem is
vrjuk el, hogy nagy problmk esetn is hatkony legyen. Az 5.5. bra els oszlopban bemutatott nhny
eredmny megersti vrakozsainkat.
5.5. bra - Az egyes CSP-algoritmusok teljestmnye klnbz problmk

megoldsban. Az algoritmusok balrl jobbra haladva a kvetkezk: egyszer
visszalpses, MRV-heurisztikval bvtett visszalpses, elrenz ellenrzs, MRV126
heurisztikval kiegsztett elrenz ellenrzs s a minimlis konfliktusok loklis

keresse. Az egyes cellkban a problma megoldsa sorn elvgzett konzisztenciaellenrzsek szma tallhat (t futtats medinrtkbl meghatrozva); figyeljnk fel
arra, hogy a kt jobb fels cella kivtelvel mindegyik rtk ezrekben van megadva (ezt
jelzi a K bet). Az els problma az Amerikai Egyeslt llamok 50 llamt tartalmaz
trkp ngy sznnel trtn sznezse. A tbbi problma a (Bacchus s van Run, 1995)bl szrmazik (1. tblzat). A msodik problma az n-kirlyn megoldshoz szksges
ellenrzsek szma (n rtkeire 2-tl 50-ig sszegezve). A harmadik az 5.13. feladatban
is szerepl zebrarejtvny. A maradk kett mestersges vletlenszeren generlt
problmk. (A min-konfliktusok algoritmus ezeken nem futott.) Az eredmnyek azt
rzkeltetik, hogy az MRV-heurisztikval kombinlt elrenz ellenrzs mindegyik
problma esetn jobban teljest, mint a tbbi visszalpses algoritmus, de nem minden
esetben jobb a min-konfliktusokat hasznl helyi keressnl.
A 4. fejezetben a nem informlt keressi algoritmusok gyenge teljestmnyt a problma ismeretbl szrmaz
trgyterlet-specifikus heurisztika bevezetsvel orvosoltuk. Az derl azonban ki, hogy a knyszerkielgtsi
problmk hatkonyan megoldhatk ilyen trgyterlet-specifikus tuds nlkl is. Olyan ltalnos cl eljrsok
alakthatk ki, amelyek az albbi krdseket vizsgljk:
1. A kvetkez lpsben melyik vltozhoz rendeljnk rtket, s milyen sorrendben prblkozzunk az
rtkekkel?
2. Milyen kvetkezmnyei vannak a jelenlegi vltoz-hozzrendelseknek a mg hozzrendeletlen vltozk
szmra?
3. Ha egy t sikertelennek bizonyul (azaz egy olyan llapothoz jutunk, ahol egy vltoznak nincs
megengedhet rtke), a kvetkez utak sorn el tudja-e kerlni a keress ezt a hibt?
A kvetkez pontokban megprbljuk sorra megvlaszolni ezeket a krdseket.
2.1. Vltoz- s rtkrendezs

A visszalpses algoritmus tartalmazza az albbi sort:
var Hozzrendeletlen-Vltoz-Kivlaszts(Vltozk[csp], hozzrendelsek, csp)
Alaprtelmezs szerint a HOZZRENDELETLEN-VLTOZ-KIVLASZTS egyszeren kivlasztja a VLTOZK[csp]

lista sorrendje szerinti kvetkez hozzrendeletlen vltozt. A statikus vltoz-hozzrendels ritkn vezet a
leghatkonyabb keresshez. Pldul miutn kivlasztottuk az NyA = vrs s az T = zld hozzrendelseket,
csak egyetlen rtket rendelhetnk DA-hoz, teht sszer lenne inkbb a DA = kk hozzrendelst elvgezni,
mintsem Q szmra keresni rtket. St miutn DA rtket kapott, knyszertve vagyunk Q, DW s V
rtkeinek kivlasztsakor. Ezt az intuitv tletet (a legkevesebb megengedett rtkkel rendelkez vltoz
kivlasztst) nevezik legkevesebb fennmarad rtk (minimum remaining values, MRV) heurisztiknak.
Neveztk mr legkorltozottabb vltoz vagy meghisulst elre heurisztiknak is (az utbbi nvnek az a
magyarzata, hogy azt a vltozt emeli ki, amelyik legvalsznbben fog hamarosan hibhoz vezetni, ezltal
megnyesve a keressi ft). Ha van egy X vltoz, amelynek egyetlen megengedett rtke sincs, akkor az MRVheurisztika ki fogja vlasztani X-et, s azonnal kiderti a hibt, elkerlve ezzel a tbbi vltoz kztti
rtelmetlen keresglst, ami mindig kudarcra vezet, amikor X vgl is kivlasztdik. Az 5.5. bra msodik,
BT+MRV cmkj oszlopa ennek a heurisztiknak a teljestmnyt mutatja. Az egyszer visszalpses
127
keressnl a teljestmny a problmtl fggen mintegy 33000-szer jobb lehet. Vegyk szre, hogy a
teljestmnymrtknk nem tartalmazza a heurisztikus rtkek kiszmtsnak tbbletkltsgt. A kvetkez
pontban bemutatunk egy mdszert, amellyel kezelhetv vlik ez a kltsg.
Az MRV-heurisztika semmit sem segt abban, hogy melyik rgit vlasszuk ki elsknt Ausztrlia
kisznezsekor, mert a kiindulskor mindegyik rginak hrom megengedett szne van. Ebben az esetben
segthet a fokszm-heurisztika (degree heuristics). Ez azltal ksrli meg a ksbbi vlasztsok elgazsi
tnyezjt cskkenteni, hogy azt a vltozt vlasztja ki, amely a legtbbszr szerepel a hozzrendeletlen
vltozkra vonatkoz knyszerekben. Az 5.1. brn DA a legnagyobb fokszm vltoz (fokszma 5), az sszes
tbbi vltoz fokszma 2 vagy 3, leszmtva T-t, amely nulla. Valjban, ha mr egyszer DA-t kivlasztottuk, a
fokszm-heurisztika alkalmazsa a problmt egyetlen hibs lps nlkl oldja meg: mindegyik vlasztsi
pontnl brmelyik konzisztens sznt is vlasztjuk, mindenkppen visszalps nlkl jutunk egy megoldshoz. A
legkevesebb fennmarad rtk heurisztika ltalban jobban irnyt, de a patthelyzetek eldntshez hasznos
segtsg lehet a fokszm-heurisztika.
Miutn az algoritmus mr kivlasztott egy vltozt, el kell dntenie, hogy milyen sorrendben vizsglja meg
ennek rtkeit. Erre nha a legkevsb-korltoz-rtk (least-constraining-value) heurisztika lehet hasznos.
Ez a heurisztika elnyben rszesti azt az rtket, amely a legkevesebb vlasztst zrja ki a knyszergrfban a
szomszdos vltozknl. Pldul tegyk fel, hogy az 5.1. bra esetben mr ltrehoztuk az NyA = vrs s az T
= zld parcilis hozzrendelst, s most Q szmra akarunk rtket tallni. A kk rossz vlaszts volna, mert ez
kizrja Q szomszdjnak, DA-nak utols megengedett rtkt. A legkevsb korltoz heurisztika ezrt a kkkel
szemben a vrset rszesti elnyben. ltalban vve a heurisztika megprblja a ksbbi vltozhozzrendelsek szmra a lehet legnagyobb szabadsgot meghagyni. Termszetesen ha egy problma sszes
megoldst meg szeretnnk tallni, s nem elgsznk meg csupn eggyel, akkor a sorrend kzmbs, hiszen
gyis minden rtknek sorra kell kerlnie. Ugyanez igaz akkor is, ha a problmnak nincsen megoldsa.
2.2. Az informci terjesztse a knyszereken keresztl

A keressi algoritmusunk eddig csak akkor foglalkozott egy vltozra vonatkoz knyszerrel, ha a vltozt a
HOZZRENDELETLEN-VLTOZ-KIVLASZTS kivlasztotta. De ha nhny knyszert a keress folyamn
korbban vagy akr mg a keress megkezdse eltt megvizsglunk, akkor drasztikusan cskkenthet a keressi
tr mrete.
2.2.1. Elrenz ellenrzs

A knyszerek keress kzbeni jobb felhasznlsnak egyik mdszert elrenz ellenrzsnek (forward
checking) nevezzk. Az elrenz ellenrzsi folyamat minden egyes alkalommal, amikor egy X vltoz rtket
kap, minden, az X-hez knyszerrel kttt, hozzrendeletlen Y-t megvizsgl, s Y tartomnybl trli az X
szmra vlasztott rtkkel inkonzisztens rtkeket. Az 5.6. bra bemutatja az elrenz ellenrzses keress
menett a trkpsznezsi problma sorn. Kt fontos dolgot kell megemltennk ezzel a pldval kapcsolatban.
Elszr is vegyk szre, hogy miutn elvgeztk az NyA = vrs s a Q = zld hozzrendelseket, T s DA
tartomnyai egyetlen elemre szkltek, s azzal, hogy az NyA-bl s a Q-bl szrmaz informcit terjesztettk,
teljesen megszntettk az ezen vltozk szerinti elgazst. Az MRV-heurisztika, amely az elrenz ellenrzs
nyilvnval partnere, automatikusan DA-t s T-t vlasztja kvetkeznek. (Tulajdonkppen mg hatkonyabb
eljrss tehetjk az elrenz ellenrzst, ha az MRV-heurisztika munkjhoz szksges informcit
inkrementlisan szmtjuk.) A msik dolog, amire rdemes felfigyelni, az az, hogy a V = kk hozzrendels utn
DA tartomnya res lett. Ezrt az elrenz ellenrzs megllaptja, hogy a {NyA = vrs, Q =zld, V = kk}
rszleges hozzrendels inkonzisztens a problma knyszereivel, s az algoritmus azonnal visszalp.
2.2.2. A knyszerek terjesztse

Az elrenz ellenrzs ugyan sok inkonzisztencit szrevesz, de nem mindet. Pldul nzzk csak az 5.6. bra
harmadik sort. Az lthat itt, hogy amikor DA vrs s Q zld, mind T-nek, mind DA-nak kknek kell lennie.
De ezek szomszdosak, s nem lehet azonos az rtkk. Az elrenz ellenrzs nem veszi szre ezt az
inkonzisztencit, mert nem nz elg messze elre. A knyszerek terjesztse (constraint propagation)
ltalnos kifejezs jelli azt, ha az egyik vltoz knyszernek a tbbi vltozt rint kvetkezmnyeit
terjesztjk: esetnkben NyA-rl Q-ra s T-rl DA-ra kell terjeszteni (ahogy ezt mr az elrenz ellenrzs is
megtette), majd az T s DA kzti knyszerre, hogy szrevehessk az inkonzisztencit. Ezt pedig gyorsan
szeretnnk tenni: semmi rtelme a keress mrett cskkenteni, ha tbb idt tltnk a knyszerek terjesztsvel,
mint az egyszer keresssel tennnk.
128
5.6. bra - A trkpsznezs folyamata elrenz ellenrzses keress esetn. Az els

hozzrendels az NyA = vrs, majd az elrenz ellenrzs trli a vrs rtket a
szomszdos T s DA vltozk tartomnyaibl. A Q = zld hozzrendels utn a zld is
kikerl az T, DA s DW vltozk tartomnyaibl. A V = kk-et kveten a kk is
trldik a DA s DW vltozk tartomnyaibl, s DA szmra nem marad
megengedett rtk.
Az lkonzisztencia (arc consistency) alapul szolglhat egy gyors, az elrenz ellenrzsnl lnyegesen
ersebb knyszerterjesztshez. Az l itt a knyszergrf irnytott leit jelenti, amilyen pldul a DA-bl az
DW-be mutat l. Ha adott DA s DW aktulis tartomnya, akkor ez az l konzisztens, ha DA mindegyik x
rtkhez tallhat egy x-szel konzisztens valamilyen y rtk DW-ben. Az 5.6. bra harmadik sorban DA s
DW pillanatnyi tartomnya rendre a {kk}, illetve a {vrs, kk}. A DA = kk esetn tallhat egy konzisztens
hozzrendels DW-hez, nevezetesen az DW = vrs; ezrt a DA-bl DW-be mutat l konzisztens. Viszont
az DW-bl a DA-ba mutat l nem konzisztens, mert az DW = {kk} hozzrendelsnl a DA-hoz nem tudunk
sznt tallni. Az l gy tehet konzisztenss, hogy az DW tartomnybl trljk a kk rtket.
A DA-bl T-be mutat l mentn is alkalmazhatjuk a keressi folyamat ugyanazon fzisban az
lkonzisztencit. Az 5.6. bra harmadik sora szerint mindkt vltoz rtktartomnya {kk}. Ez azt
eredmnyezi, hogy trlnnk kell a kk-et DA tartomnybl, amely ezzel kirl. Az lkonzisztencia ellenrzs
teht lehetv teszi, hogy korbban szrevegyk az egyszer elrenz ellenrzs ltal fel nem fedett
inkonzisztencit.
Az lkonzisztencia-ellenrzs alkalmazhat elfeldolgoz lpsknt a keress megkezdse eltt, vagy a keressi
folyamat minden egyes hozzrendelst kvet terjesztsi lpsknt (az elrenz ellenrzshez hasonlan).
(Az utbbi algoritmust lkonzisztencia fenntartsnak is, angol rvidtssel MAC-nak nevezik.) Mindkt
esetben addig kell ismtelve alkalmazni a folyamatot, amg nem marad inkonzisztencia. Erre azrt van szksg,
mert amikor egy linkonzisztencit eltvoltand egy rtk kikerl egy vltoz tartomnybl, az ehhez a
vltozhoz mutat leknl j inkonzisztencia jhet ltre. Az AC-3, az lkonzisztencia teljes algoritmusa egy sort
hasznl annak nyilvntartsra, hogy mely lek inkonzisztencijt kell mg ellenriznie (lsd 5.7. bra). Minden
egyes (Xi, Xj) let sorban egyenknt levesszk a tennivalk listjrl s ellenrizzk; ha pedig Xi tartomnynak
brmely vltozjt trlni kell, akkor minden Xi -be mutat (Xk, Xi) let visszatesznk ellenrzsre a sorba. Az
lkonzisztencia-ellenrzs komplexitsa az albbiak szerint vizsglhat: egy binris knyszerkielgtsi
problmban legfeljebb O(n2) l van; minden egyes (Xk, Xi) l csak d alkalommal kerlhet napirendre, mert Xiben sszesen d trlhet rtk van; egy l konzisztencijnak ellenrzse elvgezhet O(d2) idben; teht a
legrosszabb esetben vett teljes id O(n2d3). Ez ugyan lnyegesen kltsgesebb, mint az elretekint ellenrzs,
de az extra kltsg ltalban kifizetdik.1
5.7. bra - Az AC-3 lkonzisztencia algoritmus. Az AC-3 alkalmazst kveten vagy

mindegyik l lkonzisztens, vagy nhny vltoz tartomnya res, azaz a
knyszerkielgtsi problma nem hozhat lkonzisztens alakra (teht nem oldhat
meg). Az AC-3 nevet az algoritmus kitallja (Mackworth, 1977) vezette be, mert ezt
az algoritmust mutatta be cikkben harmadikknt.
A Mohr s Henderson (Mohr s Henderson, 1986) bemutatta AC-4 algoritmus O(n2d2) alatt fut. (Lsd 5.10. feladat.)
129
Mivel a knyszerkielgtsi problmk specilis esetknt tartalmazzk a 3SAT-ot, ezrt nem vrhatjuk, hogy
polinom idej algoritmust tallunk annak eldntsre, hogy egy adott knyszerkielgtsi problma konzisztense. Ebbl arra kvetkeztethetnk, hogy az lkonzisztencia nem tr fel minden lehetsges inkonzisztencit.
Pldul az 5.1. brn az {NyA = vrs, DW = vrs} rszleges hozzrendels inkonzisztens, de az AC-3 nem
tallja meg. Definilhat a terjeszts ersebb formja is, amit k-konzisztencinak (k-consistency) neveznk.
Egy knyszerkielgtsi problma akkor k-konzisztens, ha brmely k 1 vltozbl ll halmaz s ezen
vltozk brmely konzisztens hozzrendelse esetn mindig lehet a k-adik vltoznak konzisztens rtket
tallni. Az 1-konzisztencia pldul azt jelenti, hogy mindegyik individulis vltoz nmagban vve is
konzisztens; ezt csompont-konzisztencinak (node consistency) is nevezik. A 2-konzisztencia ugyanaz, mint
az lkonzisztencia. A 3-konzisztencia azt jelenti, hogy egyms melletti vltozk brmely prja mindig
kiterjeszthet egy szomszdos vltozra; ezt tvonal-konzisztencinak (path consistency) is nevezik.
Egy grf ersen k-konzisztens akkor, ha k-konzisztens, valamint (k 1)-konzisztens, (k 2)-konzisztens s gy
tovbb le egszen az 1-konzisztenciig. Tegyk fel most, hogy van egy n csompontbl ll knyszerkielgtsi
problmnk, s tegyk ersen n-konzisztenss (azaz k-konzisztenss k = n esetben). Ekkor visszalps nlkl
megoldhatjuk a problmt. Elszr egy konzisztens rtket vlasztunk X1 szmra. Ezutn garancink van arra,
hogy tudunk X2 szmra rtket vlasztani, mert a grf 2-konzisztens, X3 szmra, mert a grf 3-konzisztens s
gy tovbb. Minden egyes Xi vltoz esetn csak d rtket kell ellenriznnk a tartomnybl, hogy egy X1 ,..., Xi
1-gyel konzisztens rtket talljunk. Garancink van teht arra, hogy O(nd) idben megoldst tallunk. Persze
semmit sem adnak ingyen: az n-konzisztencit biztost brmely algoritmus legrosszabb esetben n-ben
exponencilis lesz.
Az n-konzisztencia s az lkonzisztencia kztt egy szles kztes mez hzdik: az ersebb konzisztenciaellenrzsek futtatsa tovbb fog tartani, de tbb eredmnnyel jr az elgazsi tnyez cskkentsben s az
inkonzisztens rszleges hozzrendelsek feldertsben. Ki lehet szmolni a legkisebb olyan k rtket, melyre a
k-konzisztencia ellenrzsnek futtatsa visszalps nlkli problmamegoldst tesz lehetv (lsd 5.4.
alfejezet), de ez gyakran nem clszer. A legmegfelelbb konzisztencia-ellenrzsi szint kivlasztsa valjban
leginkbb empirikus tudomny.
2.2.3. Specilis knyszerek kezelse

A knyszerek bizonyos tpusai gyakran fordulnak el a vals problmkban s specilis cl algoritmusokkal
jval hatkonyabban kezelhetk, mint az eddig lert ltalnos cl mdszerekkel. Pldul a MindKl knyszer
azt lltja, hogy a benne szerepl szszes vltozknak mind klnbz rtket kell felvennie (ahogy a
betrejtvnyes pldban lttuk). A MindKl knyszer inkonzisztencia-ellenrzsre egy egyszer mdszer az,
hogy ha m vltoz szerepel a knyszerben, s ha ezeknek egyttesen n klnbz rtke lehet, akkor m > n
esetn a knyszert nem lehet kielgteni.
Ez a kvetkez egyszer algoritmushoz vezet: elszr vegynk ki a knyszerbl minden vltozt, amelynek
egyelem tartomnya van, s vegyk ki ezeknek a vltozknak az rtkeit a megmarad vltozk
tartomnyaibl. Ismteljk ezt a lpst mindaddig, amg van ilyen vltoznk. Ha brmely ponton egy res
130
tartomny jn ltre, vagy tbb vltoznk marad, mint rtknk a tartomnyban, akkor egy inkonzisztencit
dertettnk fel.
Ezt a mdszert hasznlhatjuk arra, hogy az 5.1. bra {NyA = vrs, DW = vrs} rszleges hozzrendelsben
szrevegyk az inkonzisztencit. Figyeljnk fel arra, hogy a DA, az T s a Q vltozk lnyegben egy
MindKl knyszerrel vannak sszektve, mert mindegyik prnak klnbz sznnek kell lennie. Miutn
alkalmaztuk az AC-3-at a rszleges hozzrendelsre, az egyes vltozk tartomnya a {zld, kk} tartomnyra
szklt le. Azaz hrom vltoznk van s csupn kt sznnk, teht megszegtk a MindKl knyszert. Teht a
magasabb szint knyszerekre alkalmazott egyszer konzisztencia-ellenrzsek nha hatkonyabbak, mintha az
ekvivalens binris knyszerek halmazra vizsgltuk volna az lkonzisztencit.
A legfontosabb magasabb rend knyszer taln az erforrsknyszer (resource constraint), amit nha
legfeljebb knyszernek is neveznek. Jellje pldul PA1, ..., PA4 rendre ngy feladathoz hozzrendelt szemlyzet
szmt. Azt a knyszert, miszerint szszesen nem lehet 10-nl tbb embernek feladatot adni, gy rhatjuk fel:
legfeljebb(10, PA1, PA2, PA3, PA4). Az inkonzisztencit egyszeren ki lehet mutatni az aktulis tartomnyok
minimlis rtkeinek sszegzsvel: ha pldul mindegyik vltoz tartomnya a {3, 4, 5, 6}, akkor a legfeljebb
knyszert nem lehet kielgteni. A konzisztencit azltal is rvnyesthetjk, hogy trljk brmely tartomny
maximlis rtkt, amely nem konzisztens az sszes tbbi tartomny minimlis rtkvel. gy ha pldnkban
mindegyik vltoznak {2, 3, 4, 5, 6} a tartomnya, akkor az 5 s a 6 rtkeket mindegyik tartomnybl trlni
lehet.
A nagy erforrs-korltozott egsz rtk problmknl ilyenek pldul az emberek ezreit s jrmvek szzait
mozgat logisztikai problmk ltalban nem tehet meg az, hogy mindegyik vltoz tartomnyt egy nagy
egszhalmazzal brzoljuk, majd ezt a halmazt a konzisztencia-ellenrz mdszerek segtsgvel fokozatosan
cskkentjk. Ehelyett a tartomnyokat az als s a fels hatraikkal brzoljuk, s hatrterjeszts segtsgvel
kezeljk. Tegyk fel pldul, hogy kt repljrat van, a 271-es s a 272-es, amelyekre a replgpek
kapacitsa rendre 165 s 385. A repljrat utasszmnak kezdeti tartomnya teht
Jrat271 [0, 165] s Jrat272 [0, 385]
Tegyk fel most, hogy van egy kln korlt, miszerint a kt jratnak egytt 420 embert kell szlltania. Jrat271
+ Jrat272 [420, 420]. A hatrknyszereket terjesztve a tartomnyokat a kvetkezkre cskkentjk:
Jrat271 [35, 165] s Jrat272 [225, 385]
Akkor neveznk egy knyszerkielgtsi problmt hatrkonzisztensnek, ha minden X vltozra ennek a

vltoznak mind az als, mind a fels hatrrtkre tallhat minden Y vltozhoz olyan rtk, amely kielgti
az X s Y kzti knyszereket. Ezt a fajta knyszerterjesztst (bound propagation) szles krben hasznljk a
gyakorlati knyszerkielgtsi problmk sorn.
2.3. Intelligens visszalps: visszanzni

Az 5.3. bra VISSZALPSES-KERESS algoritmusa egy elg egyszer intzkedst alkalmaz akkor, amikor egy
keressi g meghisul: visszalp az elz vltozra, s megprbl szmra egy msik rtket tallni. Ezt
idrendi visszalpsnek (chronological backtracking) nevezik, mert a legutols dntsi pontot keresi fel jra.
Ebben az alrszben ltni fogjuk, hogy addik erre sokkal jobb mdszer is.
Nzzk meg, mi trtnik, amikor az egyszer visszalpses algoritmust az 5.1. brn lthat problmra
alkalmazzuk rgztett vltozsorrenddel (Q, DW, V, T, DA, NyA, T). Tegyk fel, hogy mr ltrehoztuk a {Q
= vrs, DW = zld, V = kk, T = vrs} hozzrendelst. Amikor a kvetkez vltozval, DA-val
prblkozunk, azt ltjuk, hogy mindegyik rtk srti a knyszert. Visszalpnk T-re, s egy j sznt keresnk
Tasmania szmra. Ez nyilvnvalan butasg: Tasmania tsznezse nem oldja meg a Dl-Ausztrlival
kapcsolatos problmt.
A visszalpses megkzelts intelligens alkalmazsa lenne, ha ahhoz a vltozhalmazhoz mennnk vissza,
amely a meghisulst okozta. Ezt a halmazt konfliktushalmaznak (conflict set) nevezik; esetnkben a DA-hoz
tartoz konfliktushalmaz a {Q, DW, V}. ltalnos esetben egy X vltoz konfliktushalmaza a korbban rtket
kapott vltozk egy halmaza, melyeket X-hez knyszerek ktnek. A visszaugrs (backjumping) a
konfliktushalmaz-beli legutols vltozhoz lp vissza; esetnkben a visszaugrs tugorn Tasmanit, s V
szmra prblna j rtket keresni. Ezt egyszer implementlni a VISSZALPSES-KERESS olyan
131
mdostsval, hogy az sszegyjtse a konfliktushalmazt, mikzben hozzrendelhet rtkeket keres. Ha nem

tall ilyen rtket, akkor a konfliktushalmaz legutols elemt kell visszaadnia (a meghisuls jelzsvel egytt).
Az les szem olvasnak feltnhetett, hogy az elrenz ellenrzs a konfliktushalmazt minden kln munka
nlkl elllthatja: mindig amikor az elrenz ellenrzs X egy hozzrendelsn alapulva Y tartomnybl
kitrl egy elemet, X-et hozz kell adnia Y konfliktushalmazhoz. Ezenkvl mg minden esetben, amikor az
utols rtket trli Y tartomnybl, az Y konfliktushalmazban szerepl vltozkat hozz kell adnia X
konfliktushalmazhoz. Ezek utn mihelyt Y-hoz jutunk, mr azonnal ismerni fogjuk, hogy hova lpjnk vissza,
ha erre szksg van.
Fontos
A sasszem olvasnak valami furcsasg is feltnhetett: a visszaugrs akkor kvetkezik be, amikor egy
tartomny minden rtke konfliktusban van az aktulis hozzrendelsekkel, de az elrenz ellenrzs
felismeri ezt az esemnyt, s megakadlyozza, hogy valaha is ilyen csomponthoz jussunk! Valban,
meg lehet mutatni, hogy a visszaugrs ltal levgott minden gat az elrenz ellenrzs is levgja.
Teht az egyszer visszaugrs redundns az elrenz ellenrzs sorn, vagy pontosabban szlva, egy
olyan keressnl, amely ersebb konzisztencia-ellenrzst, pldul MAC-ot hasznl.
Az elz bekezds megfigyelse ellenre a visszaugrs mgtti tlet tovbbra is hasznlhat marad: lpjnk
vissza a hiba helyre. A visszaugrs akkor veszi szre a kudarcot, amikor egy vltoz rtktartomnya ress
vlik, de sok esetben egy g mr sokkal korbban levgsra lett tlve. Tekintsk ismt az {NyA = vrs, DW
= vrs} rszleges hozzrendelst (amelyik, korbbi megjegyzseink rtelmben, inkonzisztens). Tegyk fel,
hogy a T = vrs-t prbljuk, majd az T, Q, V, DA-kra alkalmazzunk hozzrendelseket. Tudjuk, hogy az
utbbi ngy vltoz esetn semmilyen hozzrendels sem lesz j, gy vgl T prblgatsnl kifogyunk az
rtkekbl. A krds most az, hogy hova lpjnk vissza? A visszaugrs nem fog mkdni, mert T-nek igenis
van az elz hozzrendelsekkel konzisztens rtke: T esetn nincsen teljes konfliktushalmaz a megelz
vltozk kztt, amely felels lenne a kudarcrt. Tudjuk azonban, hogy a ngy vltoz, T, Q, V, s DA
egyttvve a megelz vltozk egy halmaza miatt hisul meg, s ezek azok a vltozk, amelyek kzvetlenl
konfliktusban llnak a krdses nggyel. Ennek alapjn T konfliktushalmaznak egy mlyebb megrtshez
jutottunk: a konfliktushalmaz a megelz vltozk azon halmaza, ami brmely kvetkez vltozval egytt
felels T konzisztens megoldsnak kudarcrt. Esetnkben ez a halmaz az NyA s az DW, teht az
algoritmusnak DW-hez kell visszalpnie tugorva Tasmanit. A konfliktushalmaz ilyen defincijra
tmaszkod visszaugrsi algoritmust nevezzk konfliktusvezrelt visszaugrsnak (conflict-directed
backjumping).
Magyarzatot kell most adnunk arra, hogy miknt lehet kiszmtani ezeket az jfajta konfliktushalmazokat. A
mdszer valjban nagyon egyszer. Egy keressi g terminlsi kudarca mindig azrt kvetkezik be, mert
egy vltoz tartomnya kirl, ennek a vltoznak pedig egy szoksos konfliktushalmaza van. Pldnkban DA
hisul meg, s konfliktushalmaza (mondjuk) az {NyA, T, Q}. Visszaugrunk Q-ra, s Q bepti sajt kzvetlen
konfliktushalmazba (ami az {T, DW}) DA konfliktushalmazt (leszmtva persze Q-t magt), s gy elll
az {NyA, T, DW} konfliktushalmaz. Azaz Q-tl szmtva tovbb mr nincsen megolds felttelezve {NyA,
T, DW} korbbi hozzrendelseit. Teht visszalpnk T-re, amelyik a legutbbi ezek kzl. T felveszi
{NyA, T, DW} {T}-t a sajt kzvetlen konfliktushalmazba, {NyA}-ba, s elll az {NyA, DW}
konfliktushalmaz (ahogy az elz bekezdsben lltottuk). Foglaljuk ssze az eddig mondottakat: jellje Xj az
aktulis vltozt s conf(Xj) a sajt konfliktushalmazt. Ha Xj minden lehetsges rtke meghisul, ugorjunk
vissza a conf(Xj)-beli legutols Xi rtkre s legyen
conf(Xi) conf(Xi) conf(Xj) {Xi}
A konfliktusvezrelt visszaugrs a keressi fa megfelel helyre visz vissza, de nem akadlyozza meg, hogy
ugyanazt a hibt elkvessk a fa egy msik gn. A knyszertanuls (constraint learning) a konfliktusbl
kiemelt j knyszer megtanulsval mdostja a knyszerkielgtsi problmt.
3. Loklis keress knyszerkielgtsi problmknl

A loklis keressi algoritmusok (lsd 4.3. alfejezet) nagyon hatkonynak bizonyulnak sok knyszerkielgtsi
problma megoldsban: a kiindul llapot minden vltozhoz rtket rendel, s az llapottmenet-fggvny
mkdse sorn ltalban egyszerre csak egy vltoz rtkt mdostja. A 8-kirlyn problmban pldul a
132
kezdeti llapot lehet a 8 kirlyn vletlenszer elhelyezse a 8 oszlopban, az llapottmenet-fggvny pedig

kiemel egy kirlynt, s megprblja a sajt oszlopn bell mshova helyezni. Egy msik lehetsg lehetne, ha
gy indulnnk, hogy a 8 kirlyn mindegyikt egy kln oszlopba a nyolc sor permutcijval helyezzk el, s
az a kvetkez llapotokat pedig kt kirlyn sornak felcserlsvel generlnnk.2Tulajdonkppen mr lttunk
egy pldt loklis keress alkalmazsra egy CSP-problma megoldsnl: ilyen volt a hegymszs alkalmazsa
a 8-kirlyn problma megoldsra 3.1. szakasz - Hegymsz keress. Egy msik alkalmazs a WALKSAT 5.2.
szakasz - Loklis keress algoritmus a kielgthetsgi problma megoldsra, mely szintn egy specilis esete a
knyszerkielgtsi problmknak.
Amikor egy vltoznak j rtket vlasztunk, a legnyilvnvalbban knlkoz heurisztika annak az rtknek
kivlasztsa, amelyik a legkevesebb konfliktust eredmnyezi ms vltozkkal. Ezt nevezik min-konfliktusok
(min-conflicts) heurisztiknak. Az algoritmus az 5.8. brn lthat, a 8-kirlyn problmra trtn
alkalmazst az 5.9. brn mutatjuk be, a kirtkels eredmnye pedig az 5.5. brn szerepel.
A min-konfliktusok heurisztika meglepen hatkony sok knyszerkielgtsi problma megoldsban,
klnsen amikor adott egy viszonylag j kezdeti llapot. Teljestmnyt az 5.5. bra utols oszlopa mutatja.
Meglep mdon az n-kirlyn problma esetn a min-konfliktusok algoritmus futsi ideje a kezdeti
elhelyezseket nem szmtva nagyjbl fggetlen a problma mrettl. Akr a milli-kirlyn problmt is
megoldja tlagosan tven lpsben (a kezdeti rtkadst kveten). Ez a figyelemre mlt megfigyels a
kilencvenes vekben komoly kutatmunkhoz vezetett a loklis keress, valamint a knny s nehz problmk
megklnbztetse tern (ezzel a 7. fejezetben mg foglalkozunk). Durvn szlva az n-kirlyn azrt knny a
loklis keress szmra, mert a megoldsok az llapottrben srn helyezkednek el. A min-konfliktusok
algoritmus nehz problmk esetn is mkdik. Alkalmaztk pldul a Hubble-rtvcs megfigyelseinek
temezsre, s az egy htre tervezett megfigyelsek temezsnek elksztshez szksges hrom hetet (!)
krlbell tz percre rvidtette le.
5.8. bra - A MIN-KONFLIKTUSOK algoritmus knyszerkielgtsi problmk megoldsra

loklis keresssel. A kezdeti llapotot vletlenszeren vlasztjuk ki, vagy egy moh
hozzrendelsi folyamat segtsgvel, amely minden egyes sorra kerl vltoznak egy
minimlis-konfliktus rtket vlaszt. A KONFLIKTUSOK fggvny megszmolja az adott
rtk ltal megsrtett knyszerek szmt (adottnak tekintve az aktulis hozzrendelsek
fennmarad rszt).
A loklis keress msik elnye az, hogy alkalmazhat online elrendezsben is, amikor a problma vltozik. Ez
klnsen fontos az temezsi problmkban. Egy lgitrsasg heti temezse jratok ezreit s emberekhez
rendelt feladatok tzezreit tartalmazhatja, de egy rossz idjrs az egyik repltren lehetetlenn teheti az
temezst. Ezt a lehet legkevesebb vltoztatssal szeretnnk helyrehozni, amit a jelenlegi temezsbl kiindul
loklis keressi algoritmussal vgezhetnk el knnyen. Egy visszalpses keress a knyszerek egy j
halmazval ltalban jval tbb idbe telik, s olyan megoldst is tallhat, amely jelentsen klnbzik az
aktulistl.
A loklis keress a clfggvny bevezetsvel knnyen kiterjeszthet egy knyszerkielgtsi problmv. Ebben az esetben a
hegymszsra s a szimullt lehtsre hasznlt sszes technika alkalmazhat a clfggvny optimalizlsra.
2
133
5.9. bra - Egy ktlpses megolds a 8-kirlyn problmra a MIN-KONFLIKTUSOK

felhasznlsval. Mindegyik fzisban egy kirlynnek keresnk j oszlopot. A
konfliktusok szmt (esetnkben a tmad pozciban lv kirlynk szmt)
mindegyik ngyzetben feltntettk. Az algoritmus a kirlynket a MIN-KONFLIKTUSOK
ngyzetre viszi, vletlenszeren trve fel ezzel a ktseket.
4. A problmk struktrja
Ebben az alfejezetben azt vizsgljuk meg, miknt lehet a problma struktrjt, ahogy azt a knyszergrf
megmutatja, felhasznlni a megoldsok gyors keressre. Az itt trgyalt megkzeltsek java rsze nagyon
ltalnos s a knyszerkielgtsi problmkon kvl ms eseteknl is alkalmazhat, pldul a valsznsgi
kvetkeztetsnl. Vgl is a rszproblmkk trtn dekompozci az egyetlen md, mellyel remlhetjk, hogy
megbirkzhatunk a valsvilg-beli problmkkal. Ismt rnzve az 5.1. (b) brra, mikzben a problma
struktrjt keressk, egy tny tlik a szemnkbe ki: Tasmania nincs sszekttetsben a nagy szrazflddel.3
Napnl vilgosabb, hogy Tasmania sznezse s a szrazfld sznezse fggetlen rszproblmk (independent
subproblems): a szrazfld sznezsnek brmely megoldsa s Tasmania sznezsnek brmely megoldsa
kombinlva egyben a teljes trkp sznezsnek is megoldsa lesz. A fggetlensgrl knny megbizonyosodni
a knyszergrf sszefgg komponenseit (connected components) vizsglva. Mindegyik komponens egy CSPi
rszproblmnak felel meg. Ha az Si hozzrendels egy megolds a CSPi rszproblmra, akkor az i Si
hozzrendels megoldsa lesz az i CSPi-nek. Mirt fontos ez? Gondoljunk bele a kvetkezbe: tegyk fel,
hogy minden egyes CSPi-nek c vltozja van az n-bl, ahol c konstans. Ekkor n/c rszproblmnk van, amelyek
mindegyike legfeljebb dc komplexits. Teht a teljes komplexits O(dcn/c), ami lineris n-ben, mg
dekompozci nlkl O(dn), ami exponencilis n-ben. Tegyk ezt mg konkrtabb: egy n = 80-nal jellemzett
Boole CSP-t ngy rszproblmv osztva (c = 20) a megolds futsi idejt a legrosszabb esetben is az
univerzum lethosszrl a msodperc trtrszre rvidtjk le.
Fontos
A teljesen fggetlen rszproblmk nyencfalatok, de ritkk. A legtbb esetben a knyszerkielgtsi
problmk rszproblmi kapcsolatban vannak egymssal. A legegyszerbb eset az, amikor a
knyszergrf egy ft alkot: brmely kt vltozt legfeljebb egy t kt ssze. Az 5.10. (a) bra egy
sematikus pldt mutat erre.4 Meg fogjuk mutatni, hogy brmely fastruktrj knyszerkielgtsi
problma megoldhat a vltozk szma szerinti lineris idben. Az algoritmusnak a kvetkez lpsei
vannak:
1. Vlasszuk ki brmelyik vltozt a fa gykrcsompontjul, s rendezzk a tbbi vltozt a gykrtl a
levelekig gy, hogy mindegyik csompontot a sorrendezsben megelzzn a szlje (lsd 5.10. (b) bra).
Cmkzzk ezeket a vltozkat sorban X1, , Xn-nel. Most, a gykrcsompontot leszmtva, mindegyik
vltoznak pontosan egy szlje van.
2. Alkalmazzuk az lkonzisztencit (Xi, Xj)-re, ahol Xi szlje Xj-nek (j pedig fusson visszafel n-tl 2-ig), s
szksg esetn vegynk ki rtkeket a TARTOMNY[ Xi]-bl.
Egy nagyon gondos trkpsz vagy egy tasmaniai patrita ellenvethetn, hogy Tasmanit nem lehet ugyanolyan sznnel sznezni, mint a
legkzelebbi szrazfldi szomszdjt, nehogy gy tnjn, mintha annak az llamnak a rsze lenne.
4
Sajnos nagyon kevs olyan terlete van a vilgnak (taln Celebesz ilyen), amelynek faszerkezet trkpe van. (Celebesz egy kzeltleg
csillagstruktrj sziget Kzp-Indonziban A ford.)
3
134
3. Adjunk Xj-nek brmilyen, Xi hozzrendelt rtkvel konzisztens rtket ahol Xi szlje Xj-nek, s j 1-tl n-ig
halad.
5.10. bra - (a) Egy faszerkezet knyszerkielgtsi problma knyszergrfja. (b) Az A

csompont gykrnek tekintsvel konzisztens vltozk egy lineris rendezse.
Kt dolog rdemes emltsre. Egyrszt a 2. lps utn a knyszerkielgtsi problma irny szerint
lkonzisztens, teht a 3. lps hozzrendelseiben nincsen szksg visszalpsre (lsd a k-konzisztencia
trgyalst a 2.2.2. szakasz - A knyszerek terjesztse rszben). Msrszt, miutn a 2. lpsben fordtott
sorrendben alkalmaztuk az lkonzisztencia-ellenrzseket, elrtk az algoritmussal, hogy a trlt rtkek ne
veszlyeztessk a mr feldolgozott lek konzisztencijt. A teljes algoritmus O(nd2) idben fut.
Most, hogy fkra mr van egy hatkony algoritmusunk, megvizsglhatjuk, miknt lehet az ltalnosabb
knyszergrfokat valahogyan fkra visszavezetni. Alapveten kt md van erre: az egyik a csompontok
eltvoltsn, a msik a csompontok sszevonsn alapul.
Az els megkzelts gy jr el, hogy nhny vltoznak rtket ad, a maradkok pedig ft fognak alkotni.
Vegyk ismt az 5.11. (a) brn lthat knyszergrfot az Ausztrlia-pldhoz. Ha trlni tudnnk DlAusztrlit, akkor a grf fv vlhatna (ahogy az bra (b) rszn lthat). Szerencsre meg tudjuk tenni ezt (a
grfban, nem a kontinensen) azzal, hogy DA rtkt rgztjk, s a tbbi vltoz tartomnybl trljk azokat
az rtket, melyek inkonzisztensek a DA szmra vlasztottal.
Most teht hogy mind DA-t, mind a r vonatkoz knyszereket eltvoltottuk, a knyszerkielgtsi problma
brmely megoldsa konzisztens lesz a DA szmra vlasztott rtkkel. (Ez binris knyszerkielgtsi
problmk esetn mkdik; a helyzet jval bonyolultabb magasabb rend knyszerek esetn.) Teht a keletkez
fa a fenti algoritmussal megoldhat, s gy az egsz problmt is megoldottuk. ltalnos esetben persze (nem
gy, mint a trkpsznezsnl) a DA szmra vlasztott rtk lehet rossz is, s ekkor egyesvel vgig kell
prblgatni ket. Az ltalnos algoritmus az albbi:
1. Vlasszunk ki egy S rszhalmazt a VLTOZK[csp]-bl gy, hogy a knyszergrf S eltvoltsa utn fa legyen.
S-et ciklikussg-vghalmaznak (cycle cutset) nevezzk.
2. S minden egyes vltozjnak minden egyes, az S-re vonatkoz sszes knyszert kielgt lehetsges
hozzrendelsre:
a. vegyk ki a fennmarad vltozk tartomnyaibl az S szmra vlasztott hozzrendelssel inkonzisztens
rtkeket, s
b. ha a fennmarad knyszerkielgtsi problmnak van megoldsa, akkor adjuk vissza ezt az S
hozzrendelsvel egytt.
Ha a ciklikussg-vghalmaz mrete c, akkor a teljes futsi id O(dc (n c)d2) lesz. Ha a grf kzel fa, akkor
c kicsi lesz, a megtakarts pedig tetemes a gondolkods nlkli visszalpses megoldshoz kpest. A
legrosszabb esetben azonban c akr (n 2) mret is lehet. A legkisebb ciklikussg-vghalmaz megtallsa
NP-nehz problma, de sok hatkony algoritmust ismernk erre a feladatra. Az ltalnos algoritmikus
megkzelts a vghalmaz-kondicionls (cutset conditioning); mg tallkozni fogunk ezzel a 14.
fejezetben, ahol a valsznsgekrl trtn kvetkeztetsekhez hasznljuk.
5.11. bra - (a) Az 5.1. brn szerepl eredeti knyszergrf. (b) A knyszergrf DA
eltvoltst kveten.
135
A msodik megkzelts a knyszergrf tbb, egymssal kapcsolatban lv rszproblmbl ll

fadekompozci (tree decomposition) ellltsn alapul. Mindegyik rszproblmt fggetlenl oldjuk meg, s
a keletkez megoldsokat sszekapcsoljuk. A legtbb oszd meg s uralkodj tpus megkzeltshez hasonlan
ez is akkor mkdik, ha egyik rszproblma sem tl nagy. Egy fadekompozcinak az albbi kvetelmnyeket
kell kielgtenie:
Az eredeti problma mindegyik vltozja szerepeljen a rszproblmk legalbb egyikben.
Ha brmely kt vltozt az eredeti problmban egy knyszer kt ssze, akkor a rszproblmk legalbb
egyikben egytt is el kell fordulniuk (s termszetesen a knyszernek is).
Ha egy vltoz a fa kt rszproblmjban is elfordul, akkor a vltoznak az ezeket a rszproblmkat
sszekt t minden rszproblmjban is el kell fordulnia.
Az els kt kikts biztostja, hogy az sszes vltoz s knyszer elforduljon a dekompozciban. A harmadik
kikts elgg technikai znek tnik, de egyszeren csak arrl szl, hogy brmely adott vltoznak ugyanazzal
az rtkkel kell rendelkeznie az sszes rszproblmban, ahol elfordul a rszproblmkat a fban sszekt
lek knyszertik ezt ki. Pldul DA az 5.12. bra mindegyik sszekttt rszproblmjban elfordul. Az
olvas az 5.11. bra alapjn igazolhatja, hogy van rtelme ennek a dekompozcinak.
Kln-kln megoldhatjuk az egyes rszproblmkat, s ha brmelyiknek is nincs megoldsa, akkor az egsz
problmnak nincs. Ha az sszes rszproblmt meg tudjuk oldani, akkor a kvetkezk szerint megprblhatunk
sszelltani egy globlis megoldst. Elszr is tekintsnk minden egyes vltozt egy megavltoznak,
amelynek tartomnya a rszproblma sszes megoldsnak halmaza. Pldul az 5.12. bra bal szls
rszproblmja az a trkpsznezsi problma, amelynek hrom vltozja s ezek szerint hat megoldsa van
(ezek egyike az {NyA = vrs, DA = kk, T = zld}). Ezutn a rszproblmkat sszekt knyszereket meg
tudjuk oldani a fkra adott fent bemutatott hatkony algoritmussal. A rszproblmk kzti knyszerek
egyszeren csak azrt vannak, hogy a rszproblmk megoldsai megegyezzenek az osztott vltozkban.
Pldul, ha adott az {NyA = vrs, DA = kk, T = zld} megolds az els rszproblmra, akkor a kvetkez
rszproblma egyetlen konzisztens megoldsa a {DA = kk, T = zld, Q = vrs} lehet.
5.12. bra - Az 5.11. bra (a) rszn szerepl knyszergrf egy fa dekompozcija
136
Fontos
Egy adott knyszergrfnak tbb dekompozcija is lehetsges; a dekompozci kivlasztsakor az a cl,
hogy a rszproblmk a lehet legkisebbek legyenek. Egy grf fadekompozcijnak faszlessge (tree
width) eggyel kisebb, mint a legnagyobb rszproblma mrete; magnak a grfnak a faszlessge
pedig definci szerint a legkisebb faszlessg az sszes fadekompozcija kztt. Ha egy grfnak w a
faszlessge, s adott a megfelel fadekompozci, akkor a problmt meg lehet oldani O(ndw+1)
idben. Teht egy fellrl korltos faszlessg knyszergrffal rendelkez knyszerkielgtsi
problma polinomilis idben megoldhat. Sajnlatos mdon egy minimlis faszlessg
fadekompozci megtallsa NP-nehz problma, de vannak olyan heurisztikus mdszerek, amelyek
jl mkdnek a gyakorlatban.
5. sszefoglals
A knyszerkielgtsi problmk (CSP-k) vltozkbl llnak, melyekre knyszerek vonatkoznak. Nagyon
sok fontos valsvilg-beli problma rhat le knyszerkielgtsi problmaknt. A knyszerkielgtsi
problmk struktrja egy knyszergrffal reprezentlhat.
A visszalpses keress (backtracking search), a mlysgi keress egyik formja, a knyszerkielgtsi
problmk megoldsnak gyakran alkalmazott eszkze.
A legkevesebb fennmarad rtk (least-remaining value) heurisztika s a fokszm- (degree-)
heurisztika trgyterlet-fggetlen mdszerek annak eldntsre, hogy a visszalpses keress sorn melyik
vltozt vlasszuk ki kvetkeznek. A legkevsb korltoz rtk (least-constraining value) heurisztika
segtsgl szolglhat a vltozrtkek sorrendezsben.
A visszalpses algoritmus nagyban cskkenteni tudja a problma elgazsi tnyezjt a ltrehozott rszleges
hozzrendelsek kvetkezmnyeinek terjesztsvel. Erre a legegyszerbb mdszer az elrenz ellenrzs
(forward checking). Az lkonzisztencia (arc consistency) kiknyszerts egy jval nagyobb
teljestkpessg technika, de tovbb is tart a futsa.
137
Visszalpsre akkor kerl sor, amikor egy vltozhoz mr nem tallunk hozzrendelhet rtket. A
konfliktusvezrelt visszaugrs (conflict-directed backjumping) kzvetlenl a problma okhoz ugrik
vissza. A min-konfliktusok (min-conflicts) heurisztikt hasznl loklis keresst komoly sikerrel
alkalmaztk a knyszerkielgtsi problmkra.
A knyszerkielgtsi problma komplexitsa szorosan ktdik a sajt knyszergrfjnak struktrjhoz. A
fastruktrj problmk megoldhatk lineris idben. A vghalmaz-kondicionls (cutset conditioning)
az eredeti knyszerkielgtsi problmt fastruktrjv alakthatja, s nagyon hatkonynak bizonyul, ha
sikerl kis vghalmazt tallnunk. A fadekompozci (tree decomposition) technikk a knyszerkielgtsi
problmt rszproblmk fjv alakthatjk, s hatkonyak, ha a knyszergrf faszlessge (tree width)
kicsi.

A knyszerkielgtssel kapcsolatos legkorbbi munka a numerikus knyszerekhez ktdik. Az egsz rtk
egyenlsgi knyszereket Brahmagupta indiai matematikus tanulmnyozta a 7. szzadban. Ezeket gyakran
diofantoszi egyenleteknek is nevezik Diofantosz grg matematikus (kb. 200284) nyomn, aki valjban a
pozitv racionlis szmok esett vizsglta. A lineris egyenlsgek vltozkikszblssel trtn
megoldsnak szisztematikus mdszereit Gauss tanulmnyozta (Gauss, 1829), a lineris egyenltlensg alak
knyszerek megoldsa Fourier-ig vezethet vissza (Fourier, 1827).
A vges tartomny knyszerkielgtsi problmknak hossz trtnetk van. A grfsznezs pldul
(amelynek a trkpsznezs csak egy specilis esete) a matematika rgi problminak egyike. Biggs s trsai
(Biggs s trsai, 1986) szerint a ngyszn-sejtst (minden skbeli grf kisznezhet legfeljebb ngy sznnel)
elszr Francis Guthrie, de Morgan egyik tantvnya fogalmazta meg 1852-ben. A feladat ellenllt a megoldsi
ksrleteknek annak ellenre, hogy nhnyan publikcikban az ellenkezjt lltottk , mgnem Appel s
Haken (Appel s Haken, 1977) elllt egy szmtgpre is tmaszkod bizonytssal.
A knyszerkielgtsi problmk egyes osztlyai gyakran felmerltek a szmtgp-tudomny trtnetben. Az
egyik legkorbbi nagy hats plda a SKETCHPAD rendszer volt (Sutherland, 1963), amely geometriai
knyszereket oldott meg diagramokban, s a modern rajzolprogramok s CAD-programok elfutrnak
tekinthet. A knyszerkielgtsi problmk ltalnos problmaosztlyknt trtn azonostsa Ugo Montanari
(Montanari, 1974) nevhez fzdik. A magasabb rend knyszerkielgtsi problmk visszavezetse
segdvltozk felvtelvel tisztn binris esetre (lsd 5.11. feladat) eredetileg a 19. szzadi logikushoz, Charles
Sanders Peirce-hez fzdik. A CSP-irodalomba Dechter (Dechter, 1990b) vezette be, majd Bacchus s Van
Beek (Bacchus s van Beek, 1998) dolgoztk ki. A megoldsokra vonatkoz preferencikkal kiegsztett
knyszerkielgtsi problmkat szles krben tanulmnyozza az optimalizci irodalma; lsd (Bistarelli s
trsai, 1997)-et a CSP-keretrendszer preferencikat is megenged ltalnostsrl. A vdr-elimincis
algoritmus (Dechter, 1999) szintn alkalmazhat az optimalizcis problmkra.
A knyszerkielgtsi problmk visszalpses keresse Bitnertl s Reingoldtl (Bitner s Reingold, 1975)
szrmazik, noha k az alapalgoritmust a 19. szzadig kvetik vissza. Bitner s Reingold az MRV-heurisztikt is
bevezettk (k ezt leginkbb-korltozott-rtk heurisztiknak neveztk). Az MRV-heurisztika utni eldntetlen
helyzetek megoldsra Brelaz (Brelaz, 1979) a fokszm-heurisztikt alkalmazta. Az gy ltrejv algoritmus,
minden egyszersge ellenre, mig a leghatkonyabb tetszleges grfok k-sznezsre. A legkevsb-korltozrtk heurisztikt Haralick s Elliot javasoltk (Haralick s Elliot, 1980).
A knyszerterjesztsi mdszereket Waltz (Waltz, 1975) sikere tette npszerv, amelyet a szmtgpes ltsnl
felmerl polider-lcmkzsi problmn rt el. Waltz megmutatta, hogy sok problma esetn a
knyszerterjeszts teljesen kikszbli a visszalpst. Montanari (Montanari, 1974) bevezette a knyszerhlzat
s az tvonalkonzisztencia-terjeszts fogalmt. Alan Mackworth (Mackworth, 1977) javasolta az AC-3
algoritmust az lkonzisztencia betartatsra, csakgy, mint annak ltalnos lehetsgt, hogy valamilyen fok
konziszentencia-ellenrzst ptsnk be a visszalpses algoritmusba. Az AC-4, egy jval hatkonyabb
algoritmus, melyet Mohr s Henderson fejlesztettek ki (Mohr s Henderson, 1984). Nem sokkal Mackworth
cikknek megjelense utn a kutatk elkezdtek ksrletezni a konzisztencia-ellenrzsek kltsge s a
keresslevgsban jelentkez elny csereviszonynak feltrkpezsvel. Haralick s Elliot (Haralick s Elliot,
1980) a McGregor ltal lert (McGregor, 1979) minimlis elrenz ellenrzs mellett lltak ki, mg Gaschnig
(Gaschnig, 1979) minden egyes vltoz-hozzrendels utn lkonzisztencia-ellenrzseket javasolt (ezt az
algoritmust nevezte ksbb Sabin s Freuder (Sabin s Freuder, 1994) MAC-nak). Az utbbi cikk valamennyire
meggyz bizonytkot hoz fel amellett, hogy nehezebb problmknl kifizetdik a teljes lkonzisztenciaellenrzs. Freuder (Freuder 1978, 1982) megvizsglta a k-konzisztencit s ennek kapcsolatt a
138
knyszerkielgtsi problmk megoldsnak komplexitsval. Apt (Apt, 1999) egy ltalnos algoritmikus
keretrendszert mutat be a konzisztenciaterjesztsi algoritmusok vizsglatra.
A magasabb rend knyszerek kezelsnek kln mdszerei elssorban a knyszerlogikai-programozs
(constraint logic programming) keretein bell alakultak ki. Marriott s Stuckey (Marriott s Stuckey, 1998)
nagyszer sszefoglalst nyjt errl a kutatsi terletrl. A MindKl knyszert Regin (Regin, 1994)
tanulmnyozta. Az als s fels hatrokbl ll knyszereket Van Hentenryck s trsai vezettk be a
knyszerlogikai programozsba (Van Hentenryck s trsai,1998).
Az alapvet visszaugr mdszer John Gaschnigtl (Gaschnig, 1977; 1979) szrmazik. Kondrak s van Beek
(Kondrak s Van Beek, 1997) megmutattk, hogy ezt az algoritmust lnyegben magban foglalja az elrenz
ellenrzs. A konfliktusvezrelt visszaugrst Prosser (Prosser, 1993) alaktotta ki. Az intelligens visszalps
legltalnosabb s legersebb formjt tulajdonkppen mr nagyon korn kifejlesztette Stallman s Sussman
(Stallman s Sussman, 1977). Technikjuk, a fggsgvezrelt visszalps (dependency-directed
backtracking) az igazsg-karbantart rendszerek (truth maintenance systems) kifejlesztshez vezetett
(Doyle, 1979), amelyekkel a 10.8. alfejezetben foglalkozunk. A kt terlet kzti kapcsolatot De Kleer (De
Kleer, 1989) vizsglta.
Stallman s Sussman munkja a knyszerfeljegyzs (constraint recording) elkpzelst is bevezette: a keress
ltal elrt rszleges eredmnyeket elmentjk s a keress sorn ksbb felhasznljuk. Ezt az elkpzelst a
visszalpses keressbe formlis mdon Dechter (Dechter, 1990a) vezette be. A visszajegyzs (backmarking)
(Gaschnig, 1979) egy klnlegesen egyszer mdszer, amelyben a konzisztens s inkonzisztens pronknti
hozzrendelseket elmentjk, hogy elkerljk a knyszerek ksbbi jraellenrzst. A visszajegyzs tvzhet
a konfliktusvezrelt visszaugrssal; Kondrak s Van Beek (Kondrak s Van Beek, 1997) bemutatnak egy hibrid
algoritmust, amely bizonythatan tartalmazza mindkt kln mdszert. A dinamikus visszalps (dynamic
backtracking) (Ginsberg, 1993) megrzi a vltozk ksbbi rszhalmazaibl szrmaz sikeres parcilis
hozzrendelseket, amikor egy olyan korbbi vlasztsi pontra ugrik vissza, amely a ksbbi sikert nem teszi
rvnytelenn.
A knyszerkielgtsi problmk loklis keresst Kirkpatrick s trsai (Kirkpatrick s trsai, 1983) szimullt
lehtsrl (simulated annealing) (lsd 4. fejezet) szl munkja tette npszerv, s ezt szles krben
alkalmaztk az temezsi problmknl. A min-konfliktusok heurisztikt elszr Gu (Gu, 1989) javasolta, s
tle fggetlenl Minton s trsai (Minton s trsai, 1992) is kifejlesztettk. Sosic s Gu (Sosic s Gu, 1994)
megmutatta, hogyan lehet ennek a heurisztiknak az alkalmazsval a 3 000 000-kirlyn problmt kevesebb,
mint egy perc alatt megoldani. A bmulatos siker, amit a min-konfliktusokat hasznl loklis keress rt el az nkirlyn problmban, a knny s a nehz problmk termszetnek s elterjedtsgnek jrartkelshez
vezetett. Peter Cheesman s trsai (Cheesman s trsai, 1991) feltrkpeztk a vletlenszeren generlt
knyszerkielgtsi problmk nehzsgt, s azt talltk, hogy majdnem minden ilyen problma vagy
trivilisan knny, vagy megoldhatatlan. Csak akkor tallunk nehz problma pldnyokat, ha a
problmagenertor paramtereit egy bizonyos szk tartomnyba lltjuk be, melyen bell a problmk
kzeltleg fele megoldhat. Ezzel a jelensggel a 7. fejezetben foglalkozunk rszletesebben.
A knyszerkielgtsi problmk struktrjnak s nehzsgnek kapcsolatval foglalkoz kutatst Freuder
(Freuder, 1985) indtotta el, aki megmutatta, hogy az lkonzisztens fk esetben a keress visszalpsek nlkl
fut le. Egy hasonl eredmny az aciklikus hipergrfokra val kiterjesztsvel egytt jtt ltre az adatbzisokkal
foglalkoz kutati kzssgben (Beeri s trsai, 1983). Ezen cikkek publiklsa ta komoly halads trtnt a
knyszergrf struktrja s a knyszerkielgtsi problma megoldsi komplexitsnak kapcsolatt illeten. A
faszlessg fogalmt a grfelmlettel foglalkoz Robertson s Seymour (Robertson s Seymour, 1986) vezettk
be. Freuder munkssgra ptve Dechter s Pearl (Dechter s Pearl, 1987, 1989) ugyanezt a fogalmat amit k
induklt szlessgnek (induced width) hvtak alkalmaztk a knyszerkielgtsi problmkra s
kifejlesztettk az 5.4. alfejezetben felvzolt fadekompozcit. Az adatbzis-elmletre s erre az eredmnyre
alapozva Gottlob s trsai (Gottlob s trsai, 1999a, 1999b) kialaktottk a knyszerkielgtsi problma
hipergrfknt trtn felfogsn alapul hiperfaszlessg (hypertree width) fogalmat. Annak megmutatsn
tl, hogy minden w szlessg hiperfa-CSP megoldhat O(nw+1logn) idben, azt is bebizonytottk, hogy a
hiperfaszlessg az sszes korbbi szlessg-mrtket magban foglalja (abban az rtelemben, hogy bizonyos
esetekben a hiperfaszlessg korltozott, bizonyos esetekben pedig nem).
Sok j ttekints ltezik a CSP-technikkhoz, pldul Kumar (Kumar, 1992), Dechter s Frost (Dechter s Frost,
1999) s Bartak (Bartak, 2001); tovbb a Dechter-tl (Dechter, 1992) s Mackworthtl (Mackworth, 1992)
szrmaz enciklopdiacikkek. Pearson s Jeavons (Pearson s Jeavons, 1997) a knnyen kezelhet CSPosztlyokat veszik szmba, belertve mind a strukturlis dekompozcis mdszereket, mind a maguknak a
139
tartomnyoknak vagy a knyszereknek a tulajdonsgaira tmaszkod mdszereket. Kondrak s Van Beek

(Kondrak s Van Beek, 1997) a visszalpses keressi algoritmusok analitikus ttekintst adjk, Bacchus s
Van Run (Bacchus s Van Run, 1998) pedig empirikusabb kpet festenek. Tsang (Tsang, 1993), valamint
Marriott s Stuckey (Marriott s Stuckey, 1998) szvegei jval mlyebbre hatolnak a tmban, mint azt a fejezet
korltai szmunkra lehetv tettk. Sok rdekes alkalmazst mutat be a Freuder s Mackworth szerkesztsben
megjelent gyjtemny (Freuder s Mackworth, 1994). Knyszerkielgtssel foglalkoz cikkek rendszeresen
jelennek meg az Artificial Intelligence-ben s egy specialistknak szl jsgban, a Constraintsben. A legfbb
konferenciakiadvny az International Conference on Principles and Practice of Constraint Programming, amit
gyakran CP-nek hvnak.
5.2. Feladatok
5.1.
Fogalmazza meg a sajt szavaival a knyszerkielgtsi problmk, a knyszerek, a visszalpses keress, az
lkonzisztencia, a visszaugrs s a min-konfliktusok defincijt.
5.2.
Hny megoldsa van az 5.1. bra trkpsznezsi problmjnak?
5.3.
Magyarzza el, mirt j heurisztika a leginkbb korltozott vltozt s a legkevsb korltozott rtket
vlasztani a knyszerkielgtsi problma megoldsnak keresse kzben.
5.4.
Tekintsk a keresztrejtvnyek ksztsnek (nem megoldsnak) problmjt:5 szavakat kell illeszteni egy
ngyszgletes rcsba. A rcs, amely rsze a problma specifikcijnak, megadja, hogy mely ngyzetek
legyenek resek s melyek sttek. Tegyk fel, hogy adott a szavak egy listja (pldul egy sztr), s az a
feladat, hogy az res ngyzeteket a lista tetszleges rszhalmazt hasznlva kitltsk. Fogalmazza meg pontosan
ezt a problmt ktfle mdon:
a. Mint ltalnos keressi problmt. Vlasszon egy megfelel keressi algoritmust, s specifiklja a
heurisztikus fggvnyt (amennyiben elkpzelse szerint szksge van r). A fehr kockkba egyszerre egy
bett vagy egsz szavakat rdemes-e berni?
b. Mint knyszerkielgtsi problmt. A vltozk betk vagy szavak legyenek? Melyik megfogalmazst tartja
jobbnak? Mirt?
5.5.
Adjon precz megfogalmazst az albbiakra mint knyszerkielgtsi problmkra:
a. Ngyszgletes kirak: talljon nemtfed helyeket egy nagy ngyszgben kisebb ngyszgek szmra.
b. rarend-temezs: adott szm professzor s terem van, valamint rgztett az rarendi rk listja is a
lehetsges idablakokkal egytt. Mindegyik professzorhoz adott az ltala tartott rk halmaza.
5.6.
Oldja meg az 5.2. bra betrejtvnyt kzzel, visszalpses keresssel, elrenz ellenrzssel, valamint az
MRV-, illetve a legkevsb korltoz rtk heurisztikval.
5.7.
Az 5.5. bra a klnbz algoritmusokat az n-kirlyn problmn teszteli. Prblja meg ugyanezt egy
vletlenszeren generlt trkpsznezsi problmval is: osszon el az egysgskon vletlenszeren n pontot,
Ginsberg s trsai (Ginsberg s trsai, 1990) tbb mdszert trgyalnak keresztrejtvnyek ksztsre. Littman s trsai pedig a nehezebb
problmt, megoldsukat veszik clba (Littman s trsai, 1999).
5
140
vlasszon ki vletlenszeren egy X pontot, ksse X-et a legkzelebbi olyan Y ponthoz, amelyikkel X mg nincs
sszektve, s a vonal semelyik ms vonalat nem metsz; ismtelje a fenti lpst mindaddig, amg jabb
sszekttets mr nem lehetsges. Szmtsa ki a teljestmnytblzatot a legnagyobb n-re, amire csak tudja
(mind d = 3-at mind, d = 4-et hasznlva). Fzzn magyarzatokat a kapott eredmnyhez.
5.8.
Az AC-3 algoritmus felhasznlsval mutassa meg, hogy az lkonzisztencia alkalmas arra, hogy kimutassa az
5.1. bra {NyA = vrs, V = kk} parcilis hozzrendelsnek inkonzisztencijt.
5.9.
Mi a fastruktrj knyszerkielgtsi problmn futtatott AC-3 legrosszabb esetbeli komplexitsa?
5.10.
Az AC-3 visszarak a sorba minden (Xk, Xi) let, amikor Xi tartomnybl brmely rtket trltek, akkor is, ha Xk
minden rtke konzisztens Xi tbb fennmarad rtkvel. Tegyk fel, hogy minden egyes (Xk, Xi) lhez
nyilvntartjuk a fennmarad Xi rtkek szmt, amelyek az Xk minden egyes rtkvel konzisztensek.
Magyarzza el, hogyan lehet hatkonyan frissteni ezeket az rtkeket, s hogyan lehet ennek segtsgvel az
lkonzisztencit O(n2d2) lpsben elrni.
5.11.
Mutassa meg, hogy egy ternris knyszer, mint pldul az A + B = C egy segdvltoz bevezetsvel hrom
binris knyszerr alakthat. Felttelezheti, hogy a tartomnyok vgesek. (Segtsg: gondoljon egy olyan j
vltozra, amelynek rtkei ms rtkekbl ll prok, s gondoljon olyan knyszerekre, mint X az els eleme
az Y prnak.) Ezutn mutassa meg, hogyan lehet hasonlan kezelni a hromnl tbb vltozt tartalmaz
knyszereket. Vgl mutassa meg, miknt lehet kikszblni az unris knyszereket a vltozk tartomnynak
megvltoztatsval. Ez teljess teszi annak bizonytst, hogy brmely CSP talakthat olyan problmkk,
melyek csak binris knyszereket tartalmazhatnak.
5.12.
Olvasnival. Tegyk fel, hogy ismerjk egy grfrl, hogy van egy legfeljebb k csompontot tartalmaz
ciklikussg-vghalmaza. rjon le n vltozs CSP-k esetn egy egyszer algoritmust a minimlis ciklikussgvghalmaz megkeressre, ahol a futsi id maximuma O(nk). Vgezzen irodalomkutatst olyan vghalmazkeressi eljrsok utn, amelyek a vghalmaz mretben kzeltleg polinomilis idben tallnak kzeltleg
minimlis ciklikussg-vghalmazt. Praktikuss teszi az ilyen mdszerek ltezse a ciklikussg-vghalmaz
mdszereket?
5.13.
Tekintsk a kvetkez logikai rejtvnyt: t klnbz szn hzban t klnbz nemzetisg szemly l, s
mindegyikk ms mrkj cigarettt, ms italt s ms hzillatot szeret. Az albbi tnyek alapjn a
megvlaszoland krds a kvetkez: Hol lakik a zebra, s melyik hzban isznak vizet?
Az angol a vrs hzban lakik.
A spanyolnak kutyja van.
A norvg balrl az els hzban lakik.
A Kools cigarettt a srga hzban szvjk.
A Chesterfieldset szv ember a rks hz mellett lakik.
A norvg a kk hz mellett lakik.
A Winstont szv ember kgykat tart.
A Lucky Strike-ot szv narancslevet iszik.
141
Az ukrn tet iszik.

A japn Parliamentset szv.
A Koolsot abban a hzban szvjk, amely mellett lovat tartanak.
Kvt a zld hzban isznak.
A zld hz kzvetlenl jobbra (n fell nzve) van az elefntcsontszn hztl.
Tejet a kzps hzban isznak.
Vizsglja meg a problma klnbz CSP-reprezentciit. Milyen okokbl rszesten elnyben az egyiket a
msikkal szemben?
142
6. fejezet - Keress ellensges

krnyezetben
Ebben a fejezetben azokat a problmkat vizsgljuk meg, amelyek akkor merlnek fel, amikor egy gens elre
tervez ellensges genseket tartalmaz vilgban.
1. Ktszemlyes jtkok1
A 2. fejezetben tbbgenses krnyezeteket (multiagent environments) vezettnk be, ahol minden gensnek
szmolnia kell ms gensek cselekvseivel s azzal is, hogy azok hogyan befolysoljk a jltt. Ms gensek
nem megjsolhat viselkedse szmos lehetsges eshetsget (contingencies) visz be az gens
problmamegoldsba, ahogy ezzel a 3. fejezetben foglalkoztunk. A 2. fejezetben bevezettk a tbb gensbl
ll kooperatv (cooperative) s verseny- (competitive) krnyezeteket is. A versenykrnyezetek, ahol az
gensek cljai konfliktusban vannak, elvezetnek az ellensgek melletti keresshez (adversarial search) amit
sokszor ktszemlyes jtkoknak (games) neveznk.
A matematikai jtkelmlet (game theory) a gazdasgtan egyik ga, mely a tbbgenses krnyezeteket
jtknak tekinti, feltve, hogy egy-egy gens hatsa msokra szignifikns, fggetlenl attl, hogy az gensek
kooperatvak vagy versengk.2 Az MI-ben a jtkok ltalban igen specializltak amit a jtkelmleti
szakemberek determinisztikus, vltott lps, ktszemlyes, zrussszeg teljes informcij jtkoknak
(zero-sum games of perfect information) neveznek. A mi nyelvezetnkben ez azt jelenti, hogy kt gens
helyezkedik el egy determinisztikus s teljesen megfigyelhet krnyezetben, a cselekvseik vltjk egymst, s
a jtk vgn a hasznossgrtkeik mindig azonosak s ellenttes eljelek. A sakkban pldul, ha az egyik
jtkos gyz (+1), akkor a msik szksgszeren veszt (1). ppen a hasznossgrtkekben tapasztalt
ellentttl lesz a helyzet ellensges. Ebben a fejezetben rviden foglalkozunk a tbbjtkos jtkokkal, a nem
zrussszeg jtkokkal s a sztochasztikus jtkokkal, de a tnyleges jtkelmlettel csak a 17. fejezetben
fogunk foglalkozni.
A jtkok a civilizci kezdete ta nha mr ijeszt mrtkben foglalkoztatjk az emberek intellektulis
kpessgeit. A jtkok absztrakt termszetk miatt vonz terletet jelentenek az MI-kutatk szmra. Egy jtk
llst knny reprezentlni, s az gensek kpessgei ltalban kisszm, jl definilt eredmnyre vezet
cselekvsre korltozdnak. Az olyan fizikai jtkoknak, mint a krikett vagy a jgkorong, sokkal bonyolultabb a
lersa. Sokkal tbb lehetsges cselekvssel rendelkeznek, s a cselekvsek leglis voltt ppensggel nem tl
precz szablyok hatrozzk meg. A robotfutballt kivve e fizikai jtkok az MI-kzssgben sok rdekldst
nem keltettek.
A ktszemlyes jtkok az egyik legrgebbi, az MI ltal vizsglt terletet jelentik. 1950-ben, alighogy a
szmtgpek programozhatv vltak, Konrad Zuse (az els programozhat szmtgp s az els
programozsi nyelv megalkotja), Claude Shannon (az informcielmlet atyja), Norbert Wiener (a korszer
szablyozselmlet megteremtje) s Alan Turing elkezdtek sakkprogramokkal foglalkozni. Azta a jtkok
sznvonala sokat fejldtt, addig a szintig, hogy a gpek tlszrnyaltk az embert dmajtkban s Othellban,
megvertk (br nem minden alkalommal) ostblban s sakkban az emberi bajnokokat, s versenykpesek ms
jtkokban is. Kivtel a g, ahol a szmtgp csak amatr szinten jtszik.
A 3. fejezetben tanulmnyozott jtkproblmkkal ellenttben a ktszemlyes jtkok azrt rdekesek, mert
nagyon nehz ket megoldani. A sakknl pldul az tlagos elgazsi tnyez 35, s egy jtk sorn gyakran
elfordul, hogy mindkt fl 5050 lpst is megtesz, vagyis a keressi fnak 35100, illetve 10154 csompontja van
(br a keressi grfnak ebbl csak 1040 klnbz csompontja lesz). A jtkok, ppgy, mint a vals vilg,
azt a kpessget ignylik, hogy valamilyen dntst hozzunk, akkor is, ha az optimlis dnts kiszmtsa
kivitelezhetetlen. A jtkok nagyon komolyan bntetik a rossz hatkonysgot. Mg az A* algoritmus azon
implementcija, ami csak fele olyan hatkony, egyszeren csak ktszer annyi ideig fut, hogy megkapja az
eredmnyt, addig egy olyan sakkprogramot, amely feleolyan hatkonyan gazdlkodik az idejvel, feltve, hogy
minden ms szempontbl egy msik implementcival azonos, valsznleg a fldbe dnglnnek. A
Annak ellenre, hogy az angol game sz magyar sz szerinti fordtsa jtk, gy reztk, hogy az ilyen fordts magyarul sszemossa
a game s a toy kztti klnbsget. A ktszemlyes jtkok szhasznlat alkalmas kompromisszum, annak ellenre, hogy az ebben a
fejezetben trgyalt mdszerek olyan ktszemlyes jtkokra is kiterjeszthetk, ahol tbb jtkos van. (A ford.)
2
A nagyon sok gensbl ll krnyezeteket jobb gazdasgoknak (economies) s nem jtkoknak nzni.
1
143
Keress ellensges krnyezetben
jtkelmleti kutats ezrt szmos rdekes tlethez vezetett, hogy a rendelkezsre ll idt hogyan hasznljuk a
lehet legjobb mdon.
A problma trgyalst az elmletileg lehetsges legjobb lps defincijval s ennek egy keresalgoritmusval
kezdjk. Ezek utn olyan technikkat nznk meg, amelyek korltozott id alatt is alkalmasak egy j lps
megvlasztsra. A nyess vagy metszs (pruning) lehetv teszi szmunkra, hogy figyelmen kvl hagyjuk a
keressi fa azon rszeit, amelyek nincsenek befolyssal a vgs vlasztsra. A heurisztikus kirtkel
fggvnyek (evaluation functions) lehetv teszik, hogy kimert keress nlkl meg tudjuk becslni egy adott
llapot valdi hasznossgt. A 6.5. alfejezet olyan ktszemlyes jtkokat trgyal, amelyekben a vletlen is
megjelenik, mint pldul az ostbla.3 Foglalkozunk a briddzsel is, amely tartalmazza a hinyos informci
(imperfect information) elemeit, hiszen egy-egy jtkos szmra az sszes krtya nem ismert. Megnzzk
vgl, hogy a jelenlegi legfejlettebb jtkprogramok hogyan gyzik le az ers emberi ellenfeleket, s milyenek a
jvbeli trendek.
2. Optimlis dntsek ktszemlyes jtkokban

A ktszemlyes jtkokkal fogunk foglalkozni, ahol a kt jtkost a hamarosan nyilvnvalv vl okbl
MAX-nak s MIN-nek fogjuk hvni. MAX lp elszr, majd a jtkosok felvltva lpnek, amg a jtk vget nem r.
A jtk vgn a gyztes jtkos pontokat kap (vagy nha a vesztes kap bntetpontokat). A jtkot formlisan
egyfajta keressi problmaknt lehet definilni az albbi komponensekkel:
A kiindul llapot (initial state), ami magban foglalja a tblallst, valamint azt, hogy ki fog lpni.
Egy llapottmenet-fggvny (successor function), amely (lps, llapot) prok listjval tr vissza,
megadva a leglis lpseket s az azokbl kvetkez llapotokat.
Egy vgteszt (terminal test), ami meghatrozza, hogy a jtknak mikor van vge. Azok az llapotok, ahol a
jtk befejezdtt, a vgllapotok (terminal states).
Egy hasznossgfggvny (utility function, amit nyeresgfggvnynek payoff function is neveznek) a
jtk vgeredmnyhez egy szmrtket rendel. A sakkban a vgeredmny gyzelem, veresg vagy dntetlen
lehet, amit a +1, 1 s 0 rtkekkel brzolhatunk. Nhny jtk ennl tbb vgeredmnyre vezethet. Pldul
az ostblban a nyeresg +192 s 192 kztt vltozhat. Ebben a fejezetben fleg a zrussszeg jtkokkal
foglalkozunk, br a nem zrussszeg jtkokat is megemltjk.
6.1. bra - A 3 3-as ambajtk (rszleges) keressi fja. A legfels csompont a

kiindul llapot. MAX lp elszr, egy X-et tve valamelyik res ngyzetbe. A keressi fa
egy rszt mutatjuk, MIN (O) s MAX vltakoz, egymst kvet lpseit megadva, amg el
nem rjk a vgllapotokat, melyekhez a jtk szablyai szerint lehet hasznossgi
rtkeket hozzrendelni.
Az ostbla (backgammon) Magyarorszgon nem annyira elterjedt, br szmos vidken ismert. A lnyege, hogy egy specilis tbln,
felvltva lpve, a bbukat az ellenfl trfelre juttassuk. F rdekessge, ami a nehzsgek forrsa is egyben, hogy a leglis lpsek
mindenkori vlasztka vletlenszeren egy kockadobsnak megfelelen alakul. (A ford.)
3
144
A kezdeti llapot s mindkt fl leglis lpsei a jtk jtkfjt (game tree) definiljk. A 6.1. bra a 3 3-as
ambajtk keressi fjnak egy rszt mutatja. Kezdeti llapotban MAX-nak kilenc lehetsges lpse van. A
jtk sorn MAX s MIN felvltva tesznek X-et illetve O-t, mg egy vgllapotnak megfelel levlcsompontba el
nem jutnak, ahol az egyik jtkosnak egy sorban, egy oszlopban vagy az egy tl mentn hrom O-ja vagy X-e
lesz, vagy minden ngyzet ki lesz tltve. Az egyes levlcsompontok alatt tallhat szmok a vgcsompontnak
a MAX szempontjbl mrt hasznossgt jellik. A nagy rtkekrl felttelezzk, hogy jk MAX szmra s
rosszak MIN szmra (amibl a jtkosok neve is ered). MAX feladata, hogy a jtkft (s fleg a vgllapotok
hasznossgt) a legjobb lps meghatrozsra hasznlja fel.
2.1. Optimlis stratgik

Egy normlis keressi problmnl, az optimlis megolds nem lenne ms, mint a clllapothoz vezet lpsek
szekvencija azaz egy olyan vgllapothoz vezet lpsszekvencia, amely a gyzelmet jelenti. Egy jtkban
azonban MIN-nek is van beleszlsa a dologba. Ezrt MAX-nak egy olyan stratgit (strategy) kell tallnia,
amely meghatrozza MAX lpst a kezdeti llapotban, majd a MIN lehetsges vlaszaibl keletkez llapotokban,
majd ismt MAX lpseit a MIN erre vonatkoz lehetsges vlaszaibl keletkez llapotokban s gy tovbb.
Nagyjbl azt lehet mondani, hogy egy optimlis stratgia olyan kimenetelekhez vezet, amelyek legalbb olyan
jk, mintha brmilyen ms stratgival egy tvedhetetlen opponens ellen jtszannk. Elszr megmutatjuk,
hogyan kell megkeresni az optimlis stratgit, br ennek kiszmtsra MAX-nak ltalban nem lesz elegend
ideje az ambnl bonyolultabb jtkokban.
Mg egy olyan egyszer jtk, mint az amba is tl bonyolult ahhoz, hogy megmutassuk a teljes keressi ft,
ezrt ttrnk a 6.2. brn lthat abszolt trivilis jtkra. MAX lehetsges lpseit a1-gyel, a2-vel s a3-mal
cmkztk meg. Az a1-re MIN lehetsges vlaszait a b1, b2, b3 stb. jellik. Ez a konkrt jtk MAX s MIN egy-egy
lpse utn vget r. (A jtkok nyelvn azt mondjuk, hogy ez a fa egy lps mly s kt fl lpsbl vagy
lpsvltsbl (ply) ll.) A vgcsompontok hasznossga ebben a jtkban 2 s 14 kz esik.
6.2. bra - Egy lpsvltsos jtkfa. A csompontok MAX lpseit, mg a

csompontok MIN lpseit jellik. A vgcsompontok a hasznossgi fggvnnyel
szmtott hasznossgi rtkeket MAX szemszgbl mutatjk, mg a tbbi csompontnl a
minimax rtkt jelltk be. MAX legjobb lpse a gykrben a1, mert ez vezet a
legmagasabb minimax rtk kvethz. MIN legjobb vlasza b1, mert ez vezet a
minimlis minimax rtk kvethz.
145
Adott jtkfa mellett az optimlis stratgia meghatrozshoz az egyes csompontok minimax rtkt kell
megvizsglni, amit MINIMAX-RTK (n)-knt runk le. Egy csompont minimax rtke a csompont hasznossga
MAX szemszgbl, feltve, hogy innen kezdve egszen a jtk befejezsig mindkt jtkos optimlisan lp.
Egy vgllapot minimax rtke termszetesen a sajt hasznossga. Tovbb, adott minimax rtkek mellett, MAX
szeretne a maximlis rtk, MIN pedig a minimlis rtk llapotba jutni. Rendelkeznk teht az albbi
fggvnnyel:
MINIMAX-RTK (n) =
HASZNOSSG (n)
ha n egy vgllapot,
maxs Kvetk(n) MINIMAX-RTK(s) ha n egy MAX csompont,

mins Kvetk(n) MINIMAX-RTK(s)
ha n egy MIN csompont.
Alkalmazzuk ezeket a defincikat a 6.2. brn lthat jtkfra. Az bra aljn lv clllapotokat mr
felcmkztk hasznossgi rtkkkel. Az els, B cmkj, MIN csompontnak hrom kvetje van 3, 12 s 8
rtkkel, a B csompont minimax rtke teht 3. Hasonlan a kt msik MIN csompontnak 2 a minimax rtke.
A gykr egy MAX csompont; a kvetinek minimax rtkei 3, 2, s 2, gy a gykr minimax rtke 3.
Azonosthatjuk a gykr minimax dntst (minimax decision) is. MAX szmra az a1 cselekvs az optimlis
vlaszts, mert maximlis rtk kvethz vezet.
Ezen optimlis jtkdefinci MAX szmra felttelezi, hogy MIN is optimlisan jtszik hiszen a dolgok
kimenetelt MAX szmra a legrosszabb esetre kivettve maximalizlja. Mi van azonban, ha MIN nem jtszik
optimlisan? Ekkor knny beltni (6.2. feladat), hogy MAX mg jobban jr. Szuboptimlis ellenfllel szemben
sok stratgia elkpzelhet, amely az optimlisnl jobb, azonban ezek a stratgik rosszabbnak fognak bizonyulni
optimlis ellenfelekkel szemben.
2.2. A minimax algoritmus

A minimax algoritmus (minimax algorithm) (6.3. bra) az optimlis dntst az aktulis llapotbl szmtja ki,
felhasznlva az egyes kvet llapotok minimax rtkeinek kiszmtsra a definil egyenletekbl kzvetlenl
szrmaztatott, egyszer rekurzv formult. A rekurzi egszen a falevelekig folytatdik, majd a minimax
rtkeket a fa mentn visszafel terjesztjk (back-up), ahogy a rekurzi visszalp. A 6.2. brn pldul az
algoritmus elszr rekurzv mdon leereszkedik a hrom bal als csomponthoz, a HASZNOSSG fggvnnyel
kiszmtva, hogy az rtkek rendre 3, 12, s 8. Majd az algoritmus elveszi ezen rtkek minimumt, azaz 3-t,
s ezt adja vissza, ahogy a B csomponthoz visszatr. Hasonl procedra eredmnyezi a tovbbi visszaadott
rtkeket: 2-t a C s 2-t a D csompont szmra. Vgl vesszk a 3, 2 s 2 rtkek maximumt, hogy a gykr
ltal visszaadott 3-as rtket megkaphassuk.
146
A minimax algoritmus a jtkfa teljes mlysgi feltrst vgzi. Ha a fa maximlis mlysge m, s minden
csompontban b leglis lps ltezik, akkor a minimax algoritmus idkomplexitsa O(bm). A trkomplexitsa
O(bm) egy olyan algoritmus szmra, amely az sszes kvett egyszerre szmtja ki, s O(m) egy olyan
algoritmus esetben, amely a kvetket egyenknt generlja 4.3. szakasz - Mlysgi keress. Vals jtkok
esetn ez az idkomplexits az algoritmust teljesen haszontalann teszi, az algoritmus azonban j alap a jtkok
matematikai elemzshez s a gyakorlati szempontbl alkalmasabb algoritmusokhoz.
6.3. bra - Egy algoritmus a minimax dntsek kiszmtsra. Az algoritmus a lehet

legjobb lpshez tartoz opertort adja vissza, vagyis ahhoz a lpshez tartoz
opertort, amelyik a legnagyobb hasznossgi rtkkel rendelkez eredmnyre vezet,
felttelezve, hogy az ellenfl gy jtszik, hogy minimalizlja a hasznossgi rtket. A
MAX-RTK s MIN-RTK fggvnyek vgigmennek a teljes jtkfn, le egszen a
levlcsompontokig, hogy meghatrozzk a csompont felfel terjesztett rtkt.
2.3. Optimlis dntsek tbbszemlyes jtkokban

Szmos elterjedt jtkban tbb jtkos is rszt vehet, nem csupn kett. Vizsgljuk meg, hogy a minimax tletet
hogyan terjeszthetjk ki tbbszemlyes jtkok esetre. Technikai szempontbl a dolog egyszer, azonban
felmerl nhny rdekes koncepcionlis krds.
Elszr is egy csompontokhoz rendelt egyetlen rtket egy rtkvektorral kell felvltani. Pldul egy
hromszemlyes jtkban, ahol hrom jtkos, A, B s C vesz rszt, minden csomponttal egy vA, vB, vC
vektort trstunk. Vgllapotok esetn ez a vektor megadja az llapot hasznossgt minden jtkos
szemszgbl (ktszemlyes zrussszeg jtkokban a ktelem vektort egy rtkre le lehet egyszersteni,
mert az rtkek mindig ellenttesek). Ezt a kibvtst legjobb gy implementlni, hogy a HASZNOSSG fggvny
adja vissza a hasznossgok vektort.
Most a nem terminlis llapotokkal foglalkozunk. Nzzk meg a 6.4. brn lthat jtkfban az X jelzs
csompontot. Ebben az llapotban a C jtkos dnti el, hogy mit csinljon. Egyik vlasztsa a vA = 1, vB = 2, vC
= 6 , mg a msik a vA = 4, vB = 2, vC = 3 vektorokkal rendelkez vgllapothoz vezet. Mivel 6 tbb, mint 3,
C-nek az els lpst kellene vlasztania. Ez azt jelenti, hogy ha a jtk az X csompontot elri, a kvetkez
lps a vA = 1, vB = 2, vC = 6 hasznossg vgllapothoz fog vezetni. X visszaadott rtke gy ez a vektor.
ltalnossgban egy n csompont visszaadott rtke annak a kvetnek a hasznossgvektora, amely kvetnek
az n csompontnl vlaszt jtkos szempontjbl legnagyobb az rtke.
147
6.4. bra - Hrom jtkos (A, B, C) jtkfja a hrom els fl lps esetn. Minden
csompontot az sszes jtkos szemszegbl szmtott rtkkel cmkztk meg. A
legjobb lpst a gykrnl jelltk be.
Mindenki, aki olyan tbbszemlyes jtkokat jtszik, mint pldul a Diplomacy, gyorsan meggyzdhet, hogy
a ktszemlyes jtknl sokkal tbbrl van itt sz. Tbbszemlyes jtkban a jtkosok kztt ltalban
lehetsgesek formlis vagy informlis szvetsgek (aliances). A jtk elrehaladtval szvetsgek kttetnek s
bontatnak fel.
Hogyan is kellene rtelmezni egy ilyen viselkedst? Termszetes kvetkezmnye-e a szvetsg az egyes
jtkosok optimlis stratgiinak egy tbbjtkos jtkban? gy tnik, hogy ez igaz lehet. Tegyk fel pldul,
hogy A s B gyengn, mg C ersebben ll. Akkor nha optimlis mind A, mind B szmra, ha nem egymst,
hanem C-t tmadjk meg, hogy az egyenknt ne vgezzen velk. Ily mdon az egyttmkds tisztn egoista
viselkedsbl is kialakulhat. Persze ahogy az egyttes tmadsnak kitett C gyengl, a szvetsg rtke cskken,
s vagy A, vagy B a megegyezst megszegheti. Egyes esetekben az explicit szvetsgek az gyis
bekvetkezend esemnyeket rgztik konkrt mdon. Ms esetekben szocilis megblyegzs jr a szvetsg
megszegsrt, gy a jtkosnak mrlegelnie kell a szvetsg megszegsnek rvid idej elnyt s a
szavahihetetlenknt val megblyegzs hossz tv htrnyt. (Az ilyen bonyodalmakrl tbbet a 17.6.
alfejezetben.)
Ha a jtk nem zrussszeg, akkor egyttmkds kt jtkos esetn is ltrejhet. Tegyk fel pldul, hogy
ltezik olyan vgllapot, amelynek hasznossga vA = 1000, vB = 1000 , s 1000 mindkt jtkos szmra az
elrend legnagyobb hasznossg. A kt jtkos optimlis stratgija akkor az, hogy ennek az llapotnak az
elrse rdekben mindent megtesznek azaz a kt jtkos automatikusan kooperlni fog, hogy a klcsnsen
elnys clt elrjk.
3. Alfa-bta nyess
A minimax keress problmja, hogy a jtkban a megvizsgland llapotok szma exponencilis a lpsek
szmban. A kitevtl sajnos megszabadulni nem tudunk, m lnyegben megfelezhetjk. A trkk az, hogy
lehetsges a korrekt minimax dnts kiszmtsa anlkl, hogy a jtkfban minden csompontra r kelljen
nzni. Ehhez klcsnzhetjk a 4. fejezetben megismert nyess (prunning) gondolatt, s a jtkfa nagyobb
rszt a megfontolsokbl kihagyhatjuk. A konkrt vizsglt technika az alfa-bta nyess (alpha-beta
prunning). Ha ezt egy standard minimax fra alkalmazzuk, ugyanazt az eredmnyt adja vissza, mint a minimax,
a dntsre hatssal nem lv gakat azonban lenyesi.
Tekintsk ismt a 6.2. brn lthat egylpsvltsos jtkft. Kvessk mg egyszer az optimlis dnts
kiszmtsnak menett, most azonban ksrjk figyelemmel, hogy mit is tudunk valjban a folyamat minden
pontjban. A lpsekhez a 6.5. bra ad magyarzatot. Az eredmny az, hogy meg tudjuk hatrozni a minimax
dntst anlkl, hogy a kt levlcsompontot brmikor is megnznnk.
A mdszert rtelmezhetjk mskppen is, mint a MINIMAX-RTK fggvny egy egyszerstst. Legyen a C
csompontot a 6.5. brn lthat, ki nem rtkelt kvet csompontok rtke x s y, s legyen z a kett
minimuma. A gykrcsompont rtke ekkor:
148
MINIMAX-RTK (gykr) = max(min(3, 12, 8), min(2, x, y), min(14, 5, 2)
= max(3, min(2, x, y), 2)

= max(3, z, 2) ahol z 2
=3
Ms szval a gykr rtke s gy a minimax dnts fggetlen a lenyesett levelek x s y rtkeitl.
Fontos
Az alfa-bta nyesst tetszleges mlysg fkra lehet alkalmazni, s sokszor lehetsges, hogy levelek
helyett teljes rszfkat nyessnk le. Az ltalnos elv az albbi: tekintsnk egy olyan n csompontot
valahol a fa belsejben (lsd 6.6. bra), hogy a Jtkosnak lehetsge legyen e csompontba lpni. Ha a
Jtkosnak van az n szlcsompontjnl vagy ettl feljebb brmelyik dntsi pontban egy jobb
vlasztsa, m, akkor az n-t az aktulis jtkban soha nem rjk el. Ha az n-rl teht (nhny
kvetjnek megvizsglsval) mr eleget tudunk, hogy ehhez a konklzihoz jussunk, a csompontot
nyugodtan lenyeshetjk.
Emlkezznk, hogy a minimax keress mlysgi keress, egy adott idben teht elegend a fban egy egyedi t
menti csompontokkal foglalkozni. Az alfa-bta nyess megnevezse kt paramtertl szrmazik, mely
paramterek az t mentn megjelen visszalptetett rtkek korltjaira vonatkoznak:
= az t mentn tetszleges dntsi pontban a MAX szmra eddig megtallt legjobb (azaz a legmagasabb
rtk) vlaszts rtke.
= az t mentn tetszleges dntsi pontban a MIN szmra eddig megtallt legjobb (azaz a legkisebb rtk)
vlaszts rtke.
6.5. bra - Az optimlis dnts kiszmtsnak lpsei a 6.2. brn lthat jtkfa
esetn. Minden ponton a lehetsges rtkek terjedelmt mutatjuk meg minden egyes
csompont szmra. (a) A B csompont alatt az els levlnek 3 az rtke. B teht, ami
egy MIN csompont, legfeljebb 3 rtk. (b) A B alatti msodik csompontnak 12 az
rtke. MIN ezt a lpst elkerli, gy B rtke mg mindig legfeljebb 3. (c) A B alatti
harmadik levlnek 8 az rtke. B sszes kvetit lttuk mr, B rtke teht pontosan 3.
Most azt kvetkeztethetjk ki, hogy a gykr rtke legalbb 3, mert MAX-nak a
gykrben 3-as rtk vlasztsa van. (d) A C alatti els levlnek 2 az rtke. C teht,
ami egy MIN csompont, legfeljebb 2 rtk. De mi tudjuk mr, hogy B-nek 3 az rtke,
MAX teht C-t soha nem fogja vlasztani. Azrt nem is rdemes C tovbbi kvetit
megvizsglni. Ez az alfa-bta nyess egy pldja. (e) A D alatti els levlnek 14 az
rtke, gy D rtke legfeljebb 14. Ez tbb mint MAX legjobb alternatvja (azaz 3), meg
kell vizsglni ezrt D kvetit. Jegyezzk meg, hogy most a gykr minden kvetje
esetn rendelkeznk rtkkorlttal, a gykr rtke legfeljebb 14. (f) D msodik
kvetjnek rtke 5, gy tovbb kell folytatnunk a vizsglatot. A harmadik kvet
rtke 2, D rtke teht pontosan 2. MAX dntse a gykrnl, hogy B fel kell lpni, 3-as
rtkkel.
149
Az alfa-bta keress az s a rtkeit munka kzben frissti, s a csompontnl a megmarad gakat lenyesi
(a rekurzv hvst terminlja), amint csak biztoss vlik, hogy az aktulis csompont rtke rosszabb lesz, mint
az aktulis s rtk, MAX-ra, illetve MIN-re. A teljes algoritmust a 6.7. bra mutatja. Btortjuk az olvast,
hogy a 6.5. brn lthat fra alkalmazva, kvesse vgig az algoritmus mkdst.
Az alfa-bta nyess hatkonysga ersen fgg a kvet csompontok vizsglatnak sorrendjtl. Pldul a 6.5.
(e) s (f) brn D egyetlen kvetjt sem lehetne lenyesni, mert elszr a legrosszabb kvett ( MIN
szemszgbl) generltuk. Ha a harmadik kvett elsnek generlnnk, a marad kettt le lehetne nyesni. Ez
azt sugallja, hogy rdemes lenne elszr a legjobbnak tn csompontokat megvizsglni.
6.6. bra - Alfa-bta nyess: ltalnos eset. Ha m a Jtkos szmra jobb, mint n, akkor
a jtk sorn sosem fogunk elrni n-be.
150
Ha felttelezzk, hogy ez megtehet,4 akkor az alfa-bta nyessnek elg az O(bm/2) csompontot megvizsglni, a
legjobb lps kiszmtshoz, a minimax O(bm) rtkvel szemben. Ez azt jelenti, hogy az effektv elgazsi
tnyez b helyett
lesz pldul a sakk esetben 35 helyett 6. Ms szval, az alfa-bta nyess ugyanannyi
id alatt ktszer olyan messzire nz, mint a minimax. Ha a kvet csompontokat vletlen sorrendben
vizsglnnk a legjobbat-elszr helyett, a vizsglt csompontok ssz-szma O(b3m/4) lenne, mrskelt rtk bkre. A sakk esetben egy igen egyszer rendezfggvny (mint pldul az, hogy elszr a letsekkel, majd a
tmadsokkal, ezt kveten az elrelpsekkel s vgl a htralpsekkel prblkozunk) a legjobb esetre
vonatkoz O(bm/2) eredmnyt egy 2-es tnyez erejig kzelti meg. Dinamika hozzadsa a lpsrendez
smkhoz, mint pldul azokkal a lpsekkel prblkozni elszr, amelyek legutbb a legjobbnak bizonyultak,
az elvi korlthoz egszen kzel visz.
A 3. fejezetben megjegyeztk, hogy a keressi fban az ismtld llapotok a keressi kltsgekben
exponencilis nvekedshez is vezethetnek. Jtkokban gyakran elfordulnak ismtld llapotok a
transzpozcik (transpositions) a lpsi szekvencinak az ugyanahhoz az llshoz vezet klnbz
permutcii miatt. Ha pldul Fehr lpse a1, amire Fekete b1 lpssel vlaszolhat, s a tbla ms rszn van
egy vele nem kapcsolatos a2 lpse, amire Fekete b2-vel vlaszolhat, akkor az [a1, b1, a2, b2] s az [a1, b2, a2, b1]
Termszetesen nem tkletes mdon, klnben a sorbarendez-fggvny segtsgvel egy hibtlan jtkot tudnnk jtszani.
151
szekvencik mind ugyanabban az llsban vgzdnek (ahogy ebben az llsban vgzdik az elbbi lpsek
minden a2-vel kezdd permutcija). rdemes ennek az llsnak a kirtkelst az els elfordulskor egy
hash-tblban eltrolni, mert gy a ksbbi elfordulsoknl a kiszmts megismtlst megsproljuk.
Az elbb ltott pozcik hash-tbljt hagyomnyosan transzpozcis tblnak (transposition table) hvjk. Ez
lnyegben azonos a GRF-KERESS zrt listjval 5. szakasz - Az Ismtelt llapotok elkerlse. A
transzpozcis tbla hasznlata drmai hats lehet s a sakkban nha az elrhet mlysg megduplzshoz
vezet. Msrszt ha msodpercenknt a csompontok milliit rtkeljk ki, nem praktikus ezeket mind a
transzpozcis tblban tartani. A legrtkesebb csompontok megvlasztsra klnbz stratgikat dolgoztak
ki.
6.7. bra - Az alfa-bta keressi algoritmus. Ugyanazt a szmtst hajtja vgre, mint egy
norml minimax algoritmus a 6.3. brn, kivve kt sort a MAX-RTK s a MIN-RTK
hvsokban, ahol az s a rtkeket kezeli (s adminisztrlja e paramterek tadst).
4. Nem tkletes, vals idej dntsek

A minimax algoritmus a jtk egsz keressi tert lltja el, az alfa-bta nyess viszont lehetsget ad annak
nagy rszt lenyesni. Az alfa-bta nyessnek mgis a vgllapotokig kell keresnie legalbb a keressi tr egy
rszben. Ez a mlysg ltalban nem praktikus, mert a lpseket elfogadhat id alatt tipikusan legfeljebb
percek alatt kell megtenni. Shannon az 1950-es Programming a computer for playing chess c. cikkben azt
javasolta, hogy a programnak a keresst korbban kell abbahagynia, s a csompontokra egy heurisztikus
kirtkel fggvnyt (evaluation function) kell alkalmaznia, a nem vgllapotokat lnyegben
vgllapotoknak tekintve. Ms szval a minimaxot vagy az alfa-btt ktfle mdon kellene mdostani: a
152
hasznossgi fggvnyt egy heurisztikus KIRTKEL kirtkel fggvny helyettesti, amely az lls
hasznossgnak egy becslst adja meg, valamint a clllapottesztet egy vgsi teszt (cutoff test) vltja fel,
amely eldnti, hogy KIRTKEL-t kell-e alkalmazni.
4.1. Kirtkel fggvnyek

Egy kirtkel fggvny egy adott llsbl kiindulva a jtk vrhat hasznossgnak becslst adja vissza,
ppgy, ahogy a 4. fejezet heurisztikus fggvnye a cltl val tvolsg becslst adja. A becsls tlete, amikor
Shannon felvetette, nem szmtott jnak. A sakkozk (s termszetesen ms jtkok szerelmesei) az vszzadok
sorn kifejlesztettek olyan mdszereket, amelyekkel mrlegelni tudtk egy lls rtkt, hiszen a keress
mennyisgnek tekintetben az emberek mg inkbb korltozottak, mint a szmtgpes programok.
Nyilvnval, hogy egy jtkprogram teljestmnye fgg az alkalmazott kirtkel fggvny minsgtl. Egy
pontatlan fggvny a programot olyan llsokhoz vezeti, amelyek valjban vesztes pozcik. Milyen pontosan
tudunk j kirtkel fggvnyeket tervezni?
Elszr is a kirtkel fggvnynek a vgllapotokat ugyangy kellene sorba rendeznie, mint az igazi
hasznossgfggvnynek, msklnben az azt hasznl gens mg akkor is szuboptimlis lpseket vlaszthatna,
ha trtnetesen a jtk vgig elre ltna mindent. Msodsorban a kirtkel fggvny kirtkelse nem tarthat
tl sokig! (A kirtkel fggvny szubrutinknt meg tudn hvni a MINIMAX-DNTS-t, s ki tudn szmtani a
pozci pontos rtkt, ez azonban az egsz gyakorlat rtelmt az idmegtakartst megkrdjelezn.)
Harmadsorban a nem vgllapotok tekintetben a kirtkel fggvnynek pontosan kell tkrznie a nyers
valdi eslyt.
El lehet merengeni a nyers eslye kifejezsen. Vgl is a sakk nem szerencsejtk, az aktulis llapotot
biztosan tudjuk, s nincs a dologban kockavets. Ha azonban egy nem vgllapotban levgtuk a keresst, akkor
az algoritmus szksgszeren bizonytalan lesz annak valdi kimenetelben. Ezt a bizonytalansgot nem
informcis, hanem inkbb szmtsi korltok okozzk. Ha a kirtkel fggvny egy adott llapotban csak egy
bizonyos mennyisg szmtst vgezhet el, a legjobb, amit tehet, hogy kitallja a vgkimenetelt.
Prbljuk meg ezt az tletet pontosan megfogalmazni. A kirtkel fggvnyek tbbsge az llapot klnbz
tulajdonsgait (features) kiszmtva dolgozik a sakkban pldul ilyen a mindkt flnl lv gyalogok szma.
A tulajdonsgok, egybevve, az llapotok klnbz kategriit, avagy ekvivalenciaosztlyait definiljk: az
egyes kategrikhoz tartoz llapotok az sszes tulajdonsg szempontjbl ugyanazt az rtket kpviselik.
Minden egyes kategria ltalnossgban tartalmazni fog olyan llapotokat, melyek gyzelemhez vezetnek,
olyanokat, amelyek dntetlent eredmnyeznek, s olyanokat, amelyek veresggel vgzdnek. A kirtkel
fggvny nem tudhatja, hogy melyik llapot melyik, azonban visszatrhet egyetlen olyan rtkkel, amely
tkrzi az egyes kimenetelekhez tartoz llapotok arnyt. Tegyk fel pldul, hogy a tapasztalatunk azt
sugallja, hogy a kategrihoz tartoz llapotok 72%-a vezet gyzelemhez (+1 hasznossg), 20%-a vesztshez (
1 hasznossg) s 8%-a dntetlenhez (0 hasznossg). Akkor a kategrihoz tartoz llapotok rtelmes rtkelse
a slyozott tlag vagy a vrhat rtk (expected value): (+1 0,72) + (1 0,20) + (0 0,08) = 0,52. Elvben
a vrhat rtket minden kategrira meg lehetne hatrozni, ami egy tetszleges llapot esetn is mkd
kirtkel fggvnyhez vezetne. A vgllapotokhoz hasonlan, a kirtkel fggvnynek nem kell tnyleges
vrhat rtkeket visszaadnia, amg az llapotok sorba rendezse ugyanaz.
A gyakorlatban az ilyen elemzs tl sok kategrit s gy tl sok tapasztalatot kvn ahhoz, hogy a gyzelem
valsznsgt megllaptsuk. A kirtkel fggvnyek tbbsge ehelyett az egyes tulajdonsgokbl add
numerikus rtkeket kln szmtja, majd a vgleges rtket ezek kombincijaknt hatrozza meg. A
kezdknek sznt sakk-knyvek pldul egy kzelt pontrtket (material value) rendelnek minden egyes
bbuhoz: minden gyalog 1 pontot, egy huszr vagy egy fut 3 pontot, egy bstya 5 pontot, mg egy vezr 9
pontot r. Ms jellemzk, mint pldul egy j gyalogstruktra s a kirly biztonsga rhetnek mondjuk egy
fl gyalogot. Az lls kirtkelshez ezeket az rtkeket egyszeren sszeadjuk. Egy gyaloggal ekvivalens
biztonsgos elny a gyzelem lnyeges valsznsgt adja, hrom gyaloggal ekvivalens biztonsgos elny
majdnem biztos gyzelemhez vezet, ahogy ezt a 6.8. (a) bra mutatja. Az ilyen tpus kirtkel fggvnyt a
matematikban slyozott lineris fggvnynek (weighted linear function) nevezik, mert kifejezhet az albbi
alakban:
153
ahol a w-k a slyok s az f-ek az adott tblalls jellemzi. Sakk esetben az fi-k a tbln lev egyes bbufajtk
szmt jellhetik s a wi-k a bbukhoz rendelt pontrtkek (gyalog 1, fut 3 stb.) lehetnek.
A tulajdonsgrtkek sszeadsa rtelmes dolognak tnik, azonban ezzel valjban egy igen ers felttelezssel
lnk: t. i. hogy az egyes tulajdonsgok hozzjrulsai ms tulajdonsgok rtkeitl fggetlenek. A 3-as rtk
hozzrendelse a futhoz figyelmen kvl hagyja pldul azt, hogy a vgjtkban, amikor sok tr ll
rendelkezsre a manverezshez, a fut ersebb. Ezrt a jelenlegi sakk- s ms jtkokat jtsz programok a
tulajdonsgok nemlineris kombinciit is hasznljk. Egy futpr egy kicsit rtkesebb lehet pldul, mint egy
fut rtknek ktszerese, s egy fut a vgjtkban rtkesebb, mint a nyitsnl.
6.8. bra - Kt, kiss eltr sakktblalls. (a) Feketnek egy huszr s kt gyalog elnye
van, s a jtkot megnyeri. (b) Fekete veszt, miutn Fehr a vezrt leti.
Az les elmj olvas szreveszi, hogy a tulajdonsgok s a slyok a sakk szablyainak nem rszei! Ezek az
emberi sakkjtszs vszzados tapasztalataibl szrmaznak. Lineris kirtkel kpletet alkalmazva a
tulajdonsgok s a slyok az llapotoknak az rtkeik szerinti igazi sorrendezsk legjobb kzeltst adjk
meg. A tapasztalat klnskppen azt sugallja, hogy az egy pontnl nagyobb biztonsgos anyagi elny
valsznleg gyzelemhez vezet, ha minden ms tnyez azonos. Hrompontos elny elegend a majdnem
biztos gyzelemhez. Olyan jtkokban, ahol ilyen tapasztalatra szert tenni nem lehet, a kirtkel fggvny
slyrtkeit a 18. fejezetben lert gpi tanulsi technikkkal lehet becslni. Biztat, hogy e technikk sakkra
trtn alkalmazsa tnyleg azt tmasztja al, hogy egy fut kb. hrom gyalogot r.
4.2. A keress levgsa

Kvetkez lps az ALFA-BTA-KERESS olyan mdostsa, hogy az algoritmus meghvja a heurisztikus
KIRTKEL fggvnyt, amikor a keresst le kell vgni. Az implementcit tekintve a 6.7. brnak a VG-TESZTet tartalmaz kt sort az albbi sorra cserljk:
if LEVGS-TESZT (llapot, mlysg) then return KIRTKEL (llapot)
Meg kell oldani annak az adminisztrlst is, hogy az aktulis mlysg inkrementlisan vltozzk minden
rekurzv hvs alkalmbl. A legkzenfekvbb megkzelts a keress vezrlsre, ha a keresshez rgztett
mlysgkorltot rendelnk, hogy a LEVGS-TESZT (llapot, mlysg) igazzal trjen vissza egy d-nl nagyobb
mlysgre (igazzal kell visszatrnie minden vgllapot esetben is, ahogy azt a VG-TESZT tette). A d mlysget
gy vlasztjk meg, hogy a felhasznlt id ne haladja meg a jtk szablyai ltal megengedett idt.
Egy kicsit robusztusabb megkzeltst kapunk, ha a 3. fejezetben definilt iteratvan mlyl algoritmust
alkalmazzuk. Ha a program kifut az idbl, akkor a legmlyebb, befejezett keress ltal kivlasztott lpst adja
vissza. Az ilyen megkzeltsek azonban hibkhoz vezethetnek a kirtkel fggvny kzelt jellege miatt.
Tekintsk ismt a sakkban a pontelnyn alapul kirtkel fggvnyt. Tegyk fel, hogy a program a
mlysgkorltig keres, s a 6.8. (b) bra tblallsba jut, ahol Feketnek huszr s kt gyalog elnye van. A
program a heurisztikus rtk alapjn ezt az llapotot Fekete szmra valszn gyzelemnek fogja minsteni.
154
Fehr kvetkez lpsben azonban leti a fekete vezrt, krptls nlkl. Az lls gy valjban Fehr szmra
jelent gyzelmet, viszont hogy ezt belssuk, egy tovbbi lpsvltsig elre kellene nzni.
Nyilvnvalan egy kifinomultabb levgsi tesztre van szksg. A kirtkel fggvnyt csak az egyenslyi
(quiescent) tblallsokra szabad alkalmazni, vagyis olyan llsokra, amelyek rtke a kzeljvben nem
vltozik meg radiklisan. A sakkban pldul az olyan tblallsok, amelyeknl tisztet lehet letni, egy csak a
pontrtket figyelembe vev kirtkel fggvny esetn nem tekinthetk egyenslyi llsnak. A nem egyenslyi
tblallsokat tovbb ki lehet fejteni, amg egyenslyi llsokat nem rnk el. Ezt a tbbletkeresst egyenslyi
keressnek (quiescence search) nevezzk. Ezt a keresst nha csak bizonyos tpus lpsekre korltozzk, mint
pldul a tblalls bizonytalansgait gyorsan felold bbuletsekre.
A horizontproblmt (horizont problem) nehezebb megszntetni. A problma akkor jelentkezik, amikor a
program az ellenfl egy olyan kvetkez lpsvel kerl szembe, ami komoly krokat okoz, s egyben
elkerlhetetlen. Tekintsk a 6.9. bra sakkjtszmjt. Fekete egy kicsit ersebb pontrtk, ha azonban Fehr a
hetedik sorrl a nyolcadikba tudja juttatni a gyalogjt, akkor vezrr vltozik, s Fehr knnyen megnyeri a
jtszmt. Fekete ezt 14 lpsvltssal elodzhatja, ha bstyval sakkot ad, de a fehr gyalog elkerlhetetlenl
vezrr fog vltozni. A rgztett mlysg keressek problmja, hogy ezek azt gondoljk, hogy ilyen elodz
lpsekkel el lehet kerlni a vezrr vltoztat lpst. Azt mondjuk, hogy az elodz lpsek a vezr vltst a
horizonton tlra kitoljk, egy olyan helyre, ahol ezt nem lehet szrevenni.
6.9. bra - A horizonthats. A fekete bstyval adott sorozatos sakk a horizonton

tlra knyszerti az elkerlhetetlen vezrr vltoztat lpst, s ezt a tblallst enyhn
elnys llsknt tnteti fel Fekete szmra, holott Fehr szmra ez egy biztos nyer
lls.
155
Mivel a hardverek fejldse mlyebb keresshez vezet, azt vrjuk, hogy a horizontproblma kevsb lesz
gyakori, a nagyon hossz ksleltet lpsszekvencik igen ritkk. A szingulris kiterjeszts (singular
extension) hasznlata szintn hatsos a horizontproblma elkerlsben, lnyeges keressi kltsgtbblet
nlkl. A szingulris kiterjeszts egy olyan lps, amely lnyegesen jobb, mint az lls minden ms lpse. A
szingulris kiterjeszts keresse lnyeges tbbletkltsg nlkl a normlis mlysgkorlton tl is mehet, mert
elgazsi tnyezje egysgnyi. (Az egyenslyi keresst a szingulris kiterjeszts egy vltozatnak lehet
tekinteni.) A 6.9. brn a szingulris kiterjeszts a lehetsges vezrlpst meg fogja tallni, feltve, hogy Fekete
sakkot ad s Fehr vdekez lpseit nyilvnvalan jobb-nak azonostja a tbbi alternatvhoz kpest.
Eddig a keress egy adott szinten trtn levgsrl s az eredmnyt igazoltan nem befolysol alfa-bta
nyessrl beszltnk. De elrenyesst (forward prunning) is alkalmazhatunk, ahol egy adott csompontban
egyes lpseket minden tovbbi elemzs nlkl azonnal lenyesnk. A sakkozk tbbsge egy adott llsnl
nyilvn csak nhny lpst vesz figyelembe (legalbb tudatosan). Sajnos ez a megkzelts veszlyes lehet, mert
nincs garancia arra, hogy nem fogjuk a legjobb lpst lenyesni. Ez katasztroflis lehet, ha a gykr kzelben
trtnik, mert a program sokszor nhny nyilvnval lpst el fog nzni. Az elrenyesst specilis
helyzetekben biztonsgosan lehet alkalmazni pldul amikor a kt lps szimmetrikus, vagy ms szempontbl
ekvivalens, elegend csak az egyiket figyelembe venni , vagy olyan csompontoknl, amelyek a keressi fban
mlyen tallhatk.
156
Az itt lert technikk kombinlt alkalmazsval egy elfogadhat szinten sakkoz (vagy ms jtkot jtsz)
programot kaphatunk. Tegyk fel, hogy a sakk esetre implementltunk egy kirtkel fggvnyt, egy rtelmes
keresslevgst egyenslyi keresssel s egy nagy transzpozcis tblt. Tegyk fel azt is, hogy hnapokig tart
munks bitfaragssal, a legjabb PC-n tudunk generlni s kirtkelni msodpercenknt kb. egymilli
csompontot, ami kb. 200 milli csompont megvizsglst teszi lehetv lpsenknt a standard idkorltok
mellett (3 perc lpsenknt). A sakk elgazsi tnyezje tlagosan kb. 35. Mivel 35 5 kb. 50 millival egyenl, a
minimax keresst alkalmazva gy csak t lpsvltsig tudnnk elrenzni. Br egy ilyen program nem
hasznavehetetlen, egy tlagos emberi jtkos, aki esetenknt hat vagy nyolc lpsvltsig tud elrenzni,
knnyszerrel bolondot tudna belle csinlni. Az alfa-bta nyesssel kb. 10 lpsvltst kapunk, ami a jtk
mesteri sznvonalnak felel meg. A 6.7. alfejezet tovbbi nyessi technikkat r le, amikkel az effektv keressi
mlysg durvn 14 lpsvltsig kiterjeszthet. A nagymesteri minstshez egy lnyegesen finomtott
kirtkel fggvny kellene tovbb az optimlis megnyitsok s a vgjtkok nagy adatbzisa. s az sem
rtana, ha lenne egy szuperszmtgpnk, amin a programot futtatnnk.
5. Vletlen elemet is tartalmaz jtkok

A vals letben szmos olyan megjsolhatatlan kls esemnnyel van dolgunk, ami miatt elre nem lthat
helyzetbe kerlnk. Sok jtk ezt a megjsolhatatlansgot egy vletlen elem, mint pldul a kockadobs,
bevezetsvel veszi figyelembe. Ily mdon egy lpssel kzelebb visznek bennnket a valsghoz, s megri
megvizsglni, hogy ez milyen hatssal van a dntsi folyamatra.
Az ostbla tipikusan olyan jtk, amely tvzi a szerencst s a tudst. A jtkosok a lpsek eltt kockt
dobnak, amivel meghatrozzk az adott jtkos szmra megengedett lpseket. A 6.10. bra ostblallsnl
Fehr egy 6-ost s egy 5-st dobott, s ngy lehetsges lps kzl vlaszthat.
6.10. bra - Egy tipikus ostblalls. A jtk lnyege, hogy az egyik fl sszes bbujt
eltvoltsuk a tblrl. Fehr az ramutat jrsval egyez irnyban halad a 25-s fel,
mg Fekete az ramutat jrsval ellenttes irnyban, a 0 fel halad. Egy bbuval
brmelyik helyre lehet lpni, kivve azokat a helyeket, ahol az ellenflnek mr legalbb
kt bbuja tallhat. Ha egy olyan helyre lpnk, ahol az ellenflnek egy bbuja
tallhat, akkor azt a bbut elfogtuk, s a lpkedst az elejrl kell jrakezdenie. Ennl
a tblallsnl Fehr pp most dobott 65-t, s ngy megengedett lps kzl
vlaszthat: (510,511), (511,1924), (510,1016) s (511,1116).
157
6.11. bra - Egy ostblalls sematikus jtkfja
158
Habr Fehr tudja, hogy szmra melyek a megengedett lpsek, azt nem tudja, hogy Fekete milyen szmokat
fog dobni, gy nem tudhatja, hogy melyek lesznek Fekete megengedett lpsei. Ez azt jelenti, hogy Fehr nem
tud egy 3 3-as ambnl ltott teljes jtkfhoz hasonlt elkszteni. Az ostbla esetn a jtkfnak a MAX s
MIN csompontok mellett tartalmaznia kell vletlen csompontokat (chance nodes) is. A 6.11. brn a vletlen
csompontokat krk jellik. A vletlen csompontokbl kiindul gak a lehetsges kockadobsokat jellik.
Minden g a dobott rtkkel s elfordulsnak valsznsgvel van felcmkzve. Kt kockval trtn
dobsnl harminchatfle eredmnyt kaphatunk. Ezek a dobsok mind azonos valsznsgek, mivel azonban a
65 megegyezik az 56-tal, gy csak 21 klnbz dobs ltezik. A hat dupla (11-tl egszen 66-ig) 1/36-od
valsznsggel, mg a tbbi 15 klnbz dobs 1/18-ad valsznsggel fordul el.
A kvetkez lps annak megrtse, hogyan kell helyes dntseket hozni. Nyilvnvalan tovbbra is azt a lpst
szeretnnk kivlasztani, ami a legjobb llshoz vezet. A lehetsges llsok azonban most nem rendelkeznek egy
jl meghatrozott minimax rtkkel. Ehelyett csak egy tlagos vagy vrhat rtket (expected value) tudunk
kiszmtani, ahol az tlagolst az sszes lehetsges kockadobsra vgezzk el. Ezzel a determinisztikus jtkok
minimax rtkt (minimax value) a vletlen csompontokat tartalmaz jtkok vrhatminimax rtkre
(expectiminimax value) ltalnostottuk. A vgllapotok s a MAX s MIN llapotok (ahol a kockadobs
eredmnye ismert) ugyangy viselkednek, mint eddig. A vletlen csompontok kirtkelshez az sszes
lehetsges kockadobs figyelembevtelvel szmtott slyozott tlagot kell venni, vagyis:
159
ahol a vletlen n csompont llapottmenet-fggvnye az n llapotot egyszeren mdostja az sszes

kockadobs eredmnyezte s kvet llapot rtkvel s a dobs P(s) valsznsgvel. Ezt az eljrst rekurzvan
alkalmazhatjuk a gykrig, ugyangy, mint a minimax esetn. Az algoritmus rszleteit feladatnak hagyjuk meg
az olvasnak.
5.1. Az lls kirtkelse vletlen csompontokat tartalmaz

jtkok esetn
Hasonlan a minimaxhoz, a vrhatminimax esetn is alkalmazhatjuk a nyilvnval kzeltst, vagyis
valamilyen ponton levghatjuk a keresst, s a levelekre egy kirtkel fggvnyt alkalmazhatunk. gy
gondolhatnnk, hogy egy olyan jtk esetn, mint az ostbla, a kirtkel fggvny elvben semmiben sem tr el
a sakknl alkalmazott kirtkel fggvnyektl, melyeknek most is magasabb pontot kell adniuk a jobb
llsokra. Valjban azonban a vletlen csompontok jelenlte azt jelenti, hogy sokkal krltekintbbnek kell
lennnk abban a tekintetben, hogy a kirtkel fggvny rtkei mit jelentenek. A 6.12. bra mutatja a
problmt: ha a kirtkel fggvny a levelekhez az [1, 2, 3, 4] rtkeket rendeli hozz, az A1 lps lesz a
legjobb, az [1, 20, 30, 400] rtkekkel az A2 lesz a legjobb. Ebbl addan egy program teljesen msknt
viselkedik, ha tsklzzuk a kirtkel fggvny rtkeket! Kiderl, hogy ha el akarjuk kerlni ezt az
rzkenysget, akkor a kirtkel fggvny az egy adott llsbl val gyzelem valsznsgnek (vagy
ltalnosabban az lls vrhat hasznossgnak) csak egy pozitv lineris transzformcija lehet. Ez a
bizonytalansgot is tartalmaz helyzetek fontos s ltalnos tulajdonsga. A 16. fejezetben tovbb foglalkozunk
ezzel a krdssel.
5.2. A vrhatminimax komplexitsa

Ha a program elre tudn a jtk folyamn a ksbbiekben elfordul sszes kockadobs eredmnyt, akkor
egy kockadobst is tartalmaz jtk megoldsa ugyanolyan lenne, mint egy kockadobst nem tartalmaz jtk,
amit a minimax O(bm) id alatt tesz meg. Mivel a vrhatminimax figyelembe veszi az sszes lehetsges
kockadobs-sorozat eredmnyt is, annak idignye O(bmnm) lesz, ahol n a klnbz dobsok szmt jelli.
6.12. bra - A levlrtkeken vgrehajtott sorrendrz transzformci megvltoztatja a

legjobb lpst
Mg ha a fa mlysgkorltja egy kis rtk d is, a minimaxhoz kpesti tbbletkltsg miatt irrelis tl messzire
elrenzni a vletlen jtkok tbbsgnl. Ostblnl n rtke 21, b pedig ltalban 20 krli rtket vesz fel, de
bizonyos helyzetekben akr 4000 is lehet, a dupla kockadobsoknl. Valsznleg csak hrom lpsvltst
tudunk kezelni.
A problmrl msflekpp is gondolkodhatunk: az alfa-bta algoritmus elnye, hogy figyelmen kvl hagyja
azokat a ksbbi fejlemnyeket, amelyek a legjobb jtk sorn egyszeren nem kvetkeznek be. gy a valszn
elfordulsokra koncentrl. A kockt hasznl jtkok esetn nem lteznek valszn lpssorozatok, mivel
adott lpsek megttelhez elszr a kocknak kell a megfelel oldalra esnie, hogy ezek a lpsek egyltaln
megengedhetk legyenek. Ez egy ltalnos problma minden olyan esetben, amikor a bizonytalansg is kpbe
kerl: a lehetsgek risi mrtkben megsokszorozdnak, s rtelmetlenn vlik rszletes cselekvsi terveket
kidolgozni, mert a vilg valsznleg nem ezek szerint fog viselkedni.
160
Ktsgtelen, hogy az olvasnak mr eszbe jutott, hogy valami alfa-bta nyesshez hasonl dolgot a vletlen
csompontokat tartalmaz jtkfkra is alkalmazni lehetne. Kiderl, hogy ez valban lehetsges. A MAX s a MIN
csompontok elemzse vltozatlan, de egy kis lelemnyessggel a vletlen csompontokat is nyeshetjk.
Tekintsk a 6.11. bra C vletlen csompontjt, s nzzk meg, mi trtnik az rtkvel, amikor a gyermekeit
vizsgljuk s kirtkeljk. Krds, hogy lehetsges-e C rtkre egy fels korltot tallni, mg mieltt az sszes
gyermekt megvizsglnnk? (Idzzk vissza, hogy az alfa-bta nyessnek pontosan erre van szksge ahhoz,
hogy egy csompontot s az abbl kiindul rszft lenyeshesse.) Ez els pillantsra lehetetlennek tnhet, mivel
a C rtke a gyermekei rtknek az tlaga, s amg nem lttuk az sszes kockadobs eredmnyt, addig ez az
tlag akrmi is lehet, mivel a meg nem vizsglt gyermekek akrmilyen rtket felvehetnek. Ha azonban a
hasznossgfggvny lehetsges rtkeit korltok kz szortjuk, akkor korltokat kaphatunk az tlagra is.
Pldul ha azt mondjuk, hogy a hasznossgrtkek +3 s 3 kztt lehetnek, akkor a levlcsompontok rtkei
mr korltosak, s a vletlen csompont rtkre az sszes gyermeknek megvizsglsa nlkl is adhatunk fels
korltot.
5.3. Krtyajtkok
A krtyajtkok sok szempontbl rdekesek, nem csupn a szerencsejtk-jellegk miatt. A jtkok risi
vlasztkbl azokra fogunk sszpontostani, ahol a krtykat a jtk elejn vletlen mdon osztjk szt, s ahol
mindegyik jtkos ltal kapott leoszts ms jtkosok szmra nem megfigyelhet. Ilyen jtk a bridzs, a
whistjtk, a hearts5 s a pker nhny formja.
Az els pillantsra gy tnhet, hogy a krtyajtkok pont olyanak, mint a kockadobsos jtkok. A krtykat
vletlenl osztjuk szt, s ez meghatrozza a jtkosok lehetsges lpseit. Itt azonban az sszes kocka a
legelejn grdl le! Ezt a hasonlatot prbljuk tovbbvinni. Ki fog derlni, hogy ez a gyakorlatban igen hasznos
lesz. Mellesleg hibs is, igen rdekes okok miatt.
Kpzeljk el, hogy kt jtkos, MAX s MIN, ngykrtys ktkezes bridzset gyakorol, ahol minden kzleoszts
lthat. A leosztsok az albbiak, s MAX hv elsnek:
MAX: 6 6 9 8 MIN: 4 2 10 5
Tegyk fel, hogy MAX 9-et jtszik. MIN-nek szint kell jtszania, teht 10-et vagy 5-t. MIN 10-et jtszik
s elviszi az tst. Most MIN kvetkezik s 2-vel indul. MAX-nak nincs pikkje (s gy az tst elvinni nem
tudja), kvetkezskppen valamelyik krtyjt le kell jtszania. Nyilvnval vlaszts a 6, mert a kt msik
gyztes krtya. Most fggetlenl attl, hogy MIN mivel indul a kvetkez tsben, MAX az utols kt tst
elviszi, s a jtk kt-kt ts szinten dntetlen lesz. Knny megmutatni a minimax megfelel vltozatval
(lsd 6.12. feladat), hogy MAX 9-es indulsa valjban egy optimlis vlaszts.
Mdostsuk most MIN leosztst, 4-et 4-re cserlve:
MAX: 6 6 9 8 MIN: 4 2 10 5
A kt eset tkletesen szimmetrikus: a jtk lefolysa azonos lesz, kivve, hogy a msodik tsnl MAX a 6-ot
fogja megjtszani. A jtk ugyangy dntetlen lesz kt-kt tssel, s a 9 optimlis dnts lesz most is.
Egyelre minden jnak tnik. Most rejtsk el MIN krtyinak egyikt: MAX tudja, hogy MIN-nek vagy az egyik (
4-gyel), vagy a msik ( 4-gyel) leosztsa van, de fogalma sincs melyik. MAX a kvetkezkppen rvel:
A 9-es induls optimlis vlaszts MIN els leosztsval szemben s hasonlan a msodik leosztsval
szemben is, gy most is optimlisnak kell lennie, mert tudomsom szerint MIN-nl a kt leoszts valamelyike van.
Amit MAX hasznl, azt ltalnossgban a jvbe lts szerinti tlagolsnak nevezhetnnk. Az tlet a cselekvs
rtkelse nem ltott krtyk mellett oly mdon, hogy elszr kiszmtunk minimax rtkeket minden
lehetsges leoszts esetre, majd vrhat rtket szmtunk a leosztsokra nzve, azok valsznsgt
felhasznlva.
Ha azt gondolja, hogy ez egy rtelmes stratgia (vagy ha nincs vlemnye, mert nem rti a bridzset), tekintse a
kvetkez trtnetet:
5
Az Angolmagyar Nagysztr sem segt ezeknek a jtkoknak nincs a mai magyar nyelvben hasznlatos nevk. (A ford.)
161
1. nap: Az A t egy halom aranyhoz vezet. A B t egy elgazshoz vezet. Ha az elgazsnl balra fordul, egy
kszerhegyet tall, ha az elgazsnl jobbra fordul, elti egy busz.
2. nap: Az A t egy halom aranyhoz vezet. A B t egy elgazshoz vezet. Ha az elgazsnl jobbra fordul, egy
kszerhegyet tall, ha az elgazsnl balra fordul, elti egy busz.
3. nap: Az A t egy halom aranyhoz vezet. A B t egy elgazshoz vezet. Ha jl vlaszt, egy kszerhalmot tall,
ha rosszul, elti egy busz.
Nyilvnval, nem buta dnts, ha az els kt napon a B utat vlasztjuk. Nincs olyan pelmj szemly azonban,
aki a harmadik napon is maradna B-nl. Mgis pontosan ez az, amit a jvbe lts szerinti tlagols sugall. A B
t az 1. nap s a 2. nap helyzetekben optimlis, kvetkezskppen optimlis a 3. nap szituciban is, hiszen az
els kt eset egyike fog elfordulni. Trjnk vissza a krtyajtkunkhoz: miutn MAX 9-et hv, MIN 10-zel
gyz. MIN 2-vel indul, mint korbban, s most MAX ott van az elgazsnl brmifle eligazts nlkl. Ha MAX a
6-ot jtszotta meg, s MIN-nek van mg 4-e, 4 lesz a gyztes, s MAX a jtkot elveszti. Hasonlan, ha MAX
a 6-ot jtszotta meg, s MIN-nek van mg 4-e, MAX szintn veszteni fog. A 9 els zben val hvsa teht
olyan helyzethez vezet, ahol MAX-nak 50%-os eslye van a vesztsre (sokkal jobb lenne, ha a 6-ot vagy a 6ot hvn elsnek, dntetlent biztostva).
A leszrend lecke az, hogy amikor hinyos az informci, meg kell fontolni, hogy milyen informcival
fogunk rendelkezni a jtk minden pillanatban. MAX algoritmusval az a problma, hogy felttelezi, hogy
minden lehetsges leosztsnl a jtk gy folytatdik, mintha minden krtya lthat lenne. Ahogy a pldnk
mutatja, ez olyan cselekvsre kszteti MAX-ot, mintha minden jvbeli bizonytalansg felolddna, ha eljn az
ideje. MAX algoritmusa sem fog soha informcigyjtshez folyamodni (vagy a partner informlshoz), mert
egy-egy leosztson bell erre nincs szksge. Az olyan jtkoknl, mint a bridzs, gyakran rtelmes dolog olyan
krtyval indulni, amely segti kiderteni az ellensg leosztst, vagy a partnernket a sajt leosztsunkrl
informlja. Ilyen viselkedst automatikusan generlhatunk a nem tkletes informcij jtkokra kifejlesztett
optimlis algoritmussal. Az ilyen algoritmus nem a vilgllapotok terben (krtyaleosztsok), hanem a hiedelmi
llapotok terben (belief states) (hiedelmek, hogy kinek milyen krtyja van, milyen valsznsggel) keres.
Az algoritmust a 17. fejezetben tudjuk majd megfelelen elmagyarzni, miutn felptettk a szksges
valsznsgi appartust. Abban a fejezetben azzal a nagyon fontos szemponttal is fogunk foglalkozni, hogy a
nem tkletes informcij jtkokban az a legjobb, ha minl kevesebb informcit adunk ki az ellensgnek, s
ennek legjobb mdszere, ha nem megjsolhat mdon cseleksznk. Ez az oka annak, hogy az tteremellenrk
vletlen mdon vlasztjk meg az ellenrzsek idpontjt.
6. A jelenleg legfejlettebb jtkprogramok

Azt lehetne mondani, hogy a jtkok valami olyat jelentenek az MI szmra, mint amit a Forma1 versenyek a
gpkocsiipar szmra. A legfejlettebb jtkprogramok villmgyors, hihetetlenl finoman hangolt rendszerek,
amelyek nagyon fejlett mdszereket alkalmaznak, de amelyeknek nem sok hasznt vesszk a vsrlskor. Br
vannak kutatk, akik azt gondoljk, hogy a jtkok az MI fvonalt tekintve tbb-kevsb irrelevnsak, mgis
lnk rdekldst vltanak ki, s folyamatosan fenntartjk az innovcit, amit a szlesebb kzssg fel is karol.
6.1. Sakk
Herbert Simon 1957-ben megjsolta, hogy 10 ven bell a szmtgpek legyzik az emberi vilgbajnokot.
Negyven v mltval hatjtszms kirakatmrkzsen a Deep Blue legyzte Garri Kaszparovot. Simon tvedett,
de csak egy 4-es szorzval. Kaszparov azt rta:
A mrkzs dnt jtszmja a 2. jtszma volt, amely emlkeimben sebknt maradt meg
lttunk valamit, ami a legvadabb elkpzelseinket is fellmlta, hogy egy szmtgp hogyan
lesz kpes dntseinek hossz tv pozcis konzekvenciit elre ltni. A gp emberi
veszlyrzetet produklva megtagadta, hogy egy dnten rvid tv elnyt jelent llsba
kerljn.
(Kaszparov, 1997)
A Deep Blue-t Murray Campbell, Feng-Hsiung Hsu s Joseph Hoane fejlesztettk ki az IBM-nl (Campbell s
trsai, 2002), a Campbell s Hsu ltal korbban a Carnegie Mellon Egyetemen kifejlesztett Deep Thought
tervre alapozva. A gyzedelmes gp egy prhuzamos szmtgp volt 30 IBM RS/6000 processzorral, amelyek
a szoftverkeresst futtattk, s 480 VLSI sakk-clprocesszorral, amelyek a lpsgenerlst (belertve a
162
lpsek sorba rendezst), a fa utols nhny szintjn a hardverkeresst s a levlcsompontok kirtkelst

valstottk meg. A Deep Blue tlagosan msodpercenknt 126 milli, cscssebessgnl 330 milli
csompontot vizsglt meg. Lpsenknt 30 millird llst generlt, rutinszeren 14-es mlysget elrve. A gp
szve a standard alfa-bta keress volt, transzpozcis tblval, a siker kulcsa azonban gy tnik, az a kpessge,
hogy kiterjesztseket tudott generlni az rdekes knyszerlps-sorozatok mlysgi korltjain tl. Egyes
esetekben a keress a 40-es mlysget is elrte. A kirtkel fggvny 8000 tulajdonsggal dolgozott, ezekbl
egyesek a bbuk igen specifikus konfigurciit is lertk. A rendszer felhasznlta a 4000 llst tartalmaz
megnyitsok knyvt s a 700 000 nagymesteri jtszmalerst tartalmaz adatbzist, ahonnan konszenzusos
javaslatokat lehetett generlni. A rendszer a megoldott vgjtk-pozcik nagy adatbzisval is rendelkezett,
amely minden tbbus s szmos hatfigurs llst tartalmazott. Ez az adatbzis a keressi mlysg lnyeges
kiterjesztst jelentette, lehetv tve Deep Blue szmra egyes esetekben a tkletes jtkot annak ellenre,
hogy sok lpsre volt mg a matthelyzettl.
A Deep Blue sikere megerstette azt a szles kr hiedelmet, hogy szmtgpes jtkokban az elrehalads
fleg az egyre hatkonyabb hardver eredmnye ezt a vlemnyt az IBM is btortotta. Msfell a Deep Blue
megalkoti azt nyilatkoztk, hogy a keress kiterjesztse s a kirtkel fggvny szintn kritikusak voltak
(Campbell s trsai, 2002). Azonban tudjuk azt is, hogy nhny kzelmltbeli algoritmikus javts lehetv
tette, hogy standard PC-n fut programok 1992 ta minden Szmtgpes Sakkvilgbajnoksgot megnyerjenek,
sokszor 1000-szer tbb csompont keressre is kpes masszvan parallel ellensgeket is legyzve. A nyessi
heurisztikk egsz vlasztknak hasznlatval az effektv elgazsi tnyezt kevesebb mint 3-ra lehet
cskkenteni (a tnyleges 35-s elgazsi tnyezhz viszonytva). Ezek kzl legfontosabb a nulla lps (null
move) heurisztika, amely sekly keresst alkalmazva ahol az ellensg az indulsnl ktszer is lphet az lls
rtknek j als becslst adja. Ez az als korlt sokszor lehetv teszi az alfa-bta nyesst a teljes mlysg
keress kltsge nlkl. Fontos mg a hatstalansg nyesse (futility prunnig), amely segti eldnteni, hogy
mely lpsek vezetnek bta nyesshez a kvet csompontok szintjn.
A Deep Blue csapata a Kaszparovval val visszavg all kibjt. Helyette 2002-ben a f mrkzs a FRITZ
program s Vlagyimir Kramnyik vilgbajnok sszecsapsa volt, amely nyolc jtszmban dntetlennel
vgzdtt. A mrkzs felttelei az emberi jtkosnak sokkal jobban kedveztek, s a hardver egy kznsges
PC volt, nem egy szuperszmtgp. Kramnyik vlemnye szerint mgis most mr vilgos, hogy a
cscsprogramok s a vilgbajnok kzel azonos szinten vannak.
6.1.1. Dmajtk
Az IBM-nl dolgoz Arthur Samuel szabad idejben 1952-tl kezdve kifejlesztett egy dmaprogramot, mely a
kirtkel fggvnyt tbb ezerszer sajt maga ellen jtszva maga tanulta meg. Ezt az tletet a 21. fejezetben
trgyaljuk rszletesebben. Samuel programja egy kezd jtkos szintjn kezdett jtszani, de miutn nhny
napig nmagval jtszott, mr Samuel jtkszintjt is fellmlta (br Samuel nem szmtott ers jtkosnak).
1962-ben a program Robert Nealyt a vak dmajtk bajnokt is megverte, egy hibs lpse miatt. Sokan azt
hittk, hogy ezzel bizonytst nyert, hogy dmajtkban a gp ersebb, mint az ember, azonban ez gy nem igaz.
Ha viszont figyelembe vesszk, hogy Samuel szmtgpe (egy IBM 704-es) 10
000 szavas memrival,
httrtrknt mgnesszalagos egysggel s majdnem egy milliszekundumos ciklusidvel rendelkezett, ez a
gyzelem az MI nagy eredmnyeinek egyike marad.
Kevesen prbltk meg tlszrnyalni ezt a teljestmnyt, amg Jonathan Schaeffer s kollgi ki nem
fejlesztettk a Chinookot, amely kznsges PC-n futott s alfa bta keresst alkalmazott. A Chinook egy olyan
elre ltrehozott adatbzissal dolgozott, amely az sszes nyolc vagy kevesebb bbut tartalmaz 444 millird
llsbl plt fel, hogy a vgjtka hibtlan legyen. 1990-ben az U.S. Openen a Chinook msodikknt futott be
s megnyerte a jogot, hogy a vilgbajnoki cmrt mrkzzn. Ekkor a program Marion Tinsley kpben egy
problmba tkztt. Dr. Tinsley mr 40 ve vilgbajnok volt s ez alatt a 40 v alatt sszesen csak hrom
jtszmt vesztett. A Chinookkal vvott els mrkzsn elszenvedte a negyedik, majd az tdik veresgt is, de
a bajnoksgot 20,5:18,5 pontra megnyerte. 1994 augusztusban a Tinsley s a Chinook kztti vilgbajnoki
mrkzs id eltt flbeszakadt, amikor Tinsleynek egszsggyi problmk miatt vissza kellett vonulnia. A
Chinook lett a hivatalos vilgbajnok.
Schaeffer gy gondolja, hogy megfelel szmtsi teljestmnnyel a vgjtkok adatbzist annyira ki lehetne
bvteni, hogy a kezdeti pozcitl indul elre keress valamelyik mr megoldott pozcit mindig el tudn rni,
vagyis a dmajtk teljesen megoldhat lenne (volt, hogy a Chinook mr az 5-ik lpsnl gyztt). Az ilyen
kimert elemzst kzi mdszerekkel a 3 3-as ambra meg lehet tenni s szmtgpen a 4 4 4-es
ambra (Qubic), a Go-Mokura (t egy sorban) s a Nine-Mens Morrisra is elvgeztk (Gasser, 1998). Ken
Thompson s Lewis Stiller figyelemre mlt munkja (Thompson s Stiller, 1992) az sszes t- s hatfigurs
163
sakkvgjtszmt is megoldotta, az eredmnyeket az interneten hozzfrhetv tve. Stiller egy olyan

knyszermatt esett is felfedezte, amely 262 lpst ignyelt. Ez egy kis felfordulst okozott, mert a sakk
szablyai megkvetelik, hogy 50 lps alatt valamilyen elrehaladsnak kell trtnnie.
6.1.2. Othello
Az Othello vagy ms nven Reversi szmtgpes jtkknt taln npszerbb, mint tblajtkknt. Keressi tere
kisebb, mint a sakk, ltalban 5-15 megengedett lps van, de a kirtkel szaktudst a semmibl indulva
kellett kifejleszteni. 1997-ben a Logistello program (Buro, 2002) az emberi vilgbajnokot, Takeshi Murakamit,
kpes volt hat nullra megverni. ltalnossgban elfogadott, hogy az Othellban az emberek nem ellenfelei a
szmtgpeknek.
6.1.3. Ostbla
A 6.5. alfejezetben elmagyarztuk, hogy a kockadobsbl ered bizonytalansg a mly keresst drga luxuss
teszi. Az ostblra vonatkoz kutatsok zme a kirtkel fggvny javtsra sszpontosult. Gerry Tesauro
(Tesauro, 1992) neurlis hls technikkkal (lsd 20. fejezet) tvzte Samuel megerstses tanulsi mdszert,
hogy egy figyelemre mlt kirtkel fggvnyt hozzon ltre, amit 2-es, illetve 3-as mlysg keresssel egytt
hasznlt. A sajt magval jtszott tbb mint egy milli tant jtszma utn Tesauro programja, a TD-GAMMON a
vilgranglistn stabilan az els hrom jtkos kztt foglal helyet. A program eredmnyei alapjn a jtk nyit
lpseit tekintve egyes esetekben az eddigi gyakorlat radiklisan megvltozott.
6.1.4. G
zsiban a g a legnpszerbb tblajtk, ami a mesterektl legalbb olyan felkszltsget ignyel, mint a sakk.
A 19 19-es tbla miatt az elgazsi tnyez 361-gyel indul, gy a hagyomnyos keressi algoritmusok teljesen
hasznlhatatlanok. Egszen 1997-ig kompetens programoknak hre-hamva sem volt, most azonban mr
programok is kpesek elfogadhat lpseket tenni. A legjobb programok tbbsge alakzatfelismersi
technikkat (amikor adott alakzat elfordul, akkor bizonyos lps megttelt kell megfontolni) korltos
keresssel (annak eldntsre, hogy bizonyos kveket el lehet-e fogni, egy loklis terleten maradva) kombinl.
A knyv rsnak idejn a legersebb programok valsznleg Chen Zhixing Goemate s Michael Reiss Go4++
programja voltak, mindegyiket kb. 10 kyu-ra (gyenge amatrszint) rtkeltk. A g olyan terletnek tnik, ami a
kifinomult kvetkeztetsi mdszereket alkalmaz intenzv kutatsokbl valsznleg nyerhet. Sikert hozhat
pldul az, hogy megtalljuk annak a mdjt, hogy sok, lazn csatolt rszjtszmra (amire a g
dekomponlhat) vonatkoz loklis kvetkeztets nhny szlt hogyan kellene integrlni. Az ilyen technikk
az intelligens rendszerek szempontjbl hihetetlen rtket kpviselnek.
6.1.5. Bridzs
A bridzs egy nem tkletes informcij jtk az egyik jtkos krtyi a tbbi jtkos ell el vannak rejtve. A
bridzs tbbszemlyes jtk is egyben, ngy jtkossal kett helyett, br a jtkosok kt csapatot alkotnak,
prban. Ahogyan ezt a 6.5. alfejezetben lttuk, egy bridzsparti optimlis lejtszsa az informcigyjts, a
kommunikci, a blffls s a valsznsgek gondos mrlegelsnek az elemeit is tartalmazhatja. E
technikkbl szmos elemet hasznl a Bridge Baron program (Smith s trsai, 1998), amely megnyerte az
1997-es Szmtgpes Bridzsbajnoksgot. Br nem jtszik optimlisan, a Bridge Baron azon ritka sikeres,
jtkot jtsz programok egyike, amelyek hierarchikus tervksztsi technikkat alkalmaznak (lsd 12. fejezet),
olyan magas szint, bridzsjtkosok szmra ismers tleteket felhasznlva, mint az impasszols (finessing) s
a dobsknyszer (squeezing).
A GIB program (Ginsberg, 1999) meggyz flnnyel nyerte meg a 2000. vi bajnoksgot. A GIB a jvbe
lts szerinti tlagols mdszert hasznlja, kt lnyegi mdostssal. Elszr, ahelyett hogy megvizsgln,
hogy egy adott vlaszts mennyire bizonyul jnak a rejtett krtyk minden lehetsges kombincija mellett
(amibl 10 milli is lehet), a program egy vletlenszeren vlasztott 100 kombincibl ll mintt vizsgl.
Msodszor, a GIB magyarzatalap ltalnostst (explanation-based generalization) hasznl arra, hogy
klnfle standard helyzetekre az optimlis jtkvezets ltalnos szablyait kiszmtsa s eltrolja. Ez lehetv
teszi minden leoszts egzakt megoldst. A GIB taktikai pontossga ellenslyozza azt, hogy az informcira
kvetkeztetni nem tud. Az 1998-as emberi vilgbajnoksgon az egyenl rang mrkzsen (egy leoszts
lejtszsban) 35-bl 12-ikknt vgzett, az emberi szakrtk elvrsait messze tlszrnyalva.
7. rtkels
164
Mivel a jtkokban az optimlis dnts kiszmtsa a legtbb esetben kezelhetetlen, ezrt az sszes
algoritmusnak valamilyen felttelezssel s kzeltssel kell lnie. A minimax algoritmuson, kirtkel
fggvnyeken s az alfa-bta algoritmuson alapul standard megkzelts csak egy lehetsges megolds.
Valsznleg a standard megkzelts azrt emelkedik ki a versenyjtkokra alkalmazott tbbi mdszer kzl,
mert korn vetettk fel s intenzven fejlesztettk. A terlet nhny szakrtje gy gondolja, hogy a jtkok pp
ezrt vltak el az MI f irnyvonaltl, mert a standard megkzelts mr nem hagy elegend teret ahhoz, hogy
j betekintst nyerjnk a dntshozatal ltalnos krdseibe. Ebben a rszben az alternatv megkzeltsekre
fogunk rpillantani.
Elszr tekintsk a minimax algoritmust. A minimax optimlis mdszert ad egy lps kivlasztshoz egy adott
keressi fbl, feltve, hogy a levlcsompontok kirtkelsei tkletesen pontosak. A valsgban azonban a
kirtkelsek az lls rtknek durva becsli, s gy vehetjk, hogy nagy hibval rendelkeznek. A 6.13. bra
egy olyan egylpsvltsos jtkft mutat, amire a minimax alkalmatlannak tnik. A minimax a jobb oldali gat
javasolja, holott nagyon valszn, hogy a bal oldali g valdi rtkei nagyobbak. A minimax azon a
felttelezsen alapul, hogy a 100-as, a 101-es, a 102-es s a 100-as cmkt visel csompontok mindegyike
valban jobb, mint a 99-es cmkt visel csompont. Az a tny azonban, hogy a 99-es cmkj csompontnak
1000-es cmkj testvrei vannak, azt sugallja, hogy a csompont valdi rtke valjban magasabb. Ezen
problma kezelsnek egyik lehetsges mdja, ha a kirtkels egy, a lehetsges rtkek feletti valsznsgelosztst ad vissza. Ekkor standard statisztikai mdszerekkel ki lehet szmtani a szl rtknek valsznsgeloszlst. Sajnos a testvrcsompontok rtkei ltalban ersen korrelltak, ezrt ez kltsges szmts lehet,
mert olyan rszletes ismeretre van szksg, amit ltalban nehz beszerezni.
6.13. bra - Egy olyan egylpsvltsos jtkfa, amire a minimax alkalmatlannak tnik
A kvetkezkben tekintsk a ft generl keres algoritmust. Az algoritmustervez clja, hogy olyan

algoritmust adjon meg, ami megfelel id alatt lefut, s j lpst vlaszt. Az alfa-bta algoritmus
legszembetnbb problmja, hogy nem arra terveztk, hogy egyszeren kivlasszon egy j lpst, hanem arra,
hogy rtkkorltokat szmtson ki az sszes megengedett lps rtkre. Hogy lssuk, ez a tbbletinformci
mirt szksgtelen, tekintsnk egy llst, ahol egyetlen megengedett lps ltezik. Ettl fggetlenl az alfa-bta
keress egy hatalmas s teljesen haszontalan keressi ft generl s rtkel ki. Termszetesen beiktathatunk egy
tesztet az algoritmusba, de ezzel csak elrejtjk a problmt az alfa-bta algoritmus ltal elvgzett szmtsok
nagy rsze egyltaln nem relevns. Az az eset, amikor csak egyetlen megengedett lps ltezik, nem sokban tr
el attl az esettl, amikor nhny megengedett lps ltezik, ami kzl egy j, a tbbi pedig nyilvnvalan
katasztroflis. Egy ilyen egyrtelmen favorit helyzetben szerencssebb lenne egy kis keress utn gyors
dntsre jutni, mintsem az idt fecsrelni, amit ksbb egy problmsabb helyzetben esetleg hasznosabban fel
lehetne hasznlni. Ez elvezet a csompontkifejts hasznossgnak gondolathoz. Egy j keressi algoritmusnak
nagy hasznossg csompontot kell kivlasztania kifejtsre, vagyis olyat, ami valsznleg egy lnyegesen jobb
lps felfedezshez vezet. Ha nincs olyan csompontkifejts, aminek a hasznossga nagyobb, mint a
kifejtsnek (idre vonatkoztatott) kltsge, akkor az algoritmusnak be kell fejeznie a keresst, s lpnie kell.
Vegyk szre, hogy ez nemcsak az egyrtelm favorithelyzetekre mkdik, hanem a szimmetrikus lpsekre is,
ahol brmennyi keresst is vgeznnk, egyik lps sem mutatkozna jobbnak.
Azt a fajta kvetkeztetst, amikor megmondjuk, hogy milyen szmtsokat kell vgrehajtani,
metakvetkeztetsnek (metareasoning) nevezik (kvetkeztets a kvetkeztetsrl). Ez nemcsak a jtkokra
165
vonatkozik, hanem mindenfajta kvetkeztetsre is. Minden szmtst azrt vgznk el, hogy jobb dntseket
hozhassunk. Mindegyiknek van valamilyen kltsge, s mindegyik valamilyen valsznsggel bizonyos
javulst eredmnyezhet a dnts minsgben. Az alfa-bta algoritmus a lehet legegyszerbb
metakvetkeztetst foglalja magban: olyan ttelt, miszerint a fa bizonyos gait vesztesg nlkl figyelmen
kvl lehet hagyni. Ennl sokkal jobbat is lehet tenni. A 16. fejezetben megnzzk, hogy ezeket a gondolatokat
hogyan lehet pontoss s megvalsthatv tenni.
Vgezetl ismt vizsgljuk meg magnak a keressnek a termszett. A heurisztikus keress s a jtkok
algoritmusai gy mkdnek, hogy a kiindul llapotbl indul konkrt llapotsorozatokat generlnak, majd
alkalmaznak egy kirtkel fggvnyt.
Az emberek nem gy jtszanak. A sakkban gyakran van egy konkrt clunk pldul le akarjuk tni az ellenfl
vezrt , s ezt a clt hasznlhatjuk arra, hogy a cl elrse rdekben szelektven megfelel terveket
generljunk. Ez a fajta clvezrelt kvetkeztets (goal-directed reasoning) vagy tervkszts (planning) nha
teljesen eltnteti a kombinatorikus keresst (lsd IV. rsz). David Wilkins PARADISE programja (Wilkins, 1980)
az egyetlen olyan program, amely sikeresen alkalmazta a clvezrelt kvetkeztetst a sakkra: nhny 18
lpsbl ll kombincit ignyl sakkfeladvnyt is kpes volt megoldani. Ez idig azonban mg nem ltjuk
tisztn, hogyan kellene a kt algoritmustpust egyetlen robusztus s hatkony rendszerbe tvzni, br a Bridge
BaronTM jelenthet egy, a helyes irnyban tett lpst. Egy ilyen teljesen integrlt rendszer jelents eredmnynek
szmtana nemcsak a jtkkutats terletn, hanem ltalnossgban vve az MI-kutats terletn is, mert egy
ltalnos intelligens gens szmra megfelel alapot is tudna nyjtani.
8. sszefoglals
A jtkok sokasgt nztk meg, hogy megrtsk, mit is jelent optimlisan s a gyakorlatban is jl jtszani. A
legfontosabb gondolatokat az albbiakban foglalhatjuk ssze:
Egy jtkot a kiindul llapottal (initial state) (a tblallssal), mindegyik llapotban a leglis
cselekvsekkel (actions), egy vgteszttel (terminal test) (ami megmondja, hogy mikor rt vget a jtk) s
egy hasznossgi fggvnnyel (utility function) (ami megmondja, hogy ki s mennyivel nyert) lehet
megadni.
Tkletes informcival (perfect information) rendelkez ktszemlyes zrussszeg jtkoknl a
minimax algoritmus a teljes jtkfa mlysgi felsorolsval meg tudja hatrozni a jtkos legjobb lpst.
Az alfa-bta algoritmus ugyanazt a szmtst vgzi el, mint a minimax algoritmus, azonban jval
hatkonyabb, mivel lenyesi a keressi fa azon gait, amirl be tudja bizonytani, hogy a vgs eredmny
szempontjbl irrelevnsak.
A teljes jtkfa ltalban nem kezelhet (mg az alfa-bta algoritmussal sem), ezrt a keresst valahol abba
kell hagynunk, s egy kirtkel fggvnyt (evaluation function) kell alkalmaznunk, ami az adott llapot
hasznossgnak becsljt adja.
A vletlen elemet is tartalmaz jtkokat a minimax algoritmus olyan kiterjesztsvel lehet kezelni, amely a
vletlen csompontokat (chance node) gy rtkeli ki, hogy az egyes hasznossgokat a
gyermekcsompontok valsznsgvel slyozva veszi az sszes gyermekcsompontjnak az tlagos
hasznossgt.
A nem tkletes informcij jtkok (imperfect information), mint pldul a bridzs, optimlis lejtszsa
mindegyik jtkostl az aktulis s a jvbeli hiedelmi llapotaira (belief states) vonatkoz kvetkeztetst
ignyli. Egy egyszer kzelts kaphat, ha tlagoljuk egy cselekvs rtkt a hinyos informci minden
lehetsges konfigurcijra.
A programok egyenl ellenfelek, vagy akr meg is verik a legjobb emberi jtkosokat dmajtkban,
Othellban s ostblajtkban, s igen kzel llnak ehhez a bridzsben. Egy program legyzte egy
kirakatmrkzsen az emberi sakkvilgbajnokot. A gban a programok mg amatr szinten jtszanak.

A mechanikus jtkok korai trtnetre szmos csals rnyomta a blyegt. Ezek kzl a legnevezetesebb
Kempelen Farkas br 1769-ben killtott Trkje, egy felttelezett sakkautomata, amely Napleont is
166
megverte, mieltt kiderlt, hogy a szekrnye valjban egy trpe nvs emberi sakkmestert rejtett (Levitt,
2000). A Trk 1769-tl 1854-ig jtszott. gy tnik, Charles Babbage (aki a Trk hatsa alatt llt) volt az els,
aki 1846-ban szmtgpes sakk s dmajtk megvalsthatsgnak els komoly elemzst adta (Morrison s
Morrison, 1961). Tervezett egy 3 3-as ambt jtsz clgpet is, amit soha sem ptett meg. Az els igazi
jtkgpet 1890 tjn egy spanyol mrnk, Leonardo Torres y Quevedo tervezte s ptette meg. A KRK a
sakkvgjtkra specializlt gp volt (kirly s bstya a kirly ellen) s kpes volt brmilyen kiindul llsbl
mattot adni.
A minimax algoritmust sokszor Ernst Zermelo, a modern halmazelmlet atyja 1912-es cikkhez vezetik vissza.
A cikk sajnlatos mdon tartalmaz hibkat, s a minimaxot nem rja le helyesen. A jtkelmlet komoly alapjait
a nagy hats Theory of Games and Economic Behavior c. munkban Neumann s Morgenstern (Neumann s
Morgenstern, 1944) fektettk le, kimutatva azt is, hogy egyes jtkokban szksg van randomizlt (avagy nem
megjsolhat) stratgikra. (Tovbbi informcirt lsd 17. fejezet.)
A korai szmtgpes korszak szmos prominens szemlyt kvncsiv tette a szmtgpes sakk lehetsge.
Konrad Zuse aki elsknt tervezett programozhat szmtgpet igen rszletes tleteket dolgozott ki arra,
hogy ezt hogyan lehetne megvalstani (Zuse, 1945). Norbert Wiener nagy befolys Cybernetics c. knyve
(Wiener, 1948) tartalmazta egy szmtgpes sakkprogram mkdsnek egy lehetsges vzlatt, a minimax
keresst, a mlysgi levgst s a kirtkel fggvnyt is belertve. Claude Shannon a modern szmtgpes
jtkok elvi alapjait sokkal rszletesebben fejtette ki, mint Wiener (Shannon, 1950). Shannon bevezette az
egyenslyi lls fogalmt, s nhny tletet vzolt fel a szelektv (nem kimert) jtkfakeressre vonatkozlag.
Slater s az ugyanabban a ktetben a cikkre reflektl szerzk szintn megvizsgltk a szmtgpes sakkozs
lehetsgeit (Slater, 1950). I. J. Good Shannontl fggetlenl kidolgozta az egyenslyi lls fogalmt (Good,
1950).
1951-ben Alan Turing rta meg az els valdi szmtgpes programot, ami kpes volt egy teljes sakkjtszmt
lejtszani (Turing s trsai, 1953). Valjban azonban Turing programja sohasem futott szmtgpen, kzi
szimulcival teszteltk egy nagyon gyenge emberi sakkjtkos ellen, aki legyzte a programot. Idkzben D.
G. Prinz megrt s valban futtatott is egy programot (Prinz, 1952), ami sakkfeladvnyokat oldott meg, br nem
jtszott teljes jtszmt. Alex Bernstein rta az els olyan sakkprogramot, amely egy teljes standard sakkjtszmt
jtszott (Bernstein s Roberts, 1958; Bernstein s trsai, 1958).6
Az alfa-bta keress alaptlett John McCarthy dolgozta ki 1956-ban, habr nem publiklta. Az NSSsakkprogram az alfa-bta algoritmus egy leegyszerstett vltozatt hasznlta, ez volt az els sakkprogram, ami
ezt alkalmazta (Newell s trsai, 1958). Nilsson szerint Arthur Samuel dmaprogramja (Samuel, 1959; 1967)
szintn alfa-bta algoritmust hasznlt, habr maga Samuel ezt nem emlti a rendszerrl publiklt beszmoliban
(Nilsson, 1971). Az 1960-as vek elejn jelentek meg az alfa-bta algoritmust ismertet cikkek (Hart s
Edwards, 1961; Brudno, 1963; Slagle, 1963b). Az alfa-bta algoritmus egy teljes implementcijt Slagle rta le
egy cikkben (Slagle s Dixon, 1969), ami a kalah7 jtkot jtsz jtkprogram mkdst ismertette. A John
McCarthy egyik dikja ltal rt KotokMcCarthy sakkprogram (Kotok, 1962) is az alfa-bta algoritmust
hasznlta. Knuth ismerteti az alfa-bta algoritmus trtnett (Knuth s Moore, 1975), megadja az algoritmus
teljessgnek a bizonytst s elvgzi az idigny elemzst. Knuth s Moore elemzse az alfa-bta keressnek
a kvetk vletlen sorba rendezsvel O((b/logb)d) aszimptotikus komplexitst mutatott ki, ami lehangol
eredmny, mert a b/logb effektv elgazsi tnyez magnl a b-nl nem sokkal jobb. Ksbb jttek r, hogy az
aszimptotikus kplet csak a b > 1000 igaz, s az aktulis jtkokra tallhat elgazsi tnyezkre a gyakran
idzett O(b3d/4) rvnyes. Pearl megmutatta (Pearl, 1982b), hogy az alfa-bta algoritmus aszimptotikusan
optimlis az sszes rgztett mlysg jtkfa-keressi algoritmus kztt.
Az els kt sakkprogram, ami egyms ellen jtszott, a KotokMcCarthy-program s a Moszkvai Elmleti s
Ksrleti Fizika Intzet ltal megrt ITEP program (Adelson-Velsky s trsai, 1970) volt az 1960-as vek
kzepn. Ezt az interkontinentlis mrkzst tvrn jtszottk le. A kzdelem 1967-ben az ITEP-program 3:1
arny gyzelmvel rt vget. A MacHack 6 volt az els olyan sakkprogram, ami sikeresen jtszott emberek
ellen (Greenblatt s trsai, 1967). 1400-as l-pontszma jval tbb volt, mint a kezdk 1000-es l-pontja,
azonban gy is igen messze volt a 2800 vagy tbb l-ponttl, ami szksges lett volna, hogy Herb Simon 1957es jslata teljesljn, miszerint 10 ven bell a szmtgpes sakkprogramok lesznek a sakkvilgbajnokok
(Simon s Newell, 1958).
Newell (Newell s trsai, 1958) egy orosz BESM programot emlt, amely lehet, hogy Bernstein programjt megelzte.
A kalah egy afrikai eredet ktszemlyes jtk, amelyben kavicsokat (gymntokat) kell trakosgatni csszk kztt. Tbb szmtgpes
vltozata is ltezik, l. pldul: http://ceman.ecn.purdue.edu/~ee373/kalah.html. (A ford.)
6
7
167
Az 1970-es els ACM szak-Amerikai Szmtgpes Sakkbajnoksggal a sakkprogramok versengse komolly

vlt. A korai 1970-es vek programjai igen bonyolultak voltak, szmos trkkt vetettek be, hogy a keress
bizonyos gait levgjk, elfogadhat lpseket generljanak stb. Az els Szmtgpes Sakkvilgbajnoksgot
1974-ben Stockholmban rendeztk. Ezt az els vilgbajnoksgot a Kaissa (Adelson-Velsky s trsai, 1975), egy
msik ITEP-program nyerte meg. Kaissa egy egyszerbb megkzeltsen alapult s kimert alfa-bta keresst
hasznlt egyenslyi keresssel vegytve. A megkzelts felsbbrendsgt igazolta a CHESS 4.6 gyzelme az
1977-es Szmtgpes Sakkvilgbajnoksgon. A CHESS 4.6 lpsenknt 400 000 llst elemzett s 1900 lpontot rt el.
Greenblatt MacHack 6-osnak egy ksbbi vltozata volt az els olyan sakkprogram, amely mr kifejezetten a
sakkra tervezett clhardveren futott (Moussouris s trsai, 1979), de a Belle (Condon s Thompson, 1982) volt
az els olyan program, ami a clhardvernek ksznheten jelents sikereket rt el. A Belle lpsgenerl s
llsrtkel hardvere lehetv tette, hogy lpsenknt nhny milli llst is elemezzen. A Belle 2250 lpontot rt el, s az els mesteri fokozat szint program lett. A HITECH rendszer egy specilis rendeltets
szmtgp volt, amit Hans Berliner, a korbbi levelez sakkvilgbajnok s egy CMU-beli dikja, Carl Ebeling
tervezett, hogy a kirtkel fggvnyek gyors szmtst tegyk lehetv (Ebeling, 1987; Berliner s Ebeling,
1989). A HITECH szak-amerikai sakkbajnok lett 1985-ben, s 1987-ben az els olyan program volt, amely egy
emberi nagymestert is legyztt. A CMU-n szintn kifejlesztett Deep Thought (Hsu s trsai, 1990) a tiszta
keress sebessgt tovbb fokozta. 2551 l-pontot rt el s a Deep Blue elfutra lett. Az 1980-ban alaptott
Fredkin-dj 5000 dollrt ajnlott fel annak a sakkprogramnak, amelyik elsknt ri el a mesterfokozatot, s
10 000 dollrt ajnlott fel annak a sakkprogramnak, amely elsknt ri el a USCF (Amerikai Egyeslt llamok
Sakkszvetsge) 2500-as l-pontot (ez a nagymesteri szinthez kzeli rtk), s 100 000 dollrt ajnlott fel azon
sakkprogramnak, amelyik elsknt legyz egy emberi sakkvilgbajnokot. Az 5000 dollros djat 1993-ban a
Belle, a 10 000 dollros djat 1989-ban a Deep Thought, majd a 100 000 dollros djat 1997-ben a Deep Blue
nyerte el a Kaszparov felett aratott gyzelemrt. Fontos emlkezni, hogy a Deep Blue sikert mind az
algoritmikus javtsok, mind a hardver biztostotta (Hsu, 1999; Campbell s trsai, 2002). Az olyan technikk,
mint a nulla lps heurisztika (Beal, 1990) a keressben igen szelektv programokhoz vezettek. Az utols hrom
Szmtgpes Sakkvilgbajnoksgot 1992-ben, 1995-ben s 1999-ben a standard PC-n fut programok nyertk
meg. Egy korszer sakkprogramnak taln a legrszletesebb lerst Ernst Heinz adja meg (Heinz, 2000),
amelynek DARKTHOUGHT programja volt a legmagasabb pontszm nem kereskedelmi program az 1999-es
vilgbajnoksgon.
Ksrletek trtntek arra, hogy a standard megkzelts 6.7. alfejezetben lert problmit lekzdjk. Az els
szelektv keres algoritmus, elmleti ignnyel, valsznleg a B * algoritmus (Berliner, 1979) volt, ami
megksrli, hogy a jtkfa csompontjainak az rtkeire egyetlen becslt rtk helyett intervallumkorltokat
adjon. A levlcsompontok kifejtse annak rdekben trtnik, hogy a legfels szint korltokat finomtsuk,
amg egy nyilvn legjobb lpst nem tallunk. Palay az alfa-bta algoritmus becslt rtkei, illetve a B*
algoritmus intervallumai helyett valsznsg-eloszlsokat hasznl (Palay, 1985). David McAllester
konspircis szm keressi algoritmusa azokat a levlcsompontokat fejti ki, amelyek, ha megvltoznnak az
rtkeik, elidznk, hogy az algoritmus a gykrnl j lpst vlasszon (David McAllester, 1988). Az MGSS *
(Russell s Wefald, 1989) a 16. fejezet fejlett dntselmleti technikit hasznlja minden levlcsompont
kifejtsnek rtkbecslsre a gykrszint dnts minsgben tapasztalt vrhat javuls fggvnyben. Ez a
program az Othellban kpes volt jobb eredmnyeket elrni, mint az alfa-bta algoritmus, annak ellenre, hogy
egy nagysgrenddel kevesebb csompontot vizsglt meg. Az MGSS* megkzelts elvben alkalmas a
kvetkeztets brmilyen formjnak vezrlsre.
Az alfa-bta keress tbb szempontbl a mlysgi glenyes megfelelje kt jtkos esetn, amit az egyedi
gens esetben az A* dominl. Az SSS* algoritmus (Stockman, 1979) egy ktszemlyes A*-nak tekinthet, s
azonos dnts elrshez soha nem fejt ki tbb csompontot, mint az alfa-bta algoritmus. Eredeti formjban
az SSS* memriaignye s a sorba llts szmtsi overheadje miatt nem praktikus, azonban az RLEK
algoritmusbl kifejlesztettek egy lineris trkomplexits vltozatot (Korf s Chickering, 1996). Plat az SSS *-ja
egy j megkzeltst dolgozott ki (Plat s trsai, 1996) az alfa-bta keress s a transzpozcis tblk
egytteseknt, s megmutatta, hogy az eredeti algoritmus problmit hogyan kell elkerlni, vgl MTD(f) nven
egy j vltozatot fejlesztett ki, amit sok kiemelked teljestmny programba ptettek be.
D. F. Beal s Dana Nau a minimax kzelt kirtkelsekre trtn alkalmazsoknl jelentkez gyengesgeit
tanulmnyoztk (Beal, 1980; Dana Nau, 1980; 1983). Kimutattk, hogy a levlrtkeknek a fban val
eloszlsra bizonyos fggetlensgi felttelezsekkel lve, a minimax algoritmus kevsb megbzhat becslseket
ad a gykrre, mintha a kirtkel fggvnyeket kzvetlenl, mindenfle keress nlkl alkalmaznnk. Pearl
Heuristics c. knyve (Pearl, 1984) ezt a ltszlagos paradoxont rszben megmagyarzza s szmos
jtkalgoritmust elemez. Baum s Smith (Baum s Smith, 1997) a minimax egy valsznsg-alap
168
helyettestst javasolja, s azt mutatja ki, hogy ez bizonyos jtkokban jobb dntsekhez vezet. A keress
klnfle szinteken val levgsbl s a kirtkel fggvny alkalmazsbl add hatsok elmlete mg
mindig szegnyes.
A vrhatminimax algoritmust Donald Michie vetette fel (Michie, 1966), habr az kzvetlenl kvetkezik
Neumann s Morgenstern jtkfa-kirtkelsi elmletbl. Bruce Ballard az alfa-bta nyesst kiterjesztette a
vletlen csompontokat is tartalmaz fkra (Bruce Ballard, 1983). Az els sikeres ostblaprogram a BKG volt
(Berliner, 1977; 1980b). Csak 1 mlysgig keresett s bonyolult, manulisan sszelltott kirtkel fggvnyt
hasznlt. Ez volt az els szmtgpes program, ami kpes volt legyzni egy emberi vilgbajnokot az ismert
klasszikus tblajtkok egyikben (Berliner, 1980a), habr Berliner elsknt ismerte el, hogy ez csak egy rvid,
bemutat mrkzs volt (nem egy vilgbajnoki mrkzs), s hogy a BKG nagyon szerencss kzzel dobott a
kockval. Gerry Tesauro kutatsai, elszr a NEUROGAMMON (Tesauro, 1989), majd a TD-GAMMON (Tesauro, 1995)
programokkal, azt mutattk, hogy sokkal jobb eredmny rhet el a megerstses tanulssal (amely terlettel a
21. fejezetben foglalkozunk).
A dma, s nem a sakk volt az els olyan klasszikus jtk, amire egy valban szmtgpen fut program kpes
volt vgigjtszani egy teljes jtszmt. Christopher Strachey rta az els mkdkpes dmajtkprogramot
(Strachey, 1952). Schaeffer (Schaeffer, 1997) nagyon olvasmnyosan lerja a Chinook a vilgbajnok
dmajtkprogram fejlesztstrtnett az sszes mhelytitkval egytt.
Az els gprogramokat valamivel a dma- s a sakkprogramok utn fejlesztettk ki (Lefkovitz, 1960, Remus,
1962), s lassabban fejldtek a dma- s a sakkprogramoknl. Ryder tiszta keressalap megkzeltst hasznlt
(Ryder, 1971) a szelektv nyessi mdszerek egsz palettjval, hogy le tudja gyzni a hatalmas elgazsi
tnyezbl add problmt. Zobrist felttel-cselekvs szablyokat hasznlt elfogadhat lpsek generlsra,
ha a jtkban ismert alakzatok jelentek meg (Zobrist, 1970). Reitman s Wilcox j eredmnnyel kombinlta a
szablyokat s a keresst (Reitman s Wilcox, 1979), a legtbb modern program kvette ezt a hibrid
megkzeltst. A szmtgpes g jelenlegi llst Mller (Mller, 2002) foglalja ssze, s tmrdek
hivatkozst is kzl. Anshelevich (Anshelevich, 2000) hasonl mdszereket a HEX jtkra alkalmaz. A friss
fejlemnyekrl a Szmtgpes Go Szvetsg ltal kiadott Computer Go Newsletter szmol be.
A szmtgpes jtkokrl tbb frumon jelennek meg cikkek. A felettbb flrevezet nev
konferenciakiadvny, a Heuristic Programming in Artificial Intelligence szmol be a Szmtgpes
Sakkolimpikrl, amely rendezvnyek a jtkok egsz sorra terjednek ki. A jtkprogramok kutatsrl fontos
cikkeket publikltak szmos szerkesztett cikkgyjtemnyben (Levy, 1988a; Levy, 1988a; Marsland s
Schaeffer, 1990). Az 1977-ben alaptott Nemzetkzi Szmtgpes Sakkszvetsg (International Computer
Chess Association, ICCA) negyedvenknt adja ki az ICGA Journalt (korbban ICCA Journal). (Clarke, 1977)
ta fontos cikkek jelentek meg az Advances in Computer Chess antolgiasorozatban. Az Artificial Intelligence
folyirat 134. ktete (Artificial Intelligence, 2002) lersokat tartalmaz a legfejlettebb sakk, Othello, Hex, shogi,
g, ostbla, pker, Scrabble s ms jtkprogramokrl.
8.2. Feladatok
6.1.
Ez a feladat a jtkok alapvet elveit a 3 3-as ambn (krk s ikszek) keresztl gyakoroltatja be. Xn azon
sorok, oszlopok vagy tlk szmt jelli, ahol pontosan n db X, mg egyetlen O sem tallhat. Hasonlan, On
azon sorok, oszlopok vagy tlk szmt jelli, ahol pontosan n db O, mg egyetlen X sem tallhat. A
hasznossgfggvny +1-et rendel minden olyan llshoz, ahol X3 = 1, s 1-et rendel minden olyan llshoz,
ahol O3 = 1. Az sszes tbbi vglls hasznossga 0. A nem vgllapotok esetn az albbi mdon definilt
lineris kirtkel fggvnyt fogjuk hasznlni:
Kirtkel(s) = 3X2(s) + X1(s) (3O2(s) + O1(s))
a. Krlbell hny klnbz 3 3-as ambajtszmt lehet lejtszani?

b. res tblbl kiindulva, a szimmetrit is figyelembe vve, 2-es mlysgig (vagyis egy X s egy O a tbln)
mutassa meg a teljes jtkft.
c. A fban 2-es mlysgben tntesse fel az sszes llskirtkelst.
169
d. A fban az 1-es s a 0-s mlysgben lev llsokhoz a minimax algoritmust felhasznlva tntesse fel a felfel
terjesztett rtkeket, s hasznlja fel azokat a legjobb kezd lps meghatrozshoz.
e. Karikzza be a 2-es szinten lev azon csompontokat, amelyeket az alfa-bta nyess alkalmazsa esetn az
algoritmus nem rtkelne ki, felttelezve, hogy a csompontokat az algoritmus az alfa-bta nyesshez
optimlis sorrendben generlja.
6.2.
Bizonytsa be az albbi lltst: minden jtkfa esetn a MAX ltal kapott hasznossg, amikor MAX a minimax
dntst hasznlva jtszik egy szuboptimlis MIN-nel szemben, sohasem lesz alacsonyabb, mint az a hasznossg,
ami akkor r el, ha egy optimlis MIN-nel szemben jtszana. Ki tud tallni egy olyan jtkft, ahol MAX egy
szuboptimlis stratgival egy szuboptimlis MIN-nel szemben mg jobban teljestene?
6.3.
Tekintse a 6.14. brn ltott ktszemlyes jtkot.
a. Rajzolja fel a teljes jtkft az albbi konvencit alkalmazva:
minden llapotot (SA, SB) formban rja fel, ahol SA s SB a zsetonok helyzete.
minden vgllapotot egy ngyzetbe, a jtkrtkt pedig egy krbe rja be.
a hurokllapotokat (azon llapotok, amelyek mr megjelentek a gykrig vezet t mentn) dupla
ngyzetekbe rja be. Mivel nem vilgos, hogy az ilyen llapotok rtke mennyi, jellje be mindegyiket egy
krbe rt ?-lel.
b. Most mindegyik csomponthoz rja be a visszaterjesztett minimax rtkt (szintn egy krbe rva).
Magyarzza meg, hogy a ? rtkeket hogyan kezelte, s mirt?
c. Magyarzza meg, hogy a standard minimax ebben a jtkfban mirt fulladna kudarcba, s rviden vzolja
fel, hogy a (b) krdsre adott vlaszra tmaszkodva hogyan lenne kpes az algoritmust megjavtani. Kpese a mdostott algoritmus megadni az optimlis dntseket az sszes hurkokat tartalmaz jtkban?
d. Ez a 4-ngyzetes jtk n ngyzet esetre ltalnosthat, minden n > 2-re. Bizonytsa be, hogy A gyz, ha n
pros, s veszt, ha n pratlan.
6.14. bra - Egy egyszer jtk kiindul llsa. Az A jtkos indul elsnek. Mindkt
jtkos felvltva lp s a zsetonjt a szomszdos szabad helyre helyezheti, mindkt
irnyban. Ha a szomszdos mez foglalt, akkor a jtkos az ellenfl felett tugorhat a
kvetkez szabad helyre, ha van ilyen. (Pldul ha A a 3-n s B a 2-n van, akkor A
visszalphet 1-re.) A jtknak vge, ha az egyik jtkos elri a tbla ellenttes vgt. Ha
az A jtkos elsnek ri el a 4-et, a jtk rtke +1, ha B jtkos ri el elsnek az 1-et, a
jtk rtke az A szmra 1.
170
6.4.
Implementljon lpsgenertort s kirtkel fggvnyt az albbi jtkok kzl nhnyat: kalah, Othello, dma,
sakk. Az implementcit hasznlva tervezzen egy ltalnos alfa-bta jtkgenst. Hasonltsa ssze a keressi
mlysg nvelsnek, a lpssorrendezs tkletestsnek s a kirtkel fggvny tkletestsnek a hatst.
Milyen kzel esik az n effektv elgazsi tnyezje a tkletes lpssorrendezs idelis esethez?
6.5.
lltsa el az alfa-bta nyess helyessgnek formlis bizonytst. Ehhez tekintse a 6.15. brn bemutatott
helyzetet. A krds az, hogy az algoritmus lenyesse-e az nj csompontot, ami egy max-csompont s az n1
leszrmazottja. Az alaptlet, hogy akkor s csak akkor nyessk le, ha n1 minimax rtke igazolhatan fggetlen
nj rtktl.
a. n1 rtkt az albbi kplet adja meg:
n1 = min(n2, n21, , n2b2)
Adjon egy hasonl kifejezst n2-re, s n1-re, nj-t felhasznlva.

b. Legyen li az ni csomponttl balra lev, ismert minimax rtk, i mlysgben tallhat csompontok
minimlis (maximlis) csompontrtke. Hasonlan, legyen ri az ni csomponttl jobbra lev, mg ki nem
fejtett, i mlysgben tallhat csompontok minimlis (maximlis) csompontrtke. Az n1-re elbb
meghatrozott kifejezst rja t li s ri rtkekkel kifejezve.
c. Most fogalmazza t a kifejezst, hogy megmutassa, ahhoz, hogy nj befolysolja n1-et, nj-nek meg kell
haladnia bizonyos, az li rtkekbl meghatrozott korltot.
6.15. bra - Az a helyzet, amikor az algoritmus eldnti, hogy lenyesheti-e az nj

csompontot
171
d. Az eljrst ismtelje meg arra az esetre, amikor az nj egy min-csompont.

6.6.
Implementlja a vletlen csompontokat tartalmaz jtkfk lenyessre alkalmas vrhatminimax s *-alfa-bta
algoritmust, amit Ballard (Ballard, 1983) r le. Prblja ki azokat az algoritmusokat olyan jtkokon, mint az
ostbla, s mrje meg a *-alfa-bta nyessi hatkonysgt.
6.7.
Bizonytsa be, hogy a levlcsomponti rtkek pozitv lineris transzformcija (azaz egy transzformci x-tl
ax + b-ig, ahol a > 0), nincs befolyssal a lpsek vlasztkra a jtkfban, akkor sem, ha lteznek benne
vletlen csompontok.
172
6.8.
Tekintse az albbi eljrst a lpsek megvlasztsra a vletlen csompontot is tartalmaz jtkokban:
Generljon egy megfelel szm (mondjuk 50) kockadobsbl ll sorozatot egy megfelel (mondjuk 8)
mlysgig.
Ismert kockadobsok esetn a jtkfa determinisztikuss vlik. Minden egyes kockadobs-sorozatra oldja
meg az eredmnyl kapott determinisztikus jtkft az alfa-bta algoritmussal.
Az eredmnyeket hasznlja fel az egyes lpsek rtknek megbecslsre, s vlassza ki a legjobb lpst.
Helyesen fog mkdni ez az eljrs? Mirt (nem)?
6.9.
rjon s implementljon egy vals idej, tbbszemlyes jtszkrnyezetet, ahol az id a krnyezeti llapot rsze,
s a jtkosok rgztett idszeleteket kapnak.
6.10.
Adja meg s/vagy implementlja az albbi jtkok egyikre vagy akr tbbre is az llapotlerst, lpsgenerlst
s a kirtkel fggvnyt: Monopoly, Jtk a betkkel, bridzs (egy konkrt licitet felttelezve) s pker
(vlassza meg a kedvenc vltozatt).
6.11.
Gondosan tekintse t a 6.10. feladat minden egyes jtkban a vletlen esemnyek s a rszleges informcik
sszefggseit.
a. Melyikre lesz j a standard vrhatminimax modell? Implementlja az algoritmust s futtassa le a
jtkgensben a jtkkrnyezet szksges mdostsaival.
b. Melyekre lenne j a 6.8. feladatban lert sma?
c. Vitassa meg, hogyan kellene kezelni azt a tnyt, hogy egyes jtkokban a jtkosok nem rendelkeznek
ugyanazzal az informcival az aktulis llapotrl.
6.12.
A minimax algoritmus felttelezi, hogy a jtkosak felvltva lpnek, az olyan krtyajtkokban azonban, mint a
whist vagy a bridzs, mindig a lets gyztese indul a kvetkeznek.
a. Mdostsa algoritmust, hogy e jtkokra is megfelelen mkdjn. Felttelezheti, hogy rendelkezsre ll a
GYZTES (lets) fggvny, amely azt adja vissza, hogy az adott letst mely krtya nyerte meg.
b. Rajzolja fel a 5.2. szakasz - A vrhatminimax komplexitsa rszben lthat els leosztsra a jtkft.
6.13.
A Chinook dmaprogram kiterjedten hasznlja a vgjtk adatbzisokat, amelyek pontos rtket adnak a jtk
utols hat lpsben elll sszes llshoz. Hogyan lehet egy ilyen adatbzist hatkonyan legenerlni?
6.14.
Vitassa meg, hogyan alkalmazhat a jtkok standard megkzeltse az olyan jtkokra, mint pldul a tenisz, a
pl s a krikett, amelyeket folytonos, fizikai llapottrben jtszanak.
6.15.
rja le, hogy a minimax s az alfa-bta hogyan vltozik ktszemlyes, nem zrussszeg jtkok esetn, ahol
minden jtkosnak kln kirtkel fggvnye van. Felttelezheti, hogy mindegyik jtkos msok kirtkel
173
fggvnyeit ismeri. Ha a kt vghasznossg rtkre nincs korlt, lehetsges-e valamelyik csompont szmra,
hogy az alfa-bta lenyesi?
6.16.
Tegyk fel, hogy egy olyan sakkprogrammal rendelkezik, amely kpes egymilli csompontot kirtkelni
msodpercenknt. Vlassza a jtklls egy tmr reprezentcijt a transzpozcis tbla szmra. Kb. mennyi
llst kpes eltrolni memriban, az 500 Mbjt nagysg tblban? Elg lesz-e ez a lpsenknt alloklt 3
perces keresshez? Hny tblakiolvasst kpes megvalstani egy llskirtkels ideje alatt? Most ttelezze fel,
hogy a transzpozcis tbla nagyobb, s nem fr el a memriban. Hny kirtkelst lehetne megvalstani egy
diszkhozzfrs ideje alatt, standard diszkhardver mellett?
174
7. fejezet - Logikai gensek

Ebben a fejezetben olyan genseket terveznk, amelyek kpesek reprezentcikat kialaktani a vilgrl,
kvetkeztetsi folyamatot alkalmaznak a vilg j reprezentcijnak a szrmaztatsra, s felhasznljk az j
reprezentcit a teendk kikvetkeztetsre.
Ez a fejezet tudsbzis genseket mutat be. A fogalmak, amelyeket itt trgyalunk a tuds reprezentcija s a
tuds alkalmazst lehetv tev kvetkeztetsi folyamatok kzponti tmi a mestersges intelligencia minden
terletnek.
Az emberek, gy tnik, ismernek a vilgrl szmos dolgot, s kvetkeztetseket vgeznek. A tuds s a
kvetkeztets fontos a mestersges genseknek is, mert sikeres viselkedst tesz lehetv, amelyet nagyon nehz
volna mskppen elrni. Lthattuk, hogy a problmamegold gens szmra cselekvseinek ismerete lehetv
teszi, hogy komplex krnyezetekben jl teljestsen. A reflexv gens csak a vakszerencse segtsgvel tudta
megtallni az utat Aradrl Bukarestbe. A problmamegold gens tudsa azonban igen specifikus s
rugalmatlan. Egy sakkprogram ki tudja szmtani egy kirly helyes lpseit, de nincsen semmilyen rtelmezhet
ismerete arrl, hogy egy figura egyidejleg nem lehet kt klnbz mezn. A tudsbzis gens kpes
kihasznlni a nagyon ltalnos formban lert tudst, jra s jra sszegyjtve ennek elemeit gy, hogy az
szmos clra megfelel legyen. Gyakran ez a folyamat nagyon messzire kerl a pillanatnyi ignytl, pldul
amikor egy matematikus egy ttelt bizonyt, vagy amikor egy csillagsz a Fld vrhat lettartamt szmtja.
A tuds s a kvetkeztets alapvet szerepet jtszanak a rszben megfigyelhet krnyezetek kezelsnl is. A
tudsbzis gens kpes sszekombinlni az ltalnos tudst a pillanatnyi rzetekkel, hogy kikvetkeztesse a
pillanatnyi llapot rejtett aspektusait, mieltt cselekvst vlaszt. Ilyen pldul, amikor egy orvos diagnosztizl
egy beteget, azaz kikvetkeztet egy kzvetlenl nem megfigyelhet betegsgllapotot, mieltt meghatrozn a
kezels mdjt. A tuds egy rsze, amelyet az orvos hasznl, knyvekbl vagy tanroktl megtanult szablyok
formjban ll rendelkezsre, ms rsze pedig asszocicis mintk formjban van, amelyeket lehet, hogy az
orvos nem is tud tudatosan lerni. Ha ezek is az orvos fejben vannak, akkor tudsnak szmtanak.
A termszetes nyelv megrtse szintn ignyli, hogy rejtett llapotokra kvetkeztessnk, nevezetesen, hogy a
beszl szndkt megismerjk. Amikor azt halljuk, hogy Jnos egy gymntot ltott az ablakon keresztl, s
szeretn (azt) megkapni, akkor tudjuk, hogy az azt a gymntra vonatkozik, s nem az ablakra. Ilyenkor,
taln nem is tudatosan, a relatv rtkekrl meglv ismereteink segtsgvel kvetkeztetnk. Hasonlan,
amikor azt halljuk, hogy Jnos kidobott egy kvet az ablakon keresztl, s betrte (azt), akkor tudjuk, hogy az
azt az ablakra vonatkozik. A kvetkeztets lehetv teszi szmunkra, hogy megbirkzzunk a kijelentsek
virtulisan vgtelen vltozatossgval, htkznapi tudsunk egy vges halmazt felhasznlva.
Az utols rvnk a tudsbzis gensek tanulmnyozsa mellett e rendszerek rugalmassga. Kpesek explicit
clok formjban megadott j feladatokat elfogadni, egy j krnyezetrl kapott vagy megtanult j ismeretek
rvn kompetenss vlni, s frisstve a tudsuk relevns rszt kpesek alkalmazkodni a krnyezet vltozshoz.
A 7.1. alfejezetben az gens ltalnos tervezsvel kezdnk. A 7.2. alfejezet egy egyszer j krnyezetet, a
wumpus vilgot mutatja be, amelyben illusztrlni fogjuk a tudsbzis gens mkdst a technikai rszletek
ismertetse nlkl. Ezutn a 7.3. alfejezetben elmagyarzzuk a logika (logic) ltalnos elveit. A knyv III.
rszben vgig a logika lesz az elsdleges eszkz a tuds reprezentlsra. A logikai gensek tudsa mindig
hatrozott, minden kijelents vagy igaz, vagy hamis a vilgban, habr az gens lehet agnosztikus nhny
kijelentssel kapcsolatban.
A logika jelents pedaggiai elnye, hogy egy tudsbzis gens egyszer reprezentcis formjt jelenti,
viszont van nhny komoly korltja is. A helyzet az, hogy az emberek vagy ms gensek ltal rszlegesen
megfigyelhet krnyezetekben vgzett kvetkeztetsek jelents rsze fgg bizonytalan tuds felhasznlstl. A
logika nem tudja ezt a bizonytalansgot jl reprezentlni, ezrt az V. rszben a valsznsget trgyaljuk, amely
mr kpes erre. A VI. s VII. rszben szmos reprezentcit trgyalunk, kztk nhny folytonos matematikn
alapult, mint a Gauss-grbk keverst, neurlis hlzatokat s ms reprezentcikat.
A 7.4. alfejezet bemutat egy egyszer logikt, az tletkalkulust (propositional logic). Mikzben ez lnyegesen
kevsb kifejez, mint az elsrend logika (first-order logic) (8. fejezet), az tletkalkulus lehetsget ad arra,
hogy illusztrljuk a logika minden alapvet fogalmt. Ltezik egy jl megtervezett technolgia az
tletkalkuluson trtn kvetkeztetsre, amelyet a 7.5. s 7.6. alfejezetben runk le. Vgl a 7.7. alfejezet
sszekombinlja a logikai gensek fogalmt az tletkalkulus technolgijval, hogy egyszerbb genseket
175
Logikai gensek
ptsnk a wumpus vilg szmra. Azonostjuk majd az tletkalkulus bizonyos hinyossgait, amelyek mg
hatkonyabb logikk fejlesztst fogjk motivlni a kvetkez fejezetekben.
1. A tudsbzis gens
Egy tudsbzis gens kzponti eleme a tudsbzisa (knowledge base). Egyszeren fogalmazva, a tudsbzis
mondatok (sentences) halmaza. (Itt a mondatot technikai fogalomknt hasznljuk. A fogalom kapcsolatban
van az angol, a magyar vagy ms termszetes nyelvek mondataival, de nem azonos velk.) A mondatokat egy
nyelv segtsgvel fejezzk ki, amelyet tudsreprezentcis nyelvnek (knowledge representation language)
neveznk, s a vilgrl szl lltsokat fogalmazunk meg vele.
j mondatoknak a tudsbzishoz val hozzadsra, illetve a tuds lekrdezsre valamilyen eljrsra van
szksgnk. Ezeknek a feladatoknak a tipikus elnevezse a KIJELENT, illetve a KRDEZ. Mindkt feladat
tartalmazhat kvetkeztetst (inference), azaz j mondatok levezetst rgiekbl. A logikai genseknl (logical
agents), amelyekkel ebben a fejezetben foglalkozunk, a kvetkeztetssel szemben az alapvet kvetelmny,
hogy amikor valaki KRDEZ egy krdst a tudsbzisrl, akkor a vlasznak kvetkeznie kell azokbl a
mondatokbl, amit korbban a tudsbzishoz hozzadtunk (pontosabban KIJELENT-ettnk). Ksbb a fejezetben
mg pontosabban lerjuk az igen fontos kvetkezik fogalom jelentst. Most egyelre ez jelentsen csak annyit,
hogy a kvetkeztetsi folyamat sorn nem csak gy egyszeren keletkeznek dolgok.
A 7.1. bra egy tudsbzis gens programjnak vzt mutatja. Mint ahogy az sszes gensnk, ez is szlel
valamit bemenetknt, s egy cselekvst ad vissza vlaszknt. Az gens fenntart egy tudsbzist, TB-t, amely
kezdetben bizonyos httrtudst (background knowledge) tartalmazhat. Ha az gensprogramot meghvjk, az
hrom dolgot tesz. Elszr KIJELENT-i a tudsbzisnak, hogy mit szlelt. Msodszor KRDEZ-i a tudsbzist,
hogy milyen cselekvst kell vgrehajtania. A lekrdezs megvlaszolsnak folyamatban egyre bvl
kvetkeztetst lehet vgezni a vilg pillanatnyi llapotrl, a lehetsges cselekvssorozatok eredmnyrl s gy
tovbb. Harmadszor az gens rgzti a kivlasztott cselekvst a KIJELENT felhasznlsval, s vgrehajtja a
cselekvst. A msodik KIJELENT azrt szksges, hogy a tudsbzissal tudassuk, hogy a felttelezett cselekvs
vgrehajtsa megtrtnt.
7.1. bra - Egy ltalnos tudsbzis gens
A reprezentcis nyelv rszletei hrom fggvnyben vannak elrejtve, amelyek az rzkelk s beavatkozk, az
alapreprezentci, valamint a kvetkeztet rendszer kztti kapcsolatot valstjk meg. Az SZLELS-MONDATKSZTS eljrs egy olyan mondatot konstrul, amelyik megllaptja, hogy az gens egy adott pillanatban
szlelte az rzkelt dolgot. A CSELEKVS-KRDEZS-KSZTS az idt felhasznlva bemeneti adatknt,
visszatr egy mondattal, amely alkalmas arra, hogy megkrdezzk, milyen cselekvs szksges ebben a
pillanatban. Vgl a CSELEKVS-MONDAT-KSZTS egy olyan mondatot hoz ltre, amely megllaptja, hogy a
kivlasztott cselekvs vgrehajtsa megtrtnt. A kvetkeztetsi mechanizmus rszletei a KIJELENT s a
KRDEZ eljrsok belsejben vannak elrejtve. A ksbbi fejezetekben ezeket a rszleteket is bemutatjuk.
A 7.1. bra gense egszen hasonlnak tnik, mint a 2. fejezetben bemutatott bels llapottal rendelkez gens.
Azonban a KIJELENT s a KRDEZ eljrsok defincija miatt a tudsbzis gens nem egy tetszleges,
cselekvseket meghatroz program. Meghatrozhat egy lerssal a tudsszinten (knowledge level), ahol csak
azt kell megfogalmaznunk, hogy mit tudjon s milyen cljai legyenek az gensnek, hogy rgzthessk a
viselkedst. Pldul egy automata taxi szmra a cl lehet egy utas elszlltsa Marin megybe, s a taxi
ismerheti, hogy ez San Franciscnl van, s a Golden Gate hd az egyetlen, amelyen keresztl oda el lehet jutni.
Ezutn felttelezhetjk, hogy tmegy a Golden Gate hdon, mivel tudja, hogy el fogja rni a cljt. Vegyk
176
Logikai gensek
szre, hogy ez az elemzs fggetlen attl, hogy a taxi hogyan is mkdik az implementcis szinten
(implementation level). Nem szmt, hogy a fldrajzi elhelyezkedssel kapcsolatos tudsa lncolt listkkal
vagy pixeltrkpekkel van megvalstva, vagy hogy vajon a kvetkeztetst regiszterekben trolt szimblumok
listinak manipullsval vagy neuronhlkban zajos jelek tovbbkldsvel vgzi el.
Fontos
Emltettk a fejezet bevezetjben, hogy egy tudsbzis gens megalkothat gy, hogy KIJELENT-jk
szmra, hogy mit szksges tudnia. Az gens inicializl programja a tervez krnyezetrl lv
tudst ler mondatok egyenknti tadsval pthet fel, mg mieltt az gens elkezden rzkelni a
krnyezett. Rendkvl leegyszersti az gens ltrehozsnak problmjt, ha olyan reprezentcis
nyelvet terveznk, amellyel egyszer lesz ennek a tudsnak mondatokban val megfogalmazsa. A
rendszerptsnek ezt a megkzeltsi mdjt deklaratv (declarative) mdszernek nevezzk. Ezzel
szemben a procedurlis (procedural) megkzelts kzvetlenl a program kdjban rgzti a kvnt
viselkedst, amivel minimalizlja az explicit reprezentci s a kvetkeztets szerept, s gy
lnyegesen hatkonyabb rendszer jhet ltre. Mind a ktfle gensre ltunk majd pldt a 7.7.
alfejezetben. Az 1970-es s 1980-as vekben a kt megkzelts tmogati parzs vitkat folytattak. Mi
mra felismertk, hogy egy sikeres gens tervezsekor kombinlni kell a deklaratv s a procedurlis
elemeket.
Amellett hogy KIJELENT-hetjk az gensnek, hogy mit kell tudnia, adhatunk is szmra egy olyan
mechanizmust, amely kpess teszi t, hogy sajt maga megtanulja ezt. Ez a mechanizmus, amit a 18. fejezetben
trgyalunk, ltalnos, a krnyezetre vonatkoz tudst hoz ltre rzetek sorozatnak felhasznlsval. Ezt a
tudst bele lehet illeszteni az gens tudsbzisba, s felhasznlhat a dntsek meghozatalakor. Ily mdon az
gens teljesen autonmm vlhat.
Ezek a kpessgek a reprezentci, a kvetkeztets s a tanuls mind a logika elmletnek s
technolgijnak tbb vszzados fejldsn alapulnak. Mieltt azonban az elmletet s a technolgit
elmagyarznnk, ltrehozunk egy egyszer vilgot, amelyet majd felhasznlunk ezek illusztrlshoz.
2. A wumpus vilg
A wumpus vilg (wumpus world) egy barlang, amely szobkbl s az ezeket sszekt tjrkbl ll. A
wumpus egy szrnyeteg, aki mindenkit megesz, ha a szobjba lp, a barlangban lapul valahol. Az gens le
tudja lni a wumpust, de csak egyetlen nyila van ehhez. Nhny szoba feneketlen csapdt tartalmaz, amely
mindenkit csapdba ejt, aki belp a szobba (kivve a wumpust, aki tl nagy ahhoz, hogy beleessen). A wumpus
krnyezetben az egyetlen csbt lehetsg, hogy egy halom aranyat lehet tallni. Habr a wumpus vilg
meglehetsen unalmas a modern szmtgpes jtkokhoz kpest, azonban a jtk kivl tesztkrnyezet az
intelligens gensek szmra. Michael Genesereth volt az els, aki javasolta ennek a krnyezetnek az
alkalmazst.
Egy plda wumpus vilg lthat a 7.2. brn. A pldakrnyezet pontos defincijt, ahogy a 2. fejezetben
javasoltuk, a TKCS-lerssal adjuk meg:
Teljestmnymrtk: +1000 az arany felvtele, 1000 a csapdba ess vagy ha a wumpus felfal, 1 minden
vgrehajtott cselekvs, 10 a nyl hasznlata.
7.2. bra - Egy tipikus wumpus vilg. Az gens a bal als sarokban van.
177
Logikai gensek
Krnyezet: Egy szobkbl ll 4 4-es hl. Az gens mindig az [1, 1]-gyel jellt ngyzetbl indul, arccal
jobbra nzve. Az arany s a wumpus elhelyezkedse vletlenszeren, a kiindul ngyzeten kvli ngyzetek
kzl egyenletes eloszls szerint van megvlasztva. Ezen kvl mg brmely, a kiindul ngyzeten kvli
ngyzet 0,2 valsznsggel lehet csapda.
Cselekvsek: Az gens mozoghat elre, fordulhat balra 90-kal, vagy fordulhat jobbra 90-kal. Az gens
szrnysges hallt hal, ha belp egy ngyzetbe, ahol csapda van vagy egy l wumpus tallhat.
(Biztonsgos, habr meglehetsen rossz illat egy olyan ngyzetbe belpni, amelyben egy halott wumpus
van.) Az elrelpsnek nincs hatsa, ha egy fal van az gens eltt. A Megragad cselekvst lehet arra
hasznlni, hogy az gens felvegyen egy trgyat, amely vele azonos szobban van. A Lvs cselekvst lehet
hasznlni egy nylnak abban az irnyban trtn kilvsre, amerre az gens ppen ll. A nyl addig repl,
amg el nem tallja (s egyben meg nem li) a wumpust, vagy falnak nem tkzik. Az gensnek csak egy
nyila van, gy csak egy Lvs cselekvsnek van hatsa.
rzkelk: Az gensnek t rzkelje van, mindegyik egyetlen bitnyi informcit ad:
A wumpust tartalmaz ngyzetben s a kzvetlenl (nem tlsan) szomszdos ngyzetekben az gens

bzt rez.
A csapdval kzvetlenl szomszdos ngyzetekben az gens szellt rzkel.
A ngyzetben, ahol az arany tallhat, az gens csillogst rzkel.
Ha az gens falnak megy, akkor tst rzkel.
178
Logikai gensek
Ha a wumpust megltk, akkor egy elkeseredett sikolyt hallat, amit a barlangban brhol hallani lehet.
Az rzeteket az gens egy t szimblumot tartalmaz lista formjban kapja meg; pldul ha bz s szell van
egy ngyzetben, de nincs ts, csillogs vagy sikoly, akkor az gens egy [Bz, Szell, Nincs, Nincs, Nincs]
rzetet kap.
A 7.1. feladatban definilni kell egy wumpus krnyezetet a 2. fejezetben megadott klnbz dimenzik
mentn. Az alapvet nehzsg az gens szmra, hogy kezdetben semmit sem tud a krnyezet konfigurcijrl.
gy tnik, hogy logikai kvetkeztetsre van szksge az gensnek ahhoz, hogy fellkerekedhessen a
tudatlansg okozta htrnyon. A wumpus vilgok legtbb pldnyban az gens szmra lehetsges az arany
biztonsgos megszerzse. Nhny krnyezetben azonban az gensnek vlasztania kell, hogy hazamegy-e res
kzzel, vagy kockzatot vllal, ami vagy az aranyhoz vagy a hallhoz vezet. s a krnyezetek 21%-a teljesen
tisztessgtelen (mivel az arany egy csapdban van vagy csapdkkal krlvett mezben).
Nzznk meg egy tudsbzis wumpus genst, hogy hogyan fedezi fel a 7.2. brn lthat krnyezetet. Az
gens kezdeti tudsbzisa a krnyezetet ler, az elzkben felsorolt szablyokat tartalmazza. Nevezetesen
tudja, hogy az [1, 1 ]-ben tartzkodik s hogy az [1, 1] biztonsgos hely. Ltni fogjuk, hogy hogyan bvl az
gens tudsa, amint j rzkelsek rkeznek s cselekvsek trtnnek.
Az els rzkels a [Nincs, Nincs, Nincs, Nincs, Nincs], amibl az gens arra tud kvetkeztetni, hogy a
szomszdos ngyzetek biztonsgosak. A 7.3. (a) bra mutatja az gens tudsnak llapott ezen a ponton. Az
brn a tudsbzis nhny mondatt soroljuk fel, betket hasznlva a megfelel ngyzetekben, mint az Sz
(szell) s az OK (biztonsgos, nincs se csapda, se wumpus). A 7.2. bra ezzel szemben magt a vilgot rja le.
Abbl a tnybl, hogy nem volt se bz, se szell az [1, 1]-ben, az gens kikvetkeztetheti, hogy az [1, 2] s [2,
1] ngyzetek veszlytelenek. Ennek jelzsre a megfelel ngyzetekbe OK-t runk. Egy vatos gens csak olyan
ngyzetbe lp, amelyrl tudja, hogy OK. Felttelezzk, hogy az gens gy dnt, hogy a [2, 1]-be megy,
ellltva a 7.3. (b) brn lthat helyzetet.
Az gens detektlja a szellt a [2, 1]-ben, teht egy csapdnak kell lennie valamelyik szomszdos ngyzetben. A
csapda nem lehet az [1, 1]-ben a jtk szablyai szerint, gy csapdnak kell lennie a [2, 2]-ben vagy a [3, 1]-ben
vagy mindkettben. A Cs? jells egy lehetsges csapdt jelez a mezkben a 7.3. (b) brn. Ezen a ponton csak
egy olyan ismert ngyzet van, ami OK, s amit mg nem ltogatott meg. gy a megfontolt gens visszafordul,
visszamegy az [1, 1]-be s az [1, 2]-be halad tovbb.
7.3. bra - Az gens els lpse a wumpus vilgban. (a) A kezdeti helyzet a [Nincs,
Nincs, Nincs, Nincs, Nincs] rzkelse utn. (b) Az els lps utn, rzkelve a [Nincs,
Szell, Nincs, Nincs, Nincs]-et.
Az j rzet az [1, 2, ]-ben a [Bz, Nincs, Nincs, Nincs, Nincs], ami a 7.4. (a) brn lthat helyzetet
eredmnyezi. A bz az [1, 2]-ben azt jelenti, hogy a wumpusnak a kzelben kell lennie. De a wumpus a jtk
szablyai szerint nem lehet az [1, 1]-ben s nem lehet a [2, 2]-ben sem (mert akkor az gens rezte volna a bzt,
amikor a [2, 1]-ben jrt). gy az gens kikvetkeztetheti, hogy a wumpus az [1, 3]-ban van. A W! jells ezt
179
Logikai gensek
mutatja. Mg rdekesebb, hogy a Szell rzet hinya az [1, 2]-ben azt jelenti, hogy nincs csapda a [2, 2]-ben. De
mi mr kikvetkeztettk, hogy vagy a [2, 2]-ben, vagy a [3,1]-ben van egy csapda, ami teht azt jelenti, hogy a
csapdnak a [3, 1]-ben kell lennie. Ez egy viszonylag nehz kvetkeztets, mivel klnbz idpontokban s
klnbz helyeken gyjttt tudst hasznl fel, s egy rzet hinyra tmaszkodva vgez el egy fontos lpst.
Ez a kvetkeztets meghaladja a legtbb llat kpessgeit, de tipikusan jellemzi azt a fajta kvetkeztetst, amit
egy logikai gens vgez.
Az gens gy bebizonytotta maga szmra, hogy nincs se csapda, se wumpus a [2, 2]-ben, gy a mozgs ebbe a
ngyzetbe OK. Nem mutatjuk be az gens tudst a [2, 2]-ben, csak felttelezzk, hogy fordul s tlp a [2, 3]ba, ami a 7.4. (b) brn lthat. A [2, 3]-ban az gens detektlja a csillogst, gy megragadja az aranyat, s ezzel
vget r a jtk.
7.4. bra - Kt ksbbi helyzet az gens elrehaladsa sorn. (a) A harmadik lpst
kveten, miutn [Bz, Nincs, Nincs, Nincs, Nincs]-et rzkelt. (b) Az tdik lps s a
[Bz, Szell, Csillogs, Nincs, Nincs] rzkelse utn
Fontos
Brmely esetben, amikor az gens kvetkeztetseket von le a rendelkezsre ll informcikbl, a
kvetkezmny garantltan helyes lesz, ha a rendelkezsre ll informcik helyesek. Ez alapvet
jellegzetessge a logikai kvetkeztetseknek. A fejezet htralev rszben megmutatjuk, hogyan
pthetnk olyan logikai genseket, amelyek kpesek reprezentlni a szksges informcikat, s
kvetkeztetseket vonnak le, ahogy azt az eddigi fejezetekben lertuk.
3. A logika
Ez az alfejezet ttekintst nyjt a logikai reprezentci s kvetkeztets alapvet fogalmairl. A logika brmely
specilis formjra vonatkoz technikai rszletek bemutatst a kvetkez fejezetre halasztjuk. Ehelyett
egyszer pldkat fogunk hasznlni a wumpus vilgbl vagy ismers aritmetikai terletekrl. Azrt vlasztjuk
ezt az igen rendhagy megkzeltst, mivel a logika fogalmai messze ltalnosabbak s szebbek, mint azt
ltalban felttelezik.
A 7.1. fejezetben emltettk, hogy a tudsbzis mondatokbl ll. Ezeket a mondatokat a reprezentcis nyelv
szintaxisa (syntax) szerint fejezzk ki, amely specifiklja az sszes jl formlt, nyelvtanilag helyes mondatot. A
szintaxis fogalma elg tiszta a szoksos aritmetikai mveleteknl: x + y = 4 egy jl formlt mondat, mg az
x2y + = nem az. A logikai nyelvek szintaxisait (s a matematikt is egybknt) rendszerint cikkek s
knyvek rsa cljbl terveztk. A sz szoros rtelmben tucatjai lteznek a klnbz szintaxisoknak, nhny
tele grg betkkel s egzotikus matematikai szimblumokkal, nhny inkbb vizulisan kvethet, nyilakat s
buborkokat tartalmaz diagramokbl ll. Minden esetben azonban, az gens tudsbzisban a mondatok az
gensnek magnak vagy az gens egy rsznek valdi fizikai konfigurcii. A kvetkeztets ezeknek a
konfigurciknak a ltrehozst vagy manipullst fogja jelenteni.
180
Logikai gensek
A logiknak a nyelv szemantikjt (semantics) is definilnia kell. Egyszeren fogalmazva a szemantika a

mondatok jelentsrl szl. A logikban a definci pontosabb. A nyelv szemantikja definilja minden
mondat igazsgt (truth) minden egyes lehetsges vilgra (possible world) vonatkozan. Pldul egy szoksos
aritmetikhoz vlasztott szemantika meghatrozza, hogy az x + y = 4 mondat igaz abban a vilgban, ahol x
rtke 2 s y rtke 2, de hamis abban a vilgban, ahol x rtke 1 s y rtke is 1.1 A standard logikkban minden
mondat vagy igaz, vagy hamis minden lehetsges vilgban, s nem lehet valahol az igaz s hamis kztt 2.
Amikor szksges, hogy pontosak legynk, a modell (model) kifejezst fogjuk hasznlni a lehetsges vilg
helyn. (Szintn hasznlni fogjuk az m modellje -nak kifejezst, ami azt jelenti, hogy az mondat igaz az m
modellben.) Miutn a lehetsges vilgokat gy kpzelhetjk el, mint (potencilisan) vals krnyezeteket,
amelyekben az gens ott lehet vagy nem lehet ott, a modellek olyan matematikai absztrakcik, amelyek csak
rgztik az igazsg vagy hamissg rtkt minden relevns mondatnak. Pldul, tegyk fel, hogy x s y a frfiak
s nk szma, akik egy krtyaasztal krl lnek s bridzset jtszanak, s az x + y = 4 mondat igaz, amikor
ngyen vannak sszesen. Formlisan, a lehetsges modellek nem msok, mint minden lehetsges hozzrendels
az x s y vltozkhoz. Minden ilyen hozzrendels brmely olyan aritmetikai mondat igazsgt rgzti, amely az
x s y vltozkat tartalmazza.
Most, hogy van egy kpnk az igazsg fogalmrl, tudunk beszlni a logikai kvetkeztetsrl. Ennek rsze a
mondatok kztti logikai vonzat (entailment) relci, annak kifejezse, hogy egy mondat logikusan kvetkezik
egy msik mondatbl. Matematikai jellssel ezt gy rjuk:

aminek jelentse, hogy az mondat maga utn vonzza a mondatot. A vonzat formlis defincija a kvetkez:
akkor s csakis akkor, ha minden modellben, amelyben igaz, szintn igaz. Kzvetlenebbl azt
mondhatjuk, hogy igazsgt tartalmazza igazsga. A vonzat relci ismers az aritmetikbl is, rmmel
vehetjk szre, hogy az x + y = 4 mondat maga utn vonzza a 4 = x + y mondatot. Nyilvnval, hogy brmely
modellben, ahol x + y = 4, mint pldul az a modell, amelyben x s y is 2 rtk, a 4 = x + y is fenn ll.
Hamarosan ltni fogjuk, hogy a tudsbzist tekinthetjk egy kijelentsnek, s gyakran beszlhetnk arrl, hogy
egy tudsbzis maga utn vonz egy mondatot.
Alkalmazhatunk hasonl elemzst az elz rszben bemutatott wumpus vilgbeli kvetkeztetsi pldra is.
Tekintsk a 7.3. (b) brn lthat szitucit: az gens nem szlelt semmit az [1, 1]-ben s szellt szlelt a [2, 1]ben. Ezek az rzetek, kombinlva az gensnek a wumpus vilg szablyaira vonatkoz tudsval (1. szakasz - A
tudsbzis gens rszben tallhat TKCS-lers), alkotja a TB-t. Az genst (ms dolgok mellett) az rdekli,
hogy vajon a szomszdos [1, 2], [2, 2], [3, 1] ngyzetek tartalmaznak-e csapdt. Brmelyik a hrom ngyzet
kzl tartalmazhat vagy ppen nem tartalmaz csapdt, gy a plda esetben 2 3 = 8 lehetsges modell ltezik. Ezt
mutatja a 7.5. bra.3
A TB hamis azokban a modellekben, amelyek ellentmondanak annak, amit az gens tud. Pldul a TB hamis
minden modellben, ahol az [1, 2] tartalmaz csapdt, mivel nincs szell az [1, 1]-ben. Valjban csak hrom
olyan modell van, amelyben a TB igaz, ezeket a 7.5. bra a modellek egy rszhalmazaknt mutatja. Most
tekintsnk kt lehetsges kvetkezmnyt:
1 = Nincs csapda az [1, 2]-ben
2 = Nincs csapda a [2, 2]-ben
A 7.5. brn megjelltk az 1 s 2 modelleket. Szemrevtelezve megllapthatjuk a kvetkezt:

minden olyan modellben, ahol a TB igaz, ott 1 is igaz.
gy TB 1, s nincs csapda az [1, 2]-ben. Azt is lthatjuk, hogy:
nhny modell, amelyben a TB igaz, az 2 hamis.
Az olvas minden bizonnyal szrevette a hasonlsgot a mondatok igazsgnak fogalma s az 5. fejezetben bemutatott knyszerek
kielgtsnek fogalma kztt. Ez nem vletlen, a knyszernyelvek valjban logikk, s a knyszerproblmk megoldsa a logikai
kvetkeztets egy formja.
2
A fuzzy logika (fuzzy logics), amelyet a 14. fejezetben mutatunk be, megengedi az igazsg foknak kezelst.
3
Habr az bra a modelleket, mint egy rszleges wumpus vilgot mutatja, ezek valjban nem msok, mint az igaz s hamis rtkek
hozzrendelsei a csapda van az [1, 2]-ben mondathoz. A modellek, matematikai rtelemben, nem ignylik, hogy szrnysges illat
wumpusok legyenek benne.
1
181
Logikai gensek
gy TB 2 s az gens nem tudja kikvetkeztetni, hogy nincs csapda a [2, 2]-ben. (s azt sem tudja
kikvetkeztetni, hogy van csapda a [2, 2]-ben.)4
Az elz plda nem csak illusztrlja a maga utn vonzst, hanem megmutatja, hogy a vonzat defincijt fel
lehet hasznlni a kvetkezmnyek levezetsre, azaz, hogy logikai kvetkeztetst (logical inference)
vgezznk. A 7.5. brn illusztrlt kvetkeztetsi algoritmust modellellenrzsnek (model checking) hvjuk,
mivel szmba vesz minden lehetsges modellt annak megvizsglsra, hogy igaz-e minden modellben,
amelyben a TB igaz.
7.5. bra - Lehetsges modelljei a csapda jelenltnek az [1, 2], [2, 2] s [3, 1]-ben, ha
adott a megfigyels, hogy az [1, 1]-ben semmi s a [2, 1]-ben szell rezhet. (a) A
tudsbzis s 1(nincs csapda[1, 2]-ben) modelljei. (b) A tudsbzis s 2(nincs
csapda[2, 2]-ben) modelljei.
A vonzat s a bizonyts megrtsben segthet, ha a TB sszes kvetkezmnyeit egy sznakazalnak, az -t

pedig egy gombostnek kpzeljk el. A vonzat olyan, mintha a gombost benne volna a kazalban; a bizonyts
pedig nem ms, mint megprblni megtallni ezt a tt. Ez a klnbsgttel formlisan a kvetkez
megfogalmazsban lt testet: ha egy i kvetkeztetsi algoritmus kpes levezetni -t a TB-bl, akkor rhatjuk,
hogy
TB i
amely kimondva: az i ltal levezethet TB-bl vagy i levezeti -t a TB-bl.

Egy kvetkeztetsi eljrst, amely csak vonzat mondatokat vezet le, helyesnek (sound) vagy igazsgtartnak
(truth-preserving) nevezzk. A helyessg egy igencsak kvnatos tulajdonsg. Egy nem helyes kvetkeztetsi
eljrs kitall olyan dolgokat ahogy elrehalad, olyan tk megtallst jelenti be, amelyek nem is lteznek.
Egyszer beltni, hogy a modellellenrzs, ha alkalmazhat,5 akkor helyes eljrs.
A teljessg (completeness) tulajdonsg szintn kvnatos: egy kvetkeztetsi eljrs teljes, ha kpes levezetni
minden vonzatmondatot. Valdi sznakazlak esetben, amelyek vges mretek, nyilvnvalnak tnik, hogy
szisztematikus kutatssal mindig eldnthet, hogy a t a kazalban van-e. Sok tudsbzis esetben azonban a
konzekvencik sznakazlnak mrete vgtelen, s gy a teljessg egy fontos krdss vlik. 6 Szerencsre
lteznek teljes kvetkeztetsi eljrsok a logikhoz, amelyek megfelelen kifejezk ahhoz, hogy szmos
tudsbzist kezeljenek.
Fontos
Az gens ki tudja szmolni, hogy mekkora a valsznsge annak, hogy van csapda a [2, 2]-ben. A 13. fejezet fogja megmutatni azt, hogy
hogyan.
5
A modellellenrzs mkdik, ha a modellek tere vges, mint pldul egy rgztett mret wumpus vilg esetben. Az aritmetika esetben
ezzel szemben a modellek tere vgtelen, mg akkor is, ha korltozzuk magunkat az egsz szmokra, mivel vgtelen szm x, y rtkpr
ltezik az x + y = 4 egyenlethez.
6
Hasonltsuk ssze a 3. fejezet vgtelen keressi tereinek esetvel, ahol lthat, hogy a mlysgi keress nem teljes.
4
182
Logikai gensek
Egy olyan kvetkeztetsi folyamatot rtunk le, amelynek kvetkezmnyei brmely vilgban garantltan
igazak, ahol a premisszk is igazak. Nevezetesen, ha a TB igaz a valdi vilgban, akkor brmely, a
TB-bl helyes kvetkeztetsi eljrssal levezetett mondat szintn igaz a valdi vilgban. gy, mg a
kvetkeztetsi folyamat a szintaxison mkdik bels fizikai konfigurcikon, mint pldul
regiszterek bitjein vagy az agy elektromos jelzseinek mintin , addig a folyamat megfelel valdi
vilg viszonyainak. Ennek megfelelen a valdi vilg nhny aspektusa lesz az eset, 7 mivel a valdi
vilg bizonyos ms aspektusai jelenleg kpezik az esetet. Ezt a megfeleltetst a vilg s a reprezentci
kztt mutatja a 7.6. bra.
7.6. bra - A mondatok az gens fizikai konfigurcii, s a kvetkeztets az a folyamat,

amely j fizikai konfigurcikat hoz ltre rgiekbl. A logikai kvetkeztetsnek
biztostania kell, hogy az j konfigurcik olyan aspektusait reprezentljk a vilgnak,
amelyek tnylegesen is kvetkeznek azokbl az aspektusokbl, amelyeket a rgi
konfigurcik reprezentlnak.
Fontos
Az utols krds, amivel foglalkoznunk kell a logikai gensek trgyalsnl, a megalapozottsg
(grounding) krdse, ami nem ms, mint a kapcsolat, ha egyltaln ltezik ilyen, a logikai
kvetkeztetsi folyamat s a valdi krnyezet kztt, amelyben az gens ltezik. Nevezetesen hogyan
tudhatjuk meg, hogy a TB igaz-e a valdi vilgban? (Ezutn a TB mr csak szintaxis az gens
fejben.) Ez egy filozfiai krds, amelyrl sok-sok knyvet rtak (lsd 26. fejezet). Egy egyszer
vlasz az, hogy az gens rzkeli ltestik a kapcsolatot. Pldul a mi wumpus vilgbeli gensnknek
van egy szagl rzkelje. Az gensprogram ltrehoz egy megfelel mondatot mindig, ha van illat. gy
brmikor, ha ez a mondat a tudsbzisban van, ez igaz a valdi vilgban is. Ezltal az rzetmondatok
jelentst s igazsgt az ket ltrehoz rzkel s mondatkonstrul folyamatok hatrozzk meg. s
mi a teend az gens tudsnak egyb rszeivel, mint az a meggyzdse, hogy a wumpus rossz illatot
terjeszt a szomszdos ngyzetekben? Ez nem egy kzvetlen reprezentcija egy egyedi rzetnek,
hanem egy ltalnos szably, pldul rzkelsi tapasztalatokbl levezetve, de nem azonos magval a
tapasztalatnak a kijelentsvel. Az ilyen ltalnos szablyokat a tanulsnak (learning) nevezett
mondatkonstrul folyamat hozza ltre, ami a VI. rsznek a trgya. A tanuls nem tvedhetetlen. Lehet,
hogy az eset az, hogy a wumpusok mindig rossz illatot rasztanak, kivve szkvekben februr 29-n,
amikor egybknt megfrdnek. gy lehet, hogy a TB nem igaz a valdi vilgban, de j tanul
eljrsokkal van ok az optimizmusra.
7.4. Az tletkalkulus: egy nagyon egyszer logika
Most egy nagyon egyszer logikt, az tletkalkulust (propositional logic) mutatjuk be.8 ttekintjk az
tletkalkulus szintaxist, majd a szemantikjt annak a mdjt, ahogy a mondatok igazsgt meghatrozzuk.
Azutn megnzzk a maga utn vonzst a relcit egy adott mondat s azon mondat kztt, amelyik az
elbbibl kvetkezik , s megnzzk, hogy hogyan vezet ez egy egyszer logikai kvetkeztets algoritmushoz.
Mindez termszetesen a wumpus vilgban fog lejtszdni.
3.1. Szintaxis
7
8
Mint azt Wittgenstein (1922) rta hres mvben, a Tractatusban: A vilg mindaz, aminek az esete fennll.
Az tletkalkulust Boole-logiknak (Boolean logic) is nevezzk, a logikval foglalkoz George Boole (18151864) utn.
183
Logikai gensek
Az tletkalkulus szintaxisa meghatrozza a lehetsges mondatokat. Az atomi mondatok (atomic sentences)

oszthatatlan szintaktikai elemek egyetlen tletszimblumbl (proposition symbol) llnak. Minden ilyen
szimblum egy kijelents, ami igaz vagy hamis lehet. Nagybets neveket fogunk hasznlni a szimblumok
jellsre: P, Q, R s gy tovbb. A nevek tetszlegesek, de gyakran gy vlasztjuk ket, hogy a nevek bizonyos
jelentssel is rendelkezzenek. Pldul hasznlhatjuk a W1,3-t annak az lltsnak a kifejezsre, hogy a wumpus
az [1, 3]-ban van. (Ne felejtsk el, hogy a W1,3 atomi, gy a W, az 1 s a 3 nem jelentssel br rszei a
szimblumnak.) Ltezik kt tletszimblum, amelyeknek rgztett az rtelmezse: az Igaz egy mindig igaz
llts, s a Hamis egy mindig hamis llts.
sszetett mondatok (complex sentences) ltrehozhatk egyszerbb mondatokbl logikai sszektjelek
(logical connectives) felhasznlsval. t elterjedten hasznlt sszektjel van:
(nem). Egy mondatot, mint a W1,3-t, negcinak (negation) neveznk. Egy literl (literal) vagy egy atomi
mondat (egy pozitv literl), vagy egy neglt atomi mondat (egy negatv literl).
(s). Egy mondatot, amelynek f ktszava a , mint pldul a W1,3 C1,3 konjunkci-nak (conjunction)
neveznk; ennek rszei a konjunktok (conjuncts). (Az jel hasonlt egy A-ra, az angol And (s) szbl.)
(vagy). Egy mondat, amely hasznlja a sszektjelet, mint a (W1,3 C1,3) W2,2 egy diszjunkci
(disjunction), mghozz a (W1,3 C1,3) s a W2,2 diszjunktoknak (disjuncts) a diszjunkcija. (Trtnelmileg a
jel a latin vel kifejezsbl szrmazik, ami vagy-ot jelent. A legtbb ember szmra knnyebb megjegyezni
gy, mint egy fejjel lefel ll s jelet, vagy a magyar olvask szmra, mint a vagy sz els betjt.)
(implikci). Egy mondatot, mint amilyen a (W1,3 C1,3) W2,2 implikcinak (implication) (vagy feltteles
mondatnak) neveznk. Ennek premisszja (premise) vagy elzmnye (antecedent) a (W1,3 C1,3), konklzija
(conclusion) vagy kvetkezmnye (consequent) pedig a W2,2 implikci szablyknt (rule) vagy haakkor
(ifthen) lltsknt is ismert. Az implikcit ms knyvekben idnknt a vagy a szimblumokkal jellik.
(akkor s csakis akkor). A W1,3 W2,2 mondat egy ekvivalencia (biconditional).
A 7.7. bra mutatja az tletkalkulus formlis nyelvtant; ha nem ismeri a BNF jellsrendszert, akkor nzze
meg az 1. szakasz - B1. Nyelvek definilsa BackusNaur-Formban (BNF) rszt.
7.7. bra - tletkalkulus-beli mondatok BNF (BackusNaur-forma) nyelvtana
Vegyk szre, hogy a nyelvtan nagyon szigor a zrjelezsnl: minden mondatot, amelyet binris
sszektjellel hozunk ltre, zrjelek kz kell tenni. Ez biztostja, hogy a szintaxis teljesen egyrtelm. Ez azt
is jelenti pldul, hogy ((A B) C)-t kell rjunk A B C helyett. Az olvashatsg javtsa cljbl gyakran
elhagyjuk a zrjeleket, megbzva ehelyett az sszektjeleknek egy precedencia-sorrendjben. Ez hasonl az
aritmetikban alkalmazott precedencihoz pldul az ab + c-t ((ab) + c)-nek olvassuk, s nem a(b + c)-nek,
mert a szorzsnak magasabb a precedencija, mint az sszeadsnak. Az tletkalkulus precedencia-sorrendje (a
legmagasabbtl a legalacsonyabb fel: , , , s . gy a mondat:
P Q R S
ekvivalens a kvetkez mondattal:

((P) (Q R)) S
184
Logikai gensek
A precedencia nem oldja fel a tbbrtelmsget az olyan mondatoknl, mint az A B C, amelyet olvashatunk
((A B) C)-knt vagy (A (B C))-nek. Mivel a mondatnak ez a kt olvassa ugyanazt jelenti a kvetkez
rszben definiland szemantika szerint, az olyan mondatok, mint az A B C megengedettek. Szintn
megengedjk az A B C s az A B C mondatokat. Olyan mondatok, mint az A B C nem
megengedettek, mert a kt olvassnak klnbz jelentsei vannak, ebben az esetben ragaszkodunk a
zrjelhez. Vgl, nha hasznlni fogunk szgletes zrjelet az egyszer zrjel helyett, ami a mondatot
ttekinthetbb teszi majd.
3.2. Szemantika
Most, hogy specifikltuk az tletkalkulus szintaxist, definiljuk a szemantikjt is. A szemantika definilja a
szablyokat, amivel meghatrozhat a mondat igazsga egy bizonyos modellben. Az tletkalkulusban a modell
egyszeren az igazsgrtket igaz vagy hamis rgzti minden tletszimblumra. Pldul ha a tudsbzis
mondatai a C1,2, C2,2 s C3,1 tletszimblumokat hasznljk fel, akkor egy lehetsges modell:
m1 ={C1,2 = hamis, C2,2 = hamis, C3,1 = igaz}
Hrom tletszimblum esetn 23 = 8 lehetsges modell van pontosan azok, amelyek a 7.5. brn vannak
feltntetve. Vegyk szre azonban, hogy miutn elkteleztk magunkat egy szintaxis mellett, a modellek tisztn
matematikai objektumokk vltak, amelyeknek nem felttlenl van kapcsolatuk a wumpus vilggal. A C1,2 csak
egy szimblum, jelentheti azt, hogy csapda van az [1, 2]-ben vagy azt, hogy Prizsban vagyok ma s
holnap.
Az tletkalkulus szemantikjnak meg kell hatroznia, hogyan szmtsuk ki brmely mondat igazsgrtkt egy
adott modellben. Ez rekurzvan trtnik. Minden mondat atomi mondatokbl s az tfle sszektjelbl lett
ltrehozva, gy meg kell hatroznunk, hogy hogyan szmtsuk ki az atomi mondatok igazsgt, s meg kell
hatroznunk azt is, hogy hogyan szmtsuk ki az igazsgt az egyes sszektjelek felhasznlsval formlt
sszetett mondatnak. Az atomi mondatok esete egyszer:
Igaz minden modellben igaz, s Hamis ha minden modellben hamis.
Minden ms tletszimblumnak az igazsgrtkt kzvetlenl a modellben kell meghatrozni. Pldul a
korbban megadott m1 modellben a C1,2 hamis.
sszetett mondatokra olyan szablyaink vannak, mint
Brmely s mondatra s brmely m modellre, a s mondat az m-ben akkor s csakis akkor igaz, ha s hamis mben.
Az ilyen szablyok visszavezetik az sszetett mondatok igazsgnak eldntst egyszerbb mondatokra.
Minden sszektjelre vonatkoz szably sszefoglalhat egy igazsgtblban (truth table), amely
meghatrozza egy sszetett mondat igazsgrtkt a mondat komponenseinek minden lehetsges igazsgrtk
hozzrendelseihez. Az t logikai sszektjel igazsgtbljt mutatja a 7.8. bra. Ilyen tblk felhasznlsval
brmely s mondat igazsgrtke egy m modellre vonatkozan kiszmolhat rekurzv kirtkelsek egyszer
folyamatval. Pldul a C1,2 (C2,2 C3,1) mondatot kirtkelve m1-ben igaz (hamis igaz) = igaz igaz =
igaz rtket kapunk. A 7.3. feladat azt kri, hogy rjon egy IK-IGAZ? (s,m) algoritmust, amely kiszmtja az s
tletkalkulus mondatnak az igazsgrtkt egy m modellben.
Korbban azt mondtuk, hogy a tudsbzist mondatok halmaza alkotja. Most lthatjuk, hogy egy logikai
tudsbzis ilyen mondatok konjunkcija. Teht ha egy res TB-vel kezdnk, s vgrehajtjuk a KIJELENT(TB,
S1), ..., KIJELENT (TB, Sn) mveleteket, akkor a TB = S1 Sn ll el. Ez azt jelenti, hogy tudsbzisokat s
mondatokat egymssal felcserlheten hasznlhatunk.
Az s, vagy s nem igazsgtbli eltrnek attl, amit a termszetes nyelvi jelentsk alapjn gondolnnk.
A lehetsges flrerts legszembetnbb pontja, hogy a P Q kifejezs igaz akkor is, ha mind P, mind Q is
igaz. Ltezik msik sszektjel is, a kizr vagy-nak nevezett jel (rviden xor), amely hamisat ad, ha
mindkt diszjunkt igaz.9 Nincs ltalnos egyetrts az exkluzv vagy szimblumt illeten; kt jells is
ismert:
A latinnak ltezik kln szava az exkluzv vagy kifejezsre, ez az aut.
185
Logikai gensek
7.8. bra - Az t logikai sszektjel igazsgtblja. Amikor a tblt hasznljuk pldul

a P Q rtknek szmtsra, ha P igaz s Q hamis, akkor elszr megkeressk azt a
sort, amelyben P igaz s Q hamis (a harmadik sor). Ezutn a sorban megkeressk a P
Q alatti oszlopot, hogy megtalljuk az eredmnyt: igaz. Tekinthetjk a tblzat gy is,
hogy minden sor egy modell, s az egyes oszlopbeli elemek az adott sorban azt mondjk
meg, hogy a megfelel mondat igaz-e az adott modellben.
Az implikci () igazsgtblja rejtlyesnek tnhet els ltsra, mivel nem teljesen illeszkedik sztns
megrtsnkhz, hogy P impliklja Q-t vagy ha P, akkor Q. Az tletkalkulus nem kvn semmilyen okokozati relcit vagy relevancit P s Q kztt. A mondat: az a tny, hogy 5 pratlan impliklja, hogy Toki
Japn fvrosa az tletkalkulusnak egy igaz mondata (a normlis interpretci szerint), mg akkor is, ha ez
hatrozottan furcsa mondatnak tnik. Egy msik esete a flrertseknek, hogy brmely implikci igaz, ha az
elzmnye hamis. Pldul az az az llts, hogy 5 pros szm, impliklja, hogy Samu okos mondat igaz,
fggetlenl attl, hogy Samu okos-e. Ez bizarrnak tnik, de elfogadhat, ha a P Q-t gy rtelmezzk, hogy
ha P igaz, akkor azt lltom, hogy Q is igaz. Egybknt nem lltok semmit. Az egyetlen eset, amikor ez a
mondat hamis, ha P igaz, de Q hamis.
A P Q ekvivalencia igazsgtblja azt mutatja, hogy akkor igaz, ha mind P Q s Q P igaz. Ezt gyakran
gy rjuk le, hogy P akkor s csakis akkor, ha Q vagy matematikban szoktk jellni P aa Q-nak. A
wumpus vilg szablyait legjobban az hasznlatval tudjuk felrni. Pldul, egy ngyzet szells, ha a
szomszdos, ha a szomszdos ngyzetben csapda van, s egy ngyzet csakis akkor szells ngyzetben csapda
van. gy ekvivalencikra van szksgnk, mint a
S1,1 (C1,2 C2,1)
ahol S1,1 jelenti, hogy szell van az [1, 1]-ben. Vegyk szre, hogy az egyirny implikci
S1,1 (C1,2 C2,1)
igaz a wumpus vilgban, de nem teljes. Nem szablyozza azokat a modelleket, amelyekben S1,1 hamis s C1,2
igaz, amivel megszegnnk a wumpus vilg szablyait. Egy msik md ennek rzkeltetsre, hogy az
implikci ignyli a csapda jelenltt, ha szell van, mikzben az ekvivalencia szintn megkvnja a csapda
hinyt, ha nincs szell.
3.3. Egy egyszer tudsbzis

Most, hogy definiltuk az tletkalkulus szemantikjt, ltre tudunk hozni egy tudsbzist a wumpus vilg
szmra. Az egyszersg kedvrt csak a csapdkkal fogunk trdni, a wumpust magt feladatknt az olvasra
hagyjuk. A tuds, amelyet most lerunk, elgsges ahhoz, hogy elvgezzk a 7.3. alfejezetben nem formlisan
mr elvgzett kvetkeztetst.
Elszr meg kell vlasztanunk a sztrunkat az tletszimblumaink megnevezshez. Minden i, j-re:
Legyen Ci,j igaz, ha csapda van [i, j]-ben.
Legyen Si,j igaz, ha szell van [i, j]-ben.
A tudsbzis tartalmazza a kvetkez mondatokat (mindegyiket felcmkzzk a knyelem kedvrt):
Nincs csapda az [1, 1]-ben:
186
Logikai gensek
Egy ngyzet akkor s csakis akkor szells, ha csapda van a szomszdos ngyzetben. Ezt minden ngyzetre
vonatkozan ki kell jelenteni, mi most csak a relevns ngyzeteket tekintjk:
Sz2: S1,1 (C1,2 C2,1)
Sz3: S2,1 (C1,1 C2,2 C3,1)
Az eddigi mondatok minden wumpus vilgban igazak. Most hozzadjuk a szell rzetet az els kt
megltogatott ngyzetre abban a specifikus vilgban, ahol az gens jelenleg tartzkodik, ami elvezet a 7.3. (b)
brn ltott szitucihoz.
A tudsbzis most Sz1-tl Sz5-ig tartalmaz mondatokat. Tekinthetjk ezt gy is, mint egyetlen mondatot az Sz1
Sz2 Sz3 Sz4 Sz5 konjunkcit , mivel ez azt is kijelenti egyben, hogy minden egyes mondat is igaz.
3.4. Kvetkeztets
Emlkezznk, hogy a logikai kvetkeztets clja, hogy eldntsk, hogy TB bizonyos mondatokra.
Pldul, hogy a tudsbzis maga utn vonzza-e a C2,2 lltst. Az els algoritmusunk a kvetkeztetsre a vonzat
defincijnak kzvetlen megvalstsa lesz: vegyk sorba a modelleket, s ellenrizzk, hogy igaz-e minden
modellben, amelyben a TB igaz. Az tletlogikban a modellek az igaz s hamis rtkek hozzrendelsei minden
egyes tletszimblumhoz. Visszatrve a mi wumpus vilgbeli pldnkhoz, a relevns tletszimblumok az S1,1,
S1,2, C1,1, C1,2, C2,1, C2,2, C3,1. A 7 szimblum 27 = 128 lehetsges modellt jelent, hromban ezek kzl a TB igaz
(7.9. bra). Ebben a hrom modellben
igaz, gy nincsen csapda az [1, 2]-ben. Viszont a C2,2 a hrom
modellbl kettben igaz s egyben hamis, gy mg nem tudjuk megmondani, hogy van-e csapda [2, 2]-ben.
A 7.9. bra preczebb formban megismtli a 7.5. brn illusztrlt kvetkeztetst. A 7.10. bra egy ltalnos
algoritmust mutat a maga utn vonzs eldntsre az tletkalkulusban. Mint a VISSZALPSES-KERESS
algoritmus a 4.3. szakasz - Mlysgi keress rszben, az IT-VONZAT? egy rekurzv felsorolst vgez a vltoz
hozzrendelsek vges tern. Az algoritmus helyes, mivel kzvetlenl a vonzat defincijt valstja meg, s
teljes, mivel brmely TB-on s mondaton mkdik, s mindig sikeresen vget r, hiszen vges szm modellt
kell megvizsglni.
7.9. bra - A tudsbzis alapjn ptett igazsgtbla lthat az brn. A TB igaz, ha Sz1tl s Sz5-ig igaz, amely a 128 sorbl csak 3-ban fordul el. Mind a 3 sorban C1,2 hamis,
teht nincsen csapda az [1, 2]-ben. Viszont lehet, hogy van csapda [2, 2]-ben (br lehet,
hogy nincs).
7.10. bra - Egy igazsgtbla felsorol algoritmus tletkalkulus llts vonzatnak

eldntsre. Az IT az igazsgtblt jelli. A IK-IGAZ? igazat ad vissza, ha a mondatot
187
Logikai gensek
tartalmazza a modell. A modell vltoz reprezentl egy rszleges modellt, egy

hozzrendelst a vltozk egy rszhez. A KIEGSZT (P, igaz, modell) fggvny egy j
rszleges modellt ad vissza, amelyben P rtke igaz.
Fontos
Termszetesen a vges szmossg nem mindig jelenti a nhnyat. Ha a TB s az mondat
sszesen n szimblumot tartalmaz, akkor 2n modell ltezik. gy az algoritmus idignye O(2n). (A
trignye csak O(n), mivel a felsorols mlysgi jelleg.) A fejezet ksbbi rszben fogunk ltni olyan
algoritmusokat, amelyek sokkal hatkonyabbak a gyakorlatban. Sajnos minden ismert, az tletlogikra
vonatkoz kvetkeztetsi algoritmusnak a legrosszabb esetre vonatkoz komplexitsa exponencilisan
fgg a bemenetek szmtl. Nem remlhetjk, hogy ennl hatkonyabbak is lehetnnk, mivel az
tletlogikban a maga utn vonzs co-NP-teljes (lsd A) fggelk).
3.5. Ekvivalencia, rvnyessg s kielgthetsg

Mieltt belemerlnnk a logikai kvetkeztets rszleteinek trgyalsba, szksgnk van nhny tovbbi, a
vonzattal kapcsolatos fogalomra. Mint a vonzat, ezek a fogalmak is a logika minden formjra alkalmazhatk,
de legjobban egy konkrt logikn mint amilyen az tletkalkulus lehet illusztrlni ket.
Az els fogalom a logikai ekvivalencia (logical equivalence): kt mondat, az s a mondatok logikailag
ekvivalensek, ha ezek a mondatok a modellek ugyanazon halmazn igazak. Ezt gy jelljk, hogy .
Pldul (igazsgtblkat hasznlva) knnyen megmutathatjuk, hogy P Q s Q P logikailag ekvivalensek;
tovbbi ekvivalencik lthatk a 7.11. brn. Az ekvivalencik nagyon hasonl szerepet jtszanak a logikban,
mint az aritmetikai identitsok a kznsges matematikban. Az ekvivalencia alternatv defincija a kvetkez:
brmely kt , mondatra,
akkor s csakis akkor, ha s
(Emlkeztetl, a a maga utn vonzst jelli.)

A msodik fogalom, amelyre szksgnk lesz az rvnyessg (validity). Egy mondat rvnyes, ha igaz minden
modellben. Pldul a
mondat rvnyes. Az rvnyes mondatokat tautolgiknak (tautologies) is
szoktk nevezni, ezek szksgszeren igazak s gy feleslegesek. Mivel az Igaz mondat igaz minden modellben,
minden rvnyes mondat logikailag ekvivalens az Igaz mondattal.
7.11. bra - Standard logikai ekvivalencik. Az , , szimblumok tetszleges

tletkalkulus mondatokat jellnek.
188
Logikai gensek
Fontos
Mire jk akkor az rvnyes mondatok? A vonzatokra vonatkoz defincink alapjn levezethetjk a
dedukcielmletet (deduction theorem), amelyet mr az kori grgk is ismertek:
Brmely s mondatra akkor s csakis akkor, ha az ( ) mondat
rvnyes.
(A 7.4. feladatban ennek a bizonytst krjk.) A 7.10. brn lthat kvetkeztetsi algoritmust gy
tekinthetjk, mint a (TB ) rvnyessgnek ellenrzst. Msik oldalrl nzve viszont minden
rvnyes implikci ler egy legitim kvetkeztetst.
Az utols fogalom, amelyre szksgnk lesz a kielgthetsg (satisfiability). Egy mondat kielgthet, ha igaz
nhny modellben. Pldul a korbban bemutatott tudsbzis, az (Sz1 Sz2 Sz3 Sz4 Sz5), kielgthet, mert
van hrom olyan modell, amelyben igaz, ahogy ezt a 7.9. brn megmutattuk. Ha egy mondat igaz az m
modellben, akkor azt mondjuk, hogy m kielgti (satisfies) -t, vagy m egy modellje -nak. A kielgthetsg
ellenrizhet gy, hogy a lehetsges modelleket felsoroljuk mindaddig, amg nem tallunk egyet, amely
kielgti a mondatot. A mondatok kielgthetsgnek meghatrozsa az tletlogikban az els olyan problma
volt, amelyrl bebizonytottk, hogy NP-teljes.
Szmos problma a szmtstechnikban valjban kielgthetsgi problma. Pldul a knyszerkielgtsi
problmk az 5. fejezetben alapveten arra krdeznek r, hogy a knyszerek kielgthetk-e nhny
hozzrendelssel. Megfelel transzformcik utn a keressi problmk szintn megoldhatk a kielgthetsg
ellenrzsvel. Az rvnyessg s a kielgthetsg termszetesen kapcsolatban vannak: rvnyes akkor s
csakis akkor, ha
nem kielgthet; s fordtva, akkor s csakis akkor kielgthet, ha
nem rvnyes.
A kvetkez hasznos eredmnyt is ismerjk:
akkor s csakis akkor, ha az ( ) nem kielgthet
Fontos
A mondat bizonytsa alapjn, az ( ) kielgthetetlensgnek ellenrzsvel, pontosan
megfelel a szoksos matematikai bizonytsi techniknak a redukcio ad absurdumnak (sz szerint
redukci egy abszurd dologra). Szoktk ezt megcfols (refutation) ltali bizonytsnak is nevezni
vagy bizonyts ellentmonds (contradiction) ltal. Felttelezzk, hogy a mondat hamis, s
megmutatjuk, hogy ez a felttelezs ellentmondsra vezet az ismert aximkkal. Ez az ellentmonds
pontosan azt jelenti, mint amikor azt mondjuk, hogy az ( ) mondat kielgthetetlen.
4. Az tletkalkulus kvetkeztetsi minti

Ez az alfejezet vgigveszi a kvetkeztets standard mintit, amelyek alkalmazhatk arra, hogy kvetkezmnyek
lncolatait vezethessk le, amelyek elvezetnek a kvnt clhoz. Ezeket a kvetkeztetsi mintkat kvetkeztetsi
szablyoknak (inference rules) hvjuk. A legjobban ismert szably a Modus Ponens s a kvetkezkppen
rhat le:
189
Logikai gensek
A jells azt jelenti, hogy ha brmikor adott egy formj mondat s adott egy , akkor a mondat ebbl
kvetkezik. Pldul a (WumpusElrefel Wumpusl) Lvs s a (WumpusElrefel Wumpusl) adott,
akkor a Lvs kikvetkeztethet.
Egy msik hasznos kvetkeztetsi szably az s-kikszbls (And-Elimination), ami azt mondja ki, hogy
egy konjunkcibl brmely konjunkt kikvetkeztethet:
Pldul abbl, hogy (WumpusElrefel Wumpusl) a Wumpusl kikvetkeztethet.

Tekintettel az s lehetsges igazsgrtkeire, knnyen megmutathat, hogy a Modus Ponens s az skikszbls helyes egyszer s mindenkorra. Ezek a szablyok felhasznlhatk brmely konkrt esetben, ahol
alkalmazhatk, helyes kvetkeztetseket eredmnyezve anlkl, hogy fel kellett volna sorolnunk a modelleket.
A 7.11. brn tallhat sszes logikai ekvivalencia hasznlhat kvetkeztetsi szablyknt. Pldul az
ekvivalencia kikszbls kt kvetkeztetsi szablyt eredmnyez:
Nem minden kvetkeztetsi szably mkdik mindkt irnyban, mint ezek. Pldul nem futtathatjuk a Modus
Ponenst ellenkez irnyban, hogy megkapjuk -t s -t a -bl.
Nzzk meg, hogyan hasznlhatjuk ezeket a kvetkeztetsi szablyokat s ekvivalencikat a wumpus vilgban.
Az Sz1, ..., Sz5 szablyokbl ll tudsbzisbl indulunk ki, s megmutatjuk, hogy hogyan bizonythatjuk a C1,2t azaz, hogy nincs csapda az [1, 2]-ben. Elszr alkalmazzuk az ekvivalencia kikszblst Sz2-re, s gy kapjuk,
hogy
Sz6: (S1,1 (C1,2 C2,1)) ((C1,2 C2,1) S1,1)
Ezutn alkalmazzuk az s-kikszblst az Sz6-ra, s gy kapjuk, hogy

Sz7: ((C1,2 C2,1) S1,1)
A kontrapozci logikai ekvivalencit alkalmazva:

Sz8: (S1,1 (C1,2 C2,1))
Most alkalmazhatjuk a Modus Ponenst az Sz8-ra s az Sz4 rzetre (pldul a S1,1) s gy kapjuk:
Sz9: (C1,2 C2,1)
Vgl alkalmazzuk a De Morgan-szablyt, amely a konklzit adja:

Sz10: C1,2 C2,1
Teht sem az [1, 2], sem a [2, 1] ngyzet nem tartalmaz csapdt.
Az elz levezetst kvetkeztetsi szablyok egy sorozatt bizonytsnak (proof) nevezzk. A bizonyts
megtallsa pontosan olyan, mint megoldst tallni egy keressi problmra. Valjban ha a kvetkeztetsi
szablyok sszes lehetsges alkalmazsnak generlsra egy j llapottmenet-fggvnyt definilnnk, akkor
minden, a 3. s 4. fejezetbeli keres algoritmust felhasznlhatnnk a bizonyts megtallsra. A bizonyts
keresse teht egy alternatvja a modellek felsorolsnak. A keress haladhat elrefel a kezdeti tudsbzisbl
kiindulva, alkalmazva a kvetkeztetsi szablyokat a clmondat levezetshez, vagy mehet visszafel a
clmondatbl, megprblva megtallni a kvetkeztetsi szablyoknak olyan lncolatt, amely a kiindulsi
tudsbzisra alkalmazhat szablyokbl indul. A fejezetben ksbb bemutatunk kt olyan algoritmuscsaldot,
amelyek ezeket a technikkat hasznljk.
190
Logikai gensek
Fontos
Az a tny, hogy a kvetkeztets az tletlogikban NP-teljes, azt sugallja, hogy a legrosszabb esetet
tekintve a bizonytsok keresse sem hatkonyabb a modellek felsorolsnl. Szmos gyakorlati
esetben azonban, bizonyts megtallsa sokkal hatkonyabb lehet, egyszeren azrt, mert kpes
figyelmen kvl hagyni az irrelevns lltsokat, fggetlenl attl, hogy hny van bellk. Pldul az
elz bizonyts, amely elvezetett a C1,2 C2,1 mondathoz, nem emlti az S2,1, C1,1, C2,2 vagy a C1,2
lltsokat. Ezeket azrt lehet figyelmen kvl hagyni, mert a C1,2 clllts csak az Sz2-ben jelenik meg,
az Sz2-ben szerepl egyb lltsok pedig csak az Sz2-ben s az Sz4-ben, gy az Sz1, Sz3 s Sz5
szablyoknak nincs kihatsuk a bizonytsra. Ugyanez maradna a helyzet, ha mg milli szablyt
hozzadnnk a tudsbzishoz, mikzben az igazsgtbla algoritmust ezzel ellenttben elrasztan a
modellek exponencilis robbansa.
A logikai rendszereknek ez a tulajdonsga valjban egy sokkal alapvetbb jellegzetessgkbl, a
monotonitsbl (monotonicity) kvetkezik. A monotonits azt mondja ki, hogy a vonzatmondatok halmaza
csak bvlhet, ha a tudsbzishoz informcit adunk hozz. 10
ha TB
akkor TB
Pldul felttelezzk azt, hogy a tudsbzis tartalmaz egy j lltst, amely azt mondja ki, hogy pontosan 8
csapda van a vilgban. Ez a tuds segtheti az genst tovbbi konklzik levezetsben, de nem teheti
rvnytelenn egyik korbban kikvetkeztetett konklzit sem gy azt a konklzit sem, hogy nincsen
csapda az [1, 2]-ben. A monotonits azt jelenti, hogy a kvetkeztetsi szablyok brmikor alkalmazhatk, ha a
megfelel premisszk megtallhatk a tudsbzisban a szably konklzijnak kvetkeznie kell, fggetlenl
attl, hogy mi ms is van mg a tudsbzisban.
4.1. Rezolci
Megmutattuk, hogy az eddig ismertetett kvetkeztetsi szablyok helyesek, de nem trgyaltuk az ezeket
hasznl kvetkeztetsi algoritmusok teljessgnek krdst. A keressi algoritmusok, mint az iteratvan
mlyl keress 4.5. szakasz - Iteratvan mlyl mlysgi keress rszben teljesek abban az rtelemben, hogy
meg fogjk tallni az elrend clt. Ha azonban a rendelkezsre ll szablyok hinyosak, akkor a cl nem
rhet el nem ltezik olyan bizonyts, amely csak ezeket a szablyokat hasznlja. Pldul ha kivennnk az
ekvivalencia kikszbls szablyt, az elz fejezetbeli bizonyts nem futna vgig. Ez a fejezet egyetlen
kvetkeztetsi szablyt mutat be, a rezolcit (resolution), amelynek alkalmazsa, prostva brmelyik teljes
keressi mdszerrel, egy teljes kvetkeztetsi algoritmust eredmnyez.
Elszr a rezolcis szably egy egyszer vltozatt fogjuk hasznlni a wumpus vilgban. Nzzk meg a 7.4.
(a) brhoz vezet lpseket: az gens visszafordul a [2, 1]-bl az [1, 1]-be, s innen megy az [1, 2]-be, ahol
szellt rez, de bzt nem. A kvetkez tnyeket adjuk hozz a tudsbzishoz:
Sz11: S1,2
Sz12: S1,2 (C1,1 C2,2 C1,3)
Ugyanazzal a folyamattal, amely az Sz10-hez vezetett korbban, most le tudjuk vezetni, hogy nincs csapda a [2,
2]-ben s az [1, 3]-ban (emlkezznk, hogy mr tudjuk, hogy az [1, 1] csapdamentes):
Sz13: C2,2
Sz14: C1,3
Az Sz3-ra is alkalmazhatjuk az ekvivalencia kikszblst, amelyet egy Modus Ponens kvet az Sz5-re, hogy
megkapjuk azt a tnyt, hogy csapda van az [1, 1], a [2, 2] vagy a [3, 1] ngyzetekben:
Sz15: C1,1 C2,2 C3,1
A nemmonoton logikk (nonmonotonic logics), amelyek megszegik a monotonits tulajdonsgot, az emberi rvelsnek azt a szokvnyos
tulajdonsgt jelentik meg, amikor valaki meggondolja magt. Ezeket a 10.7. alfejezetben trgyaljuk.
10
191
Logikai gensek
Most kvetkezik a rezolci szably els alkalmazsa: a C2,2 literl az Sz13-ban rezolvl a C2,2 literllal az Sz15ben, amely ezt adja:
Sz16: C1,1 C3,1
Magyarul, ha van egy csapda az [1, 1], [2, 2], [3, 1] ngyzetek egyikben, s ez a csapda nem a [2, 2]-ben van,
akkor ez az [1, 1]-ben vagy a [3, 1]-ben van. Hasonlan a C1,1 literl az Sz1-ben rezolvl a C1,1 literllal az Sz16ban, amibl addik:
Sz17: C3,1
Teht, ha van egy csapda az [1, 1]-ben vagy a [3, 1]-ben, s ez a csapda nem az [1, 1]-ben van, akkor ez a [3, 1]ben van. Ez az utols kt kvetkeztetsi lps plda az egysgrezolci (unit resolution) kvetkeztetsi
szablyra,
ahol egy literl, i s m pedig kiegszt literlok (complementary literals) (pldul az egyik negltja a
msiknak). Teht az egysgrezolci vesz egy klzt (clause) literlok diszjunkcijt meg egy literlt, s
ltrehoz egy j klzt. Vegyk szre, hogy egy egyedi literlt tekinthetnk egy literl diszjunkcijnak, amit
szoktak egysgklznak (unit clause) is nevezni.
Az egysgrezolci szablya ltalnosthat teljes rezolcis (resolution) szablly,
ahol i s mj kiegszt literlok. Ha csak kett hosszsg klzokkal foglalkozunk, akkor ezt rhatjuk:
Azaz a rezolci vesz kt klzt, s ltrehoz egy j klzt, amely tartalmaz minden literlt az eredeti kt klzbl,
kivve a kiegszt literlokat. Pldul:
Van mg egy technikai aspektusa a rezolcis szablynak: az eredmnyklznak minden literlnak csak egy
pldnyt kell tartalmaznia.11 A literlok tbbszrs pldnyainak kivonst faktorls (factoring) hvjk.
Pldul ha rezolvljuk az (A B)-t a (A B)-vel, akkor (A A)-t kapunk, amelyet reduklhatunk egyszeren
A-ra.
A rezolcis szably helyessge egyszeren belthat, ha megvizsgljuk az li literlt. Ha li igaz, akkor mj hamis,
s gy m1 mjl mj+l mn-nek igaznak kell lennie, mert m1 mn adott. Ha i hamis, akkor 1
il i+l k igaz kell, hogy legyen, mivel i k adott. gy i akr igaz, akr hamis, az egyik
vagy a msik konklzi ll, pontosan gy, ahogy a szably ezt kimondja.
Fontos
Ami mg meglepbb a rezolcis szabllyal kapcsolatban, hogy a rezolci alapjul szolgl teljes
kvetkeztetsi algoritmusok egy csaldjnak. Brmely teljes keressi algoritmus, a rezolcis szablyt
alkalmazva, az tletlogikban kpes levezetni brmilyen konklzit, amely vonzata a tudsbzisnak.
Egy figyelmeztets: a rezolci csak egy specilis rtelemben teljes. Ha adott, hogy A igaz, akkor nem
tudjuk a rezolcit arra hasznlni, hogy levezessk az A B konzekvencit. Azonban tudjuk arra
hasznlni a rezolcit, hogy megvlaszoljuk azt a krdst, hogy A B igaz-e. Ezt megcfolsi
teljessgnek (refutation completeness) nevezik, ami azt jelenti, hogy a rezolci mindig hasznlhat
Ha a klzt literlok halmaznak tekintjk, akkor ezt a korltozst automatikusan figyelembe vettk. A halmaz jellst alkalmazva a
klzokra a rezolcis szably sokkal tisztbb lesz egy jabb jells bevezetsnek rn.
11
192
Logikai gensek
arra, hogy megerstsnk vagy megcfoljunk egy mondatot, de nem alkalmazhat az igaz mondatok
felsorolsra. A kvetkez kt alfejezet azt magyarzza el, hogy a rezolci hogyan oldja ezt meg.
4.1.1. Konjunktv norml forma
Fontos
A rezolcis szably csak literlok diszjunkciira alkalmazhat, gy gy tnhet, hogy ez csak olyan
tudsbzis s lekrdezs esetben rdekes, amelyek ilyen diszjunkcikat tartalmaznak. Akkor hogyan
vezet ez egy teljes kvetkeztetsi eljrshoz az egsz tletkalkulus szmra? A vlasz az, hogy minden
tletkalkulus mondat logikailag ekvivalens literlok diszjunkciinak konjunkciival. Egy mondatot,
amelyet literlok diszjunkciinak konjunkciival fejeznk ki, konjunktv norml formjnak
(conjunctive normal form) vagy CNF formjnak neveznk. A ksbbiekben az is hasznos lesz, ha
ennek egy korltosabb csaldjt, a k-CNF mondatokat tekintjk. Egy mondat a k-CNF-be tartozik, ha
pontosan k literl van a klzokban.
( l, l 1, k) (
n,
n, k)
Ki fog derlni, hogy minden mondat transzformlhat 3-CNF mondatt gy, hogy azonos marad a modellek
halmaza.
Ahelyett hogy bizonytannk ezeket a kijelentseket (lsd 7.10. feladat), lerunk egy egyszer konvertl
eljrst. Az eljrst az Sz2 szably, az S1,1 (C1,2 C2,1) mondat CNF-re konvertlsval illusztrljuk. A lpsek
a kvetkezk:
1. Kszbljk ki a sszektjelet, helyettestve az -t ( ) ( )-vel:
(S1,1 (C1,2 C2,1)) ((C1,2 C2,1) S1,1)
2. Kikszbljk az sszektjelet, kicserlve t -ra:

(S1,1 C1,2 C2,1) ( (C1,2 C2,1) S1,1)
3. A CNF megkvnja, hogy a csak literlokra vonatkozzon, gy most a-t beljebb mozgatjuk a kvetkez
7.11. brn felrt ekvivalencik ismtelt alkalmazsval:
()
ketts negci kikszbls
( ) (
) De Morgan
( ) ( ) De Morgan
A pldban csak az utols szably alkalmazsra van szksgnk:

( S1,1 C1,2 C2,1) ((C1,2 C2,1) S1,1)
4. Most van egy mondatunk, amelyben egymsba gyazott s opertorok vannak alkalmazva a literlokra.
A 7.11. brn bevezetett disztributivits szablyt alkalmazzuk a opertorokra az felett mindenhol, ahol
lehetsges.
(S1,1 C1,2 C2,1) (C1,2 S1,1) (C2,1 S1,1)
Az eredeti mondat most mr CNF-ben van, hrom klz konjunkcijaknt. Br sokkal nehezebb olvasni ezt a
formt, de hasznlhat a rezolcis eljrs bemeneteknt.
4.1.2. A rezolci algoritmus

A rezolcin alapul kvetkeztetsi eljrsok az ellentmondsokra vezet bizonytsok elvn mkdnek, ahogy
azt a 7.4. alfejezet vgn trgyaltuk. Teht annak megmutatshoz, hogy , azt mutatjuk meg, hogy a (TB
) kielgthetetlen. Ezt az ellentmonds bizonytsval vgezzk el.
193
Logikai gensek
A rezolci algoritmust mutatja a 7.12. bra. Elszr a (TB )-t konvertljuk CNF formra. Majd a
rezolcis szablyt alkalmazzuk a ltrejv klzokra. Minden egyes prt, amely kiegszt literlokat tartalmaz,
rezolvlunk, hogy egy j klzt hozzunk ltre, amelyet hozzadunk a halmazhoz, ha mg nem volt jelen. A
folyamat addig folytatdik, amg a kvetkez kt dolog kzl valamelyik meg nem trtnik:
nincs tbb j klz, amit hozz lehet adni, ilyen esetben nem vonzza maga utn -t.
a rezolci alkalmazsa egy res klzra vezet, amely esetben -nak vonzata .
Az res klz egy diszjunkt nlkli diszjunkci ekvivalens a Hamis rtkkel, mert a diszjunkci akkor igaz
csak, ha legalbb az egyik diszjunkt igaz. gy is belthatjuk, hogy az res klz ellentmondst reprezentl, hogy
megfigyeljk azt, hogy az res klz kt kiegszt egysgklz, mint amilyen az S s S, rezolvlsbl
szrmazik.
7.12. bra - Egy egyszer rezolcis algoritmus az tletkalkulushoz. Az IK-REZOLVLS a

kt bemenetknt megkapott llts rezolvlsbl szrmaz sszes lehetsges klz
halmazt adja vissza.
Alkalmazzuk a rezolcis eljrst egy nagyon egyszer kvetkeztetsre a wumpus vilgban. Amikor az gens az
[1,1]-ben van, akkor nincs szell, teht nincs csapda a szomszdos ngyzetekben. Az ennek megfelel
tudsbzis:
TB = Sz2 Sz4 = (S1,1 (C1,2 C2,1)) S1,1
s mi bizonytani szeretnnk -t, ami mondjuk C1,2. Amikor konvertljuk a (TB )-t CNF formra, akkor a
7.13. bra fels rszn lthat klzokat kapjuk. Az bra msodik sora mutatja az sszes klzt, amit az els sor
prjainak rezolvlsbl kaptunk. s akkor, amikor a C1,2-t rezolvljuk C1,2-vel megkapjuk az res klzt, amit
egy kis ngyzet jell. A 7.13. bra megvizsglsa azt mutatja, hogy szmos rezolcis lps felesleges. Pldul
az S1,1 S1,1 C1,2 ekvivalens az Igaz C1,2-vel, ami ekvivalens az Igazzal. Levezetni, hogy az Igaz az igaz,
nem igazn hasznos. gy brmely olyan klz, amelyben kt kiegszt klz szerepel, figyelmen kvl hagyhat.
7.12. bra - Az IK-REZOLCI algoritmus rszleges alkalmazsa egy egyszer wumpus

vilgbeli kvetkeztetsre. A fels sor els ngy klza alapjn szrmaztatjuk a P1,2-t.
194
Logikai gensek
4.1.3. A rezolci teljessge

Hogy befejezzk a rezolci trgyalst, most megmutatjuk, hogy az IK-REZOLCI algoritmus teljes. Ahhoz,
hogy ezt megtehessk, hasznos bevezetni az S klzok halmaznak rezolcis lezrtjt (resolution closure),
RC(S)-t, ami az sszes olyan klz halmaza, amely levezethet a rezolci ismtelt alkalmazsaival az S
halmazbeli elemekbl s ezek leszrmazottaibl. Az IK-REZOLCI a rezolcis lezrs halmaz elemeit sorolja
fel a klzok vltozban. Knny beltni, hogy RC(S)-nek vgesnek kell lennie, mert vges sok klnbz klzt
lehetsges konstrulni az P1, , Pk szimblumokbl, amelyek elemei S-nek. (Vegyk szre, hogy ez nem volna
igaz a faktorlsi lps nlkl, amely megsznteti a literlok tbbszrzdst.) gy az IK-REZOLCI mindig
terminldik.
Az tletlogikban a rezolci teljessgi ttelt alap rezolcis ttelnek (ground resolution theorem)
nevezzk.
Ha klzok egy halmaza kielgthetetlen, akkor ezeknek a klzoknak a rezolcis lezrtja tartalmazza az res
klzt.
A ttelt az ellenttjnek demonstrlsval bizonytjuk: ha az RC(S) lezrtja nem tartalmaz res halmazt, akkor S
kielgthet. Valjban egy modellt konstrulunk S-nek a megfelel P1, , Pk igazsg rtkekkel. A
konstrukcis eljrs a kvetkez:
Minden i-re 1-tl k-ig,
Ha ltezik egy klz RC(S)-ben, amely tartalmazza a Pi literlt gy, hogy minden ms literl hamis a
vlasztott P1, , Pi1 hozzrendels szerint, akkor rendeljnk hamis rtket Pi-hez.
Egybknt rendeljnk igaz rtket Pi-hez.
Az maradt htra, hogy megmutassuk, hogy ez a P1, , Pk hozzrendels modellje S-nek, feltve, hogy RC(S)
zrt a rezolcira, s nem tartalmazza az res klzt. Ennek bizonytst meghagyjuk feladatnak.
4.2. Elre- s htrafel lncols

A rezolcit a teljessg tulajdonsga igen fontos kvetkeztetsi mdszerr teszi. Szmos gyakorlati esetben
azonban, a rezolci teljes erejre nincs szksg. A valsvilg-beli tudsbzisok gyakran a klzoknak csak egy,
Horn-klznak (Horn clause) nevezett korltosabb fajtjt tartalmazzk. A Horn-klz literlok olyan
diszjunkcija, amelyek kzl legfeljebb egy pozitv. Pldul a (P1,1 Szell S1,1) klz, ahol P1,1 jelenti,
hogy az gens pozcija az [1, 1], egy Horn-klz, mg az (S1,1 C1,2 C2,1) nem az.
A korltozs, hogy csak egy pozitv literl lehet, egy kiss nknyesnek s rdektelennek tnhet, de valjban
nagyon fontos, hrom ok miatt is:
195
Logikai gensek
1. Minden Horn-klz felrhat egy implikciknt is, amelynek premisszja pozitv literlok konjunkcija, s
konklzija egyetlen pozitv literl (lsd 7.12. feladat). Pldul a (P1,1 Szell S1,1) Horn-klz trhat a
(P1,1 Szell) S1,1 implikcira. Ebben az utbbi formjban sokkal knnyebb olvasni a mondatot: azt
mondja ki, hogyha az gens az [1, 1]-ben van, s szell rzkelhet ott, akkor az [1, 1] szells. Szmos
terleten az emberek szmra knny a tudst ilyen mondatok formjban olvasni s lerni.
A Horn-klzokat, mint amilyen az elbbi, vagyis amelyben pontosan egy pozitv literl van, hatrozott
klzoknak (definite clauses) nevezik. A pozitv literl a fej (head), mg a negatv literlok alkotjk a klz
testt (body). Egy negatv literlok nlkli hatrozott klz egyszeren kijelent egy adott lltst, amit
gyakran tnynek (fact) neveznek. A hatrozott klzok formljk a logikai programozs (logic
programming) alapjt, amelyet a 9. fejezetben trgyalunk. Egy pozitv literlok nlkli Horn-klz felrhat,
mint egy olyan implikci, amelynek a konklzija a Hamis literl. Pldul a (W1,1 W1,2) klz a
wumpus nem lehet mind az [1, 1], mind az [1, 2] mezben, ekvivalens a W1,1 W1,2 Hamis mondattal. Az
ilyen mondatokat integrits knyszereknek (integrity constraints) nevezzk az adatbzis-kezels terletn,
ahol adathibk jelzsre hasznljk. A kvetkezkben bemutatsra kerl algoritmusokban az egyszersg
kedvrt felttelezzk, hogy a tudsbzis csak hatrozott klzokat tartalmaz, s nincsenek benne
integritsknyszerek. Azt mondjuk, hogy ezek a tudsbzisok Horn-formban vannak.
2. A Horn-klzokon trtn kvetkeztets trtnhet az elrefel lncols (forward chaining) vagy a htrafel
lncols (backward chaining) algoritmusokkal, amelyeket a kvetkezkben elmagyarzunk. Mindkt
algoritmus igen termszetes, a kvetkeztetsi lpsek nyilvnvalak s egyszeren kvethetek az emberek
szmra.
3. A maga utn vonzs krdsnek eldntshez szksges id linerisan fgg a tudsbzis mrettl.
7.14. bra - Elrefel lncols algoritmus az tletkalkulus szmra. Az agenda

tartalmazza azokat a szimblumokat, amelyek ismerten igazak, de mg nem dolgoztk
fel ket. A szmol tbla kveti, hogy az egyes implikciknak hny premisszja
ismeretlen. Ha az agendrl egy j p szimblumot feldolgozunk, minden olyan
implikci szmllja cskken eggyel, amelynek premisszjban p megjelenik. (Ez
megoldhat konstans idben, ha a TB megfelelen indexelt.) Ha a szmll elri a
nullt, azaz az implikci minden premisszja ismert, akkor az implikci konklzijt
hozz lehet adni az agendhoz. Vgl szksgnk van arra, hogy kvessk melyik
szimblumot dolgoztuk mr fel; egy kikvetkeztetett szimblumot nem kell hozzadni
az agendhoz, ha azt mr korbban sikeresen feldolgoztuk. gy elkerlhet a redundns
munka, s megakadlyozza a vgtelen ciklusok kialakulst, amelyet olyan implikcik
okozhatnak, mint a P Q s Q P.
196
Logikai gensek
Ez az utols tny egy kellemes meglepets. Azt jelenti, hogy a logikai kvetkeztets nagyon olcs szmos, a
gyakorlatban elfordul tletkalkulus tudsbzis esetben.
Az IK-EL-VONZAT? (TB, q) elrefel lncolsi algoritmus meghatrozza, hogy egy q tletkalkulus szimblum
a lekrdezs vonzata-e egy Horn-klzokat tartalmaz tudsbzisnak. Az algoritmus a tudsbzisban tallhat
ismert tnyekbl (pozitv literlok) indul ki. Ha egy implikci minden premisszja ismert, akkor a konklzijt
hozzadjuk az ismert tnyek halmazhoz. Pldul, ha ismert a P1,1, s a Szell s a (P1,1 Szell) S1,1 a
tudsbzisban van, akkor S1,1-t hozzadhatjuk ehhez. Ez a folyamat folytatdik, amg vagy a q lekrdezst hozz
tudjuk adni az ismert tnyek halmazhoz, vagy mr nem tudunk tovbbi kvetkeztetst vgezni. A rszletes
algoritmust a 7.14. bra mutatja, a legfontosabb tulajdonsg, amire emlkeznnk kell, hogy ez lineris idben
fut.
Az algoritmust a legjobban gy rthetjk meg, ha megnznk egy pldt s egy hozz tartoz brt. A 7.15. (a)
bra egy egyszer Horn-klzokbl ll tudsbzist mutat be, amely az A s B ismert tnyeket tartalmazza. A
7.15. (b) bra ugyanezt a tudsbzist egy S-VAGY grfknt (AND-OR graph) brzolja. Az S-VAGY
grfokban a konjunkcikat vekkel sszefogott kapcsolatok minden egyes kapcsolatot bizonytani kell
jellik, mg a diszjunkcikat vek nlkl sszefut kapcsolatok elg valamelyik kapcsolatot bizonytani
jellik. Knny ttekinteni, hogyan is mkdik az elrefel lncols a grfon. Az ismert levelek (itt A s B)
adottak, s a kvetkeztets addig halad felfel a grfon, amg lehetsges. Brhol megjelenik egy konjunkci a
folyamatban, a tovbbterjeszts megll addig, amg az sszes konjunkt ismertt nem vlik, majd ezutn halad
tovbb. Javasoljuk az olvasnak, hogy vegye t rszletesen a pldt.
7.15. bra - (a) Egyszer Horn-klzokbl ll tudsbzis. (b) Ugyanez a tudsbzis SVAGY grfknt.
197
Logikai gensek
Fontos
Knny beltni, hogy az elrefel lncols helyes: minden kvetkeztets valjban a Modus Ponens
egy alkalmazsa. Az elrefel lncols teljes is: minden vonzat atomi mondatot vezet le. A
legegyszerbben gy rthetjk meg ezt, ha a kikvetkeztetett llapot tbla vgs llapott tekintjk
(miutn az algoritmus elrt egy fix pontot (fixed point), ahol mr jabb kvetkeztets nem lehetsges).
A tbla igaz rtket tartalmaz minden, a folyamat sorn kikvetkeztetett szimblumra, s hamis rtket
a tbbi szimblumra. A tblt gy tekinthetjk, mint egy logikai modellt, radsul minden hatrozott
klz az eredeti TB-ben igaz ebben a modellben. Ennek beltsra felttelezzkaz ellenkezjt,
nevezetesen, hogy valamely a1 ak klz hamis a modellben. Ez azt jelenti, hogy a1
ak-nak igaznak, mg -nek hamisnak kell lennie a modellben. Ez viszont ellentmond annak a
felttelezsnknek, hogy az algoritmus elrte a fix pontot! gy levonhatjuk azt a kvetkeztetst, hogy a
kikvetkeztetett atomi mondatok halmaza a fix pontban az eredeti TB egy modelljt definilja.
Ezenkvl, brmely q atomi mondatnak, amely vonzata a TB-nek, igaznak kell lennie ennek minden
modelljben, gy ebben az emltett modellben is. Ennlfogva az algoritmusnak ki kell kvetkeztetnie
minden q vonzat mondatot.
Az elrefel lncols egy pldja az ltalnos adatvezreltnek (data-driven) nevezett kvetkeztetsi elvnek,
amely olyan kvetkeztetseket jelent, ahol a figyelem fkusza kezdetben az ismert adatokon van. Ez a
megkzelts alkalmazhat az genseknl a bejv rzetekbl trtn kvetkeztetsek levezetsre, gyakran
anlkl is, hogy valamilyen krds lebegne a szemnk eltt. Pldul a wumpus gens KIJELENT-heti az rzeteit
a tudsbzisnak, felhasznlva egy inkrementlis elrefel kvetkeztet algoritmust, amelyben j tnyeket lehet
felvenni egy eljegyzsi listra, hogy tovbbi kvetkeztets inicializldjon. A mindennapi letben, jelents
szmban fordul el adatvezrelt kvetkeztets, amikor j informcik rkeznek. Pldul ha bent vagyok a
szobban s hallom, hogy elkezd esni, akkor felmerlhet bennem, hogy a tervezett kirnduls elmarad.
Ugyanakkor az valsznleg nem fog megfordulni a fejemben, hogy a szomszd kertjben a legnagyobb rzsa
tizenhetedik szirma nedves lesz. Az emberek vatos kontroll alatt tartjk az elrefel lncolst, nehogy
elrasszk ket az irrelevns kvetkezmnyek.
A visszafel lncols algoritmus, ahogy azt a neve is sugallja, visszafel mkdik a lekrdezsbl indulva. Ha a
q lekrdezsrl tudjuk, hogy igaz, akkor nem szksges tovbbi munka. Egybknt az algoritmus megtall
198
Logikai gensek
minden olyan implikcit a tudsbzisban, amelynek a kvetkezmnye q. Ha valamelyik ilyen implikcinak az

sszes premisszjt be lehet bizonytani (visszafel lncolssal), akkor q igaz. Amikor a 7.15. brn a Q
lekrdezsre alkalmazzuk a mdszert, akkor ez az brn kvetve vissza, lefel mkdik, addig, amg el nem ri
az ismert tnyek halmazt, ami a bizonyts alapja. A rszletes algoritmust meghagyjuk feladatnak, s mint az
elrefel lncolsnl, egy hatkony implementci itt is lineris idben mkdik.
A visszafel lncols a clorientlt kvetkeztets (goal-oriented reasoning) egy formja. Hasznos-e
megvlaszolni olyan krdseket, mint hogy Mit tegyek most?, vagy hogy Hol vannak a kulcsaim?. Gyakran
a visszafel lncols kltsge sokkal kisebb, mint a tudsbzis mrettl linerisan fgg kltsg, mert a
folyamat csak relevns tnyeket rint. ltalnossgban, egy gensnek meg kell osztania a munkt az elrefel s
htrafel lncols kztt, korltozva az elrefel kvetkeztets alkalmazst azokra a tnyekre, amelyek
valsznleg relevnsak azon lekrdezsekhez, amelyeket az gens visszafel lncolssal fog megoldani.
5. Hatkony tletkalkulus kvetkeztets

Ebben a szakaszban az tletkalkulus kvetkeztets kt hatkony csaldjt rjuk le, amelyek a
modellellenrzsen alapulnak: az egyik megkzelts a visszalpses keressen alapul, a msik a hegymsz
keressen. Ezek az algoritmusok az tletkalkulus technolgijnak rszei. Ez a szakasz tlapozhat a fejezet
els olvassakor.
Az algoritmusok, amelyeket lerunk, a kielgthetsget ellenrzik. Mr megfigyeltk a kapcsolatot egy logikai
mondatot kielgt modell megtallsa s egy knyszerkielgtsi problma megoldsnak megtallsa kztt,
gy taln nem meglep, hogy a kt algoritmus csald igen hasonlt az 5.2. alfejezetben bemutatott visszalpses
algoritmusokra s az 5.3. alfejezet loklis keressi algoritmusaira. Ezek az algoritmusok azonban rendkvl
fontosak sajt maguk jogn is, mert szmos kombinatorikai problma a szmtstechnikban visszavezethet
egy tletkalkulus mondat kielgthetsgnek ellenrzsre. A kielgthetsgi algoritmusok tern elrt
brmilyen halads ltalnossgban is risi hatssal van a kpessgeinkre a komplexits kezelsben.
5.1. Egy teljes visszalpses algoritmus

Az els algoritmus, amit megnznk Martin Davis s Hilary Putnam (1960) jelents konferenciacikke alapjn,
az gynevezett DavisPutnam-algoritmus. Ez az algoritmus valjban egy vltozata annak, amelyet Davis,
Logemann s Loveland (1962) publiklt, gy DPLL-nek fogjuk hvni szerzik neveinek kezdbeti alapjn. A
DPLL bemenetknt egy konjunktv norml formj mondatot vesz a klzok egy halmazt. Mint a
VISSSZALPSES-KERESS vagy az IK-VONZAT?, ez is alapveten rekurzv, mlysgi felsorolst vgzi a
lehetsges modelleknek. Az algoritmus hrom tovbbfejlesztst tartalmaz az IK-VONZAT? egyszer smjhoz
kpest:
Korai lells: Az algoritmus szreveszi, ha egy mondat mr biztos igaz vagy hamis, mg rszben elkszlt
modell alapjn is. Egy klz igaz, ha brmelyik literl igaz, mg akkor is, ha a tbbi literlnak mg nincs
igazsg rtke. Ennlfogva a mondatot mint egszet igaznak tlhetjk, mg mieltt a modell teljes volna.
Pldul az (A B) (A C) igaz, ha A igaz, fggetlenl B s C rtktl. Hasonlan, egy mondat hamis, ha
brmelyik klz hamis, ami akkor fordul el, ha ennek a klznak minden literlja hamis. Ismtelten, ez a
modell teljess vlsnl sokkal korbban is elfordulhat. A korai lells a keressi tr egsz rszfinak
tvizsglst kerli el.
Tiszta szimblum heurisztika: Egy tiszta szimblum (pure symbol) egy olyan szimblum, amely mindig
ugyanolyan eljellel szerepel minden klzban. Pldul a kvetkez hrom mondatban, (A B), (B
C) s az A szimblum tiszta, mivel csak a pozitv literlja jelenik meg, a B tiszta, mivel csak a negatv
literlja jelenik meg, s C nem tiszta. Knny beltni, hogyha egy mondatnak van modellje, akkor ltezik
tiszta szimblumokat tartalmaz modellje is, amelyben a tiszta szimblumok rtke gy van megvlasztva,
hogy literljai igazak legyenek, hiszen gy egyetlen klzt sem tesznk hamiss. Vegyk szre, hogy egy
szimblum tisztasg tulajdonsgnak meghatrozsakor az algoritmus figyelmen kvl hagyhatja azokat a
klzokat, amelyekrl mr tudjuk, hogy igazak a modell eddigi konstrulsa alapjn. Pldul ha a modellnk
tartalmazza a B = hamis hozzrendelst, akkor a (B C) klz mr igaz, s C tisztv vlik, mert csak a (C
A)-ban jelenik meg.
Egysgklz heurisztika: Az egysgklzt mr definiltuk korbban, mint egy olyan klzt, amelynek egy
literlja van. A DPLL esetben, ez azokat a klzokat is jelenti, hogy egy kivtelvel minden literl hamis
rtket kapott a modellben. Pldul ha a modell tartalmazza a B = hamis hozzrendelst, akkor a (B C)
199
Logikai gensek
egysg klzz vlik, mivel ekvivalens a (Hamis C)-vel, azaz a C-vel. Termszetesen ahhoz, hogy ez a
klz igaz legyen, C-nek hamis rtket kell adni. Az egysgklz heurisztika elvgzi ezeket a
hozzrendelseket, mieltt elgazna a maradkon. Egy fontos konzekvencija ennek a heurisztiknak, hogy
brmely, mr a tudsbzisban tallhat literlra vonatkoz (cfolat ltali) bizonytsi ksrlet azonnal sikeres
lesz (7.16. feladat). Vegyk szre azt is, hogy rtket adva egy egysgklzhoz jabb egysgklzt hozhatunk
ltre. Pldul amikor C-nek hamis rtket adunk, akkor a (C A) egysgklzz vlik, ami az igaz A-hoz val
hozzrendelst eredmnyezi. Ezt az egymst kvet kiknyszertett hozzrendelsek sorozatt
egysgterjesztsnek (unit propagation) nevezik. Hasonlt a folyamat a Horn-klzokkal trtn elrefel
lncolsra, s valban, abban az esetben ha a CNF formj kifejezs csak Horn-klzokat tartalmaz, akkor a
DPLL lnyegben lemsolja az elrefel lncolst (lsd 7.17. feladat).
7.16. bra - A DPLL algoritmus tletkalkulus mondatok kielgthetsgnek

ellenrzse. A TISZTA-SZIMBLUM-KERESS s az EGYSG-KLZ-KERESS eljrsokat a szvegben
elmagyarztuk; mindkett egy szimblummal vagy nullval tr vissza, s a
szimblumhoz hozzrendelend igazsgrtkkel. Mint az IT-VONZAT? eljrs, ez is
rszleges modelleken dolgozik.
A DPLL algoritmust mutatja a 7.16. bra. Az brn a lnyeges elemeket tartalmaz vzat adtuk meg, ami
bemutatja magt a keressi folyamatot. Nem szerepel az adatstruktra lersa, amelyet fenn kell tartani, hogy a
keressi lpseket hatkonyan lehessen elvgezni, sem azoknak a trkkknek a lersa, amelyeket a teljestmny
fokozsa cljbl az alapalgoritmushoz hozz lehet adni: klztanuls, vltoz vlasztsi heurisztika s a
vletlenszer jraindtsok technikja. Ha ezeket is beptjk az algoritmusba, akkor a DPLL az egyik
leggyorsabb kielgthetsgi algoritmus, antikvitsa ellenre is. A CHAFF implementci milli vltozs
hardververifikcis problmk megoldsra szolglt.
5.2. Loklis keress algoritmus

Szmos loklis keress algoritmust lttunk mr a knyvben, belertve a HEGYMSZ algoritmust 3.1. szakasz Hegymsz keress rszben s a SZIMULLT-LEHTS-t 3.2. szakasz - Szimullt lehts rszben. Ezek az
algoritmusok alkalmazhatk kzvetlenl is kielgthetsgi problmkra, feltve, hogy megfelel kirtkel
fggvnyt vlasztunk. Mivel a cl egy olyan hozzrendels megtallsa, amely kielgt minden klzt, megfelel
szmunkra egy olyan kirtkel fggvny vlasztsa, amely a kielgtetlen klzok szmt szmolja. Valban, ez
pontosan az a mrtk, amit a MIN-KONFLIKTUS algoritmus hasznlt knyszerkielgtsi problmknl 3. szakasz
- Loklis keress knyszerkielgtsi problmknl rszben. Minden ilyen algoritmus a teljes hozzrendelsek
terben vgez lpseket, cserlgetve egy-egy lpsben egy-egy szimblum igazsgrtkt. A tr rendszerint
szmos loklis minimumot tartalmaz, amelyekbl a meneklshez a vletlenszer lpsek klnfle formi
200
Logikai gensek
szksgesek. Az utbbi vekben nagyon sokat foglalkoztak azzal a krdssel, hogy hogyan lehet egy j
egyenslyt tallni a mohsg s a vletlenszersg kztt.
Az egyik legegyszerbb s leghatkonyabb algoritmus, amely ezen munkk kztt felbukkant a WALKSAT (7.17.
bra). Minden iterciban az algoritmus vesz egy kielgtetlen klzt s egy szimblumot a klzbl, amelynek
rtkt ellenkezre cserli. Az rtket cserl szimblum kivlasztsa a kvetkez kt mdszer kzl
vletlenszeren vlasztva az egyikkel trtnik: (1) a min-konfliktus lps, amely minimalizlja a
kielgtetlen klzokat az j llapotban, s a (2) vletlen-bejrs, amely vletlenszeren vlasztja a
szimblumot.
7.17. bra - A WALKSAT algoritmus, kielgthetsgnek ellenrzse vletlenszeren

cserlgetetett vltoz rtkekkel. Szmos vltozata ismert az algoritmusnak.
Mkdik-e egyltaln a WALKSAT? Az egyrtelm, hogy ha visszaad egy modellt, akkor a bemeneti mondat
valban kielgthet. Mi van akkor, ha kudarccal tr vissza? Sajnos ebben az esetben nem tudjuk megmondani,
hogy a mondat kielgthetetlen vagy az algoritmus szmra tbb idt kellene hagyni a keressre.
Megprblhatjuk belltani a max_csere rtkt vgtelenre. Erre az esetre knny megmutatni, hogy a WALKSAT
vgl vissza fog adni egy modellt (ha ltezik ilyen), feltve, hogy a p valsznsgre igaz a p > 0. Ez azrt van
gy, mert mindig ltezik egy olyan cserlsi sorozat, amely elvezet egy kielgt hozzrendelshez, s elbbutbb a vletlen bejrs lpsek el fogjk lltani ezt a sorozatot. Persze ha a max_csere vgtelen, s a mondat
kielgthetetlen, akkor az algoritmus soha nem fog lellni!
Ezek az eredmnyek azt sugalljk, hogy a loklis keressi algoritmusok, mint a WALKSAT, akkor a leginkbb
hasznosak, ha felttelezhetjk, hogy ltezik megolds mint pldul a 3. s 5. fejezetben trgyalt problmknak
ltalban van megoldsuk. Viszont a loklis keress nem kpes detektlni a kielgthetetlensget, amely
szksges a maga utn vonzs krdsnek az eldntshez. Pldul egy loklis keresst alkalmaz gens nem
tudja megbzhatan bizonytani, hogy egy ngyzet biztonsgos a wumpus vilgban. Ehelyett azt tudja mondani,
hogy Egy rja gondolkodom a krdsen, s nem tudtam olyan lehetsges vilgot tallni, amiben a ngyzet
nem biztonsgos. Ha a loklis keress algoritmus ltalban igazn gyors egy modell megtallsban, ha ltezik
ilyen, akkor az genst tekinthetjk igazolhatnak, felttelezve, hogy a kudarc a kielgthetetlensget jelzi. Ez
termszetesen nem azonos egy bizonytssal, s az gensnek ktszer is meg kell gondolnia, mieltt erre bzza az
lett.
5.3. Nehz kielgthetsgi problmk

Most megnzzk, hogyan is teljest a DPLL s a WALKSAT a gyakorlatban. Minket elssorban a nehz problmk
rdekelnek, mert a knny problmk megoldhatak brmely rgi algoritmussal is. Az 5. fejezetben lttunk
nhny meglep felfedezst bizonyosfajta problmkkal kapcsolatban. Pldul az n-kirlyn problma amely
igen kemny feladat volt a visszalpses keress szmra trivilisan egyszernek bizonyult az olyan loklis
keressi mdszerek szmra, mint pldul a min-konfliktus. Ennek az az oka, hogy a megoldsok nagyon srn
oszlanak el a hozzrendelsek terben, s brmely kezdeti hozzrendelshez garantltan tallhatunk egy
megoldst a kzelben. Teht az n-kirlyn knny problma, mert alulhatrozott (underconstrained).
201
Logikai gensek
Amikor konjunktv norml formban lev kielgthetsgi problmkat tekintnk, alulhatrozott problma az,
amelyben viszonylag kevs a vltozkat korltoz klz szerepel. Pldul itt van egy vletlenszeren ltrehozott 12
3-CNF mondat t szimblummal s t klzzal:
(D B C) (B A C) (C B E) (E D B) (B E C)
A 32 lehetsges hozzrendelsbl 16 modellje a mondatnak, gy tlagosan csak kt vletlenszer tallgatsra

van szksg egy modell megtallshoz.
Akkor melyek a nehz problmk? Felttelezhet, hogyha nveljk a klzok szmt, mikzben a szimblumok
szmt rgztve tartjuk, a problmt ersebben hatrozott tesszk, s a megolds megtallsa egyre nehezebb
vlik. Legyen m a klzok szma s n a szimblumok szma. A 7.18. (a) bra mutatja annak a valsznsgt,
hogy egy vletlenszeren vlasztott 3-CNF mondat kielgthet-e a klz/szimblum arny (m/n) fggvnyben
rgztett n = 50 mellett. Ahogy vrtuk, kis m/n arnynl a valsznsg kzel van 1-hez, s nagy m/n arnynl
kzel van a 0-hoz. A valsznsg viszonylag lesen esik le az m/n = 4,3 rtknl. Azok a CNF mondatok,
amelyek kzel vannak ehhez a kritikus ponthoz (critical point), alig kielgthetnek vagy alig
kielgthetetlennek jellemezhetk. Ez volna az, ahol a nehz problmk vannak?
A 7.18. (b) bra mutatja a DPLL s a WALKSAT futsi idit ennek a pontnak a krnyezetben, csak a kielgthet
problmkat vve figyelembe. Hrom dolog tiszta: elszr is, a kritikus pont krli problmk sokkal
nehezebbek, mint a tbbi problma. Msodszor, a DPLL igen hatkony mg a legnehezebb problmkra is
tlagosan nhny ezer lpst tesz, sszehasonltva az igazsgtbla felsorols 2 50 1015 szm lpsignyvel.
Harmadszor, a WALKSAT a teljes tartomnyban sokkal gyorsabb, mint a DPLL.
Termszetesen ezek az eredmnyek csak a vletlenszeren generlt problmkra vonatkoznak. A vals
problmknak nem felttlenl hasonl a struktrjuk a pozitv s negatv lltsok arnya, a klzok kzti
kapcsolatok srsge, s egyb ms vonatkozsok mint a vletlen problmknak. Mgis, a gyakorlatban a
WALKSAT s az ehhez kapcsold, hasonl algoritmusok nagyon jk vals problmk megoldsban is gyakran
ugyanolyan jk, mint az adott feladatra ksztett legjobb specilis cl algoritmus. Tbb ezer szimblumot s
millinyi klzt tartalmaz problmkat megoldkkal szoks kezelni, mint amilyen a CHAFF. Ezek a
megfigyelsek azt sugalljk, hogy a min-konfliktus s a vletlen bejrs algoritmusok valamilyen kombincija
ltalnos cl kpessget biztost a legtbb szituci elemzshez, ahol kombinatorikai kvetkeztets
szksges.
7.18. bra - (a) A grafikon a klz/szimblum arny fggvnyben annak valsznsgt

mutatja, hogy n = 50 mondat kzl vletlenszeren vlasztott 3-CNF mondat
kielgthet-e. (b) A grafikon a DPLL s a WALKSAT algoritmusok futsi idinek
kzprtkt mutatja 100 kielgthet 3-CNF mondaton n = 50 mellett, a kritikus m/n
arny melletti szk svban.
12
Minden klz hrom vletlenszeren kivlasztott szimblumot tartalmaz, amelyek 50% valsznsggel negltak.
202
Logikai gensek
6. tletlogikt alkalmaz gensek

Ebben a szakaszban, sszeszednk mindent, amit eddig tanultunk, hogy olyan genseket konstruljunk, amelyek
az tletlogika felhasznlsval mkdnek. Ktfajta genst fogunk megvizsglni: olyat, amely kvetkeztetsi
algoritmust s egy tudsbzist hasznl, mint a 7.1. bra ltalnos tudsbzis gense, s olyat, amely a logikai
kifejezsek kirtkelst kzvetlenl, ramkrket alkalmazva vgzi. Mindktfajta genst a wumpus vilgban
fogjuk demonstrlni, s ltni fogjuk, hogy mindkett komoly htrnyoktl szenved.
6.1. Csapdk s wumpusok megtallsa logikai kvetkeztets

felhasznlsval
Kezdjnk egy genssel, amely kpes logikusan rvelni a csapdk s wumpusok helyvel s a biztonsgos
ngyzetekkel kapcsolatban. A feladat megoldsa a tudsbzis felrsval kezddik, amely reprezentlja a
wumpus vilg fizikjt. Az gens tudja, hogy az [1, 1] nem tartalmaz se csapdt, se wumpust, azaz C1,1 s
W1,1. Az gens minden [x, y] ngyzetre ismer egy mondatot, ami azt jelenti ki, hogy a szell honnan ered:
Sx,y (Cx,y+1 Cx,y1 Cx+1,y Cx1,y) (7.1)
Az gens minden [x, y] ngyzetre ismer egy mondatot, ami azt jelenti ki, hogy a bz hogyan ered:
Bx,y (Wx,y+1 Wx,y1 Wx+1,y Wx1,y) (7.2)
Vgl tudja, hogy pontosan egy wumpus van. Ezt kt rszben fejezzk ki. Elszr ki kell jelentennk, hogy
legalbb egy wumpus van:
W1,1 W1,2 W4,3 W4,4
Ezutn azt kell mondanunk, hogy legfeljebb egy wumpus van. Az egyik lehetsges mdja ennek, hogy minden
kt mezre kijelentjk, hogy a kt mez egyiknek wumpusmentesnek kell lennie. Ha n ngyzet van, akkor n(n
1)/2 mondatot kapunk, olyanokat mint a W1,1 W1,2. Egy 4 4-es vilg esetben, gy sszesen 64
klnbz szimblumot tartalmaz 155 mondattal kezdnk.
Az gensprogram, amelyet a 7.19. bra mutat, KIJELENTI a tudsbzisnak az sszes szell s bz rzetet.
(Ezenkvl frissti nhny hagyomnyos vltozjnak rtkt is, amelyek azt rzik, hogy az gens merre van
most s merre jrt korbban erre ksbb mg visszatrnk). Ezutn a program kivlasztja, hogy melyik cellt
nzze meg a peremen lvk kzl olyan ngyzetek kzl, amelyek szomszdosak valamelyik megltogatottal.
Egy peremen lv [x, y] cella bizonythatan biztonsgos, ha a (Ci,j Wi,j) mondat vonzata a tudsbzisnak.
A msodik legjobb dolog, ha egy cella lehetsges, hogy biztonsgos, amikor az gens nem tudja bizonytani,
hogy ott egy csapda vagy egy wumpus van azaz, hogy a (Ci,j Wi,j) nem vonzat.
A KRDEZ eljrsban lev maga utn vonzs szmtsa implementlhat a fejezetben korbban bemutatott a
mdszerek kzl brmelyikkel. Az IT-VONZAT? (7.10. bra) nyilvn nem praktikus, mivel fel kellene sorolni a
264 sort. A DPLL (7.16. bra) nhny milliszekundum alatt vgrehajtja a kvnt kvetkeztetst, leginkbb az
egysg-propagci heurisztiknak ksznheten. A WALKSAT szintn hasznlhat, a teljessg hinybl
szrmaz gyengesgeivel. A wumpus vilgokban, a modell megtallsnak kudarca, 10 000 csert felttelezve,
praktikusan megfelel a kielgthetetlensgnek, gy nem valszn, hogy hiba fordulhatna el a teljessg hinya
miatt.
7.19. bra - (Egy wumpusvilg-beli gens programja, amely tletkalkulust hasznl a

csapdk, a wumpusok s a biztonsgos ngyzetek azonostsra. Az TVONAL-PROBLMA
szubrutin ltrehoz egy keressi problmt, aminek megoldsa egy cselekvssorozat,
amely elvezet az [x, y] ngyzetbl az [i, j]-be, s csak korbban mr ltogatott
ngyzeteken vezet keresztl.
203
Logikai gensek
Az IK-WUMPUS-GENS igen jl mkdik kismret wumpus vilgban. Azonban mgis van valami ersen nem
megnyugtat az gens tudsbzisval kapcsolatban. A TB tartalmazza a fizikai lerst a (7.1) s (7.2) alak
egyenletek formjban minden egyes ngyzetre. Minl nagyobb a krnyezet, annl nagyobb kezdeti tudsbzisra
van szksg. Sokkal inkbb azt szeretnnk, hogy csak kt mondatunk lenne, amelyek kimondjk, hogy hogyan
is keletkezhet a szell vagy a bz brmely kockban. Ez mt tl van az tletkalkulus kifejezsi kpessgn. A
kvetkez fejezetben ltni fogunk egy nagyobb kifejezervel rendelkez logikai nyelvet, amelyben egyszer
lesz ilyen mondatot kijelenteni.
6.2. A hely s az irny nyomkvetse

A 7.19. bra gensprogramja csal, mert a helyzetnek nyomkvetst a tudsbzison kvl oldja meg, ahelyett
hogy logikai kvetkeztetst vgezne.13 Hogy helyesen oldjuk meg a nyomkvetst, szksgnk lesz az
elhelyezkedssel kapcsolatos lltsokra. Els hallsra hajlamosak lehetnk felvenni egy H1,1 szimblumot, ami
azt reprezentln, hogy az gens az [1, 1]-ben van. gy a kezdeti tudsbzis ilyen mondatokat tartalmazhatna:
H1,1 ArccalJobbra Halad H2,1
Azonnal lthatjuk, hogy ez nem fog mkdni. Ha az gens kiindul az [1, 1]-bl arccal jobbra s halad abban az
irnyban, akkor a tudsbzisbl kvetkezni fog a H1,1 (az eredeti elhelyezkeds) s a H2,1 (az j elhelyezkeds).
Mgsem lehet azonban mindkt llts igaz! A problma az, hogy az elhelyezkeds lltsoknak kt klnbz
idpontra kell vonatkozniuk. Szksgnk van egy
szimblumra, ami azt jelenten, hogy az gens az [1, 1]-
ben van az 1 idpontban, s egy

szimblumra, ami azt, hogy az gens a [2, 1]-ben van a 2 idpontban s
gy tovbb. Az irny s az cselekvs lltsoknak szintn fggenik kell az idtl. gy a helyes mondatok:
s gy tovbb. Az lthat, hogy igen gyesnek kell lennnk egy teljes s helyes tudsbzis felptshez, hogy
mindent nyomon kvessnk a wumpus vilgban; ennek teljes trgyalst elhalasztjuk a 10. fejezetig. A lnyeg,
amire itt r akartunk mutatni, hogy a kezdeti tudsbzis tartalmazni fog olyan mondatokat, mint az elz kt
plda, minden t idpontra s minden helyre is. Ami azt jelenti, hogy minden t idpontra s [x,y] helyre a
tudsbzis tartalmaz egy kvetkez formj mondatot:
A figyelmes olvas szreveszi, hogy ez megengedte szmunkra azt, hogy gyeskedjnk a nyers rzet, mint a Szell, s a helyspecifikus
llts, mint az S1,1, kztti kapcsolattal.
13
204
Logikai gensek
Mg akkor is, ha fels korltot szabunk a megengedett lpsek szmnak 100-at taln mondatok tzezreihez
jutunk. Ugyanez a problma merl fel, ha minden idlpshez is hozzadunk mondatokat, ahogy szksges. A
klzoknak ez az elburjnzsa olvashatatlann teszi szmunkra a tudsbzist, de a gyors tletkalkulus megoldk
mg gy is knnyen tudjk kezelni a 4 4-es wumpus vilgot (korltaikat a 100 100-as mret krl rik el).
Az ramkrre alapul gens, amit a kvetkez alfejezet mutat be, rszleges megoldst knl a klzok
elburjnzsnak problmjra, de a teljes megoldsra vrnunk kell, mg nem alkalmazzuk az elsrend logikt
majd a 8. fejezetben.
6.3. Az ramkrn alapul gens

Az ramkrn alapul gens (circuit-based agent) a reflexv gens egy llapottal rendelkez specilis fajtja,
mint ahogy ezt a 2. fejezetben definiltuk. Az rzetek egy sorrendi ramkr (sequential circuit) bemenetei,
amely sorrendi ramkr egy kapukbl (gates) ll hlzatbl, amelyek mindegyike egy logikai kapcsolatot
valst meg, s regiszterekbl (registers) pl fel, amelyek mindegyike az egyes lltsok igazsgrtkeit
trolja. Az ramkr kimenetei olyan regiszterek, melyek cselekvseknek felelnek meg pldul a Megragad
kimenet igaz-ra van lltva, ha az gens meg akar ragadni valamit. Ha a Csillogs bemenetet kzvetlenl
sszektjk a Megragad kimenettel, akkor az gens meg fogja ragadni a clt brmikor, ha ltja (lsd 7.20. bra).
7.20. bra - Egy ramkralap, wumpusvilg-beli gens egy rsze, a bemeneteket s a

kimeneteket mutatva, az arany megragadst megvalst ramkr, s az ramkr,
amely meghatrozza, hogy a wumpus l-e. A regisztereket ngyzet jelli, s a
ksleltetket kis hromszgek mutatjk.
Az ramkrket az adatfolyamok (dataflow) mintjra rtkeljk ki, minden idlpsben belltjuk a

bemenetet, s a jeleket vgigterjesztjk a hlzaton. Ha egy kapunak minden bemenete rendelkezsre ll,
ltrehoz egy kimenetet. Ez a folyamat kzeli kapcsolatban van az elrefel lncolssal s az S-VAGY
grfokkal, mint amilyen a 7.15. (b) brn lthat.
Az elz szakaszban azt lltottuk, hogy az ramkrn alapul gens az idt kielgtbb mdon kezeli, mint az
tletkalkulus kvetkeztets alap gens. Ez azrt lehet gy, mert egy regiszterben trolt vltoz rtke adja meg
a megfelel tletkalkulus szimblumnak az igazsgrtkt a pillanatnyi t idpontban, ahelyett hogy msolatok
lteznnek minden egyes idlpshez. Pldul lehetne egy lve regiszternk, amelynek igaz rtket kell
tartalmaznia, ha a wumpus letben van, s hamis-at, ha halott. Ez a regiszter az lvet tletkalkulus
szimblumnak felel meg, gy minden egyes idpillanatban egy klnbz tletlltsra vonatkozik. Az gens
bels llapotai pldul a memrija megrizhetek a regiszterek kimenetnek egy ksleltet soron (delay
line) keresztl trtn viszszacsatolsval. Ez a regiszter az elz lpshez tartoz rtket szolgltatja. A 7.20.
205
Logikai gensek
bra egy pldt mutat. Az lve rtkt a Sikoly negltjnak s az lve ksleltetett rtknek a konjunkcija adja.
lltsokban megfogalmazva ez a hlzat az lve fogalomra megvalstja a kvetkez ekvivalencit:
lvet Sikolyt lvet1 (7.4)
amely mondat azt mondja ki, hogy a wumpus a t idpontban akkor s csakis akkor l, ha nem szleltnk sikolyt
a t idpillanatban (egy t 1 idpontbeli sikoly alapjn) s lt a t 1 idpillanatban. Felttelezzk, hogy az
ramkrben az lve regiszter igazra van inicializlva. gy az lve igaz marad mindaddig, amg nincs egy sikoly,
amikor is hamiss vlik s a ksbbiekben hamis marad. Ez pont az, amit mi akarunk.
7.21. bra - Egy ramkr, amely meghatrozza, hogy az gens az [1, 1]-ben van-e.
Minden pozci s orientci regiszterhez egy hasonl ramkr csatlakozik.
Az gens helyzete nagyon hasonl mdon kezelhet, mint a wumpus halla. Szksgnk van egy Hx,y regiszterre
minden x-hez s y-hoz, s ennek az rtke igaz kell, hogy legyen, amikor az gens az [x, y]-ban van. Az
ramkr, amelyik belltja Hx,y rtkt azonban sokkal bonyolultabb, mint az lve ramkre. Pldul az gens az
[1, 1]-ben van a t idpontban, ha (a) az ott volt a t 1-ben s vagy nem haladt semerre, vagy megprblta, de
falnak tkztt; vagy (b) az [1, 2]-ben volt arccal lefel s haladt elrefel; vagy (c) a [2, 1]-ben volt arccal balra
s haladt elre:
A H1,1 hlzata a 7.21. brn lthat. Minden elhelyezkeds regiszterhez egy hasonl ramkr tartozik. A 7.13.
(b) feladatban azt krjk, hogy ksztsen ramkrt az irnyra vonatkoz lltsokhoz.
A 7.20. s 7.21. brkon lev ramkrk fenntartjk az lve s a Hx,y igazsgrtkt minden idpillanatban. Egy
ilyen ramkr ltal reprezentlt lltsok szokatlanok azonban abban az rtelemben, hogy a helyes
igazsgrtkeiket minden pillanatban meg tudjuk hatrozni. Tekintsk az elz helyett az S4,4 lltst: a [4,
4] ngyzet szells. Habr az lltsnak az igazsgrtke
rgztve van valamilyen rtken, az gens nem ismerheti az igazsgrtket mindaddig, amg meg nem ltogatja
a [4, 4] mezt (vagy ki nem kvetkezteti, hogy van egy szomszdos csapda). Az tletlogikt s az elsrend
logikt igaz, hamis s ismeretlen rtk lltsok automatikus reprezentlsra terveztk, de az ramkrket
nem: az S4,4 regiszternek tartalmaznia kell valamely rtket, vagy igaz vagy hamis rtket, mg mieltt az
igazsgot feltrjk. A regiszterbeli rtk lehet helytelen, s ez helytelen irnyba is vezetheti az genst. Ms
206
Logikai gensek
szavakkal, szksgnk volna hromfle lehetsges llapot reprezentlsra (S4,4 ismerten igaz, ismerten hamis
vagy nem ismert), s csak egy bitnk van arra, hogy megoldjuk ezt.
A megolds erre a problmra az, hogy hasznljunk kt bitet egy helyett. Az S4,4-et reprezentlja kt regiszter,
amelyeket K(S4,4)-nek s K(S4,4)-nek neveznk, ahol K jelli azt, hogy ismert. (Emlkezznk, hogy ezek mg
mindig csak sszetett nevekkel rendelkez szimblumok, mg akkor is, ha strukturlt kifejezsnek tnnek!) Ha
mind K(S4,4) s K(S4,4) hamis, akkor ez azt jelenti, hogy az S4,4 igazsgrtke nem ismert. (Ha mindkett igaz,
akkor hiba van a tudsbzisban!) Ebben a reprezentciban brmikor is hasznlnnk az S4,4-et a hlzat valamely
rszben, a K(S4,4)-et hasznljuk helyette; s brmikor hasznlnnk az S4,4-et, akkor a K(S4,4)-et hasznljuk.
ltalnossgban, minden potencilis hatrozatlan lltst kt tudslltssal (knowledge propositions)
reprezentlunk, kijelentve, hogy a vonatkoz llts ismerten igaz vagy ismerten hamis.
Hamarosan ltni fogunk egy pldt arra, hogyan kell alkalmaznunk a tudslltsokat. Elszr is, szksgnk
van annak kidolgozsra, hogy hogyan hatrozzuk meg maguknak a tudslltsoknak az igazsgrtkt.
Vegyk szre, hogy mikzben az S4,4-nek rgztett igazsgrtke volt, a K(S4,4) s K(S4,4) vltozik, mikzben az
gens egyre tbbet tud meg a vilgrl. Pldul a K(S4,4) hamis rtkrl indul, s igazz vlik, amint az S4,4-rl
meghatrozhat, hogy igaz azaz, amikor az gens a [4, 4]-be lp, s detektlja a szellt. Majd igaz marad
ezutn. gy megllapthat, hogy
Hasonl egyenlet rhat fel K(S4,4)t-re is.

Most, hogy az gensnek van mr ismerete a szells ngyzetekrl, foglalkozhat a csapdkkal is. Egy csapda
hinya az adott ngyzetben akkor s csakis akkor hatrozhat meg, ha valamelyik szomszdos ngyzetrl
ismert, hogy nem szells. Pldul ha ltezik
K(C4,4)t K(S3,4)t K(S4,3)t (7.7)
Egy csapda adott ngyzetben val jelenltnek a meghatrozsa sokkal nehezebb szellnek kell lennie egy
szomszdos ngyzetben, de olyan szellnek, amely nem egy msik csapda miatt keletkezett:
K(C4,4)t (K(S3,4)t K(C2,4)t K(C3,3)t) (7.8)
(K(S4,3)t K(C4,2)t K(C3,3)t)
Fontos
Mikzben egy kicsit zavaros a csapdk jelenltnek s hinynak bizonytsa az ramkrk hasznlata
esetben, az ramkr konstans szm kaput hasznl minden egyes ngyzethez. Ez a tulajdonsg
alapveten fontos ahhoz, hogy olyan ramkrn alapul genst ptsnk, amelynek bonyolultsga
kezelhet mdon n a problma mretvel. Ez valjban magnak a wumpus vilgnak a jellemzje; azt
mondjuk, hogy egy krnyezet lokalits (locality) tulajdonsgot mutat fel, ha igaz, hogy brmelyik
vizsgland llts igazsgnak meghatrozshoz csak egy konstans szm msik llts
megvizsglsa szksges. A lokalits tulajdonsg nagyon rzkeny a krnyezet pontos fizikjra.
Pldul az aknakeres trgyterlet (7.11. feladat) nemloklis, mert az akna egy adott ngyzetbeli
ltezsnek eldntse ignyelheti, hogy akrmilyen tvol lev ngyzetet is megnzznk. Nemloklis
trgyterletekre az ramkrre alapul gens alkalmazs nem mindig praktikus.
Van egy msik problma is, amely mellett eddig vatosan elmentnk: a hurokmentessg (acyclicity) krdse.
Az ramkrt hurokmentesnek tekintjk, ha minden olyan g, amely egy regiszter kimenett visszacsatolja a
bemenetre, tartalmaz legalbb egy kzbls ksleltet elemet. Megkveteljk, hogy minden ramkr
hurokmentes legyen, mivel a hurkokat tartalmaz ramkrk, mint fizikai eszkzk, nem mkdnek! Az ilyen
ramkr instabil oszcillciba kerlhet hatrozatlan rtkeket eredmnyezve. Pldaknt a hurkot tartalmaz
ramkrkre, tekintsk a (7.6) egyenletnek a kvetkez kibvtst:
K(S4,4)t K(S4,4)t1 (H4,4t Szellt) K(C3,4)t K(C4,3)t (7.9)
A hozzadott diszjunktok, a K(C3,4)t s a K(C4,3)t lehetv teszik az gens szmra, hogy a szell jelenltt
meghatrozza a szomszdos ngyzetekben lev csapdk jelenltbl, ami teljesen sszernek tnik. gy viszont
sajnos a szell tulajdonsg fgg a szomszdos csapdktl, s a csapdk fggenek a szomszdos ngyzetek szell
tulajdonsgtl, ahogy azt a (7.8) egyenlet lerja. Ezltal a teljes ramkr tartalmazna hurkot.
207
Logikai gensek
A nehzsg nem az, hogy a (7.9) egyenlet nem helyes. A problma inkbb az, hogy az egyenletek ltal
reprezentlt fggsgek sszekapcsolsa nem oldhat fel az igazsgrtkek propaglsnak egyszer
mechanizmusval a vizsglt logikai ramkrkben. A (7.6) egyenletet alkalmaz hurokmentes verzi, amely a
szellssget a kzvetlen megfigyelsekbl hatrozza meg, nem teljes abban az rtelemben, hogy bizonyos
pontokon az ramkralap gens kevesebbet tud, mint a teljes kvetkeztetsi eljrst alkalmaz
kvetkeztetsalap gens. Pldul ha van szell az [1, 1]-ben, a kvetkeztetsalap gens kpes arra a
megllaptsra jutni, hogy van egy szell a [2, 2]-ben, mg a (7.6) egyenletet hasznl, hurokmentes ramkrre
alapul gens erre nem kpes. Lehetsges pteni egy teljes ramkrt vgl is, szekvencilis ramkrk
kpesek emullni brmilyen digitlis szmtgpet , de ez jelentsen bonyolultabb volna.
6.4. sszehasonlts
A kvetkeztetsalap s az ramkrn alapul gensek a deklaratv s procedurlis megkzelts szlssges
esetei az gens tervezsben. Szmos szempont szerint sszehasonlthatjuk ket:
Tmrsg. Az ramkrn alapul gensnek, ellenttben a kvetkeztetsalap genssel, nincs szksge a
tudsnak nll msolataira minden idlpsben. Ehelyett, mindig csak a pillanatnyi s a megelz
idlpsre hivatkozik. A fizika lershoz mindkt gensnek szksge van minden egyes ngyzetre
vonatkoz msolatokra (mondatok vagy ramkrk formjban), s gy nem knny nagyobb krnyezeteket
lerni. Azokban a krnyezetekben, ahol szmos objektum sszetett kapcsolatait kell lerni, a kijelentsek
szma elraszt brmilyen tletkalkulus genst. Ezek a krnyezetek mr ignylik az elsrend logika
kifejezerejt (lsd 8. fejezet). Mindkt tpus tletkalkulus gens rosszul alkalmazhat egy biztonsgos
ngyzettel szomszdos helyre vezet tvonal megtallsnak kifejezsre vagy megoldsra. (Emiatt az IKWUMPUS-GENS keressi algoritmusokat alkalmaz.)
Szmtsi hatkonysg. A legrosszabb esetben a kvetkeztets idignye exponencilisan fgg a szimblumok
szmtl, mg az ramkr futtatsa az ramkr mrettl linerisan fgg idt ignyel (vagy a mlysgtl
linerisan fgg idt, ha fizikai eszkzknt megvalstjuk). Lthattuk azonban, hogy a gyakorlatban a DPLL
igen gyorsan elvgezte a szksges kvetkeztetseket.14
Teljessg. Azt sugalltuk korbban, hogy az ramkralap gens lehet, hogy nem teljes a ciklusmentessggel
kapcsolatos korltozs miatt. A teljessg hinynak okai azonban mg alapvetbbek. Elszr is,
emlkezznk, hogy az ramkr a mretvel linerisan arnyos idben oldja meg a feladatot. Ez azt jelenti,
hogy bizonyos krnyezetek esetben egy teljes ramkrnek (egy olyannak, amely minden meghatrozhat
lltshoz kiszmtja az igazsgrtket) exponencilisan nagyobbnak kell lennie, mint a kvetkeztetsalap
gens tudsbzisnak. Egybknt lenne mdszernk arra, hogy hogyan oldjuk meg az tletkalkulus vonzat
problmjt kisebb mint exponencilis id alatt, ami nagyon valszntlen. A msodik rv az gens bels
llapotainak a jellege. A kvetkeztetsalap gens emlkezik minden rzetre, s implicit vagy explicit mdon
ismer minden mondatot, ami az rzetekbl s a kezdeti adatbzisbl kvetkezik. Pldul ha adott S1,1 s ismeri
a C1,2 C2,1 lltst, abbl S2,2 kvetkezik. Ezzel szemben az ramkralap gens elfelejt minden korbbi
rzetet s csak a regiszterekben trolt egyedi lltsokra emlkszik. Ekkppen az els rzet utn a C1,2 vagy a
C2,1 nmagban ismeretlen marad, s gy semmilyen kvetkeztets nem vonhat le S2,2-re vonatkozan.
A ltrehozs egyszersge. Ez egy nagyon fontos krds, amelyet nehz pontosan megtlni. A knyv
szerzje szmra a fizika lersa bizonyra sokkal egyszerbb deklaratv ton, mikzben kismret,
hurokmentes, majdnem teljes ramkrk tervezse a csapdk megtallsra igen nehznek bizonyult.
sszefoglalva, gy tnik, hogy ltezik kompromisszum a szmtsi hatkonysg, a tmrsg, a teljessg s a
knny ltrehozs kztt. Ha az rzetek s a cselekvsek kztti kapcsolat egyszer mint a Ragyogs vagy a
Megragad kztti kapcsolat esetben az ramkr optimlisnak tnik. Ennl bonyolultabb kapcsolatok
esetben a deklaratv megkzelts jobb lehet. Egy olyan terleten, mint a sakk pldul, a deklaratv szablyok
tmrek s knnyen kdolhatk (legalbbis az elsrend logikban), de a tbla llapotaibl a lpseket
kzvetlenl szmt hlzat elkpzelhetetlenl hatalmas lenne.
Eltr dolgokat ltunk ezekkel a megkzeltsekkel kapcsolatban az llatok vilgban. Az egyszer
idegrendszerrel rendelkez kisebb llatok valsznleg hlzatalapak, mg a magasabb rend llatok gy tnik,
hogy explicit reprezentcikon kvetkeztetseket vgeznek. Ez lnyegesen bonyolultabb gensfunkcik
szmtst teszi lehetv szmukra. Az emberek szintn rendelkeznek ramkrkkel, amelyek a reflexeket
Valjban minden olyan kvetkeztets, amely megvalsthat egy ramkrrel, megoldhat lineris idben a DPLL-lel. Ez azrt van gy,
mert egy ramkr kirtkelse hasonlt az elrefel lncolshoz, amely emullhat DPLL-lel az egysg propagci szably alkalmazsval.
14
208
Logikai gensek
valstjk meg, s taln kpesek lefordtani (compile) deklaratv ismereteket ramkrkk, amikor bizonyos
kvetkeztetsek rutinn vlnak. Ily mdon egy hibrid gens (hybrid agent) tervezse (lsd 2. fejezet) lehet a
legjobb mindkt vilg szmra.
7. sszefoglals
Bevezettk a tudsbzis gens tlett, s megmutattuk, hogy hogyan tudunk olyan logikt definilni, amellyel
az gens kpes kvetkeztetni a vilgrl. A legfontosabb pontok a kvetkezk:
Az intelligens gensnek szksge van tudsra a vilgrl, hogy j dntseket hozhasson.
A tudst az gens egy tudsbzisban (knowledge base) egy tudsreprezentcis nyelv (knowledge
represantion language) mondatainak (sentences) formjban trolja.
Egy tudsbzis genst a tudsbzis s a kvetkeztetsi mechanizmus alkotja. Mkdsnek lnyege, hogy a
tudsbzisban a vilgot ler mondatokat trol s kvetkeztetsi mechanizmust alkalmaz j mondatok
kvetkeztetsre, majd felhasznlja ezeket cselekvsek meghatrozsra.
Egy reprezentcis nyelvet szintaxisa (syntax) s szemantikja (semantics) definil. A szintaxis a mondatok
struktrjt hatrozza meg, a szemantika a mondatok igazsgt (truth) hatrozza meg minden lehetsges
vilgban (world) vagy modellben (model),
A mondatok kztti vonzat (entailment) kapcsolatnak alapveten fontos szerepe van a kvetkeztets
megrtsben. Egy mondat maga utn vonz egy msik mondatot, ha igaz minden vilgban, ahol igaz.
Ezzel ekvivalens defincik az mondat rvnyessgt (validity) s a mondat
kielgthetetlensgt (unsatisfiability) meghatroz defincik.
A kvetkeztets az a folyamat, amivel j mondatok vezethetk le rgiekbl. A helyes (sound) kvetkeztetsi
algoritmusok csak vonzat mondatokat vezetnek le; a teljes (complete) algoritmus az sszes kvetkezmnyt
levezeti.
Az tletkalkulus (propositional logic) egy nagyon egyszer nyelv, amely tlet-szimblumokbl
(proposition symbols) s logikai sszektjelekbl (logical connectives) ll. Kpes kezelni olyan
lltsokat, amelyekrl tudjuk, hogy igazak, tudjuk, hogy hamisak, vagy teljesen ismeretlen az
igazsgrtkk.
Ha adott egy tletkalkulus szimblumsztr, akkor a lehetsges modellek szma vges, gy a vonzatok
ellenrzse trtnhet a modellek felsorolsval is. Hatkony tletkalkulus modellellenrz (model
checking) algoritmusok tbbek kztt viszszalpses vagy loklis keressi eljrsokat alkalmaznak,
amelyekkel gyakran nagymret problmkat is nagyon gyorsan meg tudnak oldani.
A kvetkeztetsi szablyok (inference rules) helyes kvetkeztetsi mintk, amelyeket felhasznlhatunk
bizonytsok megtallshoz. A rezolci (resolution) szably teljes kvetkeztetsi algoritmust biztost olyan
tudsbzisokhoz, amelyek konjunktv norml formban (conjunctive normal form) vannak kifejezve. Az
elrefel lncols (forward chaining) s a htrafel lncols (backward chaining) igen termszetes
rvelsi algoritmusok Horn-formban (Horn form) adott tudsbzisokon.
Ktfajta genst lehet pteni az tletkalkulus alkalmazsra: a kvetkeztetsalap gens (inference-based
agent) kvetkeztetsi algoritmusokat hasznl a vilg esemnyeinek kvetsre, s kpes rejtett jellemzket is
levezetni, mg az ramkrn alapul gens (circuit-based agent) az lltsokat regiszterek bitjeiknt
reprezentlja, s jelek logikai ramkrkben trtn terjesztsvel vgzi ezek frisstst.
Az tletkalkulus meglehetsen hatkony bizonyos feladatokra egy gensben alkalmazva, de kezelhetetlen
nemkorltos mret krnyezetekben, mivel hinyzik a megfelel kifejez er az id, a tr s az objektumok
kztti kapcsolatok ltalnos mintinak lersra.

John McCarthy cikke a Programs with Common Sense (McCarthy, 1958, 1968) tette hress az gens
fogalmt, egy olyan programt, amely az rzetek s cselekvsek sszekapcsolsra logikai kvetkeztetst
hasznl. A cikk kitzte a deklarativizmus zszljt, megmutatva, hogy szoftverek rsnak igen elegns
209
Logikai gensek
mdszere az, ha a szksges ismereteket kzljk az genssel. Allen Newell cikke (1982) a The Knowledge
Level trgyalja azt a megkzeltst, hogy racionlis gensek lerhatk s elemezhetk egy absztrakt szinten,
ami az ltaluk birtokolt tudst s nem azt a programot definilja, amit futtatnak. A mestersges intelligencia
deklaratv s procedurlis megkzeltseit hasonltja ssze Boden (Boden, 1977). A vitt, msok mellett Brooks
(Brooks, 1991) s Nilsson (Nilsson, 1991) rsai lesztettk fel jra.
Magnak a logiknak az eredete az si grg filozfiban s matematikban tallhat. Szmos logikai alapelv
a mondatok szintaktikus struktrjnak sszektse az igaz vagy hamis jellegkkel, a jelentskkel, a bennk
megjelen argumentumok rvnyessgvel elszrt helyeken megtallhat Platn mveiben. Arisztotelsz
ksztette az els ismert, rendszerezett munkt a logikrl. Munkjt dikjai gyjtttk ssze halla utn, i. e.
322-ben az Organon c. tanulmnyban. Arisztotelsz szillogizmusai (syllogisms) olyan logikai lltsok voltak,
amelyeket ma kvetkeztetsi szablyoknak neveznnk. Habr a szillogizmus tartalmazott elemeket, mind a
propozcis, mind az elsrend logikbl, a rendszer, mint egsz, igen gyengnek szmt a modern kvnalmak
szerint. Nem tette lehetv tetszleges komplexits mondatok ltrehozst a kvetkeztetsi mintkban, mint a
modern tletlogika.
A hasonl Megara s sztoikus iskolk (az i. e. 5. szzadban indultak, s tbb szz ven keresztl mkdtek)
vezettk be az implikcit s ms alapvet szerkezeteket, amelyeket ma is hasznlunk a modern tletlogikban.
Logikai sszektjelek definilsra vezette be az igazsgtbla hasznlatt Philn s Megara. A sztoikusok t
alapvet kvetkeztetsi szablyt hasznltak, amelyeket igazols nlkl rvnyesnek tartottak, kztk azt a
szablyt, amelyet ma Modus Ponensnek nevezznk. Szmos szablyt vezettek le ebbl az tbl, felhasznlva
tbbek kztt a dedukci elmletnek alapelvt 4. szakasz - Az tletkalkulus kvetkeztetsi minti rszben, s
sokkal tisztbban hasznltk a bizonyts fogalmt, mint azt Arisztotelsz tette. A sztoikusok azt lltottk, hogy
az logikjuk teljes abban az rtelemben, hogy tartalmaz minden rvnyes kvetkeztetst, de ami fennmaradt
munkjukbl, az tlsgosan tredkes ahhoz, hogy elemezhet legyen. A Megara s a sztoikus logikk
trtnetnek, mr amennyire ezek ismertek, j beszmoljt ksztette el Benson Mates (Mates, 1953).
Wilhelm Leibniztl (16461716) szrmazik a mestersges formlis nyelvi mintk ltrehozsnak tlete a logikai
kapcsolatok tisztzsnak s a logikai kvetkeztets egy tisztn formlis s mechanikus folyamatt val
egyszerstse cljbl. Leibniz sajt matematikai logikja azonban igencsak tkletlen volt, s r inkbb
ezeknek a gondolatoknak mint clkitzseknek a bevezetsrt s nem e clok megvalstsra tett ksrletei
miatt emlkeznk.
George Boole vezette be els igazn tfog s mkdkpes formlis logikai alap rendszert a The
Mathematical Analysis of Logic c. knyvben (Boole, 1847). Boole logikjnak modellje kzel llt a vals
szmok algebrjhoz, s elsdleges kvetkeztetsi mdszerknt a logikailag ekvivalens mondatok
helyettestst hasznlta. Br Boole rendszere csak tredke volt a teljes tletkalkulusnak, elg kzel volt
ahhoz, hogy a 19. szzad szerzi Boole-t kvetve hamar kitltsk a hinyz rszeket. Schrder definilta
(Schrder, 1877) a konjunktv norml formt, mg a Horn-formt sokkal ksbb Alfred Horn (Horn, 1951)
vezette be. A modern tletkalkulus (s elsrend logika) els tfog bemutatsa Gottlob Frege Begriffschrift
(Az rs fogalma vagy Fogalmi jells) c. knyvben (Frege, 1879) tallhat.
Az els mechanikai eszkzt, amely logikai kvetkeztetst vgzett, Stanhope harmadik grfja (17531816)
ksztette. A Stanhope Demonstrator kpes volt szillogizmusokat kezelni s bizonyos valsznsgi
kvetkeztetseket vgezni. Wiliam Stanley Jevons egyike azoknak, akik tovbbfejlesztettk s kiegsztettk
Boole munkjt 1869-ben a Boole-logikn alapul kvetkeztetsek vgrehajtsra megptette a logical
pian-jt. Ezeknek s ms korai kvetkeztetsre ksztett mechanikus eszkzknek szrakoztat s tanulsgos
trtnete Martin Gardner (Gardner, 1968) munkjban olvashat. Az els logikai kvetkeztetst vgz, publiklt
szmtgpes program a Logic Theorist volt, amelyet Newell, Shaw s Simon (Newell, Shaw s Simon, 1957)
ksztettek. Ezt a programot az emberi gondolkods modellezsre szntk a szerzk. Br Martin Davis (Davis,
1957) tervezett egy programot, ami bizonythatan 1954-ben kszlt, de a Logic Theorist eredmnyeit korbban
publikltk. Mind Davis 1954-es programja, mind a Logic Theorist rszben ad hoc mdszerekre plt, amelyek
nem voltak jelents hatssal a ksbbi automatikus dedukcis rendszerekre.
Az igazsgtblknak, mint az tletkalkulus nyelvben az rvnyessgnek vagy a mondat
kielgthetetlensgnek a tesztjt egymstl fggetlenl Ludwig Wittgenstein (1922) s Emil Post (1921)
vezettk be. A harmincas vekben jelents haladst rtek el az elsrend logika kvetkeztetsi mdszereinek
tern. Nevezetesen, Gdel megmutatta (Gdel, 1930), hogy az elsrend logikban trtn kvetkeztetsre egy
teljes eljrst lehet kapni az tletlogikra trtn redukcival, felhasznlva Herbrand elmlett (Herbrand,
1930). A 9. fejezetben jra ttekintjk ennek trtnett, itt most a lnyeges pont az, hogy a hatvanas vekben, a
hatkony tletkalkulus algoritmusok fejlesztsben a matematikusok rdekldst jelents mrtkben motivlta
210
Logikai gensek
az a cl, hogy hatkony ttelbizonytt ksztsenek az elsrend logika szmra. A DavisPutnam-algoritmus

(Davis s Putnam, 1960) volt az els hatsos algoritmus az tletkalkulus rezolci megvalstsra, de a
legtbb esetben ez is sokkal kevsb hatkony, mint a DPLL visszalpses algoritmus, amelyet kt vvel ksbb
mutattak be (1962). A teljes rezolcis szably s a rezolci teljessgnek bizonytsa J. A. Robinson
(Robinson, 1965) nagyhats tanulmnyban jelent meg, ami azt is megmutatta, hogyan lehet elsrend logikai
kvetkeztetst vgezni tletkalkulus technikk ignybevtele nlkl.
Stephen Cook (Cook, 1971) mutatta meg, hogy a kielgthetsg eldntse az tletlogikban NP-teljes. Mivel a
vonzat meghatrozsa ekvivalens a kielgthetetlensg eldntsvel, ez is NP-teljes. Az tletlogika szmos
rszhalmaza ismert, amelyrl tudjuk, hogy bennk a kielgthetsg problmja polinomilis idben
megoldhat. A Horn-klzok az egyik ilyen rzhalmaz. A Horn-klzokon mkd, lineris idben fut
elrelncolsi algoritmust Dowlingnak s Galliernek (Dowling s Gallier, 1984) ksznhetjk, akik az
algoritmusokat egy adatfolyam-eljrsknt rtk le, hasonlan a jelek terjedshez az ramkrkben. A
kielgthetsg ellenrzse alapvet mdszerr vlt a problmk NP-teljessgnek vizsglatban; pldul Kaye
(Kaye, 2000), megmutatta, hogy az Aknakeres jtk (lsd 7.11. feladat) NP-teljes.
Szmos szerz prblkozott loklis keressi algoritmusokat hasznlni a kielgthetsg eldntsre a nyolcvanas
vekben. Minden ilyen algoritmus a kielgthetetlen klzok szmnak minimalizlsnak elvn (Hansen s
Jaumard, 1990) alapult. Klnlegesen hatkony algoritmust fejlesztett ki Gu (Gu, 1989), s tle fggetlenl
Selman s trsai (Selman s trsai, 1992), amelyet ez utbbi szerzk GSAT-nak neveztek el, s megmutattk,
hogy az algoritmus kpes nehz problmk szles krt igen gyorsan megoldani. A WALKSAT algoritmust,
amelyet ebben a fejezetben bemutattunk, szintn Selma s trsai publikltk (1996).
A fzistmenet ltezst a vletlen k-SAT problmk kielgthetsgben elszr Simon s Dubois (Simon s
Dubois, 1989) figyeltk meg. Crawford s Auton tapasztalati eredmnyei (Crawford s Auton, 1993) azt
sejtettk, hogy nagymret, vletlenszer 3-SAT problmk esetn ez az tmenet a 4,24-es klz/vltoz arny
krnykn van. Cikkk szintn bemutat egy hatkony DPLL megvalstst. Bayardo s Schrag lert egy msik,
knyszer-kielgtsi technikkat alkalmaz hatkony DPLL megvalstst (Bayardo s Schrag, 1997).
Moskewicz s trsai publikltk a CHAFF algoritmust (Moskewicz s trsai, 2001), amely milli vltozs
hardververifikcis problmkat kpes megoldani, s amely megnyerte a SAT 2002 versenyt. Li s Anbulagan
gyors problmamegoldkat lehetv tev egysgpropagcin alapul heurisztikkat trgyalt (Li s Anbulagan,
1997). Cheeseman s trsai (1991) szmos hasonl problmrl adtak adatokat, s megfogalmaztk azt a
feltevst, hogy minden NP-teljes problmnak van llapottmenete (Cheeseman s trsai, 1991). Kirkpatrick s
Selman mdszereket mutattak arra (Kirkpatrick s Selman, 1994), hogy a statisztikus fizika technikit hogyan
lehet alkalmazni a fzistmenetek pontos alakjnak jobb megrtshez. Az tmenetek helynek
meghatrozsra vonatkoz elmleti vizsglatok igen gyengk: az egyetlen, amit sikerlt bizonytani, hogy az
tmenet a [3,003 4,598] tartomnyba esik a vletlen 3-SAT problmknl. Cook s Mitchell kivl ttekintst
ksztettek ezekrl s szmos ms kielgthetsggel kapcsolatos tma eredmnyeirl (Cook s Mitchell, 1997).
Korai elmleti kutatsok megmutattk, hogy a DPLL tlagos komplexitsa polinomilis a problmk egy
bizonyos termszetes eloszls kreire. Ez a potencilisan rdekes tny kevsb izgalmass vlt, miutn Franco
s Paull megmutattk, hogy ugyanezek a problmk konstans idben megoldhatk egyszeren tallgatssal,
ahol vletlen hozzrendelsekkel dolgozunk (Franco s Paull, 1983). A vletlen generl mdszer, amelyet a
fejezetben bemutattunk, sokkal nehezebb problmkat hoz ltre. Az ilyen, a problmkon loklis keresssel elrt
tapasztalati sikerek ltal motivlva, Koutsoupias s Papadimitriou megmutatta, hogy egy egyszer hegymsz
algoritmussal nagyon gyorsan megoldhat szinte minden kielgthetsgi problma pldny (Koutsoupias s
Papadimitriou, 1992), ami azt sugallja, hogy a nehz problmk ritkk. Mi tbb, Schning bejelentett (Schnig,
1999) egy vletlen elemeket tartalmaz GSAT vltozatot, amelynek a legrosszabb esetre szmtott vrhat
futsi ideje 3-SAT problmkon 1,333n ami mg mindig exponencilis, de lnyegesen gyorsabb, mint a
korbbi legrosszabb esetkorltok. A kielgthetsgi algoritmusok ma is igen aktv terlett kpezik a
kutatsoknak; Du s trsai cikkgyjtemnye (Du s trsai, 1999) j kiindulsi pontot jelent.
Az ramkralap gensek gondolata visszavezethet McCulloch s Pitts nagyhats cikkre (McCulloch s
Pitts, 1943), amely a neurlis hlzatok tmakr kezdett jelentette. Npszer vlekedsekkel szemben a cikk
valjban logikai ramkralap gensterveknek az agyban trtn megvalstsval foglalkozott. Azonban az
ramkralap gens kis figyelmet kapott a mestersges intelligenciban. A leginkbb megjegyzend kivtel
Stan Rosenschein munkja (Rosenschein, 1985; Kaelbling s Rosenschein, 1990), aki mdszert dolgozott ki
ramkralap gensek lefordtsra a feladat krnyezetnek deklaratv lersra. A regiszterekben trolt
lltsok frisstsnek mdszere kzeli kapcsolatban van a Reiter ltal az elsrend logikra kifejlesztett kvet
llapot aximhoz (successor-state axiom) (Reiter, 1991). Rod Brooks munkja (1986, 1989) demonstrlta az
ramkralap megvalstsok hatkonysgt robotok vezrlsre a 25. fejezetben foglalkozunk ezzel a
211
Logikai gensek
tmval. Brooks amellett rvelt (Brooks, 1991), hogy az ramkralap gensen kvl ms nem is szksges a
mestersges intelligencihoz mivel ms mdszerek nehzkesek, drgk s szksgtelenek. A mi nzetnk
szerint, egyik mdszer sem elgsges nmagban.
A wumpus vilgot Gregory Yob (Yob, 1975) tallta ki. Nmi irnival, Yob azrt fejlesztette ki, mert unta
azokat a jtkokat, amelyeket egy rcson jtszanak: az eredeti wumpus vilg dodekader alak volt, mi
helyeztk vissza a rgi unalmas ngyzetrcsba. Michael Genesereth javasolta elszr, hogy a wumpus vilgot az
gensek tesztkrnyezeteknt alkalmazzuk.
7.2. Feladatok
7.1.
rja le a wumpus vilgot a 2. fejezetben felsorolt feladatkrnyezetek tulajdonsgainak felhasznlsval.
7.2.
Tegyk fel, hogy az gens eljutott a 7.4. (a) bra szerinti llapotba, gy, hogy nem rzett semmit az [1, 1]-ben,
szellt rzett az [2, 1]-ben s bzt az [1, 2]-ben, s most vizsglja az [1, 3], [2, 2] s [3, 1] ngyzetek tartalmt.
Ezek brmelyike tartalmazhat csapdt, s legfeljebb az egyik tartalmazhatja a wumpust. A 7.5. bra pldjt
kvetve hozza ltre a lehetsges vilgokat (32 ilyet kell tallnia). Jellje meg azokat a vilgokat, amelyekben a
TB igaz, s azokat, amelyekben a kvetkez mondatok igazak:
2 = Nincsen csapda a [2, 2]-ben
3 = Az [1,3]-ban wumpus van
Mutassa meg ezenkvl, hogy TB 2 s TB 3.

7.3.
Tekintsk azt a problmt, hogy hogyan dnthet el egy tletkalkulus mondat igazsga egy adott modellben.
a. rjon egy IK-IGAZ?(s, m) rekurzv programot, amely akkor s csakis akkor ad vissza igazat, ha az s mondat
igaz az m modellben (ahol m minden s szimblumhoz egy igazsgrtket rendel). Az algoritmusnak a mondat
mretvel linerisan vltoz idben kell futnia. (Hasznlhatja ennek a fggvnynek egy vltozatt az online
kdtrbl.)
b. Adjon hrom pldt olyan mondatokra, amelyekrl meghatrozhat, hogy igazak vagy hamisak egy rszleges
modellben, amely nem specifiklja minden szimblum igazsgrtkt.
c. Mutassa meg, hogy egy rszleges modellben egy mondat igazsgrtke (ha van ilyen) ltalnossgban nem
hatrozhat meg hatkonyan.
d. Mdostsa az IK-IGAZ? algoritmust gy, hogy nha rszleges modell alapjn is meg tudjon hatrozni
igazsgrtkeket s kzben tartsa meg a fggvny igazsgrtkt s lineris futsi idejt. Adjon meg hrom
pldt olyan mondatokra, amelyek igazsgrtkt a rszleges modellben nem llaptja meg az algoritmus.
e. Vizsglja meg, hogy a mdostott algoritmus hatkonyabb teszi-e az IT-VONZAT? eljrst.
7.4.
Bizonytsa be a kvetkez lltsokat:
a. akkor s csakis akkor rvnyes, ha Igaz .
b. Brmilyen -ra Hamis .
c. akkor s csakis akkor, ha az ( ) mondat rvnyes.
d. akkor s csakis akkor, ha az ( ) mondat rvnyes.
e. akkor s csakis akkor, ha az ( ) mondat kielgthetetlen.
212
Logikai gensek
7.5.
Vegynk egy sztrat, amelyben csak ngy tletkalkulus llts ltezik, az A, B, C s D. Hny modellje ltezik a
kvetkez mondatoknak?
a. (A B) ( B C )
b. A B
c. A B C
7.6.
Definiltunk 4 binris logikai sszektjelet.
a. Lteznek-e mg tovbbiak, amelyek hasznosak lehetnek?
b. Hny binris sszektjel lehetsges?
c. Mirt nem tlsgosan hasznos kzlk nhny?
7.7.
Egy szabadon vlasztott mdszer felhasznlsval igazolja a 7.11. bra ekvivalenciit.
7.8.
Vizsglja meg a kvetkez mondatokat, s dntse el mindegyikre, hogy rvnyesek, kielgthetetlenek, vagy
egyik sem. Igazolja a dntst igazsgtblval, vagy felhasznlva a 7.11. bra ekvivalencia szablyait. Van-e
olyan, amit elsre eltvesztett?
a. Fst Fst
b. Fst Tz
c. (Fst Tz) (Fst Tz)
d. Fst Tz Tz
e. ((Fst Hsg) Tz) ((Fst Tz) (Hsg Tz))
f. (Fst Tz) ((Fst Hsg) Tz)
g. Nagy Hallgatag (Nagy Hallgatag)
h. (Nagy Hallgatag) Hallgatag
7.9.
(Barwise s Etchemendy, 1993 alapjn) Be tudja-e bizonytani, hogy az unikornis mitikus, ha adottak az
albbiak? Mit mondhatunk a mgikussgrl? Van-e szarva?
Ha az unikornis mitikus, akkor halhatatlan, de ha nem halhatatlan, akkor egy haland emls. Ha az unikornis
vagy halhatatlan, vagy emls, akkor van szarva. Az unikornis mgikus llat, ha van szarva.
7.10.
Minden logikai mondat logikailag ekvivalens azzal az lltssal, hogy minden lehetsges vilg, amelyben hamis
volna, nem az eset. Felhasznlva ezt a megfigyelst, bizonytsa be, hogy minden mondat trhat konjuglt
normlt formra.
7.11.
213
Logikai gensek
Az ismert szmtgpes jtk, az Aknakeres igen hasonl a wumpus vilghoz. Az aknakeres vilg egy N
ngyzetet tartalmaz ngyzetes rcs, amelyek kzl M elszrtan elhelyezked ngyzet lthatatlan aknt takar.
Minden ngyzetet megprblhat az gens, de azonnali halllal lakol, ha ott egy aknt tall. Az Aknakeres jtk
minden kiprblt ngyzetben felfedi, hogy hny kzvetlenl vagy tlsan szomszdos ngyzetben van akna,
ezzel mutatva az aknk jelenltt. A cl az, hogy minden aknt nem tartalmaz ngyzetet megprbljunk.
a. Legyen Xi,j igaz akkor s csakis akkor, ha az [i, j] tartalmaz egy aknt. rja le az Xi,j szimblum logikai
kombincijt tartalmaz mondattal azt a kijelentst, hogy pontosan kt akna szomszdos az [1,
1]gyel.
b. ltalnostsa az (a)-beli kijelentst megmutatva, hogy hogyan hozhat ltre konjuglt norml formj
mondat annak kifejezsre, hogy az n szomszdos ngyzetbl k ngyzet tartalmaz aknt.
c. Magyarzza meg pontosan, hogy hogyan hasznlhat egy gens DPLL algoritmust annak bizonytsra, hogy
egy adott ngyzet tartalmaz (vagy nem tartalmaz) aknt, figyelmen kvl hagyva azt a globlis korltot, hogy
pontosan M akna van sszesen.
d. Tegyk fel, hogy a globlis korlt a (b) feladatrszben megfogalmazott mdon van ltrehozva. Hogyan fgg
a klzok szma M-tl s N-tl? Javasoljon egy mdostst a DPLL algoritmushoz, amellyel a globlis
korltot nem kell explicit mdon reprezentlni.
e. Van-e olyan a (c) feladatrszben definilt eljrs ltal ellltott kvetkezmny, amely rvnytelenn vlna,
ha figyelembe vennnk a globlis knyszert?
f. Mutasson pldt olyan lehetsges konfigurcikra, amelyek tvoli fggsgeket idznek el, olyanokat, ahol
egy ki nem prblt ngyzet tartalma tvoli ngyzetek tartalmrl ad informcit. [Segtsg: vizsgljon meg
egy N 1-es tblt.]
7.12.
Ez a feladat a klzok s az implikcis mondatok kztti kapcsolatot vizsglja.
a. Mutassa meg, hogy a (P1 Pm Q) klz logikailag ekvivalens a (P1 Pm Q) implikcis
mondattal.
b. Mutassa meg, minden klz (fggetlenl a pozitv literlok szmtl) felrhat (P1 Pm) (Q1
Qm) alakban, ahol P-k s Q-k tletkalkulus szimblumok. Az ilyen mondatokat tartalmaz tudsbzist
implikatv norml formjnak (implicative normal form) vagy Kowalski formjnak (Kowalski form)
nevezzk.
c. rja le a teljes rezolcis szablyt implikatv norml formj mondatokra.
7.13.
Ebben a feladatban tervezze tovbb az ramkrn alapul wumpus genst.
a. rjon egy a (7.4) egyenlethez hasonl egyenletet a Nyl kijelentshez, amelynek igaznak kell lennie, amikor
az gensnek mg van nyla.
b. Ismtelje meg az (a) feladatot egy ArccalJobbra kijelentsre, ahol hasznlja fel a (7.5) egyenletet modellknt.
c. Ksztsen vltozatokat a (7.7) s (7.8) egyenletekre a wumpus megtallshoz, s rajzolja fel az ramkrt.
7.14.
Elemezze, hogy mit is jelent az optimlis viselkeds a wumpus vilgban! Mutassa meg, hogy az IT-WUMPUSGENS defincija nem optimlis, s tegyen javaslatot a fejlesztsre!
7.15.
Bvtse ki az IT-WUMPUS-GENS-t gy, hogy kpes legyen folyamatosan kvetni a relevns tnyeket a
tudsbzisban!
214
Logikai gensek
7.16.
Mennyi ideig tart a DPLL szmra a bizonytsa, ahol egy literlis, amelyet mr tartalmaz a TB? Adjon
magyarzatot!
7.17.
Kvesse a DPLL viselkedst a 7.15. brn lert tudsbzison, amikor Q-t prbljuk meg bizonytani, s
hasonltsa ssze ezt a mkdst az elrefel lncolsi algoritmussal.
215
8. fejezet - Elsrend logika

Ebben a fejezeteben a vilg objektumait s ezek kapcsolatait vizsgljuk meg, s megprblunk rvelni ezek
felhasznlsval.
A 7. fejezetben megmutattuk, hogy egy tudsbzis gens hogyan kpes reprezentlni az t krlvev vilgot,
s hogyan vezeti le a vgrehajtand cselekvseket. Reprezentcis nyelvknt az tletkalkulust alkalmaztuk,
mert ez elgsges volt a logika s a tudsbzis gensek alapvet tulajdonsgainak lershoz. Sajnos az
tletkalkulus nyelvezete tlsgosan korltos ahhoz, hogy sszetett krnyezetekrl szerzett tudst megfelel
mdon reprezentljon. Ebben a fejezetben az elsrend logikt1 (first-order logic) vizsgljuk, amelynek
kifejezereje elgsges ahhoz, hogy a jzan sszel felfoghat tudsunk nagy rszt reprezentlja. Ezenkvl az
elsrend logika sok ms reprezentcis nyelvet magban foglal, vagy alapjt kpezi, s hossz vtizedek ta
vizsglatok trgya. A 8.1. alfejezetben a reprezentcis nyelvek ltalnos bemutatsval kezdnk; a 8.2.
alfejezetben az elsrend logika szintaxist s szemantikjt trgyaljuk; a 8.3. s 8.4. alfejezet lerja az
elsrend logika hasznlatt egyszer reprezentcik esetn.
1. Mg egyszer a reprezentcirl
Ebben az alfejezetben a reprezentcis nyelvek termszett vizsgljuk. Megllaptsaink be fogjk mutatni az
elsrend logika fejlesztsnek szksgessgt, ami egy lnyegesen nagyobb kifejezervel rendelkez nyelv,
mint a 7. fejezetben bemutatott tletkalkulus. Megnzzk majd, hogy az tletkalkulus s msfajta nyelvek mire
kpesek, s mire nem. A krdst itt csak felletesen trgyaljuk, nhny bekezdsbe srtve vszzadok
gondolatait, ksrletezseit s kudarcait.
A programnyelvek mint pldul a C++, a Java vagy a Lisp a hasznlatban lv formlis nyelvek messze
legnagyobb csoportjt alkotjk. A programok nmagukban, sz szerinti rtelemben, csak szmtsi folyamatokat
reprezentlnak. A programokon belli adatstruktrk tnyeket reprezentlhatnak; pldul egy program
hasznlhatja a 4 4-es ngyzetrcs-elrendezst a wumpus vilg elemeinek reprezentlshoz. gy teht az a
programnyelvi llts, hogy Vilg[2, 2] Csapda viszonylag termszetes mdja annak a kijelentsnek, hogy
van egy csapda a [2, 2] ngyzetben. (Az ilyesfajta reprezentcikat ad hoc jellegnek vlhetjk; az
adatbzisrendszereket pontosan azrt fejlesztettk ki, hogy ltalnosabb, trgyterlet-fggetlen mdjt
biztostsk a tnyek trolsnak s visszakeressnek.) A programnyelvek hinyossga, hogy nem rendelkeznek
ltalnos mechanizmussal arra, hogy tnyeket ms tnyekbl levezessenek; az adatstruktra minden frisstse
egy trgyterlet-specifikus eljrs segtsgvel trtnik, amelynek rszleteit a programoz vezeti le a
trgyterletrl meglv ismereti alapjn. Ez a procedurlis (procedural) megkzelts szembellthat az
tletkalkulus deklaratv (declarative) termszetvel, amelyben a tuds s az interferencia klnll fogalmak,
a kvetkeztets pedig teljes mrtkben trgyterletfggetlen.
A programok adatstruktrinak (s gy az adatbzisoknak is) a msik htrnya annak a kpessgnek a hinya,
hogy egyszeren lehessen kijelenteni pldul azt, hogy Van egy lyuk a [2, 2]-ben vagy a [3, 1]-ben, vagy azt,
hogy Ha a wumpus az [1, 1]-ben van, akkor nincs a [2, 2]-ben. A programok egyetlen rtket tudnak trolni
minden vltozhoz, nhny rendszer lehetv teszi azt is, hogy az rtk ismeretlen legyen, de hinyzik
bellk a rszinformcik kezelshez szksges kifejezer.
Az tletkalkulus egy deklaratv nyelv, mivel szemantikja mondatok s a lehetsges vilgok kztti
igazsgrelcikon alapul. Elgsges a kifejezereje ahhoz is, hogy rszinformcikat kezeljen, diszjunkcik
vagy negcik hasznlatval. Az tletkalkulusnak ezeken kvl egy harmadik tulajdonsga is van, ami
kvnatos a reprezentcis nyelvek esetben, nevezetesen a kompozcis kpessg (compositionality). Egy
kompozcis nyelvnl a mondat jelentse a mondatrszek jelentsnek a fggvnye. Pldul, a B1,4 B1,2
kapcsolatban van a B1,4 s a B1,2 jelentsvel. Nagyon furcsa lenne, ha a B1,4 azt jelenten, hogy az [1, 4]-es
ngyzet bds, s a B1,2 azt jelenten, hogy az [1, 2]-es ngyzet bds, de a B1,4 B1,2 mr azt jelenten,
hogy Franciaorszg s Lengyelorszg dntetlent jtszott a mlt heti jgkorong-selejtez mrkzsen.
Egyrtelm teht, hogy a kompozcis kpessg hinya nagyban megnehezti a kvetkeztet rendszerek
mkdst.
Elsrend prediktumkalkulusnak (first-order predicate calculus) is szoktk nevezni, s nha ERPK-nak rvidtik.
216
Elsrend logika
Mint azt a 7. fejezetben lttuk, az tletkalkulusnak nincs elgsges kifejezereje egy sok objektumos krnyezet
tmr lershoz. Pldul knytelenek voltunk minden egyes ngyzetnl nll szablyt rni a csapdkra s a
szellkre:
S1,1 (C1,2 C2,1)
Magyarul, ezzel szemben, elgg egyszernek tnik egyszer s mindenkorra kijelenteni, hogy A lyukas
ngyzetek mellett lvk szellsek. A termszetes nyelvek szintaxisa s szemantikja lehetv teszik a
krnyezet tmr s sszefogott lerst.
Els ltsra gy tnik, hogy a termszetes nyelvek (mint az angol vagy a magyar) valban nagyon kifejezk.
Kpesek voltunk csaknem a teljes knyvet termszetes nyelven megrni, s csak alkalmanknt kellett ttrnnk
ms nyelvekre (belertve a logikt, a matematikt s a diagramok nyelvt). Nagy mlt hagyomny a
nyelvszetben s a nyelvek filozfijban, hogy a termszetes nyelvet elssorban deklaratv tudsreprezentcis
nyelvnek tekintjk, s megprbljuk rgzteni ennek formlis szemantikjt. Ha egy ilyen kutats sikeres lenne,
nagy elrelpst jelenthetne a mestersges intelligencia szmra, mert egy termszetes nyelvet (vagy annak
valamilyen szrmazkt) hasznlhatnnk a tudsreprezentcihoz vagy a kvetkeztet rendszerekben.
A modern megkzelts szerint a termszetes nyelv kiss ms clt szolgl, nevezetesen a nyelv a
kommunikci (communication), s nem annyira a tiszta reprezentci eszkze. Amikor egy beszl rmutat
valamire, s azt mondja: Nzd! a hallgat megtudja azt, hogy mondjuk, Superman vgre megjelent a hztetk
felett. Mgsem szeretnnk azt kijelenteni, hogy a Nzd! mondatban benne foglaltatik ez a tny is. A mondat
jelentse mind magtl a mondattl, mind attl a szvegkrnyezettl (context) fgg, amelyben a mondat
elhangzott. Nyilvnvalan nem vrhat, hogy csupn a Nzd! mondatot az adatbzisban trolva visszaadhat
ennek a jelentse a szvegkrnyezet ismerete nlkl amibl az a krds kvetkezik, hogy hogyan tudjuk
magt a szvegkrnyezetet reprezentlni. A termszetes nyelvekbl is hinyzik a kompozcis kpessg egy
olyan mondat jelentse, mint az s akkor megltta, fgghet az eltte ll s az utna kvetkez mondatok
ltal alkotott szvegkrnyezettl. Vgl pedig a termszetes nyelvek egyik gyenge pontja a tbbrtelmsg
(ambiguity), ami nehzsgeket okozhatna a kvetkeztetsben. Amint azt Pinker megllaptja (Pinker, 1995):
Mikor az emberek az gre gondolnak, bizonyra nem zavarja meg ket, hogy vajon az gboltrl van-e sz,
vagy valamirl, ami lngol s ha egy sz kt gondolatot is megjelenthet, akkor a gondolatok nem feleltethetk
meg szavaknak.
Azt a megkzeltst kvetjk, hogy ptnk az tletkalkulus alapjaira felhasznlva, hogy ez egy deklaratv,
kompozcis szemantika, ami fggetlen a szvegkrnyezettl, s egyrtelm. Majd ezekre az alapokra egy mg
kifejezbb logikt ptnk azltal, hogy felhasznlunk a termszetes nyelveknl alkalmazott reprezentcis
megoldsokat, mikzben igyeksznk elkerlni ennek a htrnyait. A termszetes nyelv szintaxist vizsglva a
legegyszerbben azonosthat sszetevk a fnevek s a fnvi kifejezsek, amelyek objektumokra (objects)
utalnak (ngyzetek, lyukak, wumpusok), valamint az igk s az igei kifejezs, amelyek az objektumok kztt
fennll relcikra (relations) utalnak (szells, szomszdos, kil). Ezeknek a relciknak egy rsze fggvny
(function) azaz olyan relcik, amelyeknek csak egyetlen rtkk van egy adott bemenethez. Knnyen
tallhatunk pldkat objektumokra, relcikra s fggvnyekre:
Objektumok: emberek, hzak, szmok, elmletek, Ronald McDonald, sznek, baseballmeccs, hbork,
vszzadok
Relcik: lehetnek unris relcik vagy tulajdonsgok (properties), gymint piros, kerek, sznlelt,
elsrend, tbbemeletes, vagy ltalnosabb n-elem relcik, gymint testvre, nagyobb, belsejben, rsze,
szne, utna trtnt, birtokol, kett kztt van
Fggvnyek: apja, legjobb bartja, harmadik hivatali ideje, eggyel tbb mint, kezdete
Valjban minden llts elkpzelhet gy, mint ami objektumokra, relcikra s fggvnyekre vonatkozik. me
nhny plda:
Egy plusz kett egyenl hrommal.
Objektumok: egy, kett, hrom, egy meg kett; Relci: egyenl; Fggvny: plusz. (Egy plusz kett a neve
annak az objektumnak, amelyet gy kapunk, hogy a plusz fggvnyt alkalmazzuk az egy s kett
objektumokra. A hrom egy msik neve ugyanennek az objektumnak.)
A wumpus helyvel szomszdos ngyzetek bdsek.
217
Elsrend logika
Objektumok: wumpus, ngyzetek; Tulajdonsg: bds; Relci: szomszdos.

A gonosz Jnos kirly uralkodott Angliban 1200-ban.
Objektumok: Jnos, Anglia, 1200; Relci: uralkodott; Tulajdonsgok: gonosz, kirly.
Az elsrend logika (first order logic) nyelvezete, amelynek a szintaxist s szemantikjt a kvetkez
alfejezetben adjuk meg, objektumok s relcik kr pl. Az elsrend logika azrt olyan fontos a matematika,
a filozfia s a mestersges intelligencia szmra, mert ezeket a terleteket amelyek valjban az emberi lt
mindennapjait rjk le tekinthetjk gy, mint amelyek objektumokkal s a kztk lv relcikkal dolgoznak.
Az elsrend logika ezenkvl tnyeket kzlhet az univerzum nhny vagy sszes objektumrl. Ez lehetv
teszi, hogy ltalnos szablyokat vagy trvnyszersgeket tudjunk megfogalmazni, mint pldul azt az lltst,
hogy A wumpus helyvel szomszdos ngyzetek bdsek.
Az elsdleges klnbsg az tletlogika s az elsrend logika kztt az egyes nyelvek ontolgiai
meghatrozottsgban (ontological commitment) rejlik, abban, hogy mit felttelez a nyelv a valsg
termszetrl.
A gondolat nyelve
A filozfusok s a pszicholgusok sokat tprengtek azon, hogy az emberek s ms
llnyek hogyan jelentik meg a tudst. Egyrtelm, hogy a termszetes nyelv fejldse
fontos szerepet jtszott abban, hogy az emberekben kifejldtt ez a kpessg. Msrszt,
szmos pszicholgiai eredmny azt sugallja, hogy az emberek nem alkalmazzk kzvetlenl
a nyelvet a bels reprezentcikhoz. Pldul a kt mondat kzl melyikkel kezdtk a 8.1.
alfejezetet?
Amelyben a vilg objektumait s ezek kapcsolatait vizsgljuk meg
Ebben az alfejezetben a reprezentcis nyelvek termszett vizsgljuk
Wanner (1974) gy tallta, hogy a ksrlet alanyai vletlenszeren krlbell 50%-os
gyakorisggal jl vlasztottak, de inkbb az elolvasott szveg tartalmra emlkeztek,
tbb mint 90%-os biztonsggal. Ez azt sugallja, hogy az emberek a szavakat gy dolgozzk
fel, hogy egy nem verblis reprezentcira alaktjk t, amit emlkezetnek (memory)
neveznk.
Tovbbra is nagyon rdekes krds, hogy mi a pontos mechanizmusa annak, ahogyan a nyelv
lehetv teszi s formlja a gondolatok reprezentcijt az emberekben. A hres Sapir
Whorf-hipotzis
szerint
az
ltalunk
beszlt
nyelv
nagymrtkben
befolysolja
gondolkodsunk s dntseink mikntjt, klnsen abban, ahogy kategriarendszereket
lltunk fel, amelyet felhasznlva aztn felosztjuk a vilgot klnbz fajta
objektumokra. Whorf szerint (Whorf, 1956), azltal, hogy az eszkimknak szmos szavuk
van a hra, mskppen is rzkelik a havat, mint ms nyelvek beszli. Nhny nyelvsz
vitatja ennek az lltsnak a tnyszersgt Pullum gy rvel (Pullum, 1991), hogy az
inuitoknak, a yupiknak s ms rokon nyelvet beszlknek ugyanannyi szavuk van a hval
rokonthat fogalmakra, mint az angoloknak vannak azonban olyanok is, akik tmogatjk
az lltst (Fortescue, 1984). Vitathatatlanul igaznak tnik, hogy az olyan
embercsoportok, amelyeknek tbb ismeretk van a vilgnak egy bizonyos rszrl, sokkal
rszletesebb szkinccsel rendelkeznek erre a rszre vonatkozan pldul a gyakorl
rovarszakrtk az ltalunk bogaraknak nevezett lnyeket fajok szzezreire osztjk fel,
s sokrl ezek kzl szemlyes ismeretekkel rendelkeznek. (Az evolcis biolgus J. B.
S. Haldane meg is llaptotta, hogy a Teremt Bogarak irnti mrtktelen szeretete
klns.) Mi tbb, a tapasztalt selknek rengeteg szavuk van a hra porh, latyak,
trt krumpli, aludttej, kukorica, cukor, aszfalt, kordbrsony, pehely, trutym s gy
tovbb , s ezek olyan klnbsgeket mutatnak, amelyek ismeretlenek egy kvlll
szmra. Az ok-okozati viszony irnya azonban ismeretlen krds, hogy a selk csak
azrt ismerik fel a klnbsgeket, mert megtanuljk a szavakat, vagy a klnbsgek
keletkeznek elszr a szemlyes tapasztalat alapjn, s ezeket cmkzik fel aztn a
kzssgben mr ismert fogalmakkal. Ez a krds klnsen a gyermekek fejldsnek
tanulmnyozsa szempontjbl fontos. Egyelre kevs ismeretnk van arrl, hogy milyen
mrtkben fondik egymsba a nyelvtanuls s a gondolkods elsajttsa. Pldul egy
olyan fogalom nevnek ismerete, mint pldul az agglegny, megknnyti-e bonyolultabb,
erre pl fogalmak ellltst s hasznlatt, amelyek tartalmazzk ezt a nevet
partikpes agglegny?
218
Elsrend logika
Az tletlogika felttelezi pldul, hogy a definilt tnyek fennllnak vagy nem llnak fenn a vilgban. Minden
tnynek kt llapota lehet: igaz vagy hamis.2 Az elsrend logika bonyolultabb felttelezsekre pt,
nevezetesen, hogy a vilg objektumokbl pl fel, amelyek kztt relcik lteznek, amelyek vagy fennllnak,
vagy nem. A specilis cl logikk tovbbi ontolgiai hozzrendelseket tesznek; pldul a temporlis logika
(temporal logic) felttelezi, hogy a tnyek csak bizonyos idben llnak fenn, s hogy ezek az idk amelyek
lehetnek idpontok s idtartamok is rendezhetk. gy ezek a specilis cl logikk az objektumok egy
bizonyos fajtjhoz (s az azokhoz tartoz aximkhoz) els osztly sttust rendelnek a logikn bell,
ahelyett hogy egyszeren meghatroznk ket a tudsbzison bell. A magasabb rend logika (higher-order
logic) gy tekint az elsrend logikban relciknak s fggvnyeknek nevezettekre, mintha azok maguk is
objektumok lennnek. Ez lehetv teszi, hogy minden relcirl lltsokat alkossunk pldul arra, ha valaki
azt szeretn meghatrozni, mit jelent, hogy egy relci tranzitv. Eltren ms specilis cl logikktl a
magasabb rend logika egyrtelmen nagyobb kifejezervel rendelkezik, mint az elsrend logika, abban az
rtelemben, hogy nhny magasabb rend logikai llts nem rhat le vges szm elsrend logikai lltssal.
Egy logika jellemezhet mg az ismeretelmleti megllaptsaival (epistemological commitments) is az
egyes tnyekhez megengedett tudsllapotokkal. Mind az tletkalkulusban, mind az elsrend logikban egy
llts egy tnyt reprezentl, s az gens vagy elhiszi, hogy az llts igaz, vagy hamisnak vli, vagy nincs rla
vlemnye. Ezekben a logikkban teht a tudsnak hrom lehetsges llapota van, brmely lltst is tekintjk.
Ezzel szemben azok a rendszerek, amelyek a valsznsg-elmletet (probability theory) hasznljk,
tartalmazhatnak egy hiedelemfokozatot, ami a 0-tl (teljes hitetlensg) az 1-ig tart (teljes elfogads).3 Pldul,
egy valsznsthet wumpusvilgbeli gens hiheti, hogy a wumpus az [1, 3]-ban van, 0,75-s valsznsggel.
Az t klnbz logikai rendszer ontolgiai s ismeretelmleti megllaptsait a 8.1. tblzatban foglaltuk
ssze.
8.1. bra - Formlis

hozzrendelsei
nyelvek,
valamint
azok
ontolgiai
ismeretelmleti
A kvetkez alfejezetben elkezdjk az elsrend logika rszletes trgyalst. Ahogy egy fizikt tanul diknak
valamilyen szinten rendelkeznie kell matematikai ismeretekkel, a mestersges intelligencit tanulmnyozknak
is el kell sajttaniuk bizonyos jrtassgot a logikai jellsi rendszerek hasznlatban. Msrszt az is nagyon
fontos, hogy ne bonyoldjunk bele a logikai jellsi rendszerek sajtossgaiba hiszen szmos klnbz
vltozat ltezik. A lnyeges az, hogy tudatban legynk annak, hogy a nyelv miknt knnyti meg tmr
reprezentcik ltrehozst, s hogy a szemantika miknt vezet el helyes kvetkeztetsi folyamatokhoz.
2. Az elsrend logika szintaxisa s szemantikja

Az alfejezetet azzal kezdjk, hogy pontosabban meghatrozzuk azt a mdot, amellyel az elsrend logikban
elfordul lehetsges vilgok lerjk az objektumokra s relcikra tett ontolgiai megllaptsokat. Ezutn
bemutatjuk a nyelv klnbz elemeit, s ahogyan haladunk, megmagyarzzuk ezek szemantikjt.
2.1. Az elsrend logika modelljei

Emlkezznk arra a 7. fejezetbl, hogy a logikai nyelvek modelljei azok a formlis struktrk, amelyek a
vizsglat trgyt kpez lehetsges vilgokat alkotjk. Az tletkalkulus modelljei csupn az tletszimblumok
Ezzel szemben a fuzzy logikban (fuzzy logic) definilt az igazsg foka (degree of truth), ami egy 0 s 1 kztti rtk. Pldul az a
mondat, hogy Bcs egy nagy vros a mi vilgunkban csak 0,6 fokig lehet igaz.
3
Fontos, hogy ne keverjk ssze a valsznsg-szmtsban alkalmazott hiedelemfokozatot a fuzzy logikban reprezentlt igazsgi
fokozattal. Ltezik nhny olyan bizonytalansgot kezel rendszer, amely megenged hatrozatlansgot (a hiedelem fokt) az igazsgi
fokozatokkal kapcsolatban.
2
219
Elsrend logika
igazsgrtkeinek halmazai. Az elsrend logika modelljei ennl rdekesebbek. Elszr is, ezek tartalmaznak
objektumokat! A modell trgyterlete (domain) azoknak az objektumoknak a halmaza, amelyeket a
trgyterlet tartalmaz; ezeket az objektumokat szoktuk a trgyterlet elemeinek (domain elements) nevezni. A
8.2.
bra bemutat egy modellt t objektummal:
Oroszlnszv Richrd, Anglia kirlya 1189-tl 1199-ig; ccse, gonosz Jnos kirly, aki 1199-tl 1215-ig
uralkodott; Richrd s Jnos bal lba; vgl egy korona.
A modellben tallhat objektumok tbbfle relciban lehetnek egymssal. A 8.2. brn Richrd s Jnos
testvrek. Formlisan, egy relci csak egymssal kapcsolatban lv objektumok n-eseinek (tuple) halmaza.
(Egy n-es az objektumok egy rgztett sorrendben felsorolt gyjtemnye, amely objektumokat a zrjelpr
vesz krbe.) gy teht ebben a modellben a testvrrelci a kvetkez halmaz:
{ Oroszlnszv Richrd, Jnos kirly , Jnos kirly, Oroszlnszv Richrd }(8.1)
(Itt magyarul neveztk meg az objektumokat, de kpzeletben be lehetne helyettesteni a neveket pldul
kpekkel is.) A korona Jnos kirly fejn van, teht a fejn relcihoz csak egy n-es tartozik a korona, Jnos
kirly .
A testvr s a fejn relcik binris relcik ez azt jelenti, hogy kt objektum kztt lltanak fel
kapcsolatot. A modell ezenkvl egyelem, unris relcikat vagy tulajdonsgokat is tartalmaz: A szemly
tulajdonsg egyarnt igaz Richrdra s Jnosra; a kirly tulajdonsg csak Jnosra igaz (felteheten azrt, mert
Richrd ekkor mr halott volt); mg a korona tulajdonsg csak a koronra igaz.
8.2. bra - Egy t objektumot kt binris relcit, hrom egyelem relcit (cmkkkel
jelezve az objektumokon) s egy egyargumentum fggvnyt, bal lb tartalmaz
modell
A kapcsolatok egyes tpusai leginkbb fggvnyeknek tekinthetk, ahol egy adott objektumnak pontosan csak
egy msik objektummal kell ilyen kapcsolatban lennie. Pldul minden egyes szemlynek egy bal lba van,
teht a modellben tallhat egy bal lb fggvny, ami a kvetkez lekpezseket teszi lehetv:
Oroszlnszv Richrd Richrd bal lba
220
Elsrend logika
Jnos kirly Jnos bal lba (8.2)
Pontosabban megfogalmazva, az elsrend logika modelljei totlis fggvnyeket (total functions) kvnnak
meg, ami azt jelenti, hogy minden bemeneti n-eshez tartoznia kell egy rtknek. gy teht a koronhoz tartoznia
kell egy bal lbnak, s ennek gy kell lennie minden bal lb esetben. Ltezik erre a problmra egy technikai
megolds, amely egy hozzadott lthatatlan objektumot vezet be: egy bal lbat rendel mindenhez, amelynek
nincs bal lba, belertve nmagt is. Szerencsre, amg valaki nem tesz kijelentseket a bal lbakrl vagy olyan
dolgokrl, amelyeknek nincs bal lbuk, ezeknek a technikai problmknak nincs jelentsgk.
2.2. Szimblumok s interpretcik

Most pedig nzzk a nyelv szintaxist. A trelmetlen olvas teljes lerst tall az elsrend logika formlis
nyelvtanrl a 8.3. brn.
Az elsrend logika alapvet szintaktikai elemei az objektumokat, relcikat s fggvnyeket megjelent
szimblumok. A szimblumoknak teht hrom tpusa ltezik: konstansszimblumok (constant symbols),
amelyek az objektumokat jellik; prediktumszimblumok (predicate symbols), amelyek a relcikat
jelentik meg; s a fggvnyszimblumok (function symbols), amelyekkel fggvnyekre hivatkozhatunk. Azt
a konvencit fogjuk kvetni, hogy a szimblumok mind nagybetvel kezddnek. Pldul hasznlhatjuk a
Richrd s Jnos konstansszimblumokat; a Testvr, Fejn, Szemly, Kirly s Korona
prediktumszimblumokat, valamint a BalLb fggvnyszimblumot. gy, mint az tletszimblumoknl, a
nevek megvlasztsa itt is teljes mrtkben a felhasznlra van bzva. Minden egyes prediktum- s
fggvnyszimblum egytt jr egy szmossggal (arity), ami behatrolja a paramterek szmt.
8.3. bra - Az elsrend logika (egyenlsggel kiegsztett) szintaxisa BackusNaurforma jellseivel. (Lsd az 1. szakasz - B1. Nyelvek definilsa BackusNaurFormban (BNF) rszben, ha ez a jells ismeretlen.) A szintaxis szigor a zrjelezs
tekintetben; a zrjelekrl s az opertori elsbbsgrl a 3.1. szakasz - Szintaxis
rszben szerepl megjegyzsek ugyangy vonatkoznak az elsrend logikra is.
A szemantika a mondatokat a modellekhez kapcsolja, s kpesnek kell lennie az igazsg meghatrozsra. Hogy
ez megtrtnjen, szksgnk van egy interpretcira, amely pontosan megjelli, hogy mely objektumok,
relcik s fggvnyek felelnek meg a konstans-, prediktum- s fggvnyszimblumoknak. Egy lehetsges
interpretci amit szndkolt interpretcinak (intended interpretation) neveznk a mi esetnkben a
kvetkez:
Richrd Oroszlnszv Richrdra, mg Jnos a gonosz Jnos kirlyra vonatkozik.
221
Elsrend logika
A Testvr a testvri kapcsolatra vonatkozik, ami a (8.1) egyenletben megadott n-es halmazban lthat; a
Fejn arra a fejn relcira vonatkozik, ami a korona s Jnos kirly kztt ll fenn; a Szemly, Kirly s
Korona pedig arra az objektumhalmazra vonatkoznak, amelyek szemlyek, kirlyok s koronk.
A BalLb azt a bal lb fggvnyt jelenti, aminek a lekpezst a (8.2) egyenletben adtuk meg.
Sok ms lehetsges interpretci is ltezik, ami ezeknek a szimblumoknak a modellhez val kapcsolatt rja le.
Pldul egy lehetsges interpretciban Richrd jelenti a koront s Jnos a Jnos kirly bal lbt. A modell t
objektumot tartalmaz, gy 25 lehetsges interpretci adhat meg csak a Richrd s a Jnos
konstansszimblumokhoz.
Figyeljk meg, hogy nem minden objektumnak van arra szksge, hogy elnevezzk pldul a szndkolt
interpretci nem nevezi meg a koront vagy a lbakat. Az is lehetsges, hogy egy objektumnak tbb neve
legyen; ltezik olyan interpretci, amelyben a Richrd s a Jnos is a koronra vonatkozik. Ha ez a lehetsg
zavar, emlkezznk arra, hogy az tletlogikban teljessggel elfogadhat egy olyan modell, amelyben a
Felhs s a Napos egyarnt igaz. A tudsbzis feladata az, hogy kizrja azokat a modelleket, amelyek
ellentmondsban vannak ismereteinkkel.
Brmely mondat igazsgt egy modell s a mondat szimblumainak az interpretcija hatrozza meg. gy teht
a vonzat, az rvnyessg s ms jellemzk az sszes lehetsges modell s az sszes lehetsges interpretci
termjeinek felhasznlsval vannak meghatrozva. Fontos megjegyezni, hogy a trgyterlet elemek szma
minden egyes modellben korltlan lehet a trgyterlet elemei pldul lehetnek egsz vagy vals szmok.
Ebbl kvetkezen, a lehetsges modellek szma korltlan, mint ahogy az interpretcik szma is. A maga utn
vonzsnak az sszes lehetsges modell felsorolsval trtn vizsglata, ami az tletlogikban mkdik, nem
lehetsges az elsrend logikban. Mg ha az objektumok szma korltos is, a kombincik szma nagyon nagy
lehet. A pldnkban szerepl objektumokkal hozzvetlegesen 1025 a kombincik szma, egy t objektummal
rendelkez trgyterletben (lsd 8.5. feladat).
2.3. Termek
Egy term (term) egy objektumra vonatkoz logikai kifejezs. A konstansszimblumok teht termek, de nem
mindig knyelmes nll szimblumot alkalmazni minden egyes objektum megnevezsnl. Magyarul inkbb a
Jnos kirly bal lba kifejezst hasznljuk, mintsem nevet adjunk a lbnak. Ezrt hasznlunk
fggvnyszimblumokat: a konstansszimblumok hasznlata helyett inkbb a BalLb(Jnos)-t alkalmazzuk.
ltalnos esetben egy sszetett term egy fggvnyszimblumbl ll, amelyet a fggvnyszimblum
argumentumainak zrjelezett listja kvet. Fontos megjegyezni, hogy egy sszetett term nem ms, mint egy
bonyolult formj nv, s nem egy rtket visszaad szubrutin hvs. Nem egy BalLb szubrutinrl van sz,
amely bemenetknt megkap egy szemlyt, s visszaad egy lbat. Tudunk kvetkeztetni a bal lbakkal
kapcsolatban (pl. kiindulva az ltalnos szablybl, hogy mindenkinek van egy bal lba, s ebbl levezethet,
hogy Jnosnak is lennie kell) anlkl, hogy valaha is megadnnk a BalLb defincijt. Ez is olyasmi, amit nem
tehetnk meg a programozsi nyelvek szubrutinjaival.4
A termek formlis szemantikja nyilvnval. Tekintsk az f(t1, , tn) termet. Az f fggvnyszimblum a
modellben tallhat valamely fggvnyre (nevezzk F-nek) vonatkozik; az argumentum termek a
trgyterletben fellelhet objektumokra vonatkoznak (nevezzk ket d1, , dn-nek); s a term egszben arra az
objektumra vonatkozik, ami a d1, , dn-re alkalmazott F fggvny rtke. Pldul ttelezzk fel, hogy ha a
BalLb fggvnyszimblum a (8.2) egyenletben mutatott fggvnyre vonatkozik, s a Jnos vonatkozik Jnos
kirlyra, akkor a BalLb(Jnos) Jnos kirly bal lbt jelli. Ezen a mdon az interpretci rgzti minden
termnek a referenciit.
2.4. Atomi mondatok

Most, hogy vannak objektumokra vonatkoz termeink s relcikra vonatkoz prediktumszimblumaink,
sszerakhatjuk ket, hogy tnyeket kifejez atomi mondatokat (atomic sentences) lltsunk el. Egy atomi
A -kifejezsek ( -expressions) hasznos jellst biztostanak, amelyek az j fggvnyszimblumokat futsi idben hozzk ltre. Pldul a
fggvny, amely ngyzetre emeli a szmokat, lerhat gy, hogy ( x x x), s alkalmazhat az argumentumokra, akr brmely ms
fggvnyszimblum. Egy -kifejezst gy is meghatrozhatunk s hasznlhatunk, mint egy prediktumszimblumot (lsd 22. fejezet). A
Lambda opertor a Lispben pontosan ugyanezt a szerepet jtssza. Vegyk szre, hogy a hasznlata ilyen mdon nem nveli meg az
elsrend logika formlis kifejezerejt, mert az a mondat, ami tartalmaz egy -kifejezst, trhat gy, hogy hozzcsatoljuk a
paramtereket, ami egy ugyanolyan mondatot eredmnyez.
4
222
Elsrend logika
mondatot egy prediktumszimblum s az azt kvet zrjelezett listban tallhat termek listja alkot. Pldul
a
Testvr(Richrd, Jnos)
azt jelenti egy korbban megadott szndkolt interpretci szerint, hogy Oroszlnszv Richrd testvre Jnos
kirlynak.5 Az atomi mondatoknak is lehetnek sszetett termek az argumentumai. gy teht a
Hzas(Apja(Richrd), Anyja(Jnos))
azt jelenti, hogy Oroszlnszv Richrd apja felesgl vette Jnos kirly anyjt (ismt csak egy alkalmas
interpretciban).
Fontos
Egy atomi mondat igaz (true) egy adott modellben, egy adott interpretci mellett, ha a relci, amire
a prediktumszimblum vonatkozik, fennll az argumentumok ltal jellt objektumok kztt.
2.5. sszetett mondatok

sszetett mondatok ltrehozshoz hasznlhatunk logikai sszektjeleket (logical connectives) gy, mint az
tletkalkulusban. A logikai ktszavakkal formlt mondatok szemantikja azonos az tletkalkulusban ltott
szemantikval. me ngy mondat, amelyek igazak a 8.2. bra modelljben, a szndkolt interpretcink szerint.
Testvr(BalLb(Richrd), Jnos)
Testvr(Richrd, Jnos) Testvr(Jnos, Richrd)
Kirly(Richrd) Kirly(Jnos)
Kirly(Richrd) Kirly(Jnos)
2.6. Kvantorok
Ha egyszer ltrehoztunk egy objektumokat is tartalmaz logikt, termszetes, hogy objektumok egsz
gyjtemnyeire vonatkoz tulajdonsgokat is ki akarunk fejezni anlkl, hogy az objektumokat nevk
felhasznlsval fel kellene sorolni. Ezt a kvantorok (quantifiers) alkalmazsa teszi lehetv. Az elsrend
logika kt standard kvantort tartalmaz, amelyeket univerzlis s egzisztencilis kvantoroknak neveznk.
2.7. Univerzlis kvantor ( )

Emlkezznk vissza arra, hogy a 7. fejezetben milyen nehzsgeink voltak ltalnos szablyok tletlogikban
trtn megfogalmazsval. Az olyan szablyok, mint az A wumpus mellett tallhat ngyzetek bdsek
vagy a Minden kirly szemly adjk meg a savt-borst az elsrend logiknak. Az els szabllyal a 8.3.
alfejezetben fogunk foglalkozni. A msodik szably,
Minden kirly szemly, az elsrend logikban gy rhat le:
x Kirly(x) Szemly(x)
A -t ltalban Minden re-nek olvassuk ki. A mondat teht azt jelenti: Minden x-re, ha x egy kirly, akkor
x egy szemly. Az x szimblum neve vltoz (variable). A konvenci alapjn a vltozkat kisbetvel rjuk.
Egy vltoz nmagban egy term, s mint olyan, szerepelhet egy fggvny argumentumaknt pldul:
BalLb(x). Egy vltoz nlkli termet alaptermnek (ground term) neveznk.
Egyszeren a x P mondat, ahol a P egy tetszleges logikai kifejezs, azt mondja ki, hogy a P igaz minden x
objektumra. Pontosabban, x P igaz egy adott modellre az interpretcin bell, ha P igaz minden lehetsges
kiterjesztett interpretciban (extended interpretations), amelyet az adott interpretci felhasznlsval
hozunk ltre, ahol minden egyes kiterjesztett interpretci meghatroz egy trgyterletelemet, amire az x
vonatkozik.
Rendszerint kvetjk az argumentumok rendezsnek konvencijt, amely szerint a P(x,y)-t gy rtelmezzk, hogy az x az y-nak a P-je.
223
Elsrend logika
Ez bonyolultnak hangzik, de valjban csak egy vatos mdja annak, hogy megllaptsuk az univerzlis
kvantorok intuitv jelentst. Tekintsk a 8.2. brt s a hozz tartoz szndkolt interpretcit. tfle mdon
tudjuk kiterjeszteni az interpretcit:
x Oroszlnszv Richrd
x Jnos kirly
x Richrd bal lba
x Jnos bal lba
x a korona
A x Kirly(x) Szemly(x) univerzlis kvantort alkalmaz mondat igaz az eredeti interpretciban, ha a

Kirly(x) Szemly(x) mondat igaz mind az t kiterjesztett interpretcira. Eszerint az univerzlis kvantorral
elltott mondat egyenrtk a kvetkez t mondattal:
Oroszlnszv Richrd egy kirly Oroszlnszv Richrd egy szemly
Jnos kirly egy kirly Jnos kirly egy szemly
Richrd bal lba egy kirly Richrd bal lba egy szemly
Jnos bal lba egy kirly Jnos bal lba egy szemly
A korona egy kirly a korona egy szemly
Nzzk meg alaposan ezt az lltshalmazt. Mivel a mi modellnkben Jnos kirly az egyetlen kirly, a msodik
mondat kijelenti, hogy egy szemly, ahogy azt remltk is. De mi a helyzet a tbbi ngy mondattal, amelyek
azrt szerepelnek, hogy lltsokat fogalmazzanak meg lbakrl s koronkrl? Rsze ez annak a jelentsnek,
hogy Minden kirly szemly? Valjban, a tbbi ngy llts is igaz a modellben, de egyltaln nem lltanak
semmit a lbak, koronk vagy akr Richrd szemlyes tulajdonsgairl. Ez azrt van, mert ezen objektumok
egyike sem kirly. Ha megnzzk a () sszektjel igazsgtbljt (7.8. bra), lthatjuk, hogy az implikci
igaz, amikor a premisszja hamis tekintet nlkl a konklzi igazsgtartalmra. gy teht az univerzlis
kvantorral elltott mondat kijelentse egyenrtk azzal, hogy egyedi implikcik teljes listjt definiljuk.
Vgl is egy szably konklzijt adjuk meg azokra az objektumokra, amelyek premisszja igaz, de nem
mondunk egyltaln semmit azokrl az egyedekrl, akikre nzve a premissza hamis. gy az implikci
igazsgtbljnak sorai tkletesnek bizonyulnak univerzlis kvantorokat tartalmaz ltalnos szablyok
megrshoz.
Gyakori hiba, amelyet mg figyelmes olvask is elkvetnek, akik pedig mr tbbszr is elolvastk ezt a
bekezdst, hogy konjunkcit hasznlnak implikci helyett. A
x Kirly(x) Szemly(x)
mondat egyenrtk lenne azzal az lltssal, hogy

Oroszlnszv Richrd egy kirly Oroszlnszv Richrd egy szemly
Jnos kirly egy kirly Jnos kirly egy szemly
Richrd bal lba egy kirly Richrd bal lba egy szemly
s gy tovbb. Nyilvnval, hogy ez nem azt jelenti, mint amit szeretnnk elrni.
2.8. Egzisztencilis kvantor ( )

Az univerzlis kvantor lltsokat fogalmaz meg minden objektumrl. Hasonlan, az egzisztencilis kvantor
felhasznlshoz lltsokat tehetnk az univerzum nhny objektumrl anlkl, hogy megneveznnk azokat.
Azt az lltst teht, hogy Jnos kirlynak koronja van, gy is lerhatjuk:
x Korona(x) Fejn(x, Jnos)
Az x kiolvassa Ltezik egy olyan x vagy Nhny x-re .

224
Elsrend logika
rtheten fogalmazva, az x P mondat azt jelenti, hogy a P legalbb egy x objektumra igaz. Pontosabban az x
P igaz egy adott modellben, egy adott interpretcin bell, ha a P igaz legalbb egy kiterjesztett
interpretciban, amely az x-et a tartomny egy elemhez rendeli. A mi pldnkban ez azt jelenti, hogy a
kvetkez lltsok kzl legalbb egy igaz:
Oroszlnszv Richrd egy korona Oroszlnszv Richrd Jnos fejn van
Jnos kirly egy korona Jnos kirly Jnos fejn van
Richrd bal lba egy korona Richrd bal lba Jnos fejn van
Jnos bal lba egy korona Jnos bal lba Jnos fejn van
A korona egy korona a korona Jnos fejn van
Az tdik llts igaz a modellben, gy az eredeti egzisztencilis kvantorral elltott mondat igaz a modellben.
Vegyk szre, hogy defincink szerint a mondat igaz lenne egy olyan modellben is, ahol Jnos kirly kt
koront visel. Ez teljes mrtkben konzisztens az eredeti mondattal, miszerint Jnos kirlynak korona van a
fejn.6
Mint ahogy termszetesnek tnik az hasznlata sszektjelnek a hasznlatakor, az az a termszetes
sszektjel, amit az -vel hasznlunk. Az hasznlata f sszektjelknt az -val tlsgosan is ers
lltsokhoz vezetett az elz alfejezetben trgyalt pldban; a hasznlata az -vel igazbl nagyon gyenge
lltshoz vezet:
A felsznen ez a mondatunk elfogadhat trsnak tnik. A szemantikt alkalmazva ltjuk, hogy a mondat azt
jelenti ki, hogy a kvetkez lltsok legalbb egyike igaz:
Oroszlnszv Richrd egy korona Oroszlnszv Richrd Jnos fejn van
Jnos kirly egy korona Jnos kirly Jnos fejn van
Richrd bal lba egy korona Richrd bal lba Jnos fejn van
s gy tovbb. Mrmost, egy implikci akkor igaz, ha a premissza s a konklzi egyarnt igaz, vagy ha a
premisszja hamis. Teht ha Oroszlnszv Richrd nem egy korona, akkor az els llts igaz, s az
egzisztencilis kvantort kielgtettk. gy teht egy egzisztencilis kvantort tartalmaz implikcis mondat igaz
brmely olyan modellben, amely tartalmaz egy olyan objektumot, amelyre az implikci premisszja hamis;
kvetkezskppen az ilyen mondatok valjban nem tl sokat mondanak.
2.9. Egymsba gyazott kvantorok

Gyakran szksgnk van mg sszetettebb mondatok kifejezsre, amelyek tbb kvantort is hasznlnak. A
legegyszerbb eset az, amikor a kvantorok azonos tpusak. Pldul A fivrek testvrek mondat lerhat gy,
hogy:
x
y Fivr(x, y) Testvr(x, y)
Az egymst kvet azonos tpus kvantorokat rhatjuk gy is, hogy egy kvantort alkalmazunk az sszes
vltozra. Pldul hogy azt lltsuk, a testvrsg egy szimmetrikus kapcsolat, ezt rhatjuk:
x, y Testvr(x, y) Testvr(y, x)
Ms esetekben kevert jellssel van dolgunk. A mindenki szeret valakit azt jelenti, hogy minden szemlyhez
tartozik valaki, akit a szemly szeret:
x
y Szeret(x, y)
Ltezik az egzisztencilis kvantornak egy varinsa, amelyet 1-gyel vagy !-lel jellnk, s ami azt jelenti, hogy Ltezik pontosan
egy. Ugyanez a jelents kifejezhet egyenlsglltsokkal is, mint azt a 8.2. alfejezetben bemutattuk.
6
225
Elsrend logika
Msrszt, hogy azt lltsuk: Van valaki, akit mindenki szeret, ezt rjuk:
y
x Szeret(x, y)
A kvantorok sorrendje teht nagyon fontos. Mg vilgosabb vlik, ha zrjeleket is alkalmazunk. A x ( y

Szeret(x, y)) azt jelenti, hogy mindenkinek van egy bizonyos tulajdonsga, nevezetesen, az a tulajdonsg, hogy
mindenki szeret valakit. Msrszt, a x ( y Szeret(x, y)) azt jelenti, hogy a vilgban valakinek van egy bizonyos
tulajdonsga, mghozz az, hogy mindenki szereti t.
Zavart okozhat, ha kt kvantort hasznlunk ugyanazzal a vltoz nvvel. Tekintsk a kvetkez mondatot:
x [Korona(x) (x Fivr(Richrd, x))]
Itt az x a Fivr(Richrd, x)-ben egzisztencilis kvantorral van elltva. Az a szably, hogy a vltoz ahhoz a
legbels kvantorhoz tartozik, ami a vltozt megemlti, s utna a vltoz nem trgya semmilyen kvantor
alrendelsnek.7
A msik mdja a megoldsnak: x Fivr(Richrd, x), ahol ez egy Richrdrl szl mondat (hogy neki van egy
fivre), s nem pedig az x-rl. gy teht annak nem lesz hatsa, ha kvl el tesznk egy x-et. ppen gy
rhattuk volna azt is, hogy z Fivr(Richrd, z). Mivel ez tveszts forrsa lehet, ezrt mindig klnbz
vltozkat fogunk hasznlni.
2.10. Az s az kapcsolata
A kt kvantor valjban szoros kapcsolatban ll egymssal a negcin keresztl. Ha valaki azt mondja, hogy
mindenki utlja a paszternkot, akkor egyttal azt is mondja, hogy nem ltezik olyan valaki, aki szereti azt, s
fordtva:
x Szereti(x, Paszternk) egyenrtk azzal, hogy x Szereti(x, Paszternk)
Egy lpssel tovbb is mehetnk. A Mindenki szereti a fagylaltot mondat azt jelenti, hogy nincs olyan, aki ne
szeretn a fagylaltot:
x Szereti(x, Fagylalt) egyenrtk azzal, hogy x Szereti(x, Fagylalt)
Mivel az igazbl egy konjunkci minden univerzumbeli objektum felett, az pedig egy diszjunkci
ugyanezen objektumok felett, ezrt nem meglep, hogy eleget tesznek a De Morgan-szablyoknak. A kvantorral
s a kvantor nlkl ll mondatokra vonatkoz De Morgan-szablyok a kvetkezk:
x P x P
x
P x P
Q (P Q)
(P Q) P Q
x P x P
P Q (P Q)
x P x P
P Q (P Q)
gy valjban nincs szksgnk egyszerre mind az -ra, mind az -re, mint ahogy nincs szksg egyszerre
mind az -ra s az -ra sem. Mgis, mivel az olvashatsg fontosabb, mint a takarkossg, hasznlni fogjuk
mindkt kvantort.
2.11. Egyenlsg
Az azonos vltoznevet hasznl kvantorok interferencira val kpessge teszi lehetv a kiterjesztett interpretcik kiss barokkos
mechanizmust a kvantorral elltott mondatok szemantikjban. Az intuitve legegyrtelmbb megkzeltse az objektumok
helyettestsnek az x minden elfordulsnl nem mkdik a pldnkban, mert az x-et a Fivr(Richrd, x)-ben foglyul ejten a
behelyettests. A kiterjesztett interpretcik ezt pontosabban oldjk meg, mert a bels kvantor hozzkapcsolsa az x termhez kioltja a kls
kvantor hatst.
7
226
Elsrend logika
Az elsrend logika a prediktumok s termek korbban lert hasznlatn kvl mg egy lehetsget nyjt atomi
mondatok ksztsre. Alkalmazhatjuk az egyenlsgszimblumot (equality symbol) lltsok ksztsre is
annak kifejezsre, hogy kt term ugyanarra az objektumra vonatkozik. Pldul az
Apja(Jnos) = Henrik
azt mondja ki, hogy az Apja(Jnos) ltal hivatkozott objektum s a Henrik ltal hivatkozott objektum azonos.
Mivel az interpretci rgzti brmely term referenciit, egy egyenlsgi llts igazsgnak megllaptshoz
elegend azt ltni, hogy a kt term referencii ugyanazok az objektumok.
Az egyenlsgszimblumot hasznlhatjuk arra, hogy tnyeket llaptsunk meg egy adott fggvnyrl, ahogy ezt
megtettk az imnt az Apja szimblummal. Alkalmazhatjuk az egyenlsgszimblumot negcival is, annak a
kifejezsre, hogy kt term nem ugyanaz az objektum. Ha azt akarjuk lltani, hogy Richrdnak legalbb kt
fivre van, ezt rjuk:
x,y Fivr(x, Richrd) Fivr(y, Richrd) (x = y)
Annak a mondatnak, hogy

x,y Fivr(x, Richrd) Fivr(y, Richrd)
nem ugyanaz a szndkolt jelentse. Ez a mondat pldul igaz a 8.2. brn lthat modellre, ahol Richrdnak
csak egy fivre van. Hogy ezt megrtsk, figyeljk meg azt a kiterjesztett interpretcit, ahol mind az x, mind az
y Jnos kirlyhoz van rendelve. A (x = y) viszont mr nem eleme a modellnek. Az x y-t nha rvidtsknt
hasznljuk a (x = y) kifejezsre.
3. Az elsrend logika hasznlata

Most, hogy definiltunk egy kifejez logikai nyelvet, itt az ideje, hogy megtanuljuk hasznlni is. A legjobb
mdja ennek az, ha pldkon keresztl tesszk. A logikai szintaxis tbbfle aspektusnak illusztrlsra mr
lttunk nhny egyszer mondatot; ebben az alfejezetben az egyszer trgyterleteknek (domain) tbb
szisztematikus reprezentcijt fogjuk bemutatni. A tudsreprezentciban egy trgyterlet a vilgnak az a
rsze, amelyrl valamilyen tudst akarunk kifejezni.
Az elsrend tudsbzisokra definilhat KIJELENT/KRDEZ eljrsok rvid lersval fogunk kezdeni. Ezutn
megvizsgljuk a csaldi kapcsolatok, a szmok, a halmazok s a listk trgyterlett, valamint a wumpus
vilgot. A kvetkez alfejezet egy mg alapvetbb pldt (elektronikus ramkrk) tartalmaz, mg a 10. fejezet
mindent ttekint az univerzumban.
3.1. Kijelentsek s lekrdezsek az elsrend logikban

A mondatokat a KIJELENT hasznlatval adjuk hozz a tudsbzishoz, pontosan gy, mint az tletlogikban.
Ezeket a mondatokat kijelentseknek (assertions) nevezzk. Pldul, azt jelenthetjk ki, hogy Jnos egy kirly,
s hogy a kirlyok szemlyek:
Kijelent(TB, Kirly(Jnos))
Kijelent(TB, x Kirly(x) Szemly(x))
Krdseket tehetnk fel a tudsbzisrl a KRDEZ hasznlatval. Pldul a:

Krdez(TB, Kirly(Jnos))
igazat ad vissza. A KRDEZ-zel feltett krdseket lekrdezseknek (queries) vagy cloknak (goals) nevezzk
(ne tvesszk ssze azokkal a clokkal, amelyek az gensek kvnt llapott rjk le). ltalnossgban, brmely
lekrdezsre, ami logikusan kvetkezik a tudsbzisbl, igenl vlaszt kell adni. Pldul ha adott a kt kijelents
az elz bekezdsben, akkor a
Krdez(TB, Szemly(Jnos))
lekrdezsnek szintn azt kell visszaadnia, hogy igaz. Kvantorokat alkalmaz krdseket is feltehetnk, gy
mint:
227
Elsrend logika
Krdez(TB, x Szemly(x))
Erre a lekrdezsre a vlasz lehet igaz, de ez nem segt, s nem is szrakoztat. (Ez olyasmi, mintha a Meg
tudn mondani mennyi az id? krdsre azt vlaszolnnk, hogy Igen.) Egy egzisztencilis vltozkkal
elltott lekrdezs valjban azt a krdst teszi fel, hogy Van-e olyan x, amely, s gy oldjuk meg, hogy
megadunk egy ilyen x-et. Egy ilyen tpus vlasz szoksos formja egy helyettestsi lista (substitution list)
vagy lektsi lista (binding list), amely vltoz/term prok halmaza. Ebben az esetben, amikor csak kt
kijelents szerepel, a vlasz az {x/Jnos} lenne. Ha tbb lehetsges vlasz van, akkor a helyettestsek listjt
kapjuk vissza.
3.2. A rokonsgi trgyterlet

Az els pldban a csaldi kapcsolatokat, vagyis a rokonsgi trgyterletet vizsgljuk meg. Ez a trgyterlet
tartalmaz olyan tnyeket, mint Erzsbet Kroly anyja s Kroly Vilmos apja, valamint olyan szablyokat,
mint Valakinek a nagyanyja az szljnek az anyja.
Egyrtelm, hogy ennek a trgyterletnek az objektumai szemlyek. Kt unris prediktumunk lesz a Frfi s a
N. A rokonsgi kapcsolatokat szlsg, testvrsg, hzassg s gy tovbb binris prediktumokkal fogjuk
brzolni: Szlje, Testvre, Fivre, Nvre, Gyereke, Lnya, Fia, Hzastrsa, Felesge, Frje, Nagyszlje,
Unokatestvre, Nagynnje s Nagybtyja. Az Anyja s Apja reprezentlsra fggvnyeket fogunk alkalmazni,
mivel minden szemlynek pontosan egy ilyen rokona van (legalbb is a termszet rendje szerint).
Lerhatjuk a prediktumokat s a fggvnyeket gy, hogy ms szimblumokkal fejezzk ki, amit rluk tudunk.
Pldul valakinek az anyja, az nnem szlje:
m,c Anyja(c) = m N(m) Szlje(m, c)
Valakinek a frje az frfi hzastrsa:

w, h Frje(h, w) Frfi(h) Hzastrsa(h, w)
A n s a frfi diszjunkt kategrik:

x Frfi(x) N(x)
A szlje s a gyereke inverz relcik:

p, c Szlje(p, c) Gyereke(c, p)
Egy nagyszl a szlje valaki szljnek:

g, c Nagyszlje(g, c) p Szlje(g, p) Szlje(p, c)
Egy testvr a msik gyereke ugyanannak a szlnek:

x, y Testvre(x, y) x y p Szlje(p, x) Szlje(p, y)
Folytathatnnk gy tovbb, s a 8.11. feladatban krni is fogjuk, hogy tegye ezt meg.
Minden egyes ilyen mondat tekinthet a rokonsgi trgyterlet egy aximjnak (axiom). Az aximkat
ltalban a tisztn matematikai trgyterletekhez ktjk rviden meg fogunk vizsglni nhny aximt
szmokra de valamennyi trgyterletben szksg van rjuk. Az aximk elltnak bennnket alapvet tnybeli
informcikkal, amelyekbl hasznos kvetkeztetseket vonhatunk le. Rokonsgi aximink egyttal defincik
(definitions) is; formjuk pedig x, y P(x, y) . Az aximk meghatrozzk az Anyja fggvnyt s a Frje,
Frfi, Szlje, Nagyszlje s Testvre prediktumokat ms prediktumok felhasznlsval. A prediktumok
alapvet halmazainl (Gyereke, Hzastrsa s N) a definciinkat mr nem tudjuk ms prediktumokkal lerni.
Ez termszetes mdja annak, ahogyan felptjk egy trgyterlet reprezentcijt, s analg azzal, ahogyan a
szoftvereket felptik primitv knyvtrfggvnyek szubrutinjainak az egymst kvet definciival. Vegyk
szre, hogy a prediktumprimitveknek nincs felttlenl egyetlen kizrlagos halmaza; ppen ilyen jl
hasznlhattuk volna a Szlje, Hzastrsa s Frfi prediktumokat. Nhny trgyterletben, mint azt ltni
fogjuk, nincs egyrtelmen meghatrozhat alaphalmaz.
228
Elsrend logika
Nem minden a trgyterletrl szl logikus mondat axima. Nhny kzlk ttel (theorem) amelyeket az
aximk vonnak maguk utn. Pldul vizsgljuk meg a kijelentst, hogy a testvrsg szimmetrikus:
x, y Testvre(x, y) Testvre(y, x)
Ez vajon egy axima vagy egy ttel? Valjban ez egy ttel, amely logikusan kvetkezik a testvrsget
meghatroz aximbl. Ha ezt a mondatot KRDEZ-zk a tudsbzistl, akkor az eljrsnak az igaz eredmnyt
kell visszaadnia.
Tisztn logikai nzpontbl egy tudsbzis csak aximkat, s nem tteleket tartalmaz, mert a ttelek nem
nvelik meg a konklzik halmazt, amelyeket a tudsbzis maga utn vonz. Gyakorlati szempontbl a ttelek
elengedhetetlenek az j mondatok ellltsnl a szmtsi kltsgek cskkentshez. Nlklk egy bizonytsi
rendszernek minden egyes alkalommal az els alapelvektl kellene indulnia, mintha egy fizikusnak mindig jra
le kellene vezetnie a szmtsok szablyait az sszes j problmnl.
Nem minden axima definci. Nhny axima ltalnosabb informcikat r le egyes prediktumokrl, anlkl
hogy ltrehozna egy defincit. Valjban egyes prediktumoknak nincs teljes defincijuk, mert nem tudunk
eleget rluk ahhoz, hogy teljes mrtkben meghatrozzuk ket. Pldul nem ltezik egyrtelm befejezse a
kvetkez mondatnak:
x Szemly(x)
Szerencsre az elsrend logika lehetv teszi szmunkra, hogy hasznljuk a Szemly prediktumot, anlkl
hogy teljes mrtkben definilnnk. Ehelyett rszleges pontostsokat rhatunk tulajdonsgokrl, amelyekkel
minden szemly rendelkezik, s olyan tulajdonsgokrl, amelyek valamit szemlly tesznek:
x Szemly(x)
x Szemly(x)
Az aximk lehetnek csak puszta tnyek, mint amilyenek a Frfi(Jim) s a Hzastrsa(Jim, Laura). Az ilyen
tnyek alkotjk a specilis problma pldnyok lersait, lehetv tve specilis krdsek megvlaszolst.
Ilyenkor az ezekre a krdsekre adott vlaszok ttelek lesznek, amelyek az aximkbl kvetkeznek. Gyakran
elfordul, hogy az elvrt vlasz nem kaphat meg pldul a Frfi(George) s a Hzastrsa(George, Laura)bl azt vrnnk, hogy kikvetkeztethetnek kellene lennie annak, hogy N(Laura); de ez nem kvetkezik a
korbban megadott aximkbl. Ez annak a jele, hogy egy axima hinyzik. A 8.8. feladat ennek a megadst
kri.
3.3. Szmok, halmazok s listk

A szmok taln a legltvnyosabb pldi annak, hogy hogyan pthetnk fel egy hatalmas elmletet aximk
kicsi darabjait hasznlva. Le fogjuk rni a termszetes szmok (natural numbers), vagyis a nem negatv egsz
szmok elmlett. Szksgnk van egy prediktumra TermSzm, amely igaz lesz minden termszetes szmra;
szksgnk van tovbb egy konstansszimblumra, ez lesz a 0; valamint egy fggvnyszimblumra, az S
rekurzit ler fggvnyre. A Peano-aximk (Peano axioms) meghatrozzk a termszetes szmokat s az
sszeadst.8 A termszetes szmoknak egy rekurzv defincijt adjuk meg:
TermSzm(0)
n TermSzm(n) TermSzm(S(n))
Ez azt jelenti, hogy a 0 egy termszetes szm, s hogy minden n objektumra, ha az n egy termszetes szm,
akkor S(n) is egy termszetes szm. Teht, a termszetes szmok a 0, az S(0) s az S(S(0)) s gy tovbb.
Szksgnk van aximkra ahhoz is, hogy lezrjuk a rekurzit ler fggvnyt:
n 0 S(n)
m, n m n S(m) S(n)
Most meg tudjuk hatrozni az sszeadst az utdfggvny szempontjbl:

A Peano-aximk mg tartalmazzk az indukci elvt is, amely inkbb a msodrend logikba tartoz llts, mintsem az elsrend
logikba. Ennek a megklnbztetsnek a lerst lsd a 9. fejezetben.
8
229
Elsrend logika
m TermSzm(m) + (0, m) = m
m, n TermSzm(m) TermSzm(n) + (S(m), n) = S(+(m, n))
Az els axima azt mondja ki, hogy ha hozzadunk egy 0-t brmely m termszetes szmhoz, akkor m-et kapunk.
Figyeljk meg a + binris fggvnyszimblum hasznlatt a +(m, 0) termben. A matematika jellse szerint a
termet a kvetkezkppen rnnk: m + 0, infix (infix) jells hasznlatval. (Az eddigiekben az elsrend
logikhoz hasznlt jellseket prefixnek (prefix) nevezzk.) Azrt, hogy knnyebben olvashatv tegyk a
szmokrl szl mondatainkat, lehetv tesszk az infix jellsek hasznlatt. gy az S(n)-t lerhatjuk gy is,
hogy n + 1, ami ltal a msodik axima a kvetkez lesz:
m, n TermSzm(m) TermSzm(n) (m + 1) + n = (m + n) + 1
Ez az axima az utdfggvny ismtelt alkalmazsv egyszersti az sszeadst.

Az infix jellsek hasznlata plda a szintaktikus dessgre (syntactic sugar), ami nem ms, mint az
alapszintaxis kiterjesztse vagy rvidtse, a szemantika megvltoztatsa nlkl. Brmely mondat, amely ezt a
szintaktikai dessget hasznlja visszaalakthat, egyenrtk mondatot ellltva a hagyomnyos elsrend
logikban.
Mihelyt van egy sszeads-defincink, magtl rtetdik a szorzst ismtelt hozzadsokknt definilni, a
hatvnyozst ismtelt szorzsokknt, meghatrozni az egsz szmok osztst s maradkait, a prmszmokat s
gy tovbb. gy teht a teljes szmelmlet (belertve a titkosrst) felpthet egy konstansbl, egy fggvnybl,
egy prediktumbl s ngy aximbl.
A halmazok (sets) trgyterletnek szintn alapvet szerepe van a matematikban, ugyangy mint a htkznapi
gondolkodsban is. (Valjban a szmelmlet levezethet a halmazelmletbl kiindulva.) Halmazokat
szeretnnk reprezentlni, belertve az res halmazt is. Szksgnk van a halmazok felptsnek egy mdjra,
amelyben vagy hozz tudunk adni egy elemet a halmazhoz, vagy kt halmaz metszett vagy unijt tudjuk
kpezni. Meg kell tudnunk llaptani, hogy egy elem rsze-e egy halmaznak, s szeretnnk megklnbztetni a
halmazokat az olyan objektumoktl, amelyek nem halmazok.
A halmazelmlet hagyomnyos szkincst fogjuk hasznlni szintaktikai dessgknt. Az res halmaz egy
konstans, amelynek a jele: { }. Definilunk egy unris prediktumot, a Halmaz-t, amely minden halmaz
esetben igaz. A binris prediktumok az x s (az x az s halmaz rsze) s az s1 s2 (az s1 halmaz egy
rszhalmaza, nem felttlenl valdi rszhalmaza az s2-nek). A binris fggvnyek az s1 s2 (kt halmaz
metszete), az s1 s2 (kt halmaz unija) s az {x s} (a halmaz az x elem s halmazhoz val csatlakozsnak
eredmnye). Az aximk egy lehetsges sorozata a kvetkez:
1. Egy halmaz vagy az res halmaz, vagy azok, amelyeket egy halmaz bvtsvel hoztunk ltre:
s Halmaz(s) (s = { }) (x, s2 Halmaz(s2) s = {x s2})
2. Az res halmaznak nincs hozzadott eleme, ms szval nincs lehetsg arra, hogy az resHalmaz-t
sztvlasszunk egy kisebb halmazra s egy elemre:
x, s {x|s} = { }
3. Egy halmazbeli elem jbli hozzadsa a halmazhoz nem vltoztat a halmazon.

x, s x s s = {x|s}
4. Egy halmaznak csak az az eleme, amit hozzadunk. Ezt rekurzvan fejezzk ki, kimondva, hogy x akkor s
csakis akkor eleme az s halmaznak, ha s azonos valamilyen s2 halmaz y elemmel val bvtsvel, ahol vagy
azonos y x-szel, vagy x eleme s2-nek:
x, s x s [y, s2 (s = {y|s2} (x = y x s2))]
5. Egy halmaz egy msiknak a rszhalmaza, ha az sszes els halmazbeli elem eleme a msodik halmaznak:
s1, s2 s1 s2 (x x s1 x s2)
6. Kt halmaz akkor s csakis akkor egyenl, ha egymsnak rszhalmazai:
230
Elsrend logika
x, s1, s2 (s1 = s2) (s1 s2 s2 s1)
7. Egy objektum akkor s csakis akkor eleme kt halmaz metszetnek, ha eleme mindkt halmaznak:
x, s1, s2 x (s1 s2) (x s1 x s2)
8. Egy objektum akkor s csakis akkor eleme kt halmaz unijnak, ha a kt halmaz brmelyiknek az eleme:
x, s1, s2 x (s1 s2) (x s1 x s2)
A listk (lists) trgykre nagyon hasonl a halmazok trgykrhez. A klnbsg az, hogy a listk rendezettek,
s ugyanaz az elem tbb helyen is elfordulhat egy listban. Hasznlhatjuk a Lisp sztrt a listkra: a Nil az
elem nlkli listt jell konstans, a Cons, az Append, a First s a Rest fggvnyek. A Find egy prediktum,
amely azt hajtja vgre a listknl, mint az Eleme a halmazoknl. A List? egy prediktum, amely csak a listkra
igaz. gy, mint a halmazoknl, a listkrl szl logikai mondatokban is szoks hasznlni a szintaktikai
dessget. Az res lista a: [ ]. A Cons(x, y) termet, ahol az y nem res lista, gy rjuk, hogy: [x|y]. A Cons(x, Nil)
termet (egy lista, amely tartalmazza az x elemet) gy rjuk, hogy: [x]. Tbb elem listja, mint az [A, B, C],
ugyanazt jelenti, mint az egymsba gyazott term: Cons(A, Cons(B, Cons(C, Nil))). A 8.14. feladat trgya az
aximk megrsa a listk trgykrhez.
3.4. A wumpus vilg

A 7. fejezetben megadtunk nhny tletlogikai aximt a wumpus vilgra. Az ebben az alfejezetben szerepl
elsrend logika aximi sokkal tmrebbek lesznek, termszetes mdon brzolva azt, amit pontosan mondani
szeretnnk.
Emlkezznk arra, hogy egy wumpus gens egy t elembl ll rzetvektort kap. Az ezt ler elsrend logikai
mondat, amelyet a tudsbzisban trolunk, tartalmazza mind az rzetet, mind az idpontot amikor ez
bekvetkezett, klnben az gens sszekevern, hogy mikor ltta azt, amit ltott. Az idpontokat jell
lpsekre egsz szmokat hasznlunk. Egy tipikus rzetmondat ilyen lesz:
rzet([Bz, Szell, Ragyogs, Nincs, Nincs], 5)
Itt az rzet egy binris prediktum, mg a Bz s a tbbi rzet listba rendezett konstansok. A wumpus vilgban
lejtszd cselekvseket a kvetkez logikai termekkel reprezentlhatjuk:
Fordul(Jobbra), Fordul(Balra), Elre, L, Megragad, Elereszt, Mszik
Hogy meghatrozzuk, melyik cselekvs a legjobb az adott helyzetben, az gens program ltrehoz egy
lekrdezst, mint pldul:
a LegjobbCselekvs(a, 5)
A KRDEZ-zel vgrehajtjuk ezt a lekrdezst, s vissza fogunk kapni egy lektsi listt, mint pldul:
{a/Megragad}. Az gensprogram ezutn visszaadhatja a Megragad-ot, mint elvgzend cselekvst, de elszr a
KIJELENT felhasznlsval kzlnie kell a sajt tudsbzisval, hogy egy Megragad-ot hajt vgre.
A nyers rzetadatok alapjn kvetkeztethetnk az aktulis llapot bizonyos tnyeirl. Pldul:
t, s, g, m, c rzet([s, Szell, g, m, c], t) Szell(t)
t, s, g, m, c rzet([s, Ragyogs, m, c], t) Ragyogs(t)
s gy tovbb. A szablyok a kvetkeztetsi folyamat egy trivilis formjt mutatjk, amit rzkelsnek
(perception) neveznk, s amelyet a 24. fejezetben fogunk rszletesen tanulmnyozni. Vegyk szre az
univerzlis kvantort az id (t) felett. Az tletlogikban minden egyes idlpshez szksgnk volt a mondatok
msolatra.
Az egyszer reflex viselkeds is lerhat kvantorokat alkalmaz implikcis mondatokkal. Pldul lehet egy
ilyen mondatunk:
t Ragyogs(t) LegjobbCselekvs(Megragad, t)
231
Elsrend logika
Mivel adottak az rzet s az elz bekezdsekben megismert szablyok, ez a mondat a kvnt konklzit
eredmnyezn: LegjobbCselekvs(Megragad, 5) ami azt jelenti, hogy a Megragad a legjobb cselekvs, amit
vgrehajthatunk. Vegyk szre az egybeesst a 7.20.
brban az ramkrn alapul gensnl e szably s a
kzvetlen rzet-cselekvs kapcsolat kztt. Az ramkr jellegbl kvetkezen impliciten ltja el kvantorral az
idt.
Eddig ebben az alfejezetben az idvel operl mondatok mind szinkrnok (synchronic), azaz egyidejek
voltak, ami azt jelenti, hogy a vilg llapotnak tulajdonsgait vonatkoztatjk ugyanannak a vilgllapotnak ms
tulajdonsgaihoz. Azokat a mondatokat, amelyek lehetv teszik az idbelisget figyelembe vev kvetkeztetst
diakrnnak (diachronic) nevezzk. Pldul az gensnek tudnia kell, hogy hogyan kombinlja a megelz
helyzetrl lv informcit azzal az informcival, amely helyzetnek meghatrozshoz szksges. A diakrn
mondatok trgyalst elhalasztjuk a 10. fejezetig, most csak ttelezzk fel, hogy a helyzetre s ms idfgg
prediktumokra vonatkoz kvetkeztetsek megtrtntek.
Bemutattuk az rzeteket s a cselekvseket, ezutn itt az ideje, hogy bemutassuk magt a krnyezetet. Kezdjk
az objektumokkal. A ngyzetek, a csapdk s a wumpus nyilvnval szereplk. Elnevezhetnnk minden egyes
ngyzetet Ngyzet1,2 s gy tovbb de akkor az a tny, hogy a Ngyzet1,2 szomszdos a Ngyzet1,3-mal, egy
extra tnyt ignyelne, s minden egyes ngyzetprnl szksgnk lenne egy ilyen tnyre. Jobb egy komplex
termet hasznlni, amelyben a sor s az oszlop egsz szmokknt jelenik meg; pldul egyszeren hasznlhatjuk
a lista termet: [1, 2]. Brmely kt ngyzet szomszdossga meghatrozhat gy:
x, y, a, b Szomszdos([x, y], [a, b])
[ a, b] {[x + 1, y], [x 1, y], [x, y + 1], [x, y 1]}
Minden egyes csapdt elnevezhetnnk, de ez sem lenne megfelel, mghozz ms okbl: nincs ok arra, hogy
megklnbztetst tegynk a csapdk kztt.9 Sokkal egyszerbb hasznlni egy Csapda unris prediktumot,
amely igaz a csapdt tartalmaz ngyzetekre. Vgl, mivel pontosan egy wumpus van csak, ezrt egy Wumpus
konstans ppen gy megfelel, mintha egy unris prediktummal jellnnk (s a wumpus szempontjbl taln
tiszteletre mltbb is). A wumpus pontosan egy ngyzetben lakik, teht j gondolat egy fggvnyt hasznlni
ennek a ngyzetnek a megnevezsre, ami az Otthon(Wumpus). Ez kikszbli azt a szmos mondatot, amelyre
az tletlogikban szksgnk van ahhoz, hogy megmondjuk, pontosan egyetlen ngyzet tartalmaz wumpust.
(Mg nehezebb helyzetet teremtene az tletlogika szmra, ha kt wumpus volna.)
Az gens helyzete vltozik az id haladtval, amit gy jellnk, hogy Akkor(gens, s, t), ami azt jelenti, hogy az
gens az s ngyzetnl van t idben. Mihelyt megadtuk az aktulis helyzett, az gens kvetkeztetni tud a
ngyzet tulajdonsgaira a jelenlegi rzete tulajdonsgaibl. Pldul, ha az gens egy ngyzetnl van, s szellt
rzkel, akkor az a ngyzet szells:
s, t Akkor(gens, s, t) Szell(t) Szells(s)
Hasznos tudni, hogy egy ngyzet szells, mert tudjuk, hogy a csapdk nem tudnak mozogni. Vegyk szre, hogy
a Szells-nek nincsen idargumentuma.
Miutn felfedeztk, mely helyek szellsek (vagy bdsek) vagy s ez nagyon fontos nem szellsek (vagy
nem bdsek), az gens ki tudja kvetkeztetni, hogy hol vannak a csapdk (s hogy hol van a wumpus). Ktfajta
szinkrn szably van, amely lehetv teszi az ilyen kvetkeztetseket:
Diagnosztikus szablyok
A diagnosztikus szablyok a megfigyelt hatsoktl a rejtett okokhoz vezetnek minket. A csapdk
megtallshoz a legkzenfekvbb diagnosztikai szablyok azt mondjk ki, hogyha a ngyzet szells, akkor
valamelyik szomszdos ngyzet biztosan tartalmaz csapdt:
s Szells(s) r Szomszdos(r, s) Csapda(r)
s hogyha egy ngyzet nem szells, akkor egyetlen szomszdos ngyzet sem tartalmaz csapdt: 10
Hasonlan, legtbbnk nem nevezi meg a madarat, amint elszll fejnk felett, hogy melegebb vidkre kltzzn tlen. Egy ornitolgus
viszont, aki a vonulsi mintkat s a tllsi arnyokat szeretn tanulmnyozni, megnevez minden egyes madarat azltal, hogy meggyrzi
ket, mivel a madarakat egyenknt kell nyomon kvetnie.
10
Az emberben van hajlandsg arra, hogy elfelejtse lerni az ehhez hasonl negatv informcikat. Egy beszlgets sorn ez a tendencia
teljesen normlis furcsa lenne, ha azt mondannk: Van kt cssze az asztalon, s nincs ott hrom vagy tbb. Mg akkor is, ha a Van kt
cssze az asztalon szigoran szlva akkor is igaz, ha hrom van ott. A 10. fejezetben visszatrnk erre a problmra.
9
232
Elsrend logika
E kett kombinlsval, ezt a bikondicionlis mondatot kapjuk:

s Szells(s) r Szomszdos(r, s) Csapda(r) (8.3)
Ok-okozati szablyok
Az ok-okozati szablyok a vilgban lv okozatisg felttelezett irnyt tkrzik: a vilg nhny rejtett
tulajdonsga bizonyos rzetek generlst eredmnyezi. Pldul egy csapda azt eredmnyezi, hogy az sszes
szomszdos ngyzet szells lesz:
r Csapda(r) [s Szomszdos(r, s) Szells(s)]
s ha az adott ngyzettel szomszdos ngyzetek egyike sem tartalmaz csapdt, a ngyzet nem lesz szells:
s [r Szomszdos(r, s) Csapda(r)] Szells(s)
Nmi munkval meg lehet mutatni, hogy ezek a mondatok egytt logikusan egyenrtkek a (8.3) egyenletben
lert ekvivalenciamondatokkal. Maga az ekvivalencia is tekinthet ok-okozatinak, mert megmutatja, hogy a
Szells igazsgrtke a vilg llapota alapjn hatrozhat meg.
Azokat a rendszereket, amelyek ok-okozati szablyokat alkalmaznak modellalap kvetkeztet (modell-based
reasoning) rendszereknek nevezzk, mivel az ok-okozati szablyok a krnyezet mkdsnek modelljt
alkotjk. A modellalap s a diagnosztikus kvetkeztets kztti megklnbztets a mestersges intelligencia
szmos terletn fontos. Az orvosi diagnosztika egy klnsen aktv terlete a kutatsnak, amelyben a tnetek
s a betegsgek kztti kzvetlen asszocicikon alapul (diagnosztikai megkzeltsek) megkzeltseket
fokozatosan felvltottk az olyan mdszerek, amelyek a betegsg kialakulsnak s a betegsgtnetek
manifesztldsnak egy explicit modelljt hasznljk. Ez a tma a 13. fejezetben jra elkerl.
Fontos
Brmelyik reprezentcis formt is hasznlja az gens, ha az aximk pontosan s teljesen lerjk a
vilg mkdsnek a mdjt s azt a mdot, ahogyan az rzetek ltrejnnek, akkor brmely teljes
logikai kvetkeztetsi eljrs az elrhet rzetek megadsa utn ki fogja kvetkeztetni a vilg
llapotnak legvalsznbb lehetsges lerst. gy teht az genstervez arra koncentrlhat, hogy a
tudst helyesen adja meg, anlkl hogy sokat kellene tprengenie a kvetkeztetsek folyamatain.
Lttuk tovbb azt is, hogy az elsrend logika hasonlan tmren tudja reprezentlni a wumpus
vilgot, mint a 7. fejezetben megadott eredeti magyar nyelv lers.
4. Tudstervezs az elsrend logikban

A megelz alfejezet bemutatta az elsrend logika hasznlatt a tuds reprezentlsra hrom egyszer
trgyterletben. Ez az alfejezet a tudsbzis felptsnek ltalnos folyamatt rja le egy folyamatot, amit
tudstervezsnek (knowledge engineering) neveznk. A tudsmrnk egy olyan szemly, aki egy bizonyos
trgyterletet vizsgl, megismeri, hogy mely koncepcik fontosak abban a trgyterletben, s megalkot egy
formlis reprezentcit a trgyterletben tallhat objektumokra s relcikra. A tudstervezs folyamatt az
elektronikus ramkr trgyterletben fogjuk illusztrlni, amely mr valsznleg ismers, gy koncentrlhatunk
az ezzel jr reprezentcis problmkra. Az ltalunk alkalmazott megkzelts specilis cl tudsbzisok
kialaktshoz megfelel, amelyek trgyterlete alaposan krlhatrolt, s amelyek lekrdezseinek az egsz
sorozatt elre ismerjk. ltalnos cl tudsbzisokat, amelyeket arra hasznlunk, hogy lekrdezseket
tegyenek lehetv az emberi tuds teljes terletre vonatkozan, a 10. fejezetben trgyaljuk majd meg.
4.1. A tudstervezs folyamata

A tudstervezsi projektek klnbzk trgyukat, trgykrket s nehzsgket tekintve, de minden ilyen
projekt tartalmazza a kvetkez lpseket:
1. A feladat beazonostsa. A tudsmrnknek fel kell vzolnia a krdsek sort, amelyekkel a tudsbzis
foglalkozni fog, s a tnyeknek azokat a csoportjait, amelyek minden egyes problmaspecifikus pldnyban
megtallhatk lesznek. El kell dntenie pldul, hogy a wumpus tudsbzisnak kpesnek kell-e lennie a
233
Elsrend logika
cselekvsek kivlasztsra, vagy hogy csak az vrhat el, hogy a krnyezet elemeivel kapcsolatos krdseket
vlaszolja meg. Tudnia kell, hogy az rzkelktl szrmaz tnyek lerjk-e a jelenlegi helyzetet. A feladat
hatrozza meg, hogy mely tudst kell trolni, hogy a problmapldnyokban a vlaszokat megadhassuk az
adott esetre vonatkozan. Ez a lps analg az gensek tervezsnl ltott TKB-folyamattal, amelyrl a 2.
fejezetben rtunk.
2. A relevns tuds sszegyjtse. A tudsmrnk vagy mr szakrtje a trgyterletnek, vagy egytt kell
mkdnie igazi szakrtkkel, hogy megismerje az tudsukat ezt a folyamatot tudsmegszerzsnek
(knowledge acquisition) nevezzk. Ezen a szinten a tudst formlisan nem reprezentljuk. A cl az, hogy
megrtsk a tudsbzis trgykrt, amit a feladat hatrol be, s meg kell rteni azt is, hogy a trgyterlet
hogyan mkdik a gyakorlatban.
A wumpus vilgban, amelyet mestersgesen ltrehozott szablyrendszer hatroz meg, knny az idevonatkoz
tudsbzist azonostani. (Vegyk szre azonban, hogy a szomszdossg defincija nem volt explicit megadva a
wumpus vilg szablyaiban.) A valdi trgyterletekben a relevancia problmja meglehetsen bonyolult lehet
pldul egy VLSI tervez szimulcis rendszernek figyelembe kell vennie a szrt kapacitsokat s a felleti
hatsokat.
3. Meg kell hatrozni a prediktumok, fggvnyek s konstansok sztrt. Ez azt jelenti, hogy a fontos
trgyterlet szint koncepcikat le kell fordtani logikai szint nevekre. Ez szmos, a megkzelts jellegt
trgyal krdst rint. Hasonlan, mint a programozsi stlusnak, ennek is jelents hatsa lehet a projekt
vgs sikerre. Pldul ilyen krds, hogy a csapdkat vajon objektumok jelentsk-e meg vagy egy a
ngyzetekre vonatkoz unris prediktum? Az gens irnya fggvny legyen-e vagy prediktum? A wumpus
helyzete az idtl fggjn-e? Mihelyt a vlaszts megtrtnt, az eredmny egy sztr, amit a trgyterlet
ontolgijnak (ontology) nevezznk. Az ontolgia fogalma egy olyan elmletet takar, ami a ltezs
termszett rja le. Meghatrozza, hogy milyen dolgok lteznek, de nem hatrozza meg a rjuk jellemz
tulajdonsgokat, sem a kztk fennll kapcsolatokat.
4. A trgyterletrl szl ltalnos tuds kdolsa. A tudsmrnk lerja a sztr szszes termjhez tartoz
aximkat. Ez lergzti (amennyire lehetsges) a termek jelentst, s lehetv teszi a szakrt szmra a
tartalom ellenrzst. Ez a lps gyakran feltrja a flrertelmezseket vagy a hinyossgokat a sztrban,
amelyeket a 3. lpshez jra s jra visszatrve, iteratv eljrssal javthatunk.
5. Az adott problma pldny lersnak kdolsa. Ha az ontolgia jl tgondolt, ez a lps mr knny lesz.
Egyszer atomi mondatokat kell az ontolgiban mr lert fogalmak pldnyaira megfogalmazni. Egy logikai
gens szmra a problmapldnyokat az rzkelk biztostjk, amikor a klnll tudsbzist kiegsztik
mondatokkal ugyangy, ahogy a hagyomnyos programoknak bemeneti adatokat adunk meg.
6. Lekrdezseket fogalmazunk meg a kvetkeztetsi folyamat szmra s vlaszokat vezetnk le. Itt kapjuk meg
az eddigi munknk jutalmt: mkdtethetjk a kvetkeztetsi folyamatot az aximkon s a
problmaspecifikus tnyeken, hogy megkapjuk a minket rdekl tnyeket.
7. Szrjk ki a hibkat a tudsbzisbl. Sajnos az els prblkozsra a krdsekre kapott vlaszok nagyon
ritkn lesznek helyesek. Pontosabban, a vlaszok helyesek lesznek a megadott tudsbzis szempontjbl,
felttelezve, hogy a kvetkeztetsi folyamat megfelel, de a vlaszok nem azok lesznek, amiket a felhasznl
vr. Pldul ha hinyzik egy axima, akkor bizonyos krdsek megvlaszolhatatlanok lesznek a tudsbzis
alapjn. Ilyenkor egy hibajavtsi folyamatra van szksg. A hinyz vagy tl gyenge aximk knnyen
megtallhatk gy, hogy felfedezzk azokat a helyeket, ahol a kvetkeztets lnca vratlanul megszakad.
Pldul ha a tudsbzis tartalmazza az egyik, csapdkra vonatkoz diagnosztikus aximt,
de nem tartalmazza a msikat, akkor az gens soha nem lesz kpes bizonytani a csapdk hinyt. A helytelen
aximk azonosthatk, mivel ezek hamis lltsok a vilgrl. Pldul az a mondat, hogy:
x LbakSzma(x, 4) Emls(x)
hamis a hllkre, ktltekre vagy ami mg fontosabb, az asztalokra nzve.
Fontos
234
Elsrend logika
Ennek a mondatnak a hamissga a tudsbzis tbbi rsztl fggetlenl meghatrozhat. Ezzel

szemben egy tipikus programhiba ilyen:
eltols = pozci + 1
Nem lehet ez alapjn megmondani, hogy a mondat helyes-e anlkl, hogy megnznnk a program
tbbi rszt. Pldul azt, hogy az eltols-t a jelenlegi pozcira vonatkozan hasznljuk-e, vagy arra,
amely eggyel a jelenlegi pozci mgtt van, vagy arra, hogy a pozci rtke megvltozott egy msik
llts ltal, s gy az eltols-t is meg kell vltoztatni.
Hogy jobban megrtsk ezt a htlpses folyamatot, alkalmazzuk most egy kiterjesztett pldra az
elektronikus ramkrk trgyterletre.
4.2. Az elektronikus ramkrk trgyterlete11

Ltrehozunk egy ontolgit s egy tudsbzist, amelynek felhasznlsval kpesek lesznk kvetkeztetseket
vgezni olyan tpus digitlis ramkrkrl, mint amilyet a 8.4. bra mutat. A tudstervezs htlpses
folyamatt fogjuk kvetni.
4.3. A feladat meghatrozsa

Szmos kvetkeztetsi feladatot lehet a digitlis ramkrkkel kapcsolatban elvgezni. A legmagasabb szinten
az ramkr funkcionalitst vizsglhatjuk. Pldul szablyosan ad-e ssze a 8.4. brn lthat ramkr? Ha
minden bemenet magas, akkor mi az A2 kapu kimenetnek llapota? Az ramkr szerkezetrl feltett krdsek is
rdekesek. Pldul melyek azok a kapuk, amelyek az els bemeneti ponthoz vannak kapcsolva? Tartalmaz-e az
ramkr visszacsatolsokat? Ebben az alfejezetben ezeket a feladatokat vizsgljuk meg. Lteznek az elemzsnek
rszletesebb szintjei is, pldul amelyek az idzts ksleltetsvel, az ramkr terletvel, ramfogyasztsval,
mkdtetsi kltsgeivel s gy tovbb kapcsolatosak. Minden egyes ilyen szint vizsglata tovbbi ismereteket
ignyel.
4.4. A relevns tuds sszegyjtse

Mit tudunk a digitlis ramkrkrl? A cljainknak megfelelen azt, hogy vezetkekbl s kapukbl llnak. A
jelek a vezetkeken keresztl ramlanak a kapuk bemeneti terminljhoz, s minden kapu egy jelet hoz ltre a
kimeneti terminlon, ami aztn egy msik vezetken ramlik. Ahhoz, hogy meghatrozzuk, melyek is ezek a
jelek, ismernnk kell, hogy a kapuk hogyan alaktjk t bemeneti jeleiket. Ngyfle kaput hasznlunk: az AND,
az OR s a XOR kapuknak kt bemenetk van, mg a NOT kapuknak csak egy. Minden kapunak egy kimenete
van. Az ramkrknek, hasonlan a kapukhoz, bemeneteik s kimeneteik is vannak.
Ahhoz, hogy kvetkeztetseket vgezhessnk a funkcionalitsrl s az sszekttetsekrl, nem szksges
magukrl a vezetkekrl vagy ezek tvonalairl, kt vezetk tallkozsnl lev keresztezdseirl tudst
megfogalmazni. Csak a be- s kimenetek kztti sszekttetsek szmtanak teht csak azt kell kimondani,
hogy egy kimenet ssze van-e kapcsolva egy msik bemenettel, anlkl hogy meg kellene emlteni a
vezetkeket, amik valjban sszektik ket. A trgyterletnek sok ms tnyezje van, ami a mi
vizsglatunkban nem relevns. Ilyen pldul a klnbz elemek mrete, formja, szne vagy ra.
8.4. bra - Egy C1-es digitlis ramkr, amelynek az a clja, hogy egy egybites teljes
sszeadst vgezzen. Az els kt bemenet az a kt bit, amit ssze kell adni, mg a
harmadik bemenet az tvitel. Az els kimenet az sszeg, mg a msodik kimenet az
tvitel a kvetkez sszead fel. Az ramkr kt XOR, kt AND s egy OR kaput
tartalmaz.
Ez az alfejezet a digitlis ramkrk meglehetsen sajtos bemutatsra vllalkozik. Mikzben nem javasoljuk, hogy valaki ez alapjn
ismerkedjen meg a digitlis ramkrkkel, s esetleg az itt bemutatottak alapjn prbljon digitlis ramkrket tervezni, az itt lertak
mindenkppen rdekes nzpontot tkrznek, s rdekes ksrletet jelentenek arra, hogy az elsrend logika fogalomkszletvel mutassk
be a digitlis ramkrket. (A szerk.)
11
235
Elsrend logika
Ha a clunk valami ms lenne, s nem a kapuszint tervezs helyessgnek ellenrzse, akkor az ontolgink is
ms lenne. Pldul ha az rdekelne minket, hogyan lehetne a hibkat a hibs ramkrkben megtallni, akkor
valsznleg j tlet lenne a vezetkekkel is foglalkozni az ontolgiban, mivel egy hibs vezetk
meghamisthatja a rajta keresztlhalad jelet. Az idztsi hibk megtallshoz a kapuk ksleltetsvel
kapcsolatos fogalmakat kellene lerni. Ha az rdekelne minket, hogy hogyan lehet egy nyeresges termket
tervezni, akkor az ramkrk kltsgnek s sebessgnek a piacon jelen lv egyb termkekkel trtn
sszehasonlthatsga lenne fontos.
4.5. A sztr meghatrozsa

Tudjuk, hogy ramkrkrl, be- s kimenetekrl, jelekrl s kapukrl akarunk beszlni. A kvetkez lps az
ezeket reprezentl fggvnyek, prediktumok s konstansok kivlasztsa. Az egyes kaputpusoktl fogunk
indulni, s vgl eljutunk az ramkrkig.
Elszr is meg kell tudnunk klnbztetni egy kaput a tbbi kaputl. Ezt gy rjk el, hogy konstansokat
hasznlunk a kapuk megnevezsre: X1, X2 s gy tovbb. Habr minden kapu a maga egyedi mdjn
kapcsoldik az ramkrhz, a viselkedse vagyis az a md, ahogyan talaktja a bemeneti jeleket kimeneti
jelekk csakis a tpustl fgg. Egy kapu tpusnak jellsre12 egy fggvnyt hasznlhatunk. Pldul rhatjuk,
hogy Tpus(X1) = XOR. Ez hozzrendeli az XOR konstanst egy bizonyos kaputpushoz. A tbbi konstans nevei:
OR, AND s NOT lesznek. A Tpus fggvny nem az egyetlen lehetsges mdja annak, hogy kdoljuk az
ontolgiai megklnbztetst. Hasznlhattunk volna egy binris prediktumot is, mint a Tpus(X1, XOR), vagy
tbb egyargumentum prediktumot, mint pldul az XOR(X1). Ezeknek a megoldsoknak brmelyike jl
mkdne, de a Tpus fggvny vlasztsval kikszbltk, hogy szksg legyen egy olyan aximra, amely azt
mondja ki, hogy minden egyes kapunak csak egyetlen tpusa lehet.
Ezutn megvizsgljuk a vgpontokat (be- s kimeneteket). Egy kapunak vagy ramkrnek egy vagy tbb
bemenete, s egy vagy tbb kimenete lehet. Mindegyiket elnevezhetnnk egyszeren egy konstanssal, mint
ahogy azt a kapukkal tettk. gy az X1 kapunak olyan vgpontjai lennnek, mint az X1Be1, az X1Be2 s az X1Ki1. A
hossz, sszetett elnevezseket azonban clszer kerlni. Az, hogy valamit X1Be1-nek neveznk, nem jelenti azt,
hogy ez az X1 els bemenete; mg ekkor is hozz kell tennnk valamit egy explicit lltst hasznlva.
Valsznleg szerencssebb egy fggvnnyel lerni egy kaput, hasonlan mint, ahogy Jnos kirly bal lbt
elneveztk BalLb(Jnos)-nak. gy teht jelljk az X1 kapu els bemenett gy, hogy: Be(1, X1). Egy hasonl
Ki fggvnyt hasznlunk a kimenetekre.
A kapuk kztti sszekttetst reprezentlhatjuk az sszekapcsolt prediktummal, ami kt vgpontot vesz
argumentumknt, pldul gy: sszekapcsolt(Ki(1, X1), Be(1, X2)).
Vgl, ismernnk kell, hogy egy jel magas vagy alacsony llapotban van-e. Erre egy lehetsg egy On binris
prediktum hasznlata, s akkor igaz, ha a jel egy vgponton magas rtk. Ez azonban egy kiss megnehezti
az olyan krdsek feltevst, mint pldul: Mik a lehetsges rtkei a C1 ramkr kimenetein lv jeleknek?
Vegyk szre, hogy megfelel betkkel kezdd neveket hasznltunk A1, X1 s gy tovbb pusztn azrt, hogy knnyebben olvashatv
tegyk a pldt. A tudsbzisnak mg gy is tartalmaznia kell a kapuk tpusra vonatkoz informcikat.
12
236
Elsrend logika
Ezrt be fogunk vezetni objektumokknt kt jelrtket, az 1-et s a 0-t, valamint egy Jel fggvnyt, aminek
egy vgpont az argumentuma, s ami kijelli ennek a vgpontnak a jelrtkt.
4.6. A trgyterlettel kapcsolatos ltalnos tuds kdolsa

Az egyik jele annak, hogy megfelel ontolgit hasznlunk az, hogy kevs olyan ltalnos szably van, amit
ksbb a pldnyokra specifikuss kellene tennnk. A helyes sztr jellemzje az, hogy minden egyes szablyt
vilgosan s tmren meg tudunk fogalmazni. A mi pldnkban csak ht egyszer szablyra van szksgnk,
hogy lerjunk mindent, amit tudnunk kell az ramkrkrl.
1. Ha kt vgpont ssze van kapcsolva, akkor ugyanaz lesz a jelrtkk:
t1, t2 sszekapcsolt(t1, t2) Jel(t1) = Jel(t2)
2. A jel minden vgpontnl vagy 1, vagy 0 (de soha nem mindkett):

t1 Jel(t) = 1 Jel(t) = 0
1 0
3. Az sszekapcsolt egy felcserlhet (kommutatv) prediktum:

t1, t2 sszekapcsolt(t1, t2) sszekapcsolt(t1, t2)
4. Egy OR kapu kimenete akkor s csak akkor 1, ha brmelyik bemenete 1:

g Tpus(g) = OR
Jel(Ki(1, g)) = 1 n Jel(Be(n, g)) = 1
5. Egy AND kapu kimenete akkor s csakis akkor 0, ha brmelyik bemenete 0:

g Tpus(g) = AND
Jel(Ki(1, g)) = 0 n Jel(Be(n, g)) = 0
6. Egy XOR kapu kimenete akkor s csakis akkor 1, ha a bemenetei klnbzk:

g Tpus(g) = XOR
Jel(Ki(1, g)) = 1 Jel(Be(1, g) Jel(Be(2, g))
7. Egy NOT kapu kimenete klnbzik a bemenettl:

g (Tpus(g) = NOT) Jel(Ki(1, g)) Jel(Be(1, g))
4.7. A problmaspecifikus pldnyok kdolsa

A 8.4. brn bemutatott ramkr neve C1 s az itt kvetkez lerssal adjuk meg. Elszr kategorizljuk a
kapukat:
Tpus(X1) = XOR Tpus(X2) = XOR
Tpus(A1) = AND Tpus(A2) = AND
Tpus(O1) = OR
Ezutn lerjuk a kztk fennll kapcsolatokat:

sszekapcsolt(Ki(1, X1), Be(1, X2)) sszekapcsolt(Be(1, C1), Be(1, X1))
sszekapcsolt(Ki(1, X1), Be(2, A2)) sszekapcsolt(Be(1, C1), Be(1, A1))
sszekapcsolt(Ki(1, A2), Be(1, O1)) sszekapcsolt(Be(2, C1), Be(2, X1))
sszekapcsolt(Ki(1, A1), Be(2, O1)) sszekapcsolt(Be(2, C1), Be(2, A1))
237
Elsrend logika
sszekapcsolt(Ki(1, X2), Ki(1, C1)) sszekapcsolt(Be(3, C1), Be(2, X2))

sszekapcsolt(Ki(1, O1), Ki(2, C1)) sszekapcsolt(Be(3, C1), Be(1, A2))
4.8. Lekrdezsek megfogalmazsa a kvetkeztetsi eljrs fel

Milyen bemeneti kombincik esetben lenne a C1 els kimenete (az sszegelem) 0 s a C1 msodik kimenete (a
maradk elem) 1?
i1, i2, i3 Jel(Be(1, C1)) = i1 Jel(Be(2, C1)) = i2 Jel(Be(3, C1)) = i3
Jel(Ki(1, C1)) = 0 Jel(Ki(2, C1)) = 1
A vlaszok az i1, i2 s i3 vltozk behelyettestsei gy, hogy a keletkezett mondat kvetkezzen a tudsbzisbl.
Hrom ilyen behelyettests ltezik:
{i1/1, i2/1, i3/0} {i1/1, i2/0, i3/1} {i1/0, i2/1, i3/1}
Melyek a az sszead ramkr sszes vgpontjnak lehetsges rtkhalmazai?

i1, i2, i3, o1, o2 Jel(Be(1, C1)) = i1 Jel(Be(2, C1)) = i2
Jel(Be(3, C1)) = i3 Jel(Ki(1, C1)) = o1 Jel(Ki(2, C1)) = o2
Ez az utols lekrdezs egy teljes bemenet-kimenet tblzatot ad meg az eszkzre, amelyet aztn
ellenrizhetnk, hogy valban helyesen adja-e ssze a bemeneteket. Ez egy egyszer plda az ramkr
ellenrzsre (circuit verification). Az ramkr bemutatott defincijt nagyobb digitlis rendszerek ptsre
is felhasznlhatjuk, amelyekre aztn ugyanez a fajta ellenrzsi folyamat alkalmazhat (lsd 8.17. feladat). Sok
trgyterlet kezelhet egy ehhez hasonl strukturlt tudsbzis-fejlesztssel, amelyekben sszetettebb
koncepcikat hatrozunk meg egyszerbb koncepcikra ptve.
4.9. Hibk kiszrse a tudsbzisbl

Sokflekppen perturblhatjuk a tudsbzist, hogy meglssuk, milyen fajta hibs viselkedsek fordulhatnak el.
Pldul ttelezzk fel, hogy kihagyjuk az 1 013 lltst. A rendszer ebben a pillanatban mr nem lesz kpes
semmilyen kimenetet sem produklni az ramkrben, kivve, ha a bemenet a 000 vagy az 110. Rbukkanhatunk
a problmra, ha minden egyes kapu kimenetre rkrdeznk. Pldul, megkrdezhetjk:
i1, i2, o Jel(Be(1, C1)) = i1 Jel(Be(2, C1)) = i2 Jel(Ki(1, X1))
ami felfedi, hogy az X1-nl nem ismerjk a kimenetet az 10 s a 01 bemenetek esetn. Ezutn megnzzk az
XOR kapu aximit az X1-re alkalmazva:
Jel(Ki(1, X1)) = 1 Jel(Be(1, X1)) Jel(Be(2, X1))
Ha tudjuk, hogy a bemenetek, mondjuk, 1 s 0 voltak, akkor ezt lervidthetjk gy:

Jel(Ki(1, X1)) = 1 1 0
Most mr lthat, hogy mi a problma oka: a rendszer nem kpes kikvetkeztetni azt, hogy Jel(Ki(1, X1)) = 1,
gy meg kell neki mondanunk, hogy 1 0.
5. sszefoglals
Ebben a fejezetben megmutattuk, hogy hogyan hasznlhat az elsrend logika (first-order logic) egy
tudsalap gens reprezentcis nyelveknt. A legfontosabb megllaptsok a kvetkezk:
A tudsreprezentcis nyelveknek deklaratvnak, kompozcisnak, kifejeznek, a szvegkrnyezettl
fggetlennek s egyrtelmnek kell lennik.
Ez a fajta kihagys elgg gyakori, mert az emberek ltalban felttelezik, hogy a klnbz nevek klnbz dolgokat takarnak. A
logikai programozsi rendszerek, amelyeket bvebben a 9. fejezetben mutatunk be, szintn megteszik ezt a felttelezst.
13
238
Elsrend logika
A logikk klnbznek ontolgiai s episztemolgiai megllaptsaikban. Amg az tletlogika

megllaptsai csak tnyek ltezsre vonatkoznak, addig az elsrend logika az objektumok s a relcik
ltezst is felhasznlhatja, gy nagyobb kifejezervel rendelkezik.
Egy lehetsges vilgot vagy modellt az elsrend logikban objektumok egy halmaza definil, a kztk lv
relcik s a rjuk alkalmazhat fggvnyek ltal.
A konstansszimblumok (constant symbols) objektumokat neveznek meg, a prediktumszimblumok
(predicate symbols) relcikat, mg a fggvnyszimblumok (function symbols) fggvnyeket. Egy
interpretci megadja a lekpezst a szimblumok s a modell kztt. Az sszetett termek (complex terms)
fggvnyszimblumokat rendelnek hozz a termekhez, hogy nevet adjanak egy objektumnak. Ha megadunk
egy interpretcit s egy modellt, a mondat igazsgtartalmt meghatroztuk.
Egy atomi mondat (atomic sentence) egy vagy tbb termre alkalmazott prediktumbl ll. A mondat csak
akkor igaz, ha a prediktum ltal megnevezett relci fennll a termek ltal megnevezett objektumok kztt.
Az sszetett mondatok (complex sentences) az tletlogikhoz hasonl mdon sszektjeleket
hasznlnak, a kvantorok (quantifiers) hasznlata pedig lehetv teszi ltalnos szablyok megfogalmazst
is.
Egy tudsbzis ptse az elsrend logikban a trgyterlet alapos elemzst ignyli, valamint egy sztr
megvlasztst s a kvnt kvetkeztetsek elrshez szksges aximk kdolst.

Habr mr Arisztotelsz logikja kpes volt objektumok feletti ltalnostsok kezelsre, az igazi elsrend
logika keletkezst Gottlob Frege Begriffschrift (Fogalmak rsa vagy Fogalmi jells; Frege, 1879) c. mvnek
megjelenstl, a kvantorok bevezetstl szmthatjuk. A Frege-fle kpessg a kvantorok egymsba gyazsa
jelents elrelpst jelentett, de az ltala alkalmazott jellsrendszer igen krlmnyes volt. Az elsrend logika
jelenlegi jellsrendszere alapveten Giuseppe Peantl szrmazik (Peano, 1889), a szemantika azonban
megegyezik a Frege ltal bemutatottal. Elgg klns, hogy Peano aximi nagyrszt Grassmann-nak
(Grassmann, 1861) s Dedekindnek (Dedekind, 1888) voltak ksznhetk.
Az elsrend logika fejldsnek fontos akadlya volt az egyvltozs prediktumok eltrbe helyezse, illetve a
tbbvltozs prediktumok kizrsa. Az egyvltozs prediktumokhoz val ragaszkods ltalnosan jellemz
volt a logikai rendszerekre Arisztotelsztl Boole-ig. A logikai relcik els rendszerezett lerst Augustus De
Morgan adta (De Morgan, 1864). De Morgan a kvetkez pldval mutatta be az arisztotelszi logikval nem
kezelhet kvetkeztetseket: Minden l llat; ezrt a l feje egy llat feje. Ez a kvetkeztets nem valsthat
meg az arisztotelszi rendszerrel, mert brmely, a kvetkeztetsben alkalmazhat szablynak elszr az x a feje
y-nak kt prediktumot tartalmaz mondatot kell elemeznie. A relcik logikjt alaposan tanulmnyozta
Charles Sanders Peirce (Peirce, 1870), aki Frege-tl fggetlenl, nhny vvel ksbb szintn kifejlesztette az
elsrend logikt (Peirce, 1883).
Leopold Lwenheim adta meg a modellelmlet rendszerezett lerst az elsrend logika szmra (Lwenheim,
1915). Cikke az egyenlsgszimblumot mr a logika szerves rsznek tekinti. Lwenheim eredmnyeit Thoralf
Skolem fejlesztette tovbb (Skolem, 1920). Alfred Tarski a halmazelmletet felhasznlva megadta az igazsg s
a modellelmleti kielgthetsg explicit defincijt (Tarski, 1935, 1956).
Elssorban McCarthy rdeme az elsrend logika alkalmazsa az MI-rendszerek eszkzeknt (McCarthy,
1958). A logikn alapul MI-rendszerek fejldsben jelents elrelpst jelentett Robinson rezolcis
algoritmusa (Robinson, 1965), ami egy komplett elsrend logikai kvetkeztetsi folyamat. A rezolcit a 9.
fejezetben fogjuk trgyalni. A logikai megkzelts alapjaival a Stanfordon sok eredmnyt rtek el. Cordell
Green kifejlesztett egy elsrend logikai kvetkeztetsi rendszert, a QA3-at (Green, 1969a, 1969b), amely
ahhoz vezetett, hogy elszr ksreltek meg ltrehozni egy logikai robotot a Stanford Research Institute-ban
(Fikes s Nilsson, 1971). Az elsrend logikt Zohar Manna s Richard Waldinger alkalmazta a programokban
val kvetkeztetsre (Manna s Waldinger, 1971), majd ksbb Michael Genesereth az ramkrkhz
(Genesereth, 1984). Eurpban a logikai programozst az elsrend kvetkeztets korltozott vltozatt
fejlesztettk ki a nyelvszeti elemzsekhez (Colmerauer s trsai, 1973) s ltalnos deklaratv rendszerekhez
(Kowalski, 1974). A szmtgpes logikval Edinburgh-ban sikeresen foglalkoztak, az LCF (Szmtsi
Funkcik Logikja) projekten keresztl (Gordon s trsai, 1979). Ezeket a fejlesztseket a 9. s 10. fejezetben
kvetjk nyomon.
239
Elsrend logika
Szmos sznvonalas, az elsrend logika korszer bevezetst ad rs ismert. Ezek kzl Quine mve az egyik
legjobban ttekinthet (Quine, 1982). Enderton rsa inkbb matematikai megkzeltst kvet (Enderton, 1972).
Bell s Machover ersen formlis lerst ksztett az elsrend logikrl, s ezzel egytt szmos bonyolult, a
logika trgyterletbe tartoz tmrl (Bell s Machover, 1977). Manna s Waldinger a szmtstechnika
oldalrl kzelt, jl olvashat bevezetst ksztett (Manna s Waldinger, 1985). Gallier az elsrend logika
rendkvl precz matematikai bemutatst adta meg, egytt a logika automatikus kvetkeztetsre trtn
alkalmazsnak rszletes trgyalsval (Gallier, 1986). A Logical Foundations of Artificial Intelligence (A
mestersges intelligencia logikai alapjai) (Genesereth s Nilsson, 1987) c. knyv a logika alapos bemutatsn
kvl az rzeteket s cselekvseket kezel logikai gensek els rendszerezett bevezetst nyjtja.
5.2. Feladatok
8.1.
Egy logikai tudsbzis a vilgot mondatokkal reprezentlja hatrozott struktra nlkl. Egy analg (analog)
reprezentci viszont strukturlt, ahol a lers struktrja kzvetlenl megfelel a reprezentlt dolog
struktrjnak. Tekintsk egy orszg auttrkpt mint az orszgrl ismert tnyek egy rsznek analg
reprezentcijt. A trkp ktdimenzis felptse megfelel a terlet ktdimenzis felsznnek.
a. Adjon t pldt a trkpnyelv szimblumaira.
b. Explicit mondatnak nevezzk az olyan mondatot, amelyet a reprezentci ltrehozja kzvetlenl ler. Az
implicit mondatok az explicit mondatokbl keletkeznek az analg reprezentci tulajdonsgai szerint. Adjon
hrom pldt a trkpnyelv implicit s explicit mondataira.
c. Adjon az orszg fizikai struktrjt ler tnyekre hrom olyan pldt, amely nem reprezentlhat a
trkpnyelvvel.
d. Adjon kt pldt olyan tnyekre, amelyek egyszerbben kifejezhetk a trkpnyelvvel, mint az elsrend
logikval.
e. Adjon mg kt pldt analg reprezentcikra. Melyek az elnyei s a htrnyai ezeknek a nyelveknek?
8.2.
Tekintsnk egy tudsbzist, amely csak kt kijelentst tartalmaz: P(a) s P(b). Ebbl a tudsbzisbl
kvetkezik-e az x P(x)? Magyarzza meg vlaszt modellek segtsgvel.
8.3.
rvnyes-e a kvetkez mondat: x, y x = y? Magyarzza meg.
8.4.
rjon le egy olyan logikai mondatot, hogy minden olyan vilgban, ahol ez a mondat igaz, pontosan csak egy
objektum legyen.
8.5.
Tekintsnk egy szimblumsztrat, amely tartalmaz egy c konstansszimblumot, pk prediktumszimblumokat
minden egyes k rtkre s fggvnyszimblumokat minden egyes k rtkhez, ahol 1 k A. A trgyterlet
mrett rgztsk D-ben. Brmely adott interpretcimodell-kombinciban minden egyes prediktum vagy
fggvny hozz van rendelve az ugyanazon rtkhez tartoz relcihoz vagy fggvnyhez. Felttelezhetjk,
hogy a modellben szerepl fggvnyek lehetv teszik, hogy nhny bemenetnek ne legyen rtke a fggvny
szmra (vagyis, hogy az rtk a lthatatlan objektum). Vezessen le egy formult a lehetsges
interpretcimodell-kombincik szmnak megllaptsra a D elemet tartalmaz trgyterletben. Ne riassza
meg, ha el kell tvoltania a felesleges kombincikat.
8.6.
Reprezentlja a kvetkez mondatokat az elsrend logikban gy, hogy egy kvetkezetes sztrt hasznl
(amelyet elzleg definilnia kell):
240
Elsrend logika
a. Nhny dik felvette a francit 2001 tavaszi flvben.

b. Minden dik, aki felveszi a francit, tmegy a vizsgn.
c. Csak egy dik vette fel a grgt 2001 tavaszi flvben.
d. A grgben elrt legmagasabb pontszm mindig magasabb a franciban elrt legmagasabbnl.
e. Minden szemly okos, aki biztostst kt.
f. Senki nem kt drga biztostst.
g. Van egy gynk, aki csak azokkal kt biztostst, akiknek mg nincs ktvnyk.
h. Van egy borbly, aki minden frfit megborotvl a vrosban, aki nem borotvlkozik.
i. Az a szemly, aki az Egyeslt Kirlysgban szletik, s akinek mindkt szlje brit llampolgr vagy ottani
lakos, szletsnl fogva brit llampolgr.
j. Az a szemly, aki az Egyeslt Kirlysgon kvl szletik, s egyik szlje szletett brit llampolgr, az
szrmazsa alapjn brit llampolgr.
k. A politikusok brmikor bolondd tehetnek nhny embert, s minden embert bolondd tehetnek egy kis
idre, de nem tehetnek bolondd mindenkit rkre.
8.7.
Reprezentlja a Minden nmet azonos nyelvet beszl mondatot prediktumkalkulusban. Hasznlja a Beszl(x,
l) prediktumot, amely jelentse azt, hogy x az l nyelvet beszli.
8.8.
Milyen aximra van szksgnk, hogy ezt a tny kikvetkeztessk: N(Laura), ha adottak a tnyek: Frfi(Jim)
s Hzastrsak(Jim, Laura)?
8.9.
rjon egy ltalnos tny- s aximahalmazt, hogy reprezentlja a kvetkez lltst: Wellington hallott
Napleon hallrl; s hogy helyesen megvlaszolhassuk a krdst: Hallott Napleon Wellington hallrl?.
8.10.
rja t a 7.5. alfejezetben bemutatott tletlogikai wumpus vilg tnyeit elsrend logikba. Mennyivel tmrebb
ez a vltozat?
8.11.
Ksztsen aximkat, amelyek lerjk a kvetkez prediktumokat: Unokja, Ddnagyapja, Fivre, Hga,
Lnya, Fia, Nagynnje, Nagybtyja, Sgornje, Sgora, Unokatestvre.
rja le a 8.5. brn lthat csaldfa tnyeit. Hasznljon logikai kvetkeztet rendszert, s minden lert mondat
legyen a kvetkeztet rendszer szmra KIJELENT-ve, s KRDEZ-ze meg, hogy ki Erzsbet unokja, ki Diana
unokabtyja s kik Zara ddszlei.
8.12.
rjon le egy mondatot, amely azt lltja, hogy a + egy kommutatv funkci. Kvetkezik ez a mondat Peano
aximibl? Ha igen, magyarzza meg, hogy mirt, ha nem, adjon meg egy modellt, amelyben az aximk
igazak, az n mondata pedig hamis.
8.13.
Magyarzza meg, mi a hibs az halmaz tagsg prediktum kvetkez javasolt defincijval:
241
Elsrend logika
x, s x {x s}
x, s x s y
x {y s}
8.14.
A halmazaximkat pldaknt hasznlva, ksztsen aximkat a listk trgyterletre, amelyek tartalmazzk a
korbban a fejezetben emltett sszes konstanst, fggvnyt s prediktumot.
8.15.
Magyarzza meg, hogy mi a hiba a kvetkez ajnlott definciban a szomszdos ngyzetekre a wumpus
vilgban:
x, s Szomszdos([x, y], [x + 1, y]) Szomszdos([x, y], [x, y + 1])
8.5. bra - Egy tipikus csaldfa. Az = szimblum a hzastrsakat kti ssze, a nyilak a
gyerekekre mutatnak.
8.16.
rja meg a wumpus helyzetnek meghatrozshoz szksges aximkat a Wumpus konstansszimblum s a
Be(Wumpus, Helyzet) binris prediktum felhasznlsval. Ne felejtse el, hogy csak egy wumpus van.
8.17.
Bvtse ki a 8.4. alfejezetben lert sztrt gy, hogy definilja az sszeadst az n-bites binris szmokra. Ezutn
kdolja a 8.6. brn lthat ngybites sszead lerst, s tegye fel azokat a krdseket, amelyek szksgesek
ahhoz, hogy igazoljuk sszead-helyessgt.
8.18.
A fejezetben az ramkr reprezentlsa rszletesebb a szksgesnl, ha csak az ramkr mkdse rdekel
minket. Egy egyszerbb formula brmely m bemenet, n kimenet kaput vagy ramkrt ler, egy m + n
argumentumos prediktum hasznlatval, gy, hogy a prediktum pontosan akkor igaz, amikor a bemenet s a
kimenet konzisztens. Pldul, a NOT-kapukat gy rjuk le: NOT(i, o), amelynl a NOT(0, 1)-et s a NOT(1, 0)-t
ismerjk. A kapuk sszelltsa a kapuprediktumok sszektsvel van definilva, amelyben a kzs vltozk
direkt sszekttetseket jeleznek. Pldul egy NAND ramkrt sszellthatunk AND-ekbl s NOT-okbl:
i1, i2, oa, o NAND(i1, i2, o) AND(i1, i2, o) NOT(oa, o)
Ezt a reprezentcit felhasznlva definilja a 8.4. brn lthat egybites sszeadt s a 8.6. bra ngybites
sszeadjt, s magyarzza meg, milyen lekrdezseket hasznlna, hogy igazolja a megoldsokat. Milyen fajta
lekrdezseket nem fogad el ez a reprezentci, amelyeket pedig a 8.4. alfejezetben lv reprezentci
elfogadott?
242
Elsrend logika
8.6. bra - Egy ngybites sszead
8.19.
Krjen tlevlignyl lapot az n sajt orszgba, nevezze meg azokat a szablyokat, amelyek az ignyls
jogosultsgt meghatrozzk, s fordtsa le az elsrend logika nyelvre a 8.4. alfejezetben felvzolt lpseket
kvetve.
243
9. fejezet - Kvetkeztets elsrend

logikban
Ebben a fejezetben definilunk egy olyan hatkony kvetkeztetsi mechanizmust, amelyik kpes megvlaszolni az
elsrend logikban feltett krdseket.
A 7. fejezetben meghatroztuk a kvetkeztets (inference) fogalmt, s bemutattuk, hogy hogyan rhet el
helyes s teljes kvetkeztets az tletlogikban. Ebben a fejezetben kiterjesztjk ezeket az eredmnyeket, hogy
olyan algoritmusokat kapjunk, amelyek brmely, az elsrend logikban feltehet krdsre vlaszolni tudnak.
Ez jelents eredmny, mivel az elsrend logikval tbb-kevsb mindent kifejezhetnk, ha elg alaposan
vgezzk a feladatot.
A 9.1. alfejezet kvetkeztetsi szablyokat vezet be a kvantorokra, s megmutatja, hogy hogyan lehet jllehet
nagy erfesztsek rn az elsrend logikai kvetkeztetst tletlogikai kvetkeztetsre reduklni. A 9.2.
alfejezet lerja az egyests (unification) tlett, bemutatva, hogy az egyests felhasznlsval, hogyan
alkothatunk kvetkeztetsi szablyokat, amelyek kzvetlenl az elsrend logikai mondatokra alkalmazhatk.
Ezutn a 9.3. alfejezetben megvizsgljuk az elsrend logikai algoritmusok hrom nagy csaldjt: az elrefel
lncolst (forward chaining) s ennek alkalmazst a deduktv adatbzisokban (deductive databases) s a
produkcis rendszerekben (production systems). A htrafel lncolst (backward chaining) s a logikai
programozst (logic programming) alkalmaz rendszereket a 9.4. alfejezetben trgyaljuk; mg a rezolci
alap ttelbizonyt (theorem-proving) rendszereket a 9.5. alfejezet ismerteti. ltalnossgban mindig a
leghatkonyabb, az adott feladatban reprezentland tnyeket s aximkat kezelni kpes mdszert prbljuk
hasznlni. A teljesen ltalnos, a tetszleges elsrend logikai mondatokon alkalmazhat rezolcis
kvetkeztets ltalban kevsb hatkony, mint a bizonyos tpus mondatokon alkalmazhat elre- vagy
htrafel lncolst hasznl megoldsok.
1. tletlogikai kvetkeztets kontra elsrend logikai

kvetkeztets
Ez s a kvetkez alfejezet bemutatja azokat a gondolatokat, amelyeken a modern logikai kvetkeztetsi
rendszerek alapulnak. Nhny egyszer kvetkeztetsi szabllyal kezdjk, amelyeket kvantorral elltott
mondatokhoz alkalmazhatunk, hogy a segtsgkkel kvantorok nlkli mondatokhoz juthassunk. Ezek a
szablyok termszetes mdon elvezetnek minket ahhoz a gondolathoz, hogy az elsrend kvetkeztets
megvalsthat azltal, hogy a tudsbzist tletlogikv alaktjuk t, s a mr ltalunk ismert tletlogikai
kvetkeztetst hasznljuk. A kvetkez alfejezet rmutat egy kzenfekv egyszerstsre, amellyel olyan
kvetkeztetsi mdszerekhez juthatunk, amelyek kzvetlenl kpesek az elsrend mondatok felhasznlsra.
1.1. Kvantorokra vonatkoz kvetkeztetsi szablyok

Kezdjk az univerzlis kvantorok vizsglatval. Ttelezzk fel, hogy a tudsbzisunk tartalmazza a standard
hagyomnyos aximkat, amelyek szerint minden moh kirly gonosz:
x Kirly(x) Moh(x) Gonosz(x)
Ebbl lehetsgesnek tnik kikvetkeztetni a kvetkez mondatokat:

Kirly(Jnos) Moh(Jnos) Gonosz(Jnos)
Kirly(Richrd) Moh(Richrd) Gonosz(Richrd)
Kirly(Apja(Jnos)) Moh(Apja(Jnos)) Gonosz(Apja(Jnos))
...
Az univerzlis pldnyosts (Universal Instantiation, UI) szablya kimondja, hogy az adott vltoz brmely
alaptermmel (ground term) (vltozk nlkli termmel) val helyettestsvel elrhet mondatokat
244
Kvetkeztets elsrend logikban
kikvetkeztethetjk.1 Ahhoz, hogy formlisan le tudjuk rni a kvetkeztetsi szablyokat, a 8.3. alfejezetben
bevezetett helyettests (substitution) fogalmt hasznljuk. A HELYETTEST (, ) fogja jellni annak az
eredmnyt, hogy egy behelyettestst alkalmazunk az mondathoz. Ekkor a szably gy rhat le:
brmely v vltozra s g alaptermre. Pldul a korbban megadott hrom mondatot megkaphatjuk a kvetkez
helyettestsekkel {x/Jnos}, {x/Richrd} s {x/Apj(Jnos)}.
Az ennek megfelel egzisztencilis pldnyostsi (Existential Instantiation) szably az egzisztencilis
kvantorra egy kicsivel komplikltabb. Minden mondatra, v vltozra s olyan k konstans szimblumra, amely
sehol mshol nem jelenik meg a tudsbzisban:
Pldul abbl a mondatbl, hogy:

kikvetkeztethetjk ezt a mondatot:

Korona(C1) Fejn(C1, Jnos)
feltve, ha a C1 nem jelenik meg sehol mshol a tudsbzisban. Alapjban vve az egzisztencilis mondat azt
mondja ki, hogy van valamely objektum, amely eleget tesz egy felttelnek, s a pldnyosts folyamata csak
nvvel ltja el ezt az objektumot. Ez a nv viszont mr nem tartozhat ms objektumhoz. Egy szp pldt
tallunk a matematikban: ttelezzk fel, hogy tudjuk, ltezik olyan szm, amely egy kicsit kisebb, mint
2,71828, s eleget tesz annak az egyenletnek, hogy: d(xy)/dy = xy az x-re. Adhatunk nevet ennek a szmnak, mint
pldul e, de hiba lenne olyan nevet adni, amely mr egy ltez objektumhoz tartozik, mint pldul a . A
logikban ezt az j nevet Skolem-konstansnak (Skolem constant) nevezzk. Az egzisztencilis pldnyosts
egy specilis esete egy ltalnosabb folyamatnak, amelyet skolemizcinak (skolemization) neveznk, s
amelyet a 9.5. alfejezetben mutatunk be.
Amellett hogy az egzisztencilis pldnyosts bonyolultabb, mint az univerzlis pldnyosts, kiss klnbz
szerepet is jtszik a kvetkeztetsben. Mg az univerzlis pldnyostst tbbszr is alkalmazhatjuk, hogy sok
klnbz eredmnyhez jussunk, az egzisztencilis pldnyostst csak egyszer vgezhetjk el, majd az
egzisztencilis kvantorral elltott mondattl megszabadulhatunk. Pldul amint hozzadtuk a tudsbzishoz a
Meggyilkol(Gyilkos, ldozat) mondatot, mr nincs szksgnk a x Meggyilkol(x, ldozat) mondatra.
Pontosabban megfogalmazva, az j tudsbzis logikailag nem ekvivalens a rgivel, de tekinthetjk gy, hogy a
kvetkeztets szempontjbl ekvivalens (inferentially equivalent), azaz pontosan akkor kielgthet, amikor
az eredeti tudsbzis is kielgthet.
1.2. Redukls tletlogikra

Ha egyszer vannak szablyaink arra, hogy kvantorral elltott mondatokbl hogyan kvetkeztethetnk kvantor
nlkli mondatokra, akkor vissza tudjuk vezetni az elsrend kvetkeztetst az tletlogikai kvetkeztetsre.
Ebben az alfejezetben ttekintjk ennek a mdszernek a legfontosabb elemeit; a rszletekrl a 9.5. alfejezetben
fogunk szlni.
Az els gondolat az, hogy ppen gy, ahogyan egy egzisztencilis kvantorral elltott mondatot felcserlhetnk a
mondat egy pldnyval, egy univerzlis kvantorral elltott mondatot is felcserlhetnk a mondat sszes
lehetsges pldnyostsainak halmazval. Pldul ttelezzk fel, hogy a tudsbzisunk mindssze a kvetkez
mondatokat tartalmazza:
Ne keverjk ssze ezeket a helyettestseket a kiterjesztett interpretcikkal, amelyeket a kvantorok szemantikjnak a meghatrozsra
hasznltunk. A helyettests egy vltozt cserl le egy termre (egy szintaktikai elemre), hogy j mondatot hozzon ltre, ezzel szemben egy
interpretci hozzrendel egy vltozt egy objektumhoz a trgyterletben.
1
245
Kirly(Jnos) (9.1)
Moh(Jnos)
Fivr(Richrd, Jnos)
Ekkor alkalmazzuk az univerzlis pldnyostst az els mondatra gy, hogy az sszes lehetsges alaptermhelyettestst felhasznljuk a tudsbzissztrbl, ami ebben az esetben az {x/Jnos} s az {x/Richrd}. gy ezt
kapjuk:
Kirly(Jnos) Moh(Jnos) Gonosz(Jnos)
Kirly(Richrd) Moh(Richrd) Gonosz(Richrd)
s megvlhatunk az univerzlis kvantorral elltott mondattl. Mrmost, a tudsbzist alapveten tletkalkulusbelinek tekinthetjk, ha az alap atomi mondatokat, mint a Kirly(Jnos), Moh(Jnos) stb., tletlogikai
szimblumoknak tekintjk. gy teht a 7. fejezetben bemutatott brmely teljes tletlogikai algoritmust
alkalmazhatjuk, hogy olyan kvetkeztetshez juthassunk, mint a Gonosz(Jnos).
Ez a technika az tletlogikai lltsokra val visszavezets (propositionalization), amelyet teljesen
ltalnoss tehetnk, mint azt a 9.5. alfejezetben be is fogjuk mutatni. Ez azt jelenti, hogy minden elsrend
tudsbzis s lekrdezs talakthat tletlogikai mondatokra gy, hogy a tudsbzis vonzatai nem vltoznak.
gy teht van egy teljes kvetkeztetsi folyamatunk vonzatok levezetsre. Vagy taln mgsem? Van egy
problma: amikor a tudsbzis tartalmaz fggvnyszimblumot, a lehetsges alaptermek helyettestseinek
halmaza vgtelen! Pldul ha a tudsbzis megemlti az Apja szimblumot, akkor vgtelen szm egymsba
gyazott termeket hozhatunk ltre, mint pldul az Apja(Apja(Apja(Jnos))). Az tletlogikai algoritmusainknak
teht nehzsgeik lesznek a vgtelen nagysg mondathalmazokkal.
Szerencsre ismert egy Jacques Herbrandnak ksznhet hres ttel az elbbi problmra (Herbrand, 1930), ami
azt mondja ki, hogy ha egy mondat kvetkezik az eredeti, elsrend tudsbzisbl, akkor ltezik olyan
bizonyts, amely csak egy vges mret rszhalmazt hasznl fel az tletkalkulus-belire talaktott
tudsbzisbl. Mivel brmely ilyen rszhalmazban az alaptermeknek van egy maximlis begyazsi mlysge,
meg lehet tallni a rszhalmazt gy, hogy elszr generljuk az sszes pldnyt a konstans szimblumokhoz
(Richrd s Jnos), azutn az sszes 1-es mlysg termet (Apja(Richrd) s Apja(Jnos)), majd az sszes 2-es
mlysg termet, s gy tovbb mindaddig, amg kpesek lesznk megalkotni a vonzatmondat tletlogikai
bizonytst.
Fontos
Felvzoltuk az elsrend kvetkeztets egy megkzeltst az tletlogikai lltsokra val
visszavezets rvn, amely teljes (complete) teht brmely kvetkezmnyknt kapott mondatot
bizonytani tudunk. Ez jelents eredmny, ha figyelembe vesszk, hogy a lehetsges modellek szma
vgtelen. Msrszt viszont nem tudhatjuk, hogy a mondat vonzat-e, amg a bizonyts nincs ksz. Mi
trtnik, ha mondat nem vonzata a TB-nek? Meg tudjuk-e ezt llaptani? Nos, ahogy ez majd kiderl,
az elsrend logika esetben erre a krdsre a vlasz nemleges. A bizonytsi eljrs tovbb
folytatdik, egyre mlyebben begyazott termeket generlva, s nem tudhatjuk, hogy a folyamat egy
vgtelen ciklusba kerl, vagy hamarosan megleljk a bizonytst. Ez nagyon hasonl a Turing gpek
lellsi problmjhoz. Alan Turing s Alonzo Church egymstl fggetlenl s eltr mdon
bizonytottk be ennek a krdsnek az eldnthetetlensgre vonatkoz ttelt (Turing, 1936; Church,
1936). Az elsrend logikban a maga utn vonzs krdse flig eldnthet (semidecidable), ami azt
jelenti, hogy ltezik olyan algoritmus, amely igent mond minden vonzatmondatra, de nem ltezik olyan
algoritmus, amely emellett kpes nemet mondani a nem levezethet mondatokra.
2. Egyests s kiemels
Az elz alfejezet bemutatta az elsrend kvetkeztetsnek azt az rtelmezst, amely az 1960-as vekig
ltezett. Az les szem olvask (s bizonyra a hatvanas vek elejnek logikval foglalkoz kutati)
szrevehettk, hogy az tletlogikai megkzelts nem nagyon hatkony. Pldul ha megnzzk a Gonosz(x)
lekrdezst s az ehhez tartoz tudsbzist a (9.1) egyenletben, feleslegesnek tnik olyan mondatok generlsa,
mint a Kirly(Richrd) Moh(Richrd) Gonosz(Richrd). Valjban a Gonosz(Jnos) mondatra vonatkoz
kvetkeztets brki szmra teljesen nyilvnval a kvetkez mondatok alapjn:
246

Kirly(Jnos)
Moh(Jnos)
Most megmutatjuk, hogyan tehetjk ezt a szmtgp szmra is egyrtelmv.
2.1. Egy elsrend kvetkeztetsi szably

Az a kvetkeztets, hogy Jnos gonosz a kvetkezkppen megy vgbe: talljon egy x-et, amelyre igaz, hogy x
egy kirly s x moh, majd kvetkeztesse ki, hogy x gonosz. ltalnosabban, ha van valamely helyettests,
amely az implikci premisszjt megegyezv teszi a tudsbzisban mr ltez mondatokkal, akkor a
helyettests elvgzse utn az implikcikvetkezmny rszt hozzadhatjuk a tudsbzishoz. Ebben az
esetben az {x/Jnos} helyettests elri ezt a clt.
Tulajdonkppen tbb feladatot is elvgeztethetnk a kvetkeztets ezen lpsvel. Ttelezzk fel, hogy a
Moh(Jnos) mondat ismerete helyett csak azt tudjuk, hogy mindenki moh:
y Moh(y) (9.2)
Ebben az esetben is szeretnnk azt a kvetkeztetst levonni, hogy Gonosz(Jnos), mivel tudjuk, hogy Jnos egy
kirly (ez adott), s hogy Jnos moh (mert mindenki moh). Egy megfelel helyettests megtallsra van
szksgnk ennek elvgzshez, mind az implikcis mondatban, mind az ehhez illesztend mondatokban
tallhat vltozkra. Ebben az esetben az {x/Jnos, y/Jnos} helyettests alkalmazsa az implikci Kirly(x)
s Moh(x) premisszihoz s a Kirly(Jnos) s Moh(y) tudsbzis mondatokhoz ltrehozza az azonossgot.
gy teht ki tudjuk kvetkeztetni az implikci konklzijt.
Ez a kvetkeztets elvgezhet egyetlen kvetkeztetsi szably alkalmazsval, amelyet ltalnostott Modus
Ponensnek (Generalized Modus Ponens) neveznk: a pi, pi s q atomi mondatokra, amelyekre ltezik olyan
helyettests, hogy HELYETTEST (, pi) = HELYETTEST (, pi) minden i-re, akkor:
A szably n + 1 premisszt tartalmaz: n szm p atomi mondatot s egy implikcit. A konklzi a q

konzekvencira trtn helyettests alkalmazsnak az eredmnye. A mi pldnkra ezt gy alkalmazhatjuk:
i
p1 Kirly(Jnos) p1 Kirly(x)
p2 Moh(y)
p2 Moh (x)
{x/Jnos, y/Jnos} q Gonosz(x)

Helyettest(, q) Gonosz(Jnos)
Knny megmutatni, hogy az ltalnostott Modus Ponens helyes kvetkeztetsi szably. Elszr is,
megfigyelhetjk, hogy brmely p mondatra (amelyeknek vltozirl felttelezzk, hogy univerzlis
kvantorokkal vannak elltva) s brmely helyettestsre:
p Helyettest(, p)
Ez hasonlan igazolhat, mint az univerzlis pldnyosts szably, s alkalmazhat olyan -ra, amely kielgti
az ltalnostott Modus Ponens szably feltteleit. gy teht, a p1,, pn -bl kvetkeztethetjk, hogy:
Helyettest(, p1) Helyettest(, pn)
s a p1 pn q implikcibl ezt kvetkeztethetjk, hogy:

Helyettest(, p1) Helyettest(, pn) Helyettest(, q)
Mivel a az ltalnostott Modus Ponensben gy van definilva, hogy: HELYETTEST (, pi) = HELYETTEST (,
pi) minden i-re; ebbl kifolylag a kt mondatbl az els pontosan illeszkedik a msodiknak a premisszjhoz.
gy teht a HELYETTEST (, q) kvetkezik a Modus Ponensbl.
247
Az ltalnostott Modus Ponens egy kiemelt (lifted) vltozata a Modus Ponensnek temeli a Modus Ponenst
az tletlogikbl az elsrend logikba. Ltni fogjuk a fejezet ksbbi rszben, hogy kifejleszthetjk az
elrefel lncols, a htrafel lncols s a 7. fejezetben bemutatott rezolcis algoritmusok kiemelt vltozatait
is. A kiemelt kvetkeztetsi szablyok legfontosabb elnye az tletlogikra trtn talaktssal szemben az,
hogy csak azokat a helyettestseket hajtjk vgre, amelyek bizonyos kvetkeztetsek vgrehajtst teszik
lehetv. Egy potencilis korlt az, hogy egy bizonyos szempontbl az ltalnostott Modus Ponens kevsb
ltalnos, mint a Modus Ponens (lsd 4. szakasz - Az tletkalkulus kvetkeztetsi minti rszben): a Modus
Ponens brmely mondatot megenged az implikci bal oldaln, ezzel szemben az ltalnostott Modus
Ponens specilis formtumot kvn meg erre a mondatra. Csak abban az rtelemben nevezhet ltalnostottnak,
hogy tetszleges szm pi-re alkalmazhat.
2.2. Egyests
A kiemelt kvetkeztetsi szablyok olyan helyettestsek megtallst ignylik, amelyek a klnbz logikai
kifejezseket ltszlag azonoss teszik. Ezt a folyamatot egyestsi lpsnek (unification) nevezzk, ami
kulcsfontossg eleme minden elsrend kvetkeztetsi algoritmusnak. Az EGYEST algoritmus vesz kt
mondatot, s visszaad egy rjuk vonatkoz egyestst (unifier), ha ltezik ilyen:
Egyest(p, q) = , ahol Helyettest(, p) = Helyettest(, q)
Nzznk meg nhny pldt arra, hogy az EGYEST-nek hogyan kell viselkednie. Ttelezzk fel, hogy van egy
Ismer(Jnos, x) lekrdezsnk: kit ismer Jnos? Erre a krdsre nhny vlaszt gy tallhatunk, hogy
megkeressk az sszes mondatot a tudsbzisban, amely egyesthet az Ismer(Jnos, x)-szel. Itt vannak az
egyestsi eredmnyek ngy klnbz, a tudsbzisban elfordul mondatra.
Egyest(Ismer(Jnos, x), Ismer(Jnos, Jlia)) = {x/Jlia}
Egyest(Ismer(Jnos, x), Ismer(y, Lajos)) = {x/Lajos, y/Jnos}
Egyest(Ismer(Jnos, x), Ismer(y, Anyja(y))) = {y/Jnos, x/Anyja(Jnos)}
Egyest(Ismer(Jnos, x), Ismer(x, Erzsbet)) = sikertelen
Az utols egyests sikertelen, mert az x nem tudja a Jnos s az Erzsbet rtkeit egyszerre felvenni.
Emlkezznk arra, hogy az Ismer(x, Erzsbet) azt jelenti, hogy: Mindenki ismeri Erzsbetet, gy kpesnek
kellene lennnk azt kikvetkeztetni, hogy Jnos ismeri Erzsbetet. A problma abbl szrmazik, hogy a kt
mondat trtnetesen ugyanazt a vltoznevet, az x-et hasznlja. A problmt gy kerlhetjk el, hogy az
egyestend mondatokban tnevezzk a vltozkat (standardizing apart) gy, hogy elkerljk a nevek
egybeesseit. Pldul tnevezhetjk az x-et az Ismer(x, Erzsbet)-ben pldul z17-re (egy tetszleges j
vltoznvre) anlkl, hogy a jelentst megvltoztatnnk. Most mr mkdik az egyestsnk:
Egyest(Ismer(Jnos, x), Ismer(z17, Erzsbet)) = {x/Erzsbet, z17/Jnos}
A 9.7. feladat tovbb vizsglja az tnevezs szksgessgnek problmjt.
9.1. bra - Az egyestsi algoritmus. Az algoritmus sszehasonltja a bemenetek

felptst elemrl elemre. A helyettests, amely az EGYESTS argumentuma, tkzben
pl fel, s arra hasznljuk, hogy meggyzdjnk arrl, hogy a ksbbi
sszehasonltsok konzisztensek lesznek az ltalunk elzleg ltrehozott lektsekkel.
Egy sszetett kifejezsben, mint pldul az F(A, B), a VL fggvny kiveszi az F
fggvnyszimblumot, s az ARGOK fggvny kiveszi az (A, B) argumentumlistt.
248
Mg egy tovbbi nehzsgen kell tljutni. Azt mondtuk, hogy az EGYEST olyan helyettestseket ad vissza,
amelyek a kt argumentumot ltszlag azonoss teszi. Azonban tbb klnbz ilyen egyests ltezhet. Pldul
az EGYEST (Ismer(Jnos, x), Ismer(y, z)) visszaadhatja azt is, hogy: {y/Jnos, x/z}, vagy azt is, hogy: {y/Jnos,
x/Jnos, z/Jnos}. Az els egyestsi lps azt eredmnyezi, hogy: Ismer(Jnos, z), ezzel szemben a msodik azt
adja, hogy: Ismer(Jnos, Jnos). A msodik eredmnyt megkaphatjuk az elsbl is egy tovbbi helyettests
hozzadsval: {z/Jnos}. Lthatjuk, hogy az els egyests ltalnosabb, mint a msodik, mert kevesebb
korltozst ad meg a vltozk rtkeire. Azt llapthatjuk meg, hogy minden egyestend kifejezsprra ltezik
egy legltalnosabb egyests (most general unifier), amely egyedi a vltozk tnevezsben. Ebben az
esetben ez: {y/Jnos, x/z}.
A legltalnosabb egyestsek kiszmtshoz a 9.1. brn lthatunk egy algoritmust. Az eljrs igen egyszer:
egy rekurzv algoritmussal egymssal prhuzamosan trjuk fel a kt kifejezst, felptve az egyestst, kivve
akkor, ha a struktrkban a kt megfelel elem nem illeszkedik. Van egy drga lps: amikor egy vltozt kell
egy komplex termhez illesztnk, meg kell vizsglni, hogy a vltoz elfordul-e a termben; ha igen, akkor az
illeszts sikertelen, mert nem tudunk konzisztens egyestst megalkotni. Ez a lps az gynevezett elfordulsi
prba (occur check), amely az algoritmus komplexitst az egyestend kifejezs mretvel ngyzetesen
nvekvv teszi. Nhny rendszer, belertve az sszes logikai programozsi rendszert, egyszeren kihagyja az
elfordulsi prbt, s ennek eredmnyeknt a kvetkeztetsk nem helyes. Ms rendszerek idben lineris
komplexits, ennl sszetettebb algoritmusokat hasznlnak.
2.3. Trols s visszakeress

A KIJELENT s a KRDEZ fggvnyek, amelyek szerepe, hogy informljk s lekrdezzk a tudsbzist, kt
egyszerbb fggvnyt, a TROL s a BETLT fggvnyeket hasznljk fel. A TROL (s) eltrol egy s mondatot a
tudsbzisban, mg a BETLT (q) visszaadja az sszes egyestst, amelyet a q lekrdezs felhasznlsval lehet
ltesteni a tudsbzis illeszthet mondataival. A problma, amivel illusztrltuk az egyestst az sszes olyan
tny megtallsa, amely egyesthet az Ismer(Jnos, x)-szel a BETLT egyik pldja.
A TROL s a BETLT megvalstsnak legegyszerbb mdja, hogy a tudsbzisban az sszes tnyt egyetlen
hossz listn troljuk, s egy q lekrdezs megvlaszolsakor meghvjuk az EGYEST (q, s)-t minden s mondatra
a listn. Ez az eljrs nem hatkony, de mkdik, s egyelre elg a fejezet tovbbi rsznek megrtshez. Az
249
alfejezet htralv rsze ttekinti azokat az eljrsokat, amelyekkel a visszakeresst hatkonyabb tehetjk, gy
ezt els olvassra tugorhatjuk.
A BETLT fggvnyt azzal tehetjk hatkonyabb, hogy biztostjuk, hogy az egyestsi lpst csak olyan
mondatokkal ksreljk meg, amelyeknl van egyltaln esly az egyestsre. Pldul nincs rtelme, hogy
megprbljuk az egyestst az Ismer(Jnos, x)-re s a Fivr(Richrd, Jnos)-re. Elkerlhetjk az ilyen
egyestsi lpseket, ha indexeljk (indexing) a tnyeket a tudsbzisban. Egy egyszer sma, amit
prediktum indexelsnek (predicate indexing) neveznk, beteszi az sszes Ismer tnyt egy verembe s az
sszes Fivr tnyt egy msikba. A vermek egy hash-tblban2 trolhatk, hogy hatkonyan elrhessk ket.
A prediktumok indexelse hasznos, ha sok prediktumszimblum van, de csak kevs llts az egyes
szimblumokhoz. Nhny alkalmazsban azonban sok mondat tartozik egy adott prediktumszimblumhoz.
Pldul ttelezzk fel, hogy az adhatsgok nyomon akarjk kvetni, hogy ki alkalmaz kit, s ezeket a
kapcsolatokat egy Alkalmaz(x, y) prediktum hasznlatval rjuk le. Ez egy igen nagy verem lenne, akr
munkaadk milliival s alkalmazottak tzmilliival. Egy olyan krds megvlaszolsa, mint az Alkalmaz(x,
Richrd), a prediktumok indexelsvel az egsz verem tbngszst ignyeln.
Egy ilyen lekrdezs esetben segtene, ha a tnyeket mind a prediktummal, mind a msodik argumentummal
indexelnnk, pldul gy, hogy egy kombinlt hash-tbla kulcsot hasznlunk. A kulcsot egyszeren
elllthatjuk a lekrdezsbl, s pontosan visszakereshetjk kzvetlenl azokat a tnyeket, amelyek
egyesthetk a lekrdezssel. Ms lekrdezsekhez, mint amilyen az Alkalmaz(AIMA.org, y), szksgnk van
arra, hogy a tnyeket a prediktum s az els argumentum kombinlsval indexeljk. gy aztn a tnyeket
trolhatjuk tbbszrs indexkulcsok alatt, azonnal hozzfrhetv tve minden, a tnnyel egyesthet lekrdezs
szmra.
Ha adott egy troland mondat, akkor ltre lehet hozni az indexeket az sszes lehetsges vele egyesthet
lekrdezshez. Arra a tnyre, hogy Alkalmaz(AIMA.org, Richrd), ezek a lekrdezsek:
Alkalmaz(AIMA.org, Richrd) Az AIMA.org alkalmazza Richrdot?
Alkalmaz(x, Richrd) Ki alkalmazza Richrdot?
Alkalmaz(AIMA.org, y) Kit alkalmaz az AIMA.org?
Alkalmaz(x, y) Ki alkalmaz kit?
Ezek a lekrdezsek egy bennfoglalsi hlt (subsumption lattice) alkotnak, amint az a 9.2. (a) brn lthat.
A hlnak van nhny rdekes tulajdonsga. Pldul a hl brmely csompontjnak a gyereke a szljbl egy
egyszer behelyettestssel megkaphat, s a legmagasabb kzs leszrmazottja brmely kt csompontnak a
legltalnosabb egyestjk hasznlatval rhet el. A hl rszeibl brmely alaptny szisztematikusan
ltrehozhat (9.5. feladat). Egy ismtld konstansokkal rendelkez mondatnak egy kiss ms hlja van, ezt a
9.2. (b) brn lthatjuk. A fggvnyszimblumok s a vltozk az eltroland mondatokban mg rdekesebb
hlfelptseket tesznek szksgess.
9.2. bra - (a) A bennfoglalsi hl, amelynek a legalacsonyabb csompontja ez a

mondat: Alkalmaz(AIMA.org, Richrd). (b) A bennfoglalsi hl arra a mondatra, hogy:
Alkalmaz(Jnos, Jnos).
A hash-tbla informcik trolsra s visszakeressre szolgl olyan adatstruktra, amelyeket rgztett kulcsokkal indexelnk.
Gyakorlati okokbl egy hash-tblt tekinthetnk olyannak, mint amelynek a trolsi s a visszakrdezsi ideje lland, akkor is, ha a tbla
nagyon nagy szm elemet tartalmaz.
2
250
A sma, amelyet lertunk, nagyon jl mkdik, amikor a hl csak kisszm csompontot tartalmaz. Egy n
argumentum prediktumra a hl O(2n) csompontot tartalmaz. Ha a fggvnyszimblumok hasznlata
megengedett, akkor a csompontok szma szintn exponencilis a troland mondat termjeinek fggvnyben.
Ez rendkvl nagy szm indexet eredmnyezhet. Egy ponton az indexels elveszti elnyeit az sszes index
trolsnak s fenntartsnak problmja miatt. Ez ellen egy rgztett stratgia bevezetsvel prblhatunk
vdekezni gy, hogy csak azokon a kulcsokon tartunk fenn indexeket, amelyek prediktumokbl s az egyes
argumentumokbl llnak. Egy msik megolds, hogy egy adaptv tervet hasznlunk, amely mindig olyan
indexeket hoz ltre, amelyek megfelelnek az aktulis lekrdezstpus ignyeinek. A legtbb MI-rendszerben a
trolni kvnt tnyek szma elg kicsi ahhoz, hogy a hatkony indexels problmjt megoldottnak tekintsk.
Az ipari s kereskedelmi adatbzisok esetben jelents technikai fejlesztsek trtntek a feladat megoldsra.
3. Elrefel lncols
Az tletlogikai hatrozott klzokra mr megadtunk egy elrefel lncolsi algoritmust a 7.5. alfejezetben. A
gondolat egyszer: kezdjk a tudsbzisban szerepl atomi mondatokkal, s alkalmazzuk a Modus Ponenst
elrefel haladva, j atomi mondatokat hozzadva, egszen addig, amg tovbbi kvetkeztetsek mr nem
vgezhetk. Most megmutatjuk, hogyan alkalmazzuk az algoritmust az elsrend hatrozott klzokra, s hogyan
valsthatjuk ezt meg hatkonyan. A hatrozott klzok, mint pldul a Helyzet Vlasz klnsen hasznosak az
olyan rendszerek szmra, amelyek jonnan rkezett informcik alapjn vgeznek kvetkeztetseket
vlaszknt. Szmos rendszert tervezhetnk ilyen mdon, s ezekben az esetekben az elrefel lncolssal
trtn kvetkeztets sokkal hatkonyabb lehet, mint a rezolcis ttelbizonyts. Ebbl az kvetkezik, hogy
gyakran rdemes megprblni olyan tudsbzist pteni, amely csak hatrozott klzokat hasznl, s gy
elkerlhetjk a rezolcival jr nehzsgeket.
3.1. Elsrend hatrozott klzok

Az elsrend hatrozott klzok nagyon emlkeztetnek az tletlogikai hatrozott klzokra (4.1.3. szakasz - A
rezolci teljessgerszben). Az ilyen klzok olyan literlok diszjunkcii, amelyek kzl pontosan egy diszjunkt
pozitv. Egy hatrozott klz vagy egy atomi mondat, vagy egy implikci, amelynek a felttel rsze pozitv
literlok konjunkcija, s amelynek kvetkezmnye egyetlen pozitv literl. A kvetkez mondatok elsrend
hatrozott klzok:
Kirly(x) Moh(x) Gonosz(x)
Kirly(Jnos)
Moh(y)
Eltren az tletlogikai literloktl, az elsrend literlok tartalmazhatnak vltozkat, amely esetben a

vltozkat univerzlis kvantorral elltottnak ttelezzk fel. (A hatrozott klzok rsnl ltalban elhagyjuk az
univerzlis kvantorokat.) A hatrozott klz egy megfelel norml forma, hogy az ltalnostott Modus
Ponensszel alkalmazhassuk. Nem minden tudsbzist lehet talaktani hatrozott klzok halmazv, az egyetlen
pozitv literlis korltja miatt, de sokat igen. Gondoljuk t a kvetkez problmt:
A trvny kimondja, hogy bntny az, ha egy amerikai polgr fegyvert ad el egy Amerikval ellensges
nemzetnek. A Nono orszg, amely ellensge Ameriknak, fel van szerelve raktkkal, s ezeket a
raktkat mind West ezredes adta el, aki amerikai.
Be fogjuk bizonytani, hogy West bnz. Elszr lerjuk a tnyeinket elsrend hatrozott klzokknt. A
kvetkez alfejezet fogja bemutatni, hogy az elrefel lncols algoritmus hogyan oldja meg a problmt.
bntny az, ha egy amerikai polgr fegyvert ad el egy Amerikval ellensges nemzetnek:
Amerikai(x) Fegyver(y) Ellensges(z) Elad(x, z, y) Bnz(x) (9.3)
Nono fel van szerelve raktkkal. Azt a mondatot, hogy x Birtokol(Nono, x) Rakta(x) talaktjuk kt
hatrozott klzz Egzisztencilis Elimincival, egy j konstans, az M1 bevezetsvel:
Birtokol(Nono, M1) (9.4)
Rakta(M1) (9.5)
251
s ezeket a raktkat mind West ezredes adta el:

Rakta(x) Birtokol(Nono, x) Elad(West, x, Nono) (9.6)
Tudnunk kell mg, hogy a raktk fegyverek:

Rakta(x) Fegyver(x) (9.7)
s hogy Amerika ellensge ellensgesnek szmt:

Ellensge(x, Amerika) Ellensges(x) (9.8)
West ezredes, aki amerikai:

Amerikai(West) (9.9)
Nono orszg, amely ellensge Ameriknak

Ellensge(Nono, Amerika) (9.10)
A tudsbzis nem tartalmaz fggvnyszimblumokat, s gy egy pldja a Datalog (Datalog) tudsbzisok

osztlynak ami fggvnyszimblumok nlkli elsrend hatrozott klzok halmaza. Ltni fogjuk, hogy a
fggvnyszimblumok hinya sokkal knnyebb teszi a kvetkeztetst.
3.2. Egy egyszer elrefel lncolsi algoritmus

Az els elrefel lncolsi algoritmus, amit megvizsglunk, nagyon egyszer lesz, amint azt lthatjuk a 9.3.
brn. Az algoritmus az ismert tnyekbl kiindulva vgrehajtja az sszes olyan szablyt, amelynek premisszi ki
vannak elgtve, s ezek kvetkezmnyeit hozzadja az ismert tnyekhez. Ez az eljrs addig ismtldik, amg a
krdst meg nem vlaszoltuk (felttelezve, hogy csak egy vlaszra van szksgnk), vagy amikor mr nem
tudunk j tnyeket a tudsbzishoz hozzadni. Vegyk szre, hogy egy tny nem szmt jnak, ha csak
tnevezse (rename) egy mr ismert tnynek. Egy mondat tnevezse egy msiknak, ha az alkalmazott
vltozk neveitl eltekintve megegyeznek. Pldul a Szereti(x, Fagylalt) s a Szereti(y, Fagylalt) mondatok
egyms tnevezsnek szmtanak, mert csak az x s az y vlasztsban klnbznek. A kt mondat jelentse
megegyezik: mindenki szereti a fagylaltot.
Az elz bntnyproblmnkat fogjuk felhasznlni az ERL-EL-KRDEZ algoritmus bemutatshoz. Az
implikcis mondatok a (9.3), (9.6), (9.7) s a (9.8). Kt itercis lps szksges:
Az els iterciban a (9.3) szably nem elgtette ki a premisszkat.
A (9.6) szablyt kielgti az {x/M1} s az Elad(West, M1, Nono) hozzadsa.
A (9.7) szablyt kielgti az {x/M1} s a Fegyver(M1) hozzadsa.
A (9.8) szablyt kielgti az {x/Nono} s az Ellensges(Nono) hozzadsa.
A msodik iterciban a (9.3) szablyt kielgti az {x/West, y/M1, z/Nono), s hozzadjuk azt, hogy:
Bnz(West).
9.3. bra - Egy koncepcionlisan egyszer, de kevss hatkony elrefel lncolsi

algoritmus. Minden egyes iterciban hozzadja a TB-hez az sszes atomi mondatot,
amelyet egy lpsben az implikcis mondatokbl s a TB-ben mr meglv atomi
mondatokbl kikvetkeztethetnk.
252
9.4. bra - Az elrefel lncols algoritmus ltal generlt bizonytsi fa a bntny

pldra. A kiindul tnyek az als sorban jelennek meg, az els iterciban
kikvetkeztetett tnyek a kzps sorban, mg a msodik iterciban kikvetkeztetett
tnyek a legfels sorban.
A 9.4. bra bemutatja a generlt bizonytsi ft. Vegyk szre, hogy j kvetkeztetsek mr nem lehetsgesek
ezen a ponton, mivel minden mondatot, amelyet kikvetkeztethetnnk az elrefel lncolssal, mr explicit
mdon tartalmaz a TB. Egy ilyen tudsbzist a kvetkeztetsi folyamat fix pontjnak (fixed point) nevezzk.
Az elsrend hatrozott klzok elrefel lncolsval ltrehozott fix pontok hasonltanak az tletlogikai
elrefel lncolssal (4.2. szakasz - Elre- s htrafel lncolsrszben) generltakhoz. A leglnyegesebb
klnbsg az, hogy egy elsrend fix pont tartalmazhat univerzlis kvantorral elltott atomi mondatokat.
A ERL-EL-KRDEZ-t knny kielemezni. Elszr is megllapthat, hogy az eljrs helyes (sound), mivel
minden kvetkeztets csak az ltalnostott Modus Ponens alkalmazsa, amelyrl mr igazoltuk, hogy helyes.
Msodszor, teljes (complete) a hatrozott klzokat tartalmaz tudsbzisokra, ami azt jelenti, hogy kpes
minden olyan lekrdezst megvlaszolni, amely kvetkezik brmely hatrozott kzokbl ll tudsbzisbl. A
Datalog tudsbzisok esetre, amelyek nem tartalmaznak fggvnyszimblumokat, a teljessg bizonytsa
meglehetsen egyszer. Elszr megszmoljuk a TB-hez hozzadhat tnyeket, amely szm meghatrozza az
itercik maximlis szmt. Legyen a k ez a maximlis rtk (argumentumok szma) az adott prediktumokra, p
a prediktumok szma s n a konstansszimblumok szma. Egyrtelm, hogy nem lehet pnk klnbz
alaptnynl tbb, teht ennyi iterci utn az algoritmus el fog rni egy fix pontot. Ezutn mr az tletlogikai
253
elrefel lncols bizonytsnl lertakhoz nagyon hasonlan rvelhetnk (4.2. szakasz - Elre- s htrafel
lncolsrszben.) Az tletlogikai teljes eljrs talaktst egy elsrend teljes eljrss a 9.5. alfejezetben
mutatjuk majd meg.
Fggvnyszimblumokat is tartalmaz ltalnos hatrozott klzok esetben az ERL-EL-KRDEZ vgtelen szm
j tnyt generlhat, gy ilyenkor vatosabbnak kell lennnk. Ha egy lekrdezsre adhat vlaszmondat
levezethet a TB-bl, akkor Herbrand ttelt kell alkalmaznunk, hogy biztostsuk, hogy az algoritmus megtall
egy bizonytst (lsd a 9.5. alfejezetet a rezolcis esetre). Ha a lekrdezsre nincs vlasz, akkor az algoritmus
nhny esetben nem tud lellni. Pldul ha a tudsbzis a Peano-aximkat tartalmazza,
TermSzm(0)
n TermSzm(n) TermSzm(S(n))
akkor az elrefel lncols hozzadja a TermSzm(S(0)), TermSzm(S(S(0))), TermSzm(S(S(S(0)))) mondatokat

s gy tovbb. ltalnossgban ezt a problmt nem lehet kikerlni. Hasonlan, mint az ltalnos elsrend
logikban, a hatrozott klzokkal val kvetkeztets flig eldnthet.
3.3. Hatkony elrefel lncols

A 9.3. brn lthat elrefel lncolsi algoritmust inkbb a megrts megknnytse cljbl mutattuk be, s
nem mint egy hatkonyan vgrehajthat algoritmust. A komplexitsnak hrom lehetsges forrsa van. Elszr
is, az algoritmus bels hurka elvgzi az sszes lehetsges egyests megtallst, ahol egy szably premisszja
egyesthet a TB egy alkalmas tnyhalmazval. Ezt gyakran mintaillesztsnek (pattern matching) nevezzk,
s igen kltsges lps. Msodszor, az algoritmus jra ellenriz minden szablyt minden iterciban, hogy
megvizsglja, hogy a premisszk ki vannak-e elgtve, mg olyankor is, amikor nagyon kevs vltoztatst
vgznk a tudsbzisban az egyes ciklusokban. Vgl, az algoritmus szmos olyan tnyt is generlhat, melyek
irrelevnsak a cl szempontjbl. Mindhrom problmaforrst meg fogjuk vizsglni.
3.3.1. Szablyok illesztse az ismert tnyekhez

A szablyok premisszinak a TB tnyeihez trtn illesztse egyszer problmnak tnhet. Pldul ttelezzk
fel, hogy a kvetkez szablyt akarjuk alkalmazni:
Rakta(x) Fegyver(x)
Ezutn meg kell tallnunk az sszes tnyt, amely egyesthet a Rakta(x)-szel. Egy megfelelen indexelt
tudsbzisban ez elvgezhet a tnyek szmval lineris idben. Vizsgljunk meg egy szablyt, mint amilyen
pldul a:
Rakta(x) Birtokol(Nono, x) Elad(West, x, Nono)
Itt is megkereshetjk a Nono ltal birtokolt sszes objektumot objektumonknt konstans id alatt. Ezutn
minden egyes objektumra meg tudjuk vizsglni, hogy az rakta-e.
Amennyiben a tudsbzis sok Nono ltal birtokolt objektumot tartalmaz s nagyon kevs raktt, akkor azonban
clszerbb lenne elszr az sszes raktt megkeresni, s aztn ellenrizni, hogy azokat Nono birtokolja-e. Ez a
konjunkt sorrendezs (conjunct ordering) problma: talljunk egy olyan sorrendet, amely a szably
premissza rsznek konjunktjait megoldja gy, hogy ezzel a teljes kltsget minimalizljuk. Megmutathat,
hogy az optimlis sorrend megtallsa nmagban is NP-nehz, de egy j heurisztika elrhet. Pldul ilyen a
legkorltozottabb vltoz (most constrained variable) heurisztikja, amelyet az 5. fejezetben a
knyszerkielgtsi problmkra hasznltunk. Ez azt a logikt kveti, hogy rendezzk sorba a konjunktokat gy,
hogy elszr a raktkat keressk, ha kevesebb rakta van, mint Nono ltal birtokolt objektum.
Fontos
A kapcsolat a mintailleszts s a knyszer kielgtse kztt valjban nagyon szoros. Brmelyik
konjunktot gy tekinthetnk, mint az ltala tartalmazott vltozk korltozst pldul, a Rakta(x)
egy unris korltozs az x-en. Ezt a gondolatot kiterjesztve, minden vges trgyterlet
knyszerkielgtsi problmt kifejezhetnk egyszeri hatrozott klzknt, nhny trstott alaptnnyel
kiegsztve. Vizsgljuk meg az 5.1. brn lthat trkpsznezsi problmt, amelyet a 9.5. (a) brn
jra bemutatunk. Egy ezzel megegyez formult adtunk meg egy hatrozott klz formjban a 9.5. (b)
254
brn. Vilgos, hogy a Sznezhet() konklzi csak akkor kikvetkeztethet, ha a knyszerkielgtsi

problmnak van egy megoldsa. Mivel a knyszerkielgtsi problmk ltalban magukba foglaljk a
3SAT problmkat klnleges esetekknt, levonhatjuk azt a kvetkeztetst, hogy egy hatrozott klz
illesztse egy tnyhalmazhoz NP-nehz.
9.5. bra - (a) Ausztrlia trkpnek kisznezst bemutat knyszergrf (5.1. bra). (b)
A trkpsznez knyszerkielgtsi problma egy hatrozott klzzal reprezentlva.
Vegyk szre, hogy a vltozk trgyterlete a KL-re megadott alaptnyek konstansai
ltal implicit mdon definiltak.
Elg elkesertnek tnhet, hogy az elrefel lncols tartalmaz egy NP-nehz illesztsi problmt a bels
hurokban. Hrom mdja van annak, hogy felvidtsuk magunkat:
Emlkezhetnk arra, hogy a legtbb szably a valdi tudsbzisokban kismret s egyszer (mint a bntny
plda szablyai), s nem nagy s komplex (mint a 9.5. brn lthat knyszerproblmnl). Az adatbzisok
terletn fel szoktk ttelezni, hogy mind a szablyok mrete, mind a prediktumok argumantumszma egy
konstanssal megadhat korlt alatt marad, s gy csak az adatkomplexits (data complexity) miatt kell
aggdni vagyis a kvetkeztets komplexitsa miatt, ami az adatbzisban lv alaptnyek szmnak
fggvnye. Knny megmutatni, hogy az elrefel lncols adatkomplexitsa polinomilis.
Tekinthetjk a szablyok azon csoportjt, amelyekre az illeszts hatkony tud lenni. Alapjban vve minden
Datalog klzt tekinthetnk gy, mint ami egy knyszerkielgtsi problmt hatroz meg, gy az illeszts
kivitelezhet akkor, ha a megfelel knyszerkielgtsi problma is nyomon kvethet. Az 5. fejezet lerja a
knyszerkielgtsi problmk nhny praktikusan megoldhat csaldjt. Pldul ha a knyszergrf (egy
olyan grf, amelynek a csompontjai vltozk s az lei knyszerek) ft formz, akkor a knyszerkielgtsi
problma lineris idben megoldhat. Pontosan ugyanez a szably ll fenn a szablyillesztsre. Pldul ha
eltvoltjuk Dl-Ausztrlit a 9.5. brrl, akkor az j klz a kvetkez lesz:
Kl(nya, t) Kl(t, q) Kl(q, dw) Kl(dw, v) Sznezhet()
Ez megfelel az 5.11. brn bemutatott reduklt knyszerkielgtsi problmnak. A faszerkezet

knyszerkielgtsi problmk megoldsra hasznlt algoritmusokat kzvetlenl alkalmazhatjuk a
szablyilleszts problmjra.
s vgl dolgozhatunk azon, hogy megszntessk a felesleges szablyillesztsi ksrleteket az elrefel
lncolsi algoritmusban, amely a kvetkez alfejezet tmja lesz.
3.3.2. Inkrementlis elrefel lncols
Fontos
255
Amikor a bntny pldn bemutattuk az elrefel lncols mkdst, akkor csaltunk, nevezetesen
abban, hogy kihagytunk nhny szablyillesztst, amelyet a 9.3. brn bemutatott algoritmus elvgzett.
Pldul a msodik iterciban a:
Rakta(x) Fegyver(x)
szably (ismt) illeszthet a Rakta(M1)-hez, s termszetesen a Fegyver(M1) konklzit mr ismerjk,

gy semmi sem trtnik. Az ilyen felesleges szablyillesztst elkerlhetjk, ha figyelembe vesszk a
kvetkez megfigyelst: Minden, t-edik iterciban kikvetkeztethet j tny levezetshez szksges
legalbb egy, t 1 ciklusban kikvetkeztetett j tny felhasznlsa. Ez azrt igaz, mert brmely olyan
kvetkeztets, amely nem ignyel egy j tnyt a t 1 ciklusbl, mr elvgezhet lett volna a t 1
ciklusban.
Ez a megfigyels termszetes mdon elvezet minket egy inkrementlis elrefel lncolsi algoritmushoz, ahol a
t ciklusban csak akkor ellenrznk egy szablyt, ha annak premisszja tartalmaz egy pi konjunktot, amely
egyesthet egy pi tnnyel, s amelyre jonnan kvetkeztettnk a t 1 ciklusban. A szablyilleszt lps aztn
rgzti a pi-t, hogy illeszkedjen a pi-hez, de lehetv teszi, hogy a szably tbbi konjunktja illeszkedjen brmely
megelz ciklus tnyeihez. Ez az algoritmus pontosan ugyanazokat a tnyeket generlja minden egyes
ciklusban, mint amelyeket a 9.3. brn lthat algoritmus, de annl sokkal hatkonyabb.
Megfelel indexelssel knny megtallni azokat a szablyokat, amelyeket egy adott tny kielgthetv tehet.
Valjban szmos rendszer egy ilyen frisstsi mdban mkdik, ahol az elrefel lncols minden egyes olyan
tnyre aktualizldik, amelyet KIJELENT-ettnk a rendszernek. A kvetkeztetsek sorban vgigveszik a
szablyok halmazt, amg el nem rik a fix pontot, s ez a folyamat a kvetkez j tnynl jra kezddik.
A tudsbzisban lv szablyoknak tipikusan csak egy kis tredkt eredmnyezi egy adott tny hozzadsa. Ez
azt jelenti, hogy jelents mennyisg felesleges munkt vgznk nhny ki nem elgtett premisszt is
tartalmaz rszleges illesztsek ismtelt ltrehozsval. A bntny pldnk tl kicsi ahhoz, hogy ezt
megfelelen bemutassuk, de vegyk szre, hogy egy rszleges illesztst az els ciklusban mr ltrehoztunk az:
Amerikai(x) Fegyver(y) Elad(x, y, z) Ellensges(z) Bnz(x)
szably s az Amerikai(West) tny kztt. Ezt a rszleges illesztst aztn kiselejtezzk, de jraptjk a msodik
ciklusban is (amikor a szably sikeres). Hatkonyabb lenne megrizni, s fokozatosan kiegszteni jabb
rszleges illesztsekkel, amikor az j tnyek berkeznek, ahelyett hogy kiselejteznnk ket.
A rete algoritmus3 volt az els, amely alaposan foglalkozott ezzel a problmval. Az algoritmus feldolgozza a
tudsbzis szablyait, hogy ltrehozzon egy adatfolyam-hlzatot, amelyben minden csompont egy literl egy
szably premissza rszbl. Vltoz lektsek ramlanak a hlzaton, megszrve azokat, amelyek nem
illeszkednek egy literlhoz. Ha egy szablyban kt literlnak ugyanaz a vltozja pldul Elad(x, y, z)
Ellensges(z) a bnz pldban , akkor a literlokhoz tartoz lektsek egy egyenlsgi csomponton
mennek keresztl. Egy vltoz lektsnek, amely elr egy csompontot egy n argumentum literlnl gy, mint
az Elad(x, y, z), vrakoznia kell, mieltt a folyamat jra kezddne, amg a tbbi vltozhoz tartoz lektseket
is ltrehozzuk. Egy adott pontban a rete hl llapota megadja a szablyok sszes, addig elvgzett rszleges
illesztseit, s gy elkerlhet a jelents jraszmols.
A rete hlk, s ms, hatkonysgot nvel fejlesztsek mindig is jelents szerepet jtszottak az gynevezett
produkcis rendszerekben (production systems), amelyek az els szles krben hasznlt elrefel lncolsi
rendszerek voltak.4 Az XCON szakrti rendszer (eredetileg R1-nek hvtk, McDermott, 1982) egy produkcis
rendszer felptst felhasznlva kszlt. Az XCON nhny ezer szablyt tartalmazott szmtgp-tartozkok
konfigurciinak megtervezsre a DEC cg vsrlinak szmra. Ez volt az egyik els igazi kereskedelmi siker
a szakrt rendszerek feltrekv piacn. Sok ms hasonl rendszer plt ugyanezt a technolgit felhasznlva,
amelyet be is ptettek egy ltalnos cl programozsi nyelvbe, az OPS-5-be.
A produkcis rendszerek a kognitv architektrkban (cognitive architectures), mint pldul az ACT
(Anderson, 1983) vagy a SOAR (Laird s trsai, 1987), is npszerek. A kognitv architektrk az emberi
gondolkods modelljei. Az ilyen rendszerekben a rendszer munkamemrija az ember rvid tv memrijt
modellezi, s a produklt kvetkezmnyek a hossz tv memria rszei. A mkds minden egyes ciklusban
a produkcikat a tnyek munkamemrijhoz illesztik. Egy olyan kvetkezmny, amelynek feltteleit kielgtik,
3
4
A rete hlt jelent latinul, angol kiejtsben (riti) a treaty-vel rmel.

A produkci kifejezs a produkcis rendszerekben egy felttelcselekvs szablyt jelent.
256
hozztehet s kitrlhet tnyeket a mkd memribl. Az adatbzisokkal ellenttben a produkcis

rendszerekben gyakran sok szably s viszonylag kevs tny van. Megfelelen optimalizlt illesztsi
technolgival nhny modern rendszer kpes vals idben mkdni tbb mint egymilli szabllyal is.
3.3.3. Irrelevns tnyek

gy tnik, hogy a rossz hatkonysg problmjnak az utols forrsa az elrefel lncolsban a
megkzeltsbl fakad, ez mr az tletlogikai kontextusban is felmerlt. (lsd 7.5. alfejezet). Az elrefel
lncols az ismert tnyeken alapul sszes lehetsges kvetkeztetst elvgzi, akkor is, ha azok irrelevnsak az
elrend clhoz. A bntny pldnkban nem voltak olyan szablyok, amelyek irrelevns konklzikat vontak
volna maguk utn, gy az irnytottsg hinya nem jelentett problmt. Ms esetekben (pldul ha tbb
szablyunk van, amelyek lerjk az amerikaiak tkezsi szoksait s a raktk rt is), a ERL-EL-KRDEZ
szmos irrelevns konklzit fog generlni.
Az irrelevns konklzik elkerlsnek egy lehetsges mdja a htrafel lncols hasznlata, amint az a 9.4.
alfejezetben lthat lesz. Msik megolds, hogy az elrefel lncolst a kivlogatott szablyok egy
rszhalmazra korltozzuk. Ezt a megkzeltst az tletlogikai kontextusban mr trgyaltuk. Egy harmadik
megkzeltst hasznlnak a deduktv adatbzisok terletn, ahol az elrefel lncols elterjedt eszkznek szmt.
Az alaptlet az, hogy rjuk t a szablyhalmazt felhasznlva a cllltst, hogy aztn csak relevns vltoz
kapcsolatokat amelyek az gynevezett mgikus halmazhoz (magic set) tartoznak vegyk figyelembe az
elrefel kvetkeztetsben. Pldul ha a cl llts a Bnz(West), akkor a szablyt, amely a Bnz(x)-re
kvetkeztet, t kell rni gy, hogy tartalmazzon egy tovbbi konjunktot, amely korltozza az x rtkt:
Mgikus(x) Amerikai(x) Fegyver(y) Elad(x, y, z) Ellensges(z) Bnz(x)
A Mgikus(West) tny is hozzaddik a TB-hez. Ily mdon, mg akkor is, ha a tudsbzis amerikaiak milliirl
tartalmaz is adatokat, csak West ezredest fogjuk figyelembe venni az elrefel lncolsi folyamatban. A
mgikus halmazok definilsnak s a tudsbzis trsnak teljes folyamata tl sszetett ahhoz, hogy most itt
rszletezzk, de az alaptlet egyfajta generikus htrafel val kvetkeztets elvgzse a clbl kiindulva azrt,
hogy megtalljuk, mely vltozkapcsolatokat kell korltozni. A mgikus halmaz megkzeltst egy hibrid
algoritmusnak tekinthetjk az elrefel kvetkeztets s a htrafel halad elfeldolgoz folyamat kztt.
4. Htrafel lncols
A logikai kvetkeztetsi algoritmusoknak a msodik nagy csaldja a 7.5. alfejezetben bemutatott htrafel
lncols (backward chaining) megkzeltst hasznlja. Ezek az algoritmusok a clbl kiindulva htrafel
dolgoznak, lncszeren haladva a szablyokon keresztl, hogy megtalljk a bizonytst altmaszt mr ismert
tnyeket. Elszr bemutatjuk az alapvet algoritmust, majd lerjuk, hogyan hasznljk ezt a logikai
programozsban (logic programming), amely a legelterjedtebb formja az automatizlt kvetkeztetseknek.
Azt is ltni fogjuk, hogy a htrafel lncolsnak vannak htrnyai is az elrefel lncolssal szemben, s meg
fogjuk vizsglni, milyen mdon kerekedhetnk fell ezeken. Vgl megmutatjuk a logikai programozs s a
knyszerek kielgtsnek problmja kztti szoros kapcsolatot.
4.1. Egy htrafel lncolsi algoritmus

A 9.6. bra egy egyszer htrafel lncolsi algoritmust mutat be, az ERL-HL-KRDEZ-t. Az algoritmust clok
listjval hvjuk meg, amely kezdetben egy elemet tartalmaz, az eredeti lekrdezst, s az eljrs visszaadja az
sszes olyan helyettestshalmazt, amelyek kielgtik a lekrdezst. A clok listjt gy tekinthetjk, mint egy
feldolgozsra vr vermet. A bizonyts aktulis ga akkor lesz sikeres, ha a verem sszes elemt ki tudjuk
elgteni. Az algoritmus elszr veszi a lista els cljt, s megtallja az szszes olyan klzt a tudsbzisban,
amelynek a pozitv literlja, vagyis a feje (head) egyesthet a cllal. Minden ilyen klz ltrehoz egy j rekurzv
hvst, amelyben a premissza, vagyis a klz trzse (body) hozz lesz adva a clveremhez. Emlkezznk, hogy a
tnyek olyan klzok, amelyeknek fejk van, de trzsk nincs, gy amikor egy cl egyesl egy ismert tnnyel,
nem adunk j alclokat a veremhez, s gy a clt megoldjuk. A 9.7. bra a Bnz(West) szrmaztatsnak a
bizonytsi fjt mutatja be, a (9.3) mondataibl kiindulva a (9.10)-en keresztl.
9.6. bra - Egy egyszer htrafel lncolsi algoritmus
257
9.7. bra - Egy htrafel lncolssal ltrehozott bizonytsi fa, annak bizonytsra,
hogy West egy bnz. A ft mlysgi keresssel kell kirtkelni, balrl jobbra. Hogy
bebizonytsuk a Bnz(West) klzt, be kell bizonytanunk az alatta elhelyezked ngy
konjunktot is. Nhnyan kzlk megtallhatk a tudsbzisban, mg msok tovbbi
htrafel lncolst ignyelnek. Mindegy egyes sikeres egyests lektseit lthatjuk a
megfelel rszcl mellett. Jegyezzk meg, hogy mihelyt egy konjunkciban egy rszcl
sikeres, helyettestseit a kvetkez rszclokhoz alkalmazzuk. gy teht, mire az ERLHL-KRDEZ eljut az utols konjunkciig, az eredetileg Ellensges(z)-ig, az mr a Nonohoz lesz lektve.
Az algoritmus a helyettestsek egy kompozcijt (composition) hasznlja. A KOMPOZCI (1, 2) olyan

helyettests, amelynek hatsa ugyanaz, mintha sorban minden helyettestst alkalmaznnk. Teht:
Helyettest(Kompozci(1, 2), p) = Helyettest(2, Helyettest(1, p))
Az algoritmusban a -ban trolt aktulis vltozlektseket sszevonjuk azokkal a lektsekkel, amelyeket a

clnak a klzfejjel val egyestse eredmnyez, megkapva gy egy j aktulis lektshalmazt a visszafel
trtn hvshoz.
A htrafel lncols, ahogyan bemutattuk, egy tiszta mlysgi keressi algoritmus. Ez azt is jelenti, hogy a
helyignye a bizonyts mretnek lineris fggvnye (most figyelmen kvl hagyva a megoldsok
sszegyjtshez szksges helyet). Ez azt is jelenti, hogy a htrafel lncols alkalmazsa (eltren az elrefel
lncolstl) olyan ismert problmkkal jr, mint amilyen az ismtld llapotok s a nem teljessg. Ksbb meg
fogjuk vizsglni ezeket a problmkat s nhny lehetsges megoldst, de elszr nzzk meg, hogyan
hasznljk a htrafel lncolst a logikai programozsi rendszerekben.
258
4.2. Logikai programozs

A logikai programozs kzel ll egy olyan technolgihoz, amely megtestesti azt a deklaratv idelt, amelyet a
7. fejezetben rtunk le, miszerint a rendszereket gy kell ltrehozni, hogy a tudst formlis nyelven fejezzk ki,
s a problmkat egy kvetkeztetsi folyamat vgigfuttatsval oldjuk meg. Ezt az idelis megkzeltst Robert
Kowalski egyenlete foglalja ssze:
Algoritmus = Logika + Vezrls
A Prolog messze a legszlesebb krben hasznlt logikai programozsi nyelv. Tbb szzezer hasznlja van.
Elssorban gyors prototpusnyelvknt hasznltk, valamint szimblummanipulcis feladatokhoz, mint pldul
fordtprogramok rsra (Van Roy, 1990) vagy termszetes nyelvek elemzsre (Pereira s Warren, 1980).
Szmos szakrtrendszert rtak Prologban jogi, orvosi, pnzgyi s ms trgyterleteken.
A Prolog programok hatrozott klzok halmazai, jellsi rendszere kiss eltr a standard elsrend logiktl. A
Prolog nagybetket hasznl a vltozkra s kisbetket a konstansokra. A klzok lersban a fej megelzi a
trzset; a :- -t hasznlja a bal oldali implikcira, vesszk vlasztjk el a literlokat a trzsben, s pont jelzi a
mondat vgt:
bnz(X):- amerikai(X), fegyver(Y), elad(X,Y,Z), ellensges(Z)
A Prolog a listk jellsre s az aritmetikra tartalmazza a szintaktikai nyalnksgot. Pldaknt me egy

Prolog program a csatol(X,Y,Z)-re, amely akkor sikeres, ha a Z- lista az X- s az Y -listk csatolsnak az
eredmnye:
csatol([],Y,Y)
csatol([A1 2 X, Y, AZ]):- csatol(X,Y,Z)
Termszetes nyelven gy olvashatak ezek a klzok, hogy (1) egy res listt hozzcsatolva az Y listhoz, egy
ugyanolyan Y listt kapunk eredmnyknt, s a (2) szerint az [A|Z] az [A|X] Y-hoz csatolsnak az eredmnye.
A csatol ezen defincija elgg hasonlnak tnik a Lispben megtallhat megfelel defincikhoz, de valjban
ez sokkal kifejezbb. Pldul feltehetjk a kvetkez krdst: csatol(A,B, [1, 2]): melyik kt listt kell csatolni
ahhoz, hogy sszelltsuk az [1, 2]-t? A programot futtatva ezeket a megoldsokat kapjuk vissza:
A = [] B = [1, 2]
A = [1] B = [2]
A = [1, 2] B = []
A Prolog-programok vgrehajtsa mlysgi keresst alkalmaz htrafel lncolson keresztl trtnik, ahol a
klzokat olyan sorrendben alkalmazzk, ahogyan a tudsbzisban szerepelnek. A Prolog nhny aspektusa a
standard logikai kvetkeztetsen kvl esik.
Beptett aritmetikai fggvnyeket tartalmaz. Az ilyen fggvnyszimblumokat hasznl literlokat a kd
vgrehajtsval bizonytja a program, s nem vgez tovbbi kvetkeztetseket. Pldul az X egyenl 4+3
akkor sikeres, ha az X rtkt a 7-hez ktjk. Ugyanakkor, az a clllts, hogy: 5 egyenl X+Y sikertelen
lesz, mert a beptett fggvnyek nem kpesek nllan egy tetszleges egyenletmegoldst elvgezni. 5
Vannak olyan beptett prediktumok, amelyeknek mellkhatsai vannak, ha vgrehajtjuk ket. Ilyenek a
bemeneti-kimeneti prediktumok s a tnyeket a TB-hez hozzad, illetve onnan trl kijelent/visszavon
prediktumok. Ezeknek a prediktumoknak nincs megfeleljk a logikban, s hatsukat sokszor nem
egyszer vgigkvetni pldul ha a tnyeket egy olyan bizonytsi fa egyik gn jelentjk ki, amely vgl
sikertelennek bizonyul.
A Prolog lehetv tesz olyan egyedi formj tagadst, amelyet sikertelensgi tagadsnak (negation as
failure) neveznk. Egy neglt cl, mint a a nem P, akkor tekintet bizonytottnak, ha a rendszernek nem
sikerl bebizonytania a P-t. gy a kvetkez mondat:
Jegyezzk meg, hogy ha a Peano-aximk meg vannak adva, akkor az ilyen clok megoldhatk egy Prolog-programon belli
kvetkeztetssel.
5
259
l(X) :- nem halott(X)
gy olvashat, hogy: Mindenki l, ha nem bizonythat, hogy halott.

A Prolognak van egy egyenlsgi opertora (=), de ez nem rendelkezik a logikai egyenlsg teljes
hatkonysgval. Egy egyenlsget tartalmaz clllts akkor sikeres, ha a kt term egyesthet,
msklnben sikertelen. Teht az X + Y = 2 + 3 akkor sikeres, ha az X lekttt rtke a 2, s az Y lekttt
rtke a 3, de a hajnalcsillag=esthajnalcsillag sikertelen. (A klasszikus logikban az utbbi egyenlet lehet
igaz, vagy lehet nem igaz.) Az egyenlsgrl sem tnyt, sem szablyt nem tudunk hozzadni a TB-hez.
A Prolog egyestsi algoritmusa nem tartalmazza az elfordulsi prbt. Ennek az a kvetkezmnye, hogy
lehetsges nem helyes kvetkeztetst vgezni. Ez azonban ritkn okoz problmt, leginkbb olyankor, amikor
a Prologot matematikai ttelek bizonytsra hasznljuk.
A Prolog tervezsnl meghozott dntsek kompromisszumot jelentenek a deklarativits s a vgrehajtsi
hatkonysg kztt mrmint amit hatkonysgon rtettnk a Prolog tervezsnek idejn. Visszatrnk majd
ehhez a tmhoz, miutn megvizsgltuk, hogyan valstjk meg a Prologot.
4.3. A logikai programok hatkony megvalstsa

Egy Prolog program vgrehajtsa ktfle mdon trtnhet: lehet interpretlt s lehet lefordtott. Az interpretci
ltalban az ERL-HL-KRDEZ algoritmus (lsd 9.6. bra) futtatst jelenti a programmal mint tudsbzissal. Azt
mondjuk, hogy ltalban, mivel a Prolog klnbz interpretcii klnbz megoldsokat tartalmaznak a
sebessg maximalizlsra. Itt mi csak kt implementcit nznk meg.
Elszr is ahelyett, hogy minden lpsben sszelltannk az sszes lehetsges vlasz listjt minden egyes
rszclhoz, a Prolog interpreter egy vlaszt hoz ltre, s egy gretet ad meg arra, hogy a tbbi lehetsges
vlaszt is generlni fogja, miutn az aktulis vlaszt teljes mrtkben feltrta. Ezt az gretet vlasztsi pontnak
(choice point) nevezzk. Mikor a mlysgi keress befejezte az aktulis vlaszbl fakad lehetsges
megoldsok feltrst, s visszalp a vlasztsi ponthoz, a vlasztsi pontot kiterjesztjk gy, hogy megadjon
egy j vlaszt a rszclhoz, s egy j vlasztsi pontot. Ez a megkzelts idt s trolhelyet takart meg.
Ezenkvl nagyon egyszer hatrfelletet biztost a hibakeresshez, mert egy adott pillanatban csak egyetlen
megoldsi tvonal vizsglata trtnik meg.
Msodszor, az ERL-HL-KRDEZ egyszer alkalmazsa a helyettestsek generlsakor s kompozcijakor jl
gazdlkodik az idvel. A Prolog a helyettestseket gy alkalmazza, hogy olyan logikai vltozkat hasznl,
amelyek emlkezni tudnak az aktulis lektseikre. A program futsnak brmely pontjn a programban lv
minden egyes vltoz vagy szabad, vagy valamely rtkhez lekttt. Ezek a vltozk s rtkek egytt
definiljk implicit mdon a helyettestst a bizonyts aktulis ghoz. A vizsglt gak kiterjesztse csak
tovbbi vltozlektseket hoz ltre, mivel egy j lekts hozzadsa egy mr lekttt vltozhoz az egyests
sikertelensgt eredmnyezi. Mikor a keressben sikertelennek bizonyul egy g, a Prolog visszalp egy
megelz vlasztsi ponthoz, s ekkor esetleg fel kell oldania nhny vltozt. Ezt gy hajtja vgre, hogy
nyomon kveti a veremben amelynek tvonal (trail) a neve lekttt sszes vltozt. Mivel minden egyes j
vltoz az EGYEST-VLT-tal kapcsoldik, a vltozt beteszi az tvonalba. Amikor egy cl sikertelen, s ideje
visszatrni egy megelz vlasztsi ponthoz, minden egyes vltoz szabadd vlik, minthogy kivesszk az
tvonalbl.
Mg a leghatkonyabb Prolog interpretereknek is nhny ezer gpi utastsra van szksgk egy kvetkeztetsi
lps vgrehajtshoz; az index kikeressnek, az egyestsnek, a rekurzv hvsi verem felptsnek a kltsge
miatt. Valjban az interpreter gy viselkedik, mint aki mg soha sem ltta a programot. Pldul jra meg kell
tallnia a clhoz illeszked klzokat. Egy lefordtott Prolog program ezzel szemben egy olyan kvetkeztetsi
eljrs, amelyet egy specifikus klzhalmazra ksztettek, s gy tudja, mely klzok illeszthetk az adott clhoz.
A Prolog fordt alapjban vve minden egyes klnbz prediktumra egy miniatr ttelbizonytt generl,
kikszblve gy az interpretcis lpsek nagy rszt. Lehetsges az is, hogy az egyestsi eljrst nyitott
kddal (open-code) lssuk el az egyes eljrs hvsokra, elkerlve gy a termek struktrjnak explicit
elemzst. A nyitott kd egyests rszleteit megtallhatk a (Warren s trsai, 1977)-ben.
A mai szmtgpek utastskszletei szegnyesnek tnnek sszehasonltva a Prolog szemantikjval, gy teht
a Prolog fordtit egy tmeneti nyelvre fordtjk le ahelyett, hogy kzvetlenl gpi nyelvre fordtank. A
legnpszerbb tmeneti nyelv a Warren Absztrakt Gp (Warren Abstract Machine) vagy WAM, amelyet David
H. D. Warrenrl neveztek el, aki az els Prolog fordt egyik megvalstja volt. A WAM a Prolog szmra
260
alkalmas absztrakt utastskszlet, s interpretlhat vagy lefordthat gpi nyelvre. Ms fordtk, mint pldul a
Lisp vagy a C, egy magas szint nyelvre fordtjk le a Prologot, s ezutn hasznljk a nyelvnek a fordtjt,
hogy azt a gpi nyelvre fordtsa. Pldul, a Csatol defincijt a 9.8. brn bemutatott kdra lehet fordtani. Van
mg nhny krds, amit fontos megemlteni:
Ahelyett hogy keresglni kellene a tudsbzisban a Csatol klzokat, a klzokat eljrss lehet alaktani, s a
kvetkeztetseket egyszeren gy hajtjuk vgre, hogy meghvjuk az eljrst.
Mint azt korbban lertuk, az aktulis vltozk lektseit egy tvonalhoz rendeljk. Az eljrs els lpse
elmenti az tvonal pillanatnyi llapott gy, hogy azok visszallthatak lesznek a VISSZALLT-TVONALlal, ha az els klz sikertelen. Ez fel fog oldani minden lektst, amelyet az els EGYEST hvs generlt.
A legtrkksebb rsz a folytatsok (continuations) listjnak hasznlata a vlasztsi pontok
implementlsra. Gondolhatunk gy egy folytatsra, mint egy eljrs s egy argumentumlista
becsomagolsra, melyek egytt hatrozzk meg, hogy mit kell legkzelebb csinlni, amikor az aktulis cl
sikeres lesz. Nem elg csak gy egyszeren visszatrni egy olyan eljrsbl, mint a CSATOL, amikor a cl
sikeres, mivel itt sokfle mdon lehet sikeres az eljrs, s minden egyes esetet fel kell derteni. A folytats
argumentum megoldja ezt a problmt, mert minden egyes esetben lehvhatjuk, ha egy cl sikeres. A CSATOL
kdban, ha az els argumentum res, akkor a CSATOL prediktum sikeres. Ezutn HVJUK a folytatst, az
tvonalhoz rendelt lektsekkel, hogy vgrehajtsa, amit a folytatsban legkzelebb meg kell tenni. Pldul ha
a CSATOL hvsa a legfels szinten trtnik, a folytats kinyomtatja a vltozk lektseit.
9.8. bra - A Csatol prediktum fordtsnak pszeudokdos reprezentcija. Az JVLTOZ fggvny egy j vltozt ad vissza, amely klnbzik a korbban visszaadott
vltozktl. A HV (folytats) eljrs folytatja a vgrehajtst a megadott folytatssal.
Mieltt Warren a Prolog fordtt elksztette volna, a logikai programozs tl lass volt ltalnos cl
felhasznlshoz. A Warren s msok ltal ltrehozott fordtk lehetv tettk, hogy a Prolog kd olyan
sebessget rjen el, amelyek klnbz standard tesztek szerint is versenykpess tettk a C nyelvvel (Van
Roy, 1990). Termszetesen az a tny, hogy egy tervksztt vagy egy elemzt egy termszetes nyelvhez nhny
tucat Prolog sorban meg lehet rni, lnyegesen vonzbb teszi a Prologot a C-nl a legtbb kisebb MI-kutatsi
projekt prototpusnak az elksztsnl.
A prhuzamosts szintn jelents gyorstst eredmnyezhet. Kt elsdleges tere van a prhuzamostsnak. Az
els, amelynek neve VAGY-prhuzamossg (OR-paralellism), abbl a lehetsgbl szrmazik, hogy egy cl
szmos klnbz klzzal lehet egyesthet a tudsbzisban. Mindegyik egyests egy potencilis megoldshoz
vezet fggetlen g megjelenst eredmnyezi a keressi helyen, s minden ilyen gat prhuzamosan is
megoldhatunk. A msodik, amelynek neve S-prhuzamossg (AND-paralellism), abbl szrmazik, hogy az
implikci trzsben minden egyes konjunktot egy prhuzamos implikcival is meg lehet oldani. Az Sprhuzamossgot nehezebb megvalstani, mert a megolds az egsz konjunkcira konzisztens lektseket
ignyel az sszes vltozra. gy minden egyes konjunktv gnak kommuniklnia kell a tbbi ggal, hogy
biztostsk a globlis megoldst.
4.4. Redundns kvetkeztets s vgtelen hurkok

Most nzzk meg a Prolog nyelv Achilles-sarkt, a mlysgi keress s az ismtelt llapotokat s vgtelen
tvonalakat tartalmaz fk illeszkedsnek hinyt. Vizsgljuk meg a kvetkez logikai programot, amely
eldnti, hogy ltezik-e egy tvonal kt pont kztt egy irnytott grfban:
tvonal(X, Z):- kapcsolat(X, Z)
261
tvonal(X, Z):- tvonal(X, Y), kapcsolat(Y, Z)
Egy egyszer, hrom csompontos grfot, amelyet a kapcsolat(a,b) s a kapcsolat(b,c) definil, mutat be a 9.9.
(a) bra. Az tvonal(a,c) lekrdezsre a program a 9.10. (a) brn lthat bizonytsi ft generlja. Msrszt
viszont, ha a kt klzt ebbe a sorrendbe tesszk:
tvonal(X, Z):- tvonal(X, Y), kapcsolat(Y, Z)
tvonal(X, Z):- kapcsolat(X, Z)
akkor a Prolog a 9.10. (a) brn bemutatott vgtelen keresst vgzi. A Prolog teht, mint egy ttelbizonyt,
hatrozott klzokbl ll TB-re nem teljes (incomplete) (mg a Datalog programok esetben sem teljes, mint
azt a pldnk mutatja), mivel lteznek olyan tudsbzisok, amelyekben nem tud bizonytani vonzat mondatokat.
Vegyk szre, hogy az elrefel lncolssal nincs ilyen problma: ha egyszer az tvonal(a, b), az tvonal(b, c)
s az tvonal(a, c) tvonalak ki lettek kvetkeztetve, az elrefel lncols lell.
A mlysgi keressen alapul htrafel lncolsnak is akad problmja a felesleges szmtsokkal. Pldul
amikor meg akarunk tallni egy tvonalat az A1-bl a J4-be a 9.9. (b) brn, a Prolog 877 kvetkeztetst hajt
vgre, amelyek legnagyobb rszt a csompontokhoz tartoz sszes lehetsges tvonal megtallsa kpezi,
amelyekbl pedig nem lehet elrni a clt. Ez hasonl a 3. fejezetben megtrgyalt ismtelt llapot problmhoz.
A kvetkeztetsi lpsek teljes szma a generlt alaptnyek szmnak exponencilis fggvnye lehet. Ha az
elrefel lncolst alkalmazzuk ehelyett, akkor legfeljebb n2 tvonal(X, Y) tny generlhat az n csompont
sszektsvel. A 9.9. (b) brn lthat problmhoz csak 62 kvetkeztetsi lps szksges.
9.9. bra - (a) Az A-bl a C-be vezet tvonal megtallsa a Prologot egy vgtelen
hurokba vezetheti. (b) Egy grf, amelyben minden csompontot kt vletlenszer
kvetkez rtegbeli csomponthoz kapcsolunk a kvetkez rtegben. Egy tvonal
megtallsa az A1-bl a J4-be 877 kvetkeztetst ignyel.
Az elrefel lncols a grfkeressi problmknl a dinamikus programozs (dynamic programming) egyik

pldja, amelyben a rszproblmkra vonatkoz megoldsok ellltsa inkrementlisan trtnik a kisebb
rszproblmktl indulva, vgig trolva a rszmegoldsokat, hogy elkerljk az jraszmolst. Ugyanezt a
hatst rhetjk el egy htrafel lncol rendszerben a memk gyjtsnek (memoization) hasznlatval, ami
azt jelenti, hogy a rszclok megoldsait troljuk, amint megtalltuk ket, hogy azutn jra felhasznlhassuk
ezeket a megoldsokat, amikor a rszcl visszatr, megtakartva gy az elz szmts megismtlst. Ezt a
megkzeltst hasznljk a tblzatos logikai programozsi (tabled logic programming) rendszerek,
amelyeknek hatkony trolsi s visszakeressi mechanizmusuk van a memk gyjtsnek megvalstsra. A
tblzatos logikai programozs egyesti a htrafel lncols clirnyossgt az elrefel lncols dinamikus
programozsi hatkonysgval. Ez az eljrs teljes a Datalog programokra is, ami azt eredmnyezi, hogy a
programoznak kevesebbet kell aggdnia a vgtelen hurkok problmja miatt.
9.10. bra - (a) Az A-bl a C-be vezet tvonal bizonytsa. (b) Vgtelen mlysg
bizonytsi fa, amely akkor generldik, ha a klzok rossz sorrendben vannak.
262
4.5. Korltozott logikai programozs

Az elrefel lncols trgyalsnl (lsd 9.3. alfejezet) bemutattuk, hogy a knyszerkielgtsi problmkat
hogyan lehet hatrozott klzokknt kdolni. A standard Prolog kpes megoldani az ilyen problmkat, pontosan
gy, mint az 5.3. brn bemutatott visszalpses algoritmus.
Mivel a visszalpses mdszer sorba veszi a vltozk trgyterleteit, ezrt csak vges trgyterlet (finite
domain) knyszerkielgtsi problmkra mkdik. A Prolog termjeiben vges szm megoldsnak szabad
lteznie brmely szabad vltozkkal rendelkez clra. (Pldul, a kl(q, sa) clnak, amely azt jelenti ki, hogy
Queenslandnek s Dl-Ausztrlinak klnbz sznnek kell lenni, hat megoldsa van, ha hrom szn
megengedett.) A vgtelen mret trgyterletekre alkalmazott mdszerek pldul az egsz szmokat felvev
vagy vals rtk vltozkat tartalmaz problmknl alkalmazhat mdszerek teljesen klnbz
algoritmust ignyelnek, mint pldul a knyszerpropaglst vagy a lineris programozst.
A kvetkez klz akkor tehet sikeress, ha a hrom szm kielgti a hromszg egyenltlensget:
hromszg(X, Y, Z):X>=0, Y>=0, Z>=0, X+Y>=Z, Y+Z>=X, X+Z>=Y
Ha a Prolognak a hromszg (3, 4, 5) lekrdezst adjuk, akkor ez jl mkdik. Ha viszont azt krdezzk:
hromszg (3, 4, Z), akkor erre nem tall megoldst, mert a Z>=0 rszclt a Prolog nem tudja kezelni. A
nehzsget az okozza, hogy a Prologban a vltozknak kt llapot valamelyikben kell lennik: egy vltoz
szabad vagy egy bizonyos termhez lekttt.
Egy vltoz lektse egy termhez a korltozs egyik specilis fajtjnak tekinthet, nevezetesen egy
egyenlsgknyszernek. A korltozott logikai programozs (constraint logic programming, CLP) lehetv
teszi, hogy a vltozk korltozva legyenek, ahelyett hogy lektttek lennnek. Egy korltozott logikai program
megoldsa a korltoknak a tudsbzisbl szrmaztathat legspecifikusabb halmaza a lekrdezs vltozin.
Pldul a hromszg (3, 4, Z) lekrdezsre a megolds a 7 >= Z >= 1 knyszer. A standard logikai programok
csak a CLP specilis esetei, amelyekben a megolds knyszereinek egyenlsgi knyszereknek azaz
lektseknek kell lennik.
A CLP-rendszerek klnfle knyszermegold algoritmusokat is tartalmaznak a nyelvben megengedett
knyszerek kezelsre. Pldul egy vals rtk vltozkon rtelmezett, lineris egyenltlensgeket megenged
rendszer tartalmazhat egy lineris programozsi algoritmust ezen knyszerek feloldsra. A CLP-rendszerek egy
sokkal rugalmasabb megkzeltst is adoptlnak a standard logikai programozsi lekrdezsek megoldsra.
Pldul a mlysgi, balrl jobbra trtn visszalpses keress helyett hasznlhatjk brmelyik ennl
hatkonyabb, az 5. fejezetben trgyalt algoritmust, belertve a heurisztikus konjunktok sorba rendezst, a
visszaugrst, a vgsi halmaz kondicionlst s gy tovbb. A CLP-rendszerek teht vegyesen alkalmazzk a
knyszerekkielgtsi algoritmusok, a logikai programozs s a deduktv adatbzisok elemeit.
A CLP-rendszerek szintn hasznostjk az 5. fejezetben bemutatott klnbz knyszerprogramozsi keressi
optimalizcis mdszereket, mint a vltozk s rtkek sorba rendezst, az elrefel ellenrzst vagy az
intelligens visszalps mdszert. Szmos rendszert gy terveztek meg, hogy a programoznak nagyobb
kontrollja legyen a kvetkeztetsek keressnek a sorrendje felett. Pldul az MRS nyelv (Genesereth s Smith,
263
1981; Russell, 1985) lehetv teszi a programoz szmra, hogy metaszablyokat (metarules) rjon a
konjunktok megvizsglsi sorrendjnek meghatrozsra. A felhasznl pldul rhat egy olyan szablyt, amely
azt mondja ki, hogy a legkevesebb vltozval rendelkez cl legyen elszr kiprblva, vagy rhat trgyterletspecifikus szablyokat bizonyos prediktumokhoz.
5. Rezolci
A logikai rendszerek ltalunk bemutatand hrom csaldjnak az utols tagja a rezolcin (resolution) alapul.
Lttuk a 7. fejezetben, hogy a propozcis rezolci egy cfolsteljes kvetkeztetsi folyamat az tletlogikban.
Ebben az alfejezetben meg fogjuk vizsglni, hogyan lehet kiterjeszteni a rezolcit az elsrend logikra.
A teljes bizonytsi eljrs ltezsnek krdse a matematikusokat rdekli kzvetlenl. Ha egy teljes bizonytsi
eljrs megtallhat matematikai lltsokra, ebbl kt dolog kvetkezik. Elszr is, az sszes ttel elfeltteleit
mechanikusan el tudjuk lltani; msodszor, a teljes matematika felpthet alapaximk halmaznak logikai
kvetkezmnyeknt. A teljessg krdsnek vizsglata gy a 20. szzadi matematika nhny legfontosabb
eredmnynek a megszletshez vezetett. 1930-ban Kurt Gdel nmet matematikus bebizonytotta az els
teljessgi ttelt (completeness theorem) az elsrend logikra, megmutatva, hogy minden kikvetkeztetett
mondatnak ltezik vges bizonytsa. (Gyakorlatban is felhasznlhat bizonytsi mdszert viszont nem talltak
egszen addig, amg J. A. Robinson nem publiklta a rezolcis algoritmust 1965-ben.) 1931-ben Gdel
bebizonytotta a mg hresebb nemteljessgi ttelt (incompleteness theorem). A ttel kimondja, hogy egy
logikai rendszer, amely tartalmazza az indukci elvt amely nlkl a diszkrt matematika igen kis rsze
pthet fel szksgszeren nem teljes. Ebbl az kvetkezik, hogy lteznek olyan kikvetkeztetett mondatok,
amelyeknek a rendszeren bell nincs vges bizonytsa. Lehet, hogy a t ott van a metaforikus sznakazalban,
de nincs olyan eljrs, amely garantln, hogy megtalljuk.
Gdel ttele ellenre, a rezolcialap ttelbizonytsokat szles krben alkalmaztk matematikai ttelek
levezetsre, belertve nhny olyan ttelt is, amelyre elzleg nem volt ismert bizonyts. A ttelbizonytsokat
ms alkalmazsok mellett hasznltk pldul hardvertervezs verifiklsra vagy logikailag helyes
programok generlsra.
5.1. Az elsrend logika konjunktv norml formja

Mint az tletlogika esetben, az elsrend rezolci is megkveteli, hogy a mondatok konjunktv norml
formban (conjunctive normal form) (CNF) legyenek, teht minden mondat klzok konjunkcija, ahol
minden egyes klzt literlok diszjunkcija alkot.6 A literlok tartalmazhatnak vltozkat, amelyeket univerzlis
kvantorral elltottnak feltteleznk. Pldul a
x Amerikai(x) Fegyver(y) Elad(x, y, z) Ellensges(z) Bnz(x)
mondat CNF-formra talaktva ilyen lesz:

Amerikai(x) Fegyver(y) Elad(x, y, z) Ellensges(z) Bnz(x)
Fontos
Minden elsrend logikai mondat talakthat a kvetkeztets szempontjbl egyenrtk CNFmondatt. Ami azt jelenti, hogy egy CNF-mondat akkor kielgthetetlen, ha az eredeti mondat is
kielgthetetlen, ezltal a CNF-mondatok kztt ellentmondsokat keresve ltre tudunk hozni
bizonytsokat.
A CNF-mondatok talaktsnak eljrsa nagyon hasonl az tletlogikai eljrshoz, amelyet a 4.1.1. szakasz Konjunktv norml formarszben lthatunk. A legfontosabb klnbsg abbl fakad, hogy ki kell vonnunk a
mondatokbl az egzisztencilis kvantorokat. Ezt az eljrst a kvetkez mondat lefordtsval illusztrljuk:
Mindenkit, aki az sszes llatot szereti, valaki szeret, vagyis:
x [y llat(y) Szereti(x, y)] [y Szereti(y, x)]
Egy klzt implikciknt is reprezentlhatunk a bal oldali atomok konjunkcijval s a jobb oldali atomok diszjunkcijval, mint azt a
7.12. feladatban lthatjuk. Ezt a formt, amelyet Kowalski-formnak (Kowalski form) szoktak nevezni, gyakran sokkal knnyebb
kiolvasni, ha az implikcik rsa jobbrl balra trtnik (Kowalski, 1979b).
6
264
A lpsek a kvetkezk:
Az implikcik eliminlsa.
A befel mozgatsa. A neglt sszektjelekre vonatkoz mr ismert szablyok mellett szksgnk van a
neglt kvantorokra vonatkoz szablyokra is. gy ezt kapjuk:
x p-bl lesz x p
x p-bl lesz x p
A mondatunk a kvetkez talaktsokon megy keresztl:

x [y (llat(y) Szereti(x, y))] [y Szereti(y, x)]
x [y
llat(y) Szereti(x, y)] [y Szereti(y, x)]
Figyeljk meg, hogyan alaktottuk t az univerzlis kvantort ( y) az implikci premisszjban egzisztencilis

kvantorr. A mondatot most gy lehet kiolvasni Vagy van olyan llat, amelyet x nem szeret, vagy (ha ez nem
ll fenn) valaki szereti x-et. Vilgos, hogy az eredeti mondat jelentst megriztk.
A vltozk tnevezse. Az olyan mondatokban, mint a ( x P(x)) ( x Q(x)), amelyek ugyanazt a vltoz
nevet ktszer is hasznljk, vltoztassuk meg az egyik vltoz nevt. Ezzel elkerljk, hogy ksbb kevereds
lehessen, amikor elhagyjuk a kvantorokat. gy ezt kapjuk:
x [y llat(y) Szereti(x, y)] [z Szereti(z, x)]
Skolemizci. A skolemizci (skolemization) az az eljrs, amelynek sorn elimincival eltvoltjuk az

egzisztencilis kvantorokat. Egyszer esetben ez megegyezik a 9.1. alfejezetben tallhat egzisztencilis
pldnyostsi szabllyal: fordtsuk le a x P(x)-et P(A)-ra, ahol az A egy j konstans. Ha ezt a szablyt
alkalmazzuk a mintamondatunkra, akkor azonban ezt kapjuk:
x [llat(A) Szereti(x, A)] Szereti(B, x)
amelynek teljesen tves a jelentse: azt mondja ki, hogy mindenki vagy nem tud szeretni egy bizonyos A llatot,
vagy egy bizonyos B entits szereti t. Valjban, az eredeti mondatunk lehetv teszi minden egyes szemly
szmra, hogy ne szeressen egy msik llatot, vagy egy msik szemly szeresse t. gy teht, azt szeretnnk,
hogy a Skolem entitsok az x-tl fggjenek:
x [llat(F(x)) Szereti(x, F(x))] Szereti(G(x), x)
Itt az F s a G Skolem-fggvnyek. Az ltalnos szably az, hogy a Skolem-fggvnyek argumentumai mind

univerzlis kvantorral elltott vltozk, amelyeknek a hatkrben az egzisztencilis kvantor rtelmezett.
Hasonlan az Egzisztencilis Pldnyostshoz, a skolemizlt mondat is pontosan akkor kielgthet, ha az
eredeti mondat is kielgthet.
Az univerzlis kvantorok elhagysa. Ezen a ponton minden megmaradt vltoz univerzlis kvantorral van
elltva. Mi tbb, a mondat egyenrtk azzal a mondattal, amelyben az sszes univerzlis kvantort balra
rendeztk. gy teht most mr elhagyhatjuk az univerzlis kvantorokat:
[llat(F(x)) Szereti(x, F(x))] Szereti(G(x), x)
Az elosztsa a felett.
[llat(F(x)) Szereti(G(x), x)] [ Szereti(x, F(x)) Szereti(G(x), x)]
Ennek a lpsnek az elvgzshez szksg lehet az egymsba gyazott konjunkcik s diszjunkcik kibontsra
is.
A mondat most CNF formj, s kt klzbl ll. Elgg olvashatatlan lett. (Nmikppen segthet, ha
megmagyarzzuk, hogy az F(x) fggvny egy, az x szemly ltal potencilisan nem szeretett llatra vonatkozik,
265
mg a G(x) olyan valakire utal, aki szeretheti x-et.) Szerencsre, neknk ritkn kell CNF-mondatokat
vizsglnunk a fordtsi folyamat knnyen automatizlhat.
5.2. A rezolcis kvetkeztetsi szably

Az elsrend klzokra vonatkoz kvetkeztetsi szably egyszeren a 4.1. szakasz - Rezolci rszben
megadott propozcis rezolcis szably kiterjesztett vltozata. Kt klz, amelyek standardizlva vannak, teht
nem tartalmaznak azonos vltozkat, akkor rezolvlhat, ha tartalmaznak komplememens literlokat. Az
tletlogikai literlok akkor komplemensek, ha az egyik a negcija a msiknak; mg az elsrend literlok
akkor komplemensek, ha az egyik egyesl a msik negcijval. gy ezt kapjuk:
ahol az EGYEST (li, mj) = . Pldul rezolvlhatjuk ezt a kt klzt:

[llat(F(x)) Szereti(G(x), (x)] s [Szereti(u, v) Megli(u, v)]
a = {u/G(x), v/x} egyest felhasznlsval a komplemens literlokat, a Szereti(G(x), x)-t s a Szereti(u, v)-t
eliminlva kapjuk meg a rezolvens (resolvent) klzt:
[llat(F(x)) Megli(G(x), x)]
A bemutatott szably neve binris rezolcis (binary resolution) szably, mert pontosan kt literlt old fel. A
binris rezolcis szably nmagban nem eredmnyez egy teljes kvetkeztetsi folyamatot. A teljes rezolcis
szably literlok rszhalmazait rezolvlja minden egyes egyesthet klzban. Egy alternatv megkzelts a
faktorlsnak (factoring), a felesleges literlok eltvoltsnak a kiterjesztse az elsrend logikra. A
propozcis faktorls kt literlt eggy redukl, ha azok azonosak. Az elsrend faktorls kt literlt eggy
redukl, ha azok egyesthetk. Az egyestt a teljes klzra kell alkalmazni. A binris rezolci s a faktorls
kombincija mr teljes eljrst eredmnyez.
5.3. Pldabizonytsok
A rezolci a TB lltst gy igazolja, hogy bebizonytja, hogy a TB nem kielgthet, vagyis a
bizonyts az res klz szrmaztatsval trtnik. Az algoritmikus megkzelts megegyezik az tletlogikban
lvvel, amelyet a 7.12. brn mr bemutattunk, gy ezt itt most nem ismteljk meg. Ehelyett inkbb kt
pldabizonytst adunk meg. Az els a bntny plda a 9.3. alfejezetbl. A mondatok CNF-ben a kvetkezk:
Amerikai(x) Fegyver(y) Elad(x, z, y) Ellensges(z) Bnz(x)
Rakta(x) Birtokol(Nono, x) Elad(West, x, Nono)
Ellensg(x, Amerika) Ellensges(x)
Rakta(x) Fegyver(x)
Birtokol(Nono, M1) Rakta(M1)
Amerikai(West) Ellensg(Nono, Amerika)
Hozzadjuk a mondatok halmazhoz a neglt clt is Bnz(West). A rezolcis bizonytst a 9.11. bra
mutatja be. Figyeljk meg a szerkezett: a bizonytsnak egy egyszer gerince van, amely a clklzzal
kezddik, s folyamatosan rezolvl a tudsbzisbl szrmaz klzokkal, mindaddig, amg az res klzt nem
generlja. Ez jellemz a Horn-klzokat tartalmaz tudsbzisokon vgzett rezolcira. Valjban a f gerinc
mentn tallhat klzok pontosan megfelelnek a 9.6. brn lthat htrafel lncolsi algoritmusban a
clvltozk egymst kvet rtkeinek. Ez azrt van gy, mert mindig azt a klzt vlasztjuk ki rezolvlsra,
amelynek a pozitv literlja egyesthet a gerincen lv aktulis klz bal szlen elhelyezked literljval, s
pontosan ez trtnik a htrafel lncolsban is. gy teht a htrafel lncols valjban a rezolci egy specilis
esete, egy klnleges vezrlsi stratgival, amely meghatrozza, hogy melyik rezolcit hajtsuk vgre
legkzelebb.
9.11. bra - Egy rezolcis bizonyts arra, hogy West bnz

266
A msodik pldnk kihasznlja a skolemizcit, s nem hatrozott klzokat is tartalmaz. Ez valamivel

bonyolultabb bizonytsi struktrt eredmnyez. Termszetes nyelven megfogalmazva a problma a kvetkez:
Mindenkit, aki az sszes llatot szereti, szeret valaki.
Brkit, aki megl egy llatot, senki sem szeret.
Jank szereti az sszes llatot.
Vagy Jank, vagy a Kvncsisg lte meg a macskt, akinek a neve Tuna.
A Kvncsisg lte meg a macskt?
Elszr is lerjuk az eredeti mondatokat, nmi httrtudst, s a G neglt clt az elsrend logikban:
A. x [y llat(y) Szereti(x, y)] [y Szereti(y, x)]
B. x [y llat(y) Megli(x, y)] [z Szereti(z, x)]
C. x llat(x) Szereti(Jank, x)
D. Megli(Jank, Tuna) Megli(Kvncsisg, Tuna)
E. Macska(Tuna)
F. x Macska(x) llat(x)
G. Megli(Kvncsisg, Tuna)
Most pedig alkalmazzuk az talaktsi procedrt, hogy minden egyes mondatot CNF-be konvertljunk:
A1. llat(F(x)) Szereti(G(x), x)
A2. Szereti(x, F(x)) Szereti(G(x), x)
B. llat(y) Megli(x, y) Szereti(z, x)
C. llat(x) Szereti(Jank, x)
D. Megli(Jank, Tuna) Megli(Kvncsisg, Tuna)
E. Macska(Tuna)
F. Macska(x) llat(x)
G. Megli(Kvncsisg, Tuna)
267
A 9.12. brn lthat a rezolcis bizonytsa annak, hogy a Kvncsisg lte meg a macskt. Magyarul a
bizonytst gy rhatjuk t:
Tegyk fel, hogy a Kvncsisg nem lte meg Tunt. Tudjuk, hogy vagy Jank, vagy a Kvncsisg tette;
teht biztosan Jank tehette. Mrmost, Tuna egy macska, s a macskk llatok, teht Tuna egy llat.
Mivel brkit, aki megl egy llatot, senki sem szeret, tudjuk, hogy Jankt nem szereti senki. Msrszt,
Jank minden llatot szeret, teht valaki szereti t, teht ez az ellentmonds ll fenn. gy teht a
Kvncsisg lte meg a macskt.
A bizonyts kpes megvlaszolni a A Kvncsisg lte meg a macskt? krdst, de gyakran ennl
ltalnosabb krdseket akarunk feltenni, mint pldul: Ki lte meg a macskt? A rezolci meg tudja
vlaszolni ezt is, de ennek a vlasznak a levezetse egy kicsit tbb munkt ignyel. A clllts a w Megli(w,
Tuna), amely neglskor CNF-ben Megli(w, Tuna) lesz. Megismtelve a bizonytst a 9.12. brn az j neglt
cllal, hasonl bizonytsi ft kapunk, de a kvetkez helyettestssel: {w/Kvncsisg} az egyik lpsben. gy
ebben az esetben, annak a kidertse, hogy ki lte meg a macskt, nem ll msbl, mint a lekrdezs vltoziban
lv lektsek nyomon kvetse a bizonytsban.
Sajnos, a rezolci csak nem konstruktv bizonytst (nonconstructive proofs) tud ellltani az
egzisztencilis clmondatokra. Pldul a Megli(w, Tuna) rezolvlhat a Megli(Jank, Tuna)
Megli(Kvncsisg, Tuna)-val, hogy a Megli(Jank, Tuna) mondatot megkapjuk, amely megint rezolvlhat
ezzel: Megli(w, Tuna), s gy kapjuk meg az res klzt. Figyeljk meg, hogy ebben a bizonytsban a w-nek
kt klnbz lektse van. A rezolci megmutatja azt, hogy igen, valaki meglte Tunt vagy Jank, vagy a
Kvncsisg. Ez nem tl meglep! Egy lehetsges megolds korltozni a rezolcis lpseket gy, hogy a
krds vltozinak csak egy lektsk lehessen egy adott bizonytsban, majd kpesnek kell lennnk arra, hogy
visszakvessk a lehetsges lektseket. Egy msik megolds egy specilis vlasz literl (answer literal)
hozzadsa a neglt clhoz, amelybl ez lesz: Megli(w, Tuna) Vlasz(w). Ilyenkor a rezolcis folyamat
mindig generl egy pontosan egy literlt tartalmaz vlaszt, amikor egy ilyan klz generldik. A 9.12. brn
lthat bizonytsra ez a Vlasz(Kvncsisg).A nem konstruktv bizonyts ezt a klzt generln:
Vlasz(Kvncsisg) Vlasz(Jank), amely nem ad szmunkra vlaszt.
9.12. bra - Egy rezolcis bizonytsa annak, hogy a Kvncsisg lte meg a macskt.
Figyeljk meg a faktorls hasznlatt a Szereti(G(Jank), Jank) klz
szrmaztatsnl.
5.4. A rezolci teljessge

Ebben a rszben bebizonytjuk a rezolci teljessgt. A fejezet elolvasst nyugodtan kihagyhatja brki, aki
megelgszik azzal, hogy elhiszi ezt az lltst.
Be fogjuk mutatni, hogy a rezolci cfolsteljes (refutation-complete), ami azt jelenti, hogy ha egy
mondathalmaz kielgthetetlen, akkor a rezolci mindig kpes levezetni egy ellentmondst. A rezolci nem
alkalmazhat arra, hogy mondatok egy halmaznak sszes logikai kvetkezmnyt generlja, de hasznlhat
arra, hogy megmondjuk, hogy egy adott mondat kvetkezmnye-e a mondathalmaznak. gy alkalmazhat egy
adott krdsre adhat sszes vlasz megtallsra, felhasznlva a korbban a fejezetben mr bemutatott
clnegls mdszert.
Fontos
268
Tnyknt tekintjk, hogy minden (egyenlsget nem tartalmaz) elsrend logikai mondat trhat
CNF-klzok halmazra. Ez a mondat alakjn vgzett indukcis bizonytssal igazolhat, az atomi
mondatbl, mint alapesetbl kiindulva (Davis s Putnam, 1960). Clunk teht bizonytani a kvetkezt:
ha S egy kielgthetetlen klzhalmaz, akkor az S-en elvgzett vges szm rezolcis lps alkalmazsa
ellentmondshoz vezet.
Bizonytsunk vza kveti Robinson eredeti bizonytst, nhny Geneserethtl s Nilssontl szrmaz
egyszersts hozzadsval (Genesereth s Nilsson, 1987). A 9.13. bra mutatja be a bizonyts alapvet
struktrjt, ami a kvetkez:
1. Elszr megvizsgljuk, hogy ha S kielgthetetlen, akkor ltezik S klzai kztt bizonyos alappldnyoknak
egy olyan halmaza, ami szintn kielgthetetlen. (Herbrand-ttel).
2. Ekkor az alap rezolcis ttelhez (ground resolution theorem) fordulunk, amelyet a 7. fejezetben adtunk
meg, s amely kijelenti, hogy a propozcis rezolci teljes az alapmondatokra.
3. Ezutn alkalmazzuk a kiterjesztslemmt (lifting lemma) annak megmutatsra, hogy brmely propozcis
rezolcis bizonytshoz, amely alapmondatok halmazt hasznlja, tallhat olyan elsrend rezolcis
bizonyts, amely azokat az elsrend logikai mondatokat hasznlja, amelyekbl az alapmondatokat
megkaptuk.
Az els lps elvgzshez szksgnk lesz hrom j fogalomra:
Herbrand-univerzum: Ha S a klzok egy halmaza, akkor a HS a Herbrand-univerzuma S-nek, vagyis az
sszes alaptermbl ll halmaz, amelyet ltrehozhatunk a kvetkezkbl:
a. Az S fggvny szimblumai, ha vannak ilyenek.
b. Az S konstansszimblumai, ha vannak ilyenek. Ha nincs ilyen, akkor az A konstans szimblum.
9.13. bra - A rezolciteljessg bizonytsnak a szerkezete
Pldul, ha az S csak a P(x, F(x, A)) Q(x, A) R(x, B) klzt tartalmazza, akkor a HS az alapmondatok
kvetkez vgtelen halmaza:
{A, B, F(A, A), F(A, B), F(B, A), F(B, B), F(A, F(A, A)), }
Teltds: Ha S a klzok egy halmaza, s P az alaptermek egy halmaza, s P(S) az S teltett halmaza P-re
vonatkoztatva, akkor P(S) az sszes alapklz halmaza, amelyet gy kapunk meg, hogy alkalmazzuk az sszes
lehetsges konzisztens helyettestst a P-beli alaptermeknek az S-beli vltozkkal.
Herbrand-bzis: Egy S klzhalmaznak a hozz tartoz Herbrand-univerzumra vonatkoz teltdst S
Herbrand-bzisnak nevezzk, s HS(S)-sel jelljk. Pldul, ha S csak a korbban pldaknt hasznlt klzt
tartalmazza, akkor a HS(S) a kvetkez vgtelen klzhalmaz :
{P(A, F(A, A)) Q(A, A) R(A, B),
269

P(B, F(B, A)) Q(B, A) R(B, B),
P(F(A, A), F(F(A, A), A)) Q(F(A, A), A) R(F(A, A), B)
P(F(A, B), F(F(A, B), A)) Q(F(A, B), A) R(F(A, B), B), }
Ezek a defincik lehetv teszik, hogy a Herbrand-ttel (Herbrands theorem) egyik formjt lltsuk:
Ha a klzok egy S halmaza nem kielgthet, akkor ltezik egy vges HS(S) rszhalmaz, amely
szintn nem kielgthet.
(Herbrand, 1930)
Legyen S ez a vges rszhalmaza az alapmondatoknak. Mrmost, alkalmazhatjuk az alap rezolcis ttelt
(4.1.3. szakasz - A rezolci teljessge rszben), hogy kimutassuk, hogy a rezolcis! lezrt (resolution!
closure) RC(S) tartalmazza az res klzt. Ez azt jelenti, hogy a propozcis rezolci futtatsa a teljessgig az
S-en egy ellentmondst fog eredmnyezni.
Fontos
Gdel nemteljessg ttele
A matematikai indukcis smkkal (mathematical induction schema) kibvtve az elsrend
logikt, Gdel nemteljessg ttele (incompleteness theorem) megmutatta, hogy lteznek olyan igaz
aritmetikai mondatok, amelyek nem bizonythatk.
A nemteljessg elmlet igazolsa mintegy 30 oldalt kvnna, gy tlmutat ennek a knyvnek a keretein,
de a bizonyts lnyegt felvzoljuk a kvetkezkben. Elszr a szmok logikai elmlett vezetjk be.
Ebben az elmletben egyetlen konstans ltezik, a 0, s egyetlen fggvny, az S (az utd-fggvny). Az
gy ltrehozott modellben S(0) fejezi ki az 1-et, S(S(0)) jelli a 2-t s gy tovbb. A nyelv teht
alkalmas az sszes termszetes szm kifejezsre. A nyelv sztra tartalmazza ezenkvl a +, a s az
exp (exponencilis) fggvnyszimblumokat s a logikai sszektjelek s a kvantorok szoksos
halmazt. Elszr figyeljk meg, hogy a nyelv mondatai megszmozhatk. (Definiljunk alfabetikus
sorrendet a szimblumok kztt, s rendezzk alfabetikus sorrendbe a nyelv 1, 2, , n, hosszsg
mondatait.) gy minden mondathoz hozzrendelhetnk egy egyedi # termszetes szmot, a Gdelszmot (Gdel number). Fontos teht, hogy a szmelmlet minden sajt mondathoz tartalmaz egy
nevet. Hasonlan megszmozhatunk minden egyes P bizonytst egy G(P) Gdel-szmmal, mivel egy
bizonyts nem ms, mint mondatok vges sorozata.
Most tegyk fel, hogy adott egy A halmaz, amely a termszetes szmokrl igaz lltsokat
megfogalmaz mondatokat tartalmaz. Mivel az A halmaz megadhat egsz szmoknak egy adott
halmazval (az A halmazban tallhat mondatok Gdel-szmaival), ezrt ltre tudunk hozni a definilt
nyelvben egy (j, A) mondatot, amely a kvetkez llts:
i i nem a Gdel-szma a j Gdel-szm mondat olyan bizonytsnak, amely bizonyts csak A-beli
premisszkat hasznl.
Legyen a az (#, A) mondat, vagyis egy olyan mondat, amely kifejezi nmagnak a
bizonythatatlansgt A-bl. (Igazolhat, hogy ilyen mondat mindig ltezik, de nem egyszer ezt
beltni.)
Kvessk vgig a kvetkez gyes rvelst. Tegyk fel, hogy bizonythat A-bl, de akkor hamis,
mivel pp azt mondja ki, hogy nem igazolhat. Ebben az esetben viszont ltezik egy hamis mondat,
ami bizonythat A-bl, gy A nem tartalmazhatna csak igaz mondatokat ez az elzetes
felttelezsnkkel ellenttes. Teht nem bizonythat A-bl. Ez viszont ppen az, amit llt sajt
magrl, teht egy igaz mondat.
Teht megmutattuk (29 s fl oldalnyi levezetst tugorva), hogy brmely, a szmelmletben
definilhat igaz mondatokat tartalmaz halmaz esetben, bizonyos alapaximk felttelezse mellett,
lteznek olyan igaz mondatok, amelyek nem bizonythatk az aximkbl. Ez az eredmny, ms
kvetkezmnyek mellett azt jelenti, hogy a matematika brmely aximarendszerben
megfogalmazhat olyan ttel, amely nem bizonythat az adott rendszer aximibl. Ez a
270
matematiknak egy igen fontos eredmnye. A Gdel-ttel hatst a mestersges intelligencia terletre
sokan vitattk, kztk maga Gdel is. A 26. fejezetben visszatrnk erre a krdsre.
Most, hogy megllaptottuk, hogy mindig van egy rezolcis bizonyts, amely magban foglal nhny vges
rszhalmazt a Herbrand S bzisbl, a kvetkez lps annak megmutatsa, hogy ltezik egy rezolcis
bizonyts, amely magnak az S-nek a klzait tartalmazza, amelyek nem szksgszeren alapklzok. Azzal
kezdjk, hogy megvizsgljuk a rezolcis szably egy egyszer alkalmazst. Robinson alaplemmja magba
foglalja a kvetkez tnyt:
Legyen C1 s C2 kt klz, amelyeknek nincsenek kzs vltozi. Legyenek C1 s C2 az alappldnyai C1-nek s
C2-nek. Ha C rezolvense C1-nek s C2-nek, akkor ltezik egy olyan C klz, amelyik (1) rezolvense C1-nek s
C2-nek s (2) C alappldnya C-nek.
Ezt kiterjesztslemmnak (lifting lemma) nevezik, mivel kiterjeszti a bizonytsi lpst az alap klzokrl az
ltalnos elsrend klzokra. A kiterjesztsi lemma bizonytshoz Robinsonnak szksge volt az egyests
mdszernek megalkotsra s a legltalnosabb egyest tulajdonsgainak levezetsre is. A bizonyts
ttekintse helyett a kvetkezkben illusztrljuk a lemmt:
C1 = P(x, F(x, A)) Q(x, A) R(x, B)
C2 = N(G(y), z)) P(H(y), z)
C'1 = P(H(B), F(H(B), A)) Q(H(B), A) R(H(B), B)
C'2 = N(G(B), F(H(B), A)) P(H(B), F(H(B), A))
C' = N(G(B), F(H(B), A)) Q(H(B), A) R(H(B), B)
C = N(G(y), F(H(y), A)) Q(H(y), A) R(H(y), B)
Lthat, hogy C valban C alaptermje. ltalnossgban ahhoz, hogy C1-nek s C2-nek legyen rezolvense, gy
kell ltrehozni ket, hogy elszr a C1-beli s a C2-beli komplemens literlok legltalnosabb egyestjt
alkalmazzuk C1-re s C2-re. A kiterjesztsi lemma felhasznlsval knny hasonl lltsokat levezetni a
rezolcis szably alkalmazsnak brmely sorozatra:
Brmely az S lezrshoz tartoz C klzhoz ltezik egy S lezrsban lev C klz, amelyre a C klz a C klz
alappldnya, s a C levezetse azonos hosszsg a C levezetsvel.
Ebbl a tnybl kvetkezik, hogy ha S lezrsban megjelenik az res klz, akkor ez szintn megtallhat az S
rezolcis lezrsban. Ez azrt van, mivel az res klz semmilyen ms klznak sem alappldnya.
sszefoglalva: megmutattuk, hogyha S nem kielgthet, akkor ltezik az res klznak egy vges mret
rezolcis szablyt alkalmaz levezetse.
Az elmlet bizonytsban az alapklzokrl az elsrend klzokra trtn kiterjeszts az llts erejnek igen
jelents nvelse. Ez abbl kvetkezik, hogy az elsrend bizonytsban mr csak annyiszor kell a vltozkat
helyettesteni, amennyiszer ez a bizonytshoz szksges, mg az alapklzmdszereknl szksges volt
nagyszm nknyes pldnyostst megvizsglni.
5.5. Az egyenlsg kezelse

Az ebben a fejezetben az eddig lert kvetkeztetsi mdszerek kzl egyik sem foglalkozott az egyenlsggel.
Hrom jl elklnthet megkzeltst alkalmazhatunk. Az els az, hogy aximkkal ltjuk el az egyenlsget
vagyis lerunk mondatokat az egyenlsgi relcirl a tudsbzisban. El kell mondanunk, hogy az egyenlsg
reflexv, szimmetrikus, tranzitv, s hogy az egyenlk helyettesthetk egyenlkkel brmely prediktumban
vagy fggvnyben. Ezrt van szksgnk hrom alapaximra, majd ezutn egy tovbbira minden egyes
prediktumhoz vagy fggvnyhez:
x x = x
x, y x = y y = x
x, y, z x = y y = z x = z
x, y x = y (P1(x) P1(y))
271

x, y x = y (P2(x) P2(y))
.
.
.
w, x, y, z w = y x = z (F1(w, x) = F1(y, z))
w, x, y, z w = y x = z (F2(w, x) = F2(y, z))
.
.
.
Mikor ezek a mondatok adottak, egy standard kvetkeztetsi eljrs, mint amilyen a rezolci elvgezhet olyan
feladatokat, amelyek egyenlsgi kvetkeztetst ignyelnek, mint pldul a matematikai egyenletek megoldsa.
Az egyenlsg kezelsnek msik mdja egy tovbbi kvetkeztetsi szably alkalmazsa. A legegyszerbb
szably, a demodulci (demodulation) vesz egy egysgklzt, x = y s helyettesti az y-t brmely termmel, ami
x-szel egyesthet egy msik klzban. Formlisabban kifejezve ezt kapjuk:
Demodulci. Brmely x, y s z termekre, ahol EGYEST (x, z) = , s az mn[z] egy literl, ami tartalmazza a zt.
A demodulcit jellemzen arra hasznljk, hogy leegyszerstsen lltsok kollekciit hasznl kifejezseket,
mint pldul x + 0 = x, x1 = x s gy tovbb. A szablyt ki lehet terjeszteni, hogy olyan nem egysg klzokkal is
tudjon foglalkozni, amelyekben egy egyenlsgi literl megjelenik.
Paramodulci (paramodulation). Brmely x, y s z termre, ahol az EGYEST (x, z) =
A demodulcival ellenttben a paramodulci egy teljes kvetkeztetsi eljrst eredmnyez az egyenlsggel

rendelkez elsrend logikban.
Egy harmadik megkzelts az egyenlsgi kvetkeztetst teljes mrtkben egy kiterjesztett egyestsi
algoritmuson bell kezeli. Ez azt jelenti, hogy a termek egyesthetk, ha bizonythatan egyenlk egy bizonyos
helyettests alatt, ahol a bizonythatan lehetv tesz egy bizonyos mennyisg egyenlsgi kvetkeztetst.
Pldul, azok a termek, hogy 1 + 2 s 2 + 1 normlis esetben nem egyesthetk, de egy egyestsi algoritmus,
amely ismeri, hogy x + y = y + x, tudn ket egyesteni az res helyettestssel. Az ilyen fajta egyenleti
egyests (equational unification) elvgezhet hatkony algoritmusokkal, amelyeket arra terveztek, hogy a
felhasznlt bizonyos aximkat hasznlja (kommutativits, asszociativits s gy tovbb), ahelyett hogy explicit
kvetkeztetseket tenne ugyanazokkal az aximkkal. A ttelbizonytsok, amelyek ezt a technikt hasznljk,
szoros kapcsolatban llnak a korltozott logikai programozsi rendszerekkel, amelyeket a 9.4. alfejezetben
rtunk le.
5.6. Rezolcis stratgik

Tudjuk, hogy a rezolci ismtelt alkalmazsa megtallja a bizonytst, ha ltezik. Ebben a rszben olyan
stratgikat tekintnk t, amelyek hatkonyan segtenek megtallni a bizonytsokat.
5.6.1. Egysgpreferencia
272
Ez a stratgia elnybe helyezi azoknak a mondatoknak az alkalmazst, amelyek egyetlen literlt tartalmaznak
(szoktk ezeket egysgklznak (unit clause) is nevezni). A stratgia alaptlete az, hogy prbljunk meg
ltrehozni egy res klzt, gy teht j tlet lehet elnyben rszesteni az olyan kvetkeztetseket, amelyek
rvidebb klzokat hoznak ltre. Egy egysgmondat feloldsa (mint amilyen a P) egy brmely ms mondattal
(mint amilyen a P Q R), mindig egy olyan klzt eredmnyez (ebben az esetben: Q R ), amely
rvidebb lesz, mint a msik klz. Amikor az egysgpreferencia-stratgit elszr alkalmaztk az
tletkalkulusban, akkor ez drmai gyorsulst eredmnyezett, megvalsthatv tve olyan bizonytsok
elvgzst, amelyek a preferencik meghatrozsa nlkl nem voltak kivitelezhetk. Az egysgpreferencia
azonban nmagban nem cskkenti le elgg az elgazsok szmt a kzepes mret problmkban ahhoz,
hogy ezek kezelhetk legyenek rezolcival. Mindenesetre a mdszer egy hasznos heurisztika, amit jl lehet
kombinlni ms stratgikkal.
Az egysgrezolci (unit resolution) a rezolci egy korltozott formja, amelyben minden rezolcis
lpsnek tartalmaznia kell egy egysgklzt. Az egysgrezolci ltalban nem teljes, de a Horntudsbzisokban teljes. Az egysgrezolcis bizonytsok a Horn-tudsbzisokon emlkeztetnek az elrefel
lncolsra.
5.6.2. Tmogat halmaz

Hasznosak azok a mdszerek, amelyek megprbljk meghatrozni, hogy melyik rezolcit rdemes elszr
elvgezni, de mg hatkonyabbak, ha megprbljuk kizrni a lehetsges rezolcik egy csoportjt is. A
tmogat halmaz (set of support) stratgia pontosan ezt teszi. Az eljrs mondatok egy halmaznak
kivlasztsval kezddik, amelyet tmogat halmaznak neveznk. Minden rezolci egy tmogat halmazbeli
elemet s egy msik, nem halmazbeli elemet kombinl ssze, s hozzadja a rezolvenst a tmogat halmazhoz.
Ha a tmogat halmaz viszonylag kicsi a tudsbzishoz kpest, akkor a mdszer alkalmazsa jelents mrtkben
lecskkenti a keressi teret.
vatosan kell alkalmaznunk a megkzeltst, mivel az algoritmus nem lesz teljes, ha a tmogat halmazt rosszul
vlasztjuk meg. Ha az S tmogat halmazt gy vlasztjuk meg, hogy a maradk mondatok egyttesen
kielgthetk, akkor a tmogat halmaz stratgijt alkalmaz rezolci teljes. Elterjedt mdszer, hogy a neglt
lekrdezs mondatot hasznljuk tmogat halmazknt, azt felttelezve, hogy az eredeti tudsbzis konzisztens.
(Vgl is, ha a tudsbzis nem konzisztens, akkor a lekrdezsbl kvetkeztethet tny is jelents nlkli.) A
tmogat halmaz stratginak tovbbi elnye, hogy a ltrehozott bizonytsi fk clorientltak, gy az olvask
szmra knnyen rthetk.
5.6.3. Bemeneti rezolci

A bemeneti rezolci (input resolution) stratgiban minden rezolci egy (tudsbzisbeli vagy lekrdez-)
mondatot kombinl ms mondatokkal. A 9.11. brn lthat bizonyts csak bemeneti rezolcit hasznl. Ezt az
brkon sok oldalkapcsolattal rendelkez vonal jellemzi, ahol a kapcsoldsokon egyedi mondatok tallhatk.
Egyrtelm, hogy az ilyen alak bizonytsi fk mrete kisebb, mint brmely ms bizonytsi f. Horn formj
tudsbzisok esetben a Modus Ponens egyfajta bemeneti rezolcis stratgia, mivel mindig az eredeti TB egy
mondatt kombinlja egy msik mondattal. gy nem meglep, hogy a bemeneti rezolci teljes a Horn formj
tudsbzisok esetben, de nem teljes ltalnos esetben. A lineris rezolci (linear resolution) stratgia egy
olyan ltalnosts, amely megengedi, hogy P s Q egytt szerepeljenek a rezolciban, ha P eredeti eleme a
TB-nek, vagy ha P leszrmazottja Q-nak a bizonytsi fban. A lineris rezolci teljes eljrs.
5.6.4. Bennfoglals
A bennfoglals (subsumption) mdszere kizrja a keressbl azokat a mondatokat, amelyek benne foglaltatnak
(pldul mert specifikusabbak) ms tudsbzisbeli mondatokban. Pldul ha P(x) megtallhat a tudsbzisban,
akkor nincs rtelme hozzadni P(A)-t, mg kevesebb rtelme van hozzadni P(A) Q(B)-t. A bennfoglals segt
kis mreten tartani a TB-t, amely a keressi tr mretnek cskkentst eredmnyezi.
5.7. Ttelbizonytk
A ttelbizonytk (amelyeket automatizlt kvetkeztetknek is szoktunk nevezni) kt szempontbl klnbznek
a logikai programozsi nyelvektl. Elszr is a legtbb logikai programozsi nyelv csak Horn klzokkal
dolgozik, ezzel szemben a ttelbizonytsok elfogadjk a teljes elsrend logikt. Msodszor, a Prolog
programok egymsba fzik a logikt s a kontrollt. Ha a programoz vlasztsa az A:-B, C-re esik az A:-C, B
273
helyett, ez a program vgrehajtsra van hatssal. A legtbb ttelbizonytsban a mondatok vlasztott

szintaktikai formja nincs hatssal a kapott eredmnyekre. A ttelbizonytsoknak is szksgk van az
informci kontrolljra, hogy hatkonyan mkdhessenek, de ezt az informcit ltalban kln troljk a
tudsbzistl, ahelyett, hogy magnak a tudsreprezentcinak a rszeknt jelenne meg. A legtbb kutats a
ttelbizonytsok trgyban magban foglalja az ltalban hasznos kontrollstratgikat, amelyek a sebessget is
nvelhetik.
5.7.1. Egy ttelbizonyts szerkesztse

Ebben a rszben lerjuk az OTTER (Organized Techniques for Theoremproving and Effective Research) nev
ttelbizonytt (McCune, 1992), klns figyelmet fordtva a vezrlsi stratgijra. Ahhoz, hogy egy problmt
ksztsen el az OTTER szmra, a felhasznlnak ngy rszre kell osztania a tudsbzist:
Egy klzhalmazra, melyet tmogat halmaznak (set of support) (vagy sos-nek) neveznk, s amely
definilja a problmrl szl legfontosabb tnyeket. Minden rezolcis lps a tmogat halmaz egy tagjt
rezolvlja egy msik aximhoz kpest, teht a keresst a tmogat halmazra koncentrljuk.
A hasznlhat aximkra (usable axioms), amely egy halmaz a tmogat halmazon kvl. Ez httrtudst
biztost a problmaterletrl. A hatr megvlasztsa a problma rszei (teht ami az sos-en bell van) s a
httr (teht a hasznlhat aximk) kztt a felhasznl megtlsn mlik.
Az egyenletek egy halmazra, amelyeket trsoknak (rewrites) vagy demodultoroknak (demodulators)
neveznk. Habr a demodultorok egyenletek, mindig balrl jobbra irnyban alkalmazzk ket. gy teht egy
kanonikus formt hatroznak meg, amelyben az sszes term leegyszersdik. Pldul az x + 0 = x
demodultor kimondja, hogy minden termet az x + 0 formban az x termmel kell helyettesteni.
Paramterek s klzok egy halmazra, amelyek meghatrozzk a vezrlsi stratgit. A felhasznlnak egy
heurisztikus funkcit szksges specifiklni, hogy kontrolllja a keresst, s egy szr funkcit, hogy
kitrljn nhny lnyegtelen rszclt.
Az OTTER gy mkdik, hogy folyamatosan rezolvlja a tmogathalmaz egy elemt az egyik hasznlhat
aximval szemben. A Prologgal ellenttben, ez egy a legjobbat-elszr keresst hasznl. A heurisztikus
funkcija megmri minden egyes klz slyt, ahol a knnyebb klzokat rszesti elnyben. A heurisztika
egzakt kivlasztsa a felhasznln mlik, de ltalban a klz slynak korrellnia kell a mretvel vagy a
nehzsgvel.
9.14. bra - Az OTTER ttelbizonyts vzlata. A heurisztikus kontrollt alkalmazzk a

legknnyebb klz kivlasztsra s a FILTER funkciban, amely kitrli a jelentktelen
klzokat a tovbbi vizsglatbl.
274
Az egysgklzokat knnyknt kezeljk; gy teht a keresst az egysgpreferencia-stratgia ltalnostsnak

tekinthetjk. Minden egyes lpsnl az OTTER tteszi a legknynyebb klzt a tmogathalmazbl a
hasznlhat listra, s hozzadja a hasznlhat listhoz a legknnyebb klz s a hasznlhat lista elemeinek
rezolvlsakor keletkezett nhny kzvetlen kvetkezmnyt. Az OTTER lell, amikor tall egy cfolatot, vagy
amikor nincs tbb klz a tmogathalmazban. Az algoritmus a 9.14. brn lthat rszletesebben.
5.7.2. A Prolog kiterjesztse

Egy ttelbizonyt ltrehozsnak alternatv mdja, ha a Prolog fordtbl indulunk ki, s ezt kiterjesztjk gy,
hogy egy helyes s teljes kvetkeztetgpet kapjunk a teljes elsrend logikhoz. Ezt a megkzeltst
alkalmaztk a Prolog Technolgia Ttelbizonytban (Prolog Technology Theorem Prover, PTTP) (Stickel,
1988). A PTTP ngy jelents vltoztatst tartalmaz a Prologhoz kpest, hogy helyrelltsa a teljessget s a
kifejezkpessget:
Az elfordulsi prba visszakerl az egyestsi folyamatba, hogy azt biztosabb tegye.
A mlysgi keresst felvltja egy iteratvan mlyl keress. Ez a keressi stratgit teljess teszi, s csak egy
konstans rtkkel vesz tbb idt ignybe.
A neglt literlok (mint a P(x)) engedlyezettek. A megvalstsban kt klnll folyamat van, az egyik a
P-t akarja bebizonytani, a msik a P-t.
Egy n atommal rendelkez klz n klnbz szablyknt kerl trolsra. Pldul az A B C-t gy is
trolnnk, mint B C A s gy is, mint C B A. Ez a technika, amelyet zrsnak (locking)
neveznk, azt eredmnyezi, hogy az aktulis clt csak minden egyes klz fejvel kell egyesteni, de mg gy
is lehetv teszi a negls helyes kezelst.
A kvetkeztetst teljess teszik (mg a nem Horn-klzokra is) a lineris bemeneti szably hozzadsval: ha a
z aktulis cl egyesl a veremben lv egyik cl negltjval, akkor azt a clt rezolvltnak kell tekinteni. Ez
egy mdja az ellentmondsokkal val kvetkeztetsnek. Ttelezzk fel, hogy az eredeti cl a P, s ezt
redukltuk kvetkeztetsek sorozatval a P clra. Ez a P P mondatra vezet, amely logikailag
egyenrtk a P-vel.
275
A felsorolt vltoztatsok ellenre a PTTP megrzi azokat a tulajdonsgokat, amelyek a Prologot gyorss teszik.
Az egyestsek mg gy is a vltozk kzvetlen vltoztatsval trtnnek gy, hogy a lektsek feloldsa a
visszalps sorn az tvonal lezrsval egytt trtnik. A keressi stratgia itt is a bemeneti rezolcin
alapszik, ami azt jeleneti, hogy minden rezolci a problma egyik eredeti kijelentsben megadott klzzal
szemben trtnik (s nem egy szrmaztatott klzzal). Ez lehetv teszi a problma eredeti kijelentsben adott
sszes klz lefordtst.
A PTTP f htrnya az, hogy a felhasznl elveszt minden vezrlsi lehetsget a megoldsok keresse sorn.
Minden kvetkeztetsi szablyt a rendszer mind az eredeti, mind a kontrapozitv formjban felhasznl. Ez
nehezen rtelmezhet keresseket eredmnyez. Pldul figyeljk meg ezt a szablyt:
(f(x, y) = f(a, b)) (x = a) (y = b)
Prolog szablyknt tekintve, ez is egy kvetkezetes mdja annak a bizonytsnak, hogy kt f term megegyezik.
De a PTTP mg a kontrapozitv lltst is generlhatja:
(x a) (f(x, y) f(a, b)) (y = b)
gy tnik, hogy ez igen fradsgos mdja annak, hogy bizonytsuk kt term, x s a klnbzsgt.
5.7.3. Ttelbizonytsok mint segdeszkzk

Eddig gy tekintettnk a kvetkeztet rendszerekre, mint fggetlen gensre, amelynek nllan kell dntseket
hoznia s cselekednie. A ttelbizonytsok msik felhasznlsa, amikor segtknt hasznljuk, s tancsokkal lt
el, mondjuk egy matematikust. Ebben a hasznlati mdban a matematikus felgyelknt viselkedik, feltrkpezi
a kvetkez lps meghatrozsnak stratgijt, hogy mi legyen, s megkri a ttelbizonytt, hogy tltse ki a
rszleteket. Egy bizonyos fokig mellkess teszi a flig eldnthetsg problmjt, mivel a felgyel
megszntethet egy lekrdezst, s prblhat egy msik megkzeltst, ha a lekrdezs tl sok idt vesz ignybe.
A ttelbizonyts bizonyts-ellenrzknt (proof checker) is mkdhet, ahol a bizonytst mi adjuk meg
vzlatosan, nagyobb lpsek sorozataknt, s a rendszer tlti ki az egyedi kvetkeztetsek rszleteit, amelyek
igazoljk lpseink helyessgt.
A Socratic kvetkeztet (Socratic reasoner) egy ttelbizonyt, amelynek a KRDEZ fggvnye nem teljes, de
amely mindig elrkezhet egy megoldshoz, ha a megfelel krdssorozatot tesszk fel. gy teht a Socratic
kvetkeztetk j segtk, feltve, ha van egy felgyel, aki a megfelel KRDEZ hvsokat sszelltja. Az ONTIC
(McAllester, 1989) egy Socratic kvetkeztet rendszer matematikai ttelbizonytshoz.
5.7.4. A ttelbizonytsok gyakorlati felhasznlsa

A ttelbizonytk jszer matematikai eredmnyeket produkltak. A SAM (Semi-Automated Mathematics)
program volt az els, amely bebizonytott egy lemmt a rcselmletben (Guard s trsai, 1969). Az AURA
program szintn nyitott krdseket vlaszolt meg a matematika klnfle terletein (Wos s Winker, 1983). A
BoyerMoore-ttelbizonytt (Boyer s Moore, 1979) sok ven keresztl hasznltk s bvtettk. Natarajan
Shankar ezt hasznlta fel, hogy megadja az els teljes, precz formlis bizonytst Gdel nemteljessg ttelnek
(Shankar, 1986). Az OTTER program az egyik legersebb ttelbizonyt. Hasznltk a kombinatorikus logika
nhny nyitott krdsnek megoldsra. A legismertebb ezek kzl a Robbins-algebra. 1933-ban Herbert
Robbins egy egyszer aximasorozatot javasolt, amely a Boole-algebra definilsra ltszott alkalmasnak, de
nem talltak hozz bizonytst (tbb matematikus, kztk Alfred Tarski, jelents munkja ellenre). 1996.
oktber 10-n, nyolc nap szmts utn az EQP (az OTTER egyik vltozata) megtallta a bizonytst (McCune,
1997).
A ttelbizonytsokat alkalmazhatjuk a hardver- s szoftvertervezsben a verifikci (verification) s a
szintzis (synthesis) sorn felmerl problmkra, mivel mindkt trgyterlethez lehetsges megfelel
aximarendszert definilni. gy teht a ttelbizonytsi kutatst megtallhatjuk a hardvertervezs, a
programozsi nyelvek s a szoftverfejleszts terletein is nem csupn az MI-ben. A szoftver esetben az
aximk meghatrozzk a programozsi nyelv minden egyes szintaktikus elemnek tulajdonsgait. (A
programokrl trtn kvetkeztets elgg hasonl az akcikrl trtn kvetkeztetshez a
szitucikalkulusban.) Egy algoritmus akkor tekinthet igazoltnak, ha a kimenetei megfelelnek a
specifikcinak minden bemenet mellett. Az RSA nyilvnos kulcskdolsi algoritmust s a BoyerMoore-fle
hrillesztsi algoritmust is ilyen mdon igazoltk (Boyer s Moore, 1984). A hardver esetben az aximk
lerjk a jelek s az ramkr elemei kztti interakcikat (lsd a 8. fejezetbeli pldt). Egy 16 bites sszead
276
tervt az AURA igazolta (Wojcik, 1983). A logikai kvetkeztetk, amelyeket specilisan igazolsokra terveztek,
egsz CPU-kat voltak kpesek verifiklni, belertve ezek idztsi tulajdonsgait is (Srivas s Bickford, 1990).
Az algoritmusok formlis szintzise volt a ttelbizonytsok egyik els felhasznlsa, amint azt Cordell Green
(Green, 1969a) felvzolta, aki Simon korbbi tleteire tmaszkodott (Simon, 1963). Az alaptlet az volt, hogy
egyfle mdon bizonytsk azt a ttelt, hogy ltezik egy p program, amely eleget tesz egy bizonyos
specifikcinak. Ha a bizonytst gy korltozzuk, hogy konstruktv legyen, a program maga is kinyerhet lesz
a bizonytsbl. Habr ez egy teljesen automatizlt deduktv szintzis (deductive synthesis), legalbbis gy
nevezzk, mg nemigen hasznlhat ltalnos cl programok ksztsre, m a kzzel irnytott deduktv
szintzis mr sikeresen tervezett nhny jszer s bonyolult algoritmust. A specilis cl programok szintzise
szintn aktv kutatsi terlet. Az AURA ttelbizonytt sikerrel alkalmaztk a hardverszintzis terletn olyan
ramkrk tervezsre, amelyek kompaktabbak, mint minden azt megelz terv (Wojciechowski s Wojcik,
1983). Sok ramkr tervezsnl az tletlogika elegend, mivel a legfontosabb tletlltsok halmaza rgztett,
ugyanis ezek az ramkr elemeit rjk le. Az tletlogikai kvetkeztets alkalmazsa a hardverszintzisben ma
mr egy standard technika, amelynek sok nagymret hlzati alkalmazsa ltezik (lsd pldul Nowick s
trsai, 1993).
Ugyanezeket a technikkat mostanban kezdik el alkalmazni a szoftverek verifikcijhoz is, pldul a SPIN
modell ellenrz programmal (Holzmann, 1997). A Remote Agent rhaj vezrlsi programot pldul sikerlt
verifiklni a repls eltt s utn (Havelund s trsai, 2000).
6. sszefoglals
Az elsrend logikai kvetkeztets egy elemzst mutattuk be, tovbb szmos algoritmust, melyek ilyen
kvetkeztetseket kpesek vgrehajtani.
Egy els megkzelts kvetkeztetsi szablyokat hasznl kvantorok pldnyostsra azrt, hogy talaktsa a
kvetkeztetsi problmt az tletkalkulusra. Ez a megkzelts jellemzen nagyon lass megoldsokat
eredmnyez.
A egyests hasznlata, azaz a megfelel helyettestsek megkeresse vltozkhoz, megsznteti a
pldnyosts lpst az elsrend bizonytsokban, s gy sokkal hatkonyabb teszi a folyamatot.
A Modus Ponens kiterjesztett vltozata az egyestst hasznlja, ltrehozva egy termszetes s nagy
modellez erej kvetkeztetsi szablyt, az ltalnostott Modus Ponenst (generalized Modus Ponens). Az
elrefel lncols (forward chaining) s a htrafel lncols (backward chaining) algoritmusok hatrozott
klzok halmazra alkalmazzk ezt a szablyt.
Az ltalnostott Modus Ponens teljes a hatrozott klzokra, habr a kvetkeztetsi problma flig eldnthet
(semidecidable). A Datalog programok esetben, amely programok csak fggvnymentes hatrozott
klzokat tartalmaznak, a kvetkeztets eldnthet.
Az elrefel lncolst a deduktv adatbzisokban (deductive databases) hasznljk, ahol sikeresen
kombinljk ezt a mdszert a relcis adatbzis ms mveleteivel. Ezenkvl az elrefel lncolst hasznljk
a produkcis rendszerekben (production systems) is, amelyek hatkonyan kpesek frissteni a
tudsbzisukat nagymret szablyhalmazokkal is.
Az elrefel lncols teljes a Datalog programokra, s polinomilis idben fut.
A htrafel lncolst a logikai programozsi rendszerekben (logic programming systems) hasznljk, mint
amilyen pldul a Prolog, amely kifinomult fordtsi technikkat alkalmaz, hogy biztostsa a gyors
kvetkeztetst.
A htrafel lncolsban sok a felesleges kvetkeztets, s elfordulhatnak vgtelen hurkok. Ezeket a memk
gyjtsvel (memoization) lehet kezelni.
Az ltalnostott rezolcis (resolution) kvetkeztets teljes bizonytsi rendszer az elsrend logikban. Az
eljrs konjunktv norml formj tudsbzisokat hasznl fel.
277
Szmos stratgia ismert a rezolcis rendszerek keressi ternek a cskkentsre, anlkl hogy a teljessget
veszlybe sodornnk. A hatkony rezolcialap ttelbizonytsokat felhasznltk, hogy rdekes matematikai
tteleket bebizonytsanak, s hogy verifikljanak, valamint szintetizljanak szoftvereket s hardvereket.

A logikai kvetkeztetseket szles krben vizsgltk mr az kori grg matematikusok is. Az Arisztotelsz
ltal legtbbet vizsglt kvetkeztetsi mdszer a szillogizmus (syllogism) volt. A szillogizmus szitucikra s
hangulatokra bonthat a termek mondatbeli sorrendjtl fggen (amelyeket prediktumoknak neveznk ma)
s az egyes termek ltalnossgnak mrtktl fggen (amit ma a kvantorok segtsgvel rtelmeznk), illetve
attl fggen, hogy a termek neglva voltak-e. A legalapvetbb szillogizmus, amely az els szituci els
hangulata, a kvetkez:
Minden S az M is.
Minden M a P is.
Ezrt minden S a P is.
Arisztotelsz ms szillogizmusok rvnyessgt is megprblta igazolni, visszavezetve ezeket az els
szitucira. Pontosan lerta az egyes szillogizmusokhoz tartoz hangulatokat s szitucikat, de a
szillogizmusok igazolsa mr kevsb volt precz.
Gottlob Frege, aki teljes elsrend logikt fejlesztett ki 1879-ben, kvetkeztetsi rendszert logikailag rvnyes
smk nagymret gyjtemnyre s egyetlen kvetkeztetsi szablyra alapozta, a Modus Ponensre. Frege
kihasznlta azt a tnyt, hogy ennek a formnak A P-bl kvetkeztesd a Q-t kvetkeztetsi szablynak a
hatst szimullhatja a Modus Ponens alkalmazsval a P-re, egy logikailag rvnyes smval, a P Q-val. A
kifejezsnek ezt az axiomatikus stlust, amely a Modus Ponenst, plusz szmos logikailag rvnyes smt
hasznl, Frege utn mg szmos matematikus hasznlta; a leginkbb emltsre mlt, hogy a Principia
Mathematicban (Whitehead s Russell, 1910) is felhasznltk.
A kvetkeztetsi szablyok, mint az axiomatikus smktl klnll dolgok lltak a termszetes dedukci
(natural deduction) kzpontjban, amelyet Gerhard Gentzen s Stanislaw Jskowski vezetett be (Gentzen,
1934; Jskowski, 1934). A termszetes dedukcit azrt nevezik termszetesnek, mert nem kvnja meg a
mondatok talaktst az (olvashatatlan) norml formra, s kvetkeztetsi szablyaikat gy terveztk, hogy az
emberek szmra termszetesnek tnjenek. Prawitz egy egsz knyv hosszsg elemzst adott a termszetes
dedukcirl (Prawitz, 1965). Gallier az automatikus dedukci elmleti altmasztsnak kifejtshez alkalmazta
Gentzen szekvenciit (Gallier, 1986).
A klzforma felfedezse nagy jelentsg lps volt az elsrend logika matematikai elemzsnek
kifejlesztsben. Whitehead s Russell (Whitehead s Russell, 1910) kiterjesztettk az gynevezett tviteli
szablyt [maga a kifejezs Herbrandtl szrmazik (Herbrand, 1930)], amit a kvantoroknak a formula el trtn
kiemelsre alkalmaztak. A Skolem-konstansokat s a Skolem-fggvnyeket, viszonylag precz lerst adva,
Thoralf Skolem vezette be (Skolem, 1920). A skolemizci teljes eljrsa, a Herbrand-univerzum fontos
fogalmnak bevezetsvel egytt egy ksbbi rsban tallhat (Skolem, 1928).
Herbrand elmlete, amit Jacques Herbrand francia matematikusrl neveztek el, fontos szerepet jtszott az
automatikus kvetkeztet rendszerek mdszereinek fejlesztsben, mind a Robinsonhoz fzd rezolci
bevezetse eltt s utn (Herbrand, 1930). Ezt tkrzi az, hogy habr maga a fogalom valjban Skolem
eredmnye, erre Skolem-univerzum helyett Herbrand-univerzumknt hivatkozunk. Herbrandot emlthetjk
mg az egyests felfedezjeknt is, mivel az egyests algoritmus egy vltozata megtallhat a (Herbrand,
1930)-ban. Gdel (Gdel, 1930) mutatta meg, Skolem s Herbrand elmleteire ptve, hogy az elsrend
logiknak ltezik teljes bizonytsi eljrsa. Alan Turing s Alonzo Church egymstl fggetlenl, igen
klnbz bizonytsokat alkalmazva megmutattk, hogy az rvnyessg krdse az elsrend logikban nem
eldnthet (Turing, 1936; Church 1936). Enderton kivlan megfogalmazott rsa egy precz, de viszonylag
rthet stlusban magyarzza el ezeket az eredmnyeket (Enderton, 1972).
Habr McCarthy (McCarthy, 1958) javasolta elszr az elsrend logika hasznlatt reprezentcis feladatokra
s kvetkezetsre az MI-ben, az els ilyen rendszert a matematikai ttelbizonyts irnt rdekld matematikai
logika kutati fejlesztettk ki. Abraham Robinson javasolta elszr, hogy hasznljk az tletlogikra trtn
talaktst s Herbrand-elmletet egytt. Gilmore (Gilmore, 1960) ksztett elszr egy olyan programot, amely
278
ezen a megkzeltsen alapult. Davis s Putnam (Davis s Putnam, 1960) vezettk be a klzformt, s hoztak
ltre egy olyan programot, amely megksrelt cfolatokat tallni, oly mdon, hogy a Herbrand-univerzum
elemeit a vltozk helyre alapklzokat helyettestve s tletinkonzisztencikat keresve az alapklzok kztt.
Prawitz (Prawitz, 1960) vezette be azt az alaptletet, hogy az tletinkonzisztencia lekrdezse vezesse a
keressi folyamatot, s azt is, hogy csak akkor hozzunk ltre termeket a Herbrand-univerzumban, hogyha ez
szksges az tlet-inkonzisztencia megllaptsa cljbl. Ms kutatk egyb fejlesztsei utn, ez a gondolat
vezette el J. A. Robinsont (nem rokona az elznek) a rezolci mdszernek kifejlesztshez (Robinson,
1965). Az gynevezett inverz mdszer, amit egyidejleg fejlesztett ki S. Maslov szovjet kutat, kiss eltr
elveken alapult, mint Robinson rezolcis mdszere, de hasonl szmtsi elnyket nyjt a
propozicionalizcihoz kpest (Maslov, 1964, 1967). Wolfgang Bibel kapcsolati mdszere (connection
method) e megkzelts kiterjesztsnek tekinthet.
A rezolci kifejlesztse utn az elsrend kvetkeztetssel foglalkoz munkk klnbz irnyokban gaztak
el. Az MI-ben a rezolcit a krds-vlasz rendszerekre adoptlta Cordell Green s Bertram Raphael (Green s
Raphael, 1968). Egy kevsb formlis megkzeltst alkalmazott Carl Hewitt (Hewitt, 1969). Az PLANNER
nyelve, habr sohasem valstottk meg teljessgben, elfutra volt a logikai programozsnak, s
tmutatsokat tartalmazott az elrefel s htrafel lncolshoz, valamint a negltak sikertelensgnek vizsglati
mdszerhez. Az eredeti nyelv egy rszt, a MICRO-PLANNER-t (Sussman s Winograd, 1970) megvalstottk s
felhasznltk az SHRDLU termszetes nyelvek megrtst segt rendszerben (Winograd, 1972). A korai MIalkalmazsok jelents erfesztst tettek olyan adatstruktrk ellltsra, amelyek lehetv teszik tnyek
hatkony elhvst. Ezeket a munkkat is bemutatjk az MI-programozssal kapcsolatos cikkek (Charniak s
trsai, 1987; Norvig, 1992; Forbus s de Kleer, 1993).
A hetvenes vek elejre az elrefel lncols (forward chaining) jl megalapozottnak tekinthet az MI-ben,
egy knnyen rthet alternatvja lett a rezolcinak. Rendszerek szles krben kerlt felhasznlsra, Nevins
geometriai ttelbizonytjtl (Nevins, 1975) a VAX konfigurcijhoz hasznlt R1 szakrti rendszerig
(McDermott, 1982). Az MI-alkalmazsok jellemzen nagyszm szablyt tartalmaztak, teht fontos volt
kifejleszteni hatkony szablyillesztsi technolgit, klnsen az inkrementlis frisstsek problmjra. A
produkcis rendszerek (production systems) technolgijt azrt fejlesztettk ki, hogy segtse az ilyen tpus
az alkalmazsok megvalstst. Az OPS-5 produkcis rendszer nyelvet (Forgy, 1981; Brownston s trsai,
1985) hasznltk az R1-hez s a SOAR kognitv szerkezethez (Laird s trsai, 1987). Az OPS-5 tartalmazta a
rete illesztsi folyamatot is (Forgy, 1982). A SOAR, amely j szablyokat generl, hogy megrizze a megelz
szmtsok eredmnyeit, igen nagy szablyhalmazokat llthat el tbb mint 1 000 000 szablyt a TACAIRSOAR rendszer esetben, amely katonai replgpek szimulcijt kontrolllja (Jones s trsai, 1998). A CLIPS
(Wygant, 1989) egy C-alap produkcis rendszer nyelv, amelyet a NASA-nl fejlesztettek ki, s hatkony
integrcit tett lehetv ms programokkal, eszkzkkel s rzkel rendszerekkel, valamint felhasznltk
rjrmvek automatizlsra s egyb harcszati alkalmazsokra.
A deduktv adatbzisokknt (deductive databases) ismert kutatsi terlet szintn hozzjrult az elrefel
kvetkeztets megrtshez. Egy Toulouse-i szellemi mhelyben kezddtt a munka 1977-ben, amelyet Jack
Minker szervezett, sszehozva a logikai kvetkeztetsi s az adatbzisrendszerekkel foglalkoz szakembereket
(Gallaire s Minker, 1978). Egy trtneti ttekints (Ramakrishnan s Ullman, 1995) szerint: a deduktv
[adatbzis-] rendszerek megksrlik a Prolog adaptlst, a kis mennyisg adat megkzeltsrl a
nagymennyisg adat vilgra. gy teht, ennek a munknak a clja az, hogy egybeolvassza a relcis
adatbzis technolgit, amelyet nagymret tnyhalmazok elhvsra terveztek, a Prolog-alap kvetkeztetsi
technolgival, amely jellemzen egyszerre csak egy tnyt hv el. A deduktv adatbzisokrl szl szvegek
kz tartoznak az (Ullman, 1989) s a (Ceri s trsai, 1990) munkk.
Chandra s Harel (Chandra s Harel, 1980), valamint Ullman (Ullman, 1985) nagy hats munki a Datalognak
mint egy, a deduktv adatbzisokhoz kidolgozott standard nyelvnek az elfogadshoz vezettek. Az alulrl
felfel irny kvetkeztets, az elrefel lncols szintn standard lett rszben azrt, mert elkerli a lellsi
problmkat s a felesleges szmtsok problmjt, amely a htrafel lncolsnl elfordul, s rszben azrt,
mert termszetesebben felhasznlhat az alapvet relcis adatbzis-opercikhoz. A mgikus halmazok
(magic sets) technikja a szablyok trsra, amelyet Bancilhon (Bancilhon s trsai, 1986) fejlesztettek ki,
lehetv tette az elrefel lncolsnak, hogy a htrafel lncolstl klcsnzze a clorientltsg elnys
tulajdonsgt. A fegyverkezsi verseny kiegyenltse cljbl, a tblzatos logikai programozsi mdszerek
klcsnveszik a dinamikus programozs elnyt az elrefel lncolstl.
A logikai kvetkeztetsek komplexitsrl szerzett tudsunk legnagyobb rsze a deduktv adatbzisokkal
foglalkoz tudomnyos kzssgbl szrmazik. Chandra s Merlin (Chandra s Merlin, 1977) mutattk ki
elszr, hogy egy egyszer nem rekurzv szably (vagyis egy konjunktv lekrdezs (conjunctive query) az
279
adatbzisok terminolgijban) illesztse NP-nehz lehet. Kuper s Vardi (Kuper s Vardi, 1993) javasoltk az
adatkomplexits (data complexity) hasznlatt annak a mrtknek a hasznlatt, ami a komplexitst, mint az
adatbzis mretnek egy fggvnyt mri, mikzben a szably mrett konstansnak tekinti a lekrdezsek
megvlaszolsnak mrtkre. Gottlob s trsai (Gottlob s trsai, 1999b) a konjuktv lekrdezsek s a
knyszerkielgts kztti kapcsolatot vizsgltk, megmutatva, hogy a hiper-fk lebontsa hogyan optimizlja
az illesztsi folyamatot.
Mint azt mr elzleg emltettk, a htrafel lncols (backward chaining) Hewitt PLANNER nyelvben jelent
meg a logikai kvetkeztetshez (Hewitt, 1969). A logikai kvetkeztets magtl rtetden ettl a munktl
fggetlenl fejldtt tovbb. A lineris rezolci egy korltozott vltozatt, amelyet SL-rezolcinak (SLresolution) neveznk, Kowalski s Kuehner (Kowalski s Kuehner, 1971) fejlesztette ki Loveland
modellelimincis (model elimination) technikjra ptve (Loveland, 1968). Ennek a hatrozott klzokra
alkalmazott vltozata az SLD-rezolci (SLD-resolution), amely nmagban alkalmas hatrozott klzok, mint
programok interpretlsra (Kowalski, 1974; 1979a; 1979b). Ezalatt, 1972-ben, a francia kutat, Alain
Colmerauer kifejlesztette s alkalmazni kezdte a Prologot, a termszetes nyelvek elemzsnek cljbl. A
Prolog klzait elszr kontextusmentes nyelvtani szablyoknak szntk (Roussel, 1975; Colmerauer s trsai,
1973). Az elmleti httr tlnyom rszt a logikai programozs rszre Colmerauerrel egyttmkdve
Kowalski fejlesztette ki. A szemantikai definci, amely a rgztett pontokat hasznlja, Van Emdennek s
Kowalskinak ksznhet (Van Emden s Kowalski, 1976). Kowalski (Kowalski, 1988) s Cohen (Cohen, 1988)
j trtneti ttekintst nyjtanak a Prolog eredetrl. A Logikai programozs alapjai (Foundations of Logic
Programming) (Lloyd, 1987) egy elmleti elemzse a Prolog s egyb logikai programoznyelvek
megalapozsnak.
A hatkony Prolog fordtkat ltalban a Warren Abstract Machine (WAM) szmtsi modelljre alapozzk,
amelyet David H. D. Warren (Warren, 1983) fejlesztett ki. Van Roy (Van Roy, 1990) megmutatta, hogy a
tovbbi fordtsi technikk alkalmazsa, mint amilyen a tpusinterferencia, versenykpess teszi a Prolog
programokat a C programokkal a sebessg tekintetben. A Japn tdik Genercis projekt, amely egy 1982ben kezdd 10 ves kutatsi erfeszts volt, teljes egszben a Prologon, mint az intelligens rendszerek
kifejlesztsnek alapeszkzn alapult.
A rekurzv logikai programok felesleges ciklusainak elkerlshez egymstl fggetlenl Smith (Smith s
trsai, 1986), valamint Tamaki s Sato (Tamaki s Sato, 1986) fejlesztettek ki mdszereket. Az utbbi
tanulmny tartalmazta a memk gyjtst is a logikai programokra, egy olyan mdszert, amelyet teljes
mrtkben David S. Warren fejlesztett ki a tblzatos logikai programozs (tabled logic programming)
mdszerben. Swift s Warren (Swift s Warren, 1994) bemutattk, hogy hogyan terjesszk ki a WAM-ot
tblzatok kezelsre, amely kpess tette a Datalog programokat, hogy egy nagysgrenddel gyorsabban
fussanak, mint az elrefel lncolst alkalmaz deduktv adatbzisrendszerek.
A korai elmleti munkkat a korltozott logikai programozs terletn Jaffar s Lassez vgeztk (Jaffar s
Lassez, 1987). Jaffar s trsai (Jaffar s trsai, 1992a) kifejlesztettk a CLP(R) rendszert a vals rtk
knyszerek kezelsre. Jaffar (Jaffar s trsai, 1992b) ltalnostotta a WAM-ot, ltrehozva ezzel a CLAM-ot
(Korltozott Logikai Absztrakt Gp, Constraint Logic Abstract Machine) a CLP megvalstsainak
specifiklshoz. Ait-Kaci s Podelski (Ait-Kaci s Podelski, 1993) bemutattak egy kifinomult LIFE-nak
nevezett nyelvet, amely egyesti a CLP-t a funkcionlis programozssal s az rklds kvetkeztetssel. Kohn
(Kohn, 1991) egy ambicizus projektet mutat be a korltozott logikai programozs hasznlva, a vals idej
vezrlsi architektrkat megalapozva, teljesen automata piltk alkalmazsra.
A logikai programozsrl s a Prologrl szmos knyvet rtak. A Logika a problmamegoldshoz (Logic for
Problem Solving) (Kowalski, 1979b) egy korai ltalnos tanulmny a logikai programozsrl. A Prologgal
foglalkoz knyvek kz tartoznak Clocksin s Mellish (Clocksin s Mellish, 1994), Shoham (Shoham, 1994)
s Bratko (Bratko, 2001) rsai. Marriott s Stuckey (Marriott s Stuckey, 1998) kitn lerst adjk a CLPnek. A 2000-ben trtnt megsznsig a Journal of Logic Programming volt a tma legfontosabb folyirata;
helyt mra tvette a Theory and Practice of Logic Programming. A logikai programozsok konferencii kztt
a legjelentsebbek az International Conference on Logic Programming (ICLP) s az International Logic
Programming Symposium (ILPS).
A kutatsok a matematikai ttelbizonytsok (mathematical theorem proving) terletn mr az els teljes
elsrend logikai rendszerek kifejlesztse eltt megkezddtek. Herbert Gelernter Geometriai Ttelbizonytja
(Gelernter, 1959) heurisztikai keressi mdszereket hasznlt diagramokkal kombinlva, hogy kiselejtezze a
hamis rszclokat, s kpes volt bebizonytani nhny nagyon bonyolult eredmnyt az euklideszi geometriban.
Ettl kezdve azonban nem volt jelents egyttmkds a ttelbizonyts s az MI kztt.
280
A korai munkk a teljessgre koncentrltak. Robinson korszakalkot tanulmnyt kveten a demodulcis s a

paramodulcis szablyokat az egyenlsgi kvetkeztetsekre Wos (Wos s trsai, 1967), valamint Wos s
Robinson (Wos s Robinson, 1968) vezettk be, ebben a sorrendben. Ezeket a szablyokat a term trsi
rendszerek kontextusban is kifejlesztettk (Knuth s Bendix, 1970). Az egyenlsgi kvetkeztets beptse az
egyestsi algoritmusba Gordon Plotkinnak ksznhet (Plotkin, 1972); ez fontos vonsa volt a QLISP-nek is
(Sacerdoti s trsai, 1976). Jouannaud s Kirchner (Jouannaud s Kirchner, 1991) az egyenlsgi egyestst a
termek trsnak szempontjbl vizsgljk. Hatkony algoritmusokat a standard egyestsre Martelli s
Montanari (Martelli s Montanari, 1976), valamint Paterson s Wegman (Paterson s Wegman, 1978)
fejlesztettek ki.
Az egyenlsgi kvetkeztetsek mellett a ttelbizonytsok tartalmaztak klnfle specilis cl dntsi
folyamatokat. Nelson s Oppen (Nelson s Oppen, 1979) javasoltak egy nagy hats smt az ilyen eljrsoknak
egy ltalnos kvetkeztetsi rendszerbe integrlsra. Ms mdszerek is hasonl problmkkal foglalkoztak,
belertve Stickel (Stickel, 1985) elmleti rezolcijt, valamint Manna s Waldinger (Manna s Waldinger,
1986) specilis relciit.
Szmos vezrlsi stratgit javasoltak a rezolcira, kezdve az egysgpreferencia stratgival (Wos s trsai,
1964). A tmogat halmaz stratgit Wos (Wos s trsai, 1964) javasolta, hogy biztostson egy bizonyos fok
clorientltsgot a rezolciban. A lineris rezolci elszr Lovelandnl (Loveland, 1970) jelent meg.
Genesereth s Nilsson (Genesereth s Nilsson, 1987, 5. fejezet) rvid, de tfog elemzst nyjtanak a vezrlsi
stratgik szles skljrl.
Guard s trsai (Guard s trsai, 1969) egy korai SAM ttelbizonytt rnak le, amely segtett megoldani egy
megoldatlan problmt a rcselmletben. Wos s Winkler (Wos s Winkler, 1983) ttekintst nyjtanak az AURA
ttelbizonyt eredmnyeirl, amelyeket a matematika s a logika klnbz terletein fellelhet problmk
megoldsa tern rt el. McCune (McCune, 1992) ezt folytatja, amikor felhasznlja ezeket az eredmnyeket az
AURA utdjnak, az OTTER-nek alkalmazsban megoldatlan problmk megoldsra. Weidenbach (Weidenbach,
2001) bemutatja a SPASS-t, az egyik legerteljesebb jelenlegi ttelbizonytt. A Computational Logic (Boyer s
Moore, 1979) cm knyv az alapreferencia a BoyerMoore-ttelbizonytkhoz. Stickel (Stickel, 1988) lerja a
Prolog Technolgiai Ttelbizonytt (PTTP), amely egyesti a Prolog fordts elnyeit a modell eliminci
teljessgvel (Loveland, 1968). A SETHEO (Letz s trsai, 1992) egy msik szles krben hasznlt
ttelbizonyt, amely hasonl megkzeltsen alapul; msodpercenknt tbb milli kvetkeztetst tud
vgrehajtani egy 2000-es munkallomson. A LEANTAP (Beckert s Posegga, 1995) hatkony ttelbizonyt,
amelyet mindssze 25 Prolog sorral valstottak meg.
Az automata programszintzisrl szl korai munkkat Simon (Simon, 1963), Green (Green, 1969a), valamint
Manna s Waldinger (Manna s Waldinger, 1971) ksztettk. Burstall s Darlington transzformcis rendszere
(Burstall s Darlington, 1977) egyenlsg kvetkeztetst hasznlt a rekurzv programszintzishez. A KIDS
(Smith, 1990, 1996) az egyik legersebb modern rendszer; amely egy szakrt segdeszkzknt mkdik.
Manna s Waldinger (Manna s Waldinger, 1992) egy ttekint bevezetst adtak a tmakr aktulis helyzetrl
fkuszba lltva a sajt deduktv megkzeltsket. Az Automating Software Design (Lowry s McCartney,
1991) szmos, a tmrl szl tanulmnyt gyjttt ssze. A logiknak a hardvertervezsben val
felhasznlsrl Kern s Greenstreet (Kern s Greenstreet, 1999) adott egy ttekintst; Clarke (Clarke s trsai,
1999) mve pedig a modellellenrzssel foglalkozik a hardververifiklsban.
A Computability and Logic (Boolos s Jeffrey, 1989) egy j referencia a teljessg s a nem eldnthetsg
tmakrhez. Szmos korai tanulmny a matematikai logikrl megtallhat a From Frege to Gdel: A Source
Book in Mathematical Logic (van Heijenoort, 1967) cm knyvben. A tiszta matematikai logika tmakrnek
folyirata a Journal of Symbolic Logic. Az automatizlt dedukci irnyba halad knyvek kz tartozik a
klasszikus Symbolic Logic and Mechanical Theorem Proving (Chang s Lee, 1973), s szmos ms rs, kztk
Wos, Bibel s Kaufmann ksbb rdott munki (Wos s trsai, 1992; Bibel, 1993; Kaufmann s trsai, 2000).
Az Automation of Reasoning c. antolgia (Siekmann s Wrightson, 1983) sok fontos korai tanulmnyt tartalmaz
az automatizlt dedukcirl. Tovbbi ttekint mveket rtak Loveland (Loveland, 1984) s Bundy (Bundy,
1999). A legjelentsebb folyirat a ttelbizonytsok terletn a Journal of Automated Reasoning; a
legfontosabb konferencia az vente megtartott Conference on Automated Deduction (CADE). A ttelbizonyts
terletn foly kutats szintn szoros kapcsolatban ll a logika hasznlatval a programok s programozsi
nyelvek elemzsben, amely trgyban a legfbb konferencia a Logic in Computer Science.
6.2. Feladatok
281
9.1.
Vezesse le az alapttelekbl, hogy az univerzlis pldnyosts helyes, s azt, hogy az egzisztencilis
pldnyosts kvetkeztetsi szempontbl egyenrtk tudsbzist hoz ltre.
9.2.
A Szereti( Jnos, Fagylalt) mondatbl kiindulva logikusnak tnik arra kvetkeztetni, hogy x Szereti(x,
Fagylalt). Adjon meg egy ltalnos kvetkeztetsi szablyt, az egzisztencilis bevezetst (Existential
Introduction), amely megersti ezt a kvetkeztetst. Gondosan vizsglja meg a feltteleket, amelyeket ki kell
elgteni a felhasznlt vltozkkal s termekkel.
9.3.
Ttelezzk fel, hogy egy tudsbzis csak egy mondatot tartalmaz: x OlyanMagasMint(x, Everest). A
kvetkezk kzl melyek a trvnyszer kvetkezmnyei az Egzisztencilis Pldnyosts alkalmazsnak?
a. OlyanMagasMint(Everest, Everest)
b. OlyanMagasMint(Kilimandzsr, Everest)
c. OlyanMagasMint(Kilimandzsr, Everest) OlyanMagasMint(BenNevis, Everest)
(a szably ktszeri alkalmazsa utn).
9.4.
Adja meg az albbi atomi mondatprok legltalnosabb egyestjt, ha egyltaln ltezik ilyen:
a. P(A, B, B), P(x, y, z)
b. Q(y, G(A, B)), Q(G(x, x), y)
c. Idsebb(Apja(y), y), Idsebb(Apja(x), Jnos)
d. Ismeri(Apja(y), y), Ismeri(x, x)
9.5.
Figyelje meg a 9.2. brn bemutatott bennfoglalsi rcsokat.
a. Hozza ltre a rcsot a kvetkez mondatra: Alkalmaz(Anyja(Jnos), Apja(Richrd)).
b. Hozza ltre a rcsot a kvetkez mondatra: Alkalmaz(IBM, y) (Mindenki az IBM-nl dolgozik). Figyeljen
arra, hogy minden olyan lekrdezst felsoroljon, amely egyesthet a mondattal.
c. Ttelezzk fel, hogy a TROL indexel minden egyes mondatot, minden egyes csompontra a bennfoglalsi
rcsban. Magyarzza meg, hogy a BETLT eljrsnak hogyan kell mkdnie, amikor nhny mondat ezek
kzl vltozkat is tartalmaz; pldaknt hasznlja a mondatokat az (a) s (b) rszfeladatokbl, s a kvetkez
lekrdezst: Alkalmaz(x, Apja(x)).
9.6.
Ttelezzk fel, hogy betltjk egy logikai adatbzisba az amerikai vlasztsi cmjegyzket, amely felsorolja a
kort, a lakhelyt, a szletsi dtumt s az anyja nevt minden szemlynek, trsadalombiztostsi szmokat
hasznlva azonost adatknt. gy teht Gyrgy kora gy van megadva: Kora(443-65-1282, 56). A kvetkez
S1S5 indexel smk melyike tesz lehetv hatkony megoldst a Q1Q4 lekrdezsekre (tekintsnk egy
norml htrafel lncolst)?
S1: egy index minden egyes atomra minden egyes pozciban.
S2: egy index minden egyes els argumentumra.
282
S3: egy index minden egyes prediktumatomra.

S4: egy index a prediktum s az els argumentum minden egyes kombincijra.
S5: egy index a prediktum s a msodik argumentum minden egyes kombincijra, s egy index minden
egyes els argumentumra (nem standard).
Q1: Kora(443-44-4321, x)
Q2: Lakik(x, Houston)
Q3: Anyja(x, y)
Q4: Kora(x, 34) Lakik(x, PiciVrosUSA)
9.7.
Felttelezhetnnk, hogy az egyests sorn a vltoz konfliktus problmjt elkerlhetjk gy, ha minden
mondatnl egyszerre tnevezzk az sszes vltozt a tudsbzisban. Mutassa meg, hogy lteznek olyan
mondatok, amelyekre ez a megkzelts nem alkalmazhat. (Segtsg: tekintsnk egy olyan mondatot, amelynek
egyik rsze egyesthet a tbbivel.)
9.8.
Mutassa meg, hogy hogyan rhatunk meg egy tetszleges mret adott 3-SAT problmt, egy elsrend
hatrozott klzt s nem tbb, mint 30 alaptnyt felhasznlva.
9.9.
Adja meg az albbi mondatok olyan logikai reprezentcijt, amely alkalmas arra, hogy az ltalnostott Modus
Ponens szablyt alkalmazzuk rjuk:
a. A lovak, a tehenek s a malacok emlsk.
b. Egy l leszrmazottja is l.
c. Kkszakll egy l.
d. Kkszakll Charlie szlje.
e. A leszrmazott s a szl inverz relcik.
f. Minden emlsnek van szlje.
9.10.
Ebben a problmban a 9.4. feladatban bemutatott mondatokat fogjuk hasznlni. Vlaszolja meg a kvetkez
krdseket htrafel lncolst alkalmazva!
a. Rajzolja fel egy kimert htrafel lncols algoritmus bizonytsi fjt a kvetkez mondat igazolshoz:
h L(h)
b. Mi figyelhet meg errl a trgyterletrl?
c. Hny megolds szrmaztathat le h-ra a mondatokbl?
d. Tudna-e olyan mdszert mondani, amellyel mindet megkaphatjuk? (Segtsg: rdemes megnzni (Smith s
trsai, 1986).)
9.11.
Egy npszer talls krds gyerekeknek a kvetkez: Nincs se btym, se nvrem, mgis annak az embernek
az apja az n apm fia. Hasznlja fel a csald trgykr szablyait (lsd 7. fejezet), s mutassa meg, hogy ki is
az emltett ember. Hasznlhatja brmelyik, a fejezetben bemutatott kvetkeztetsi mdszert.
283
9.12.
Kvesse nyomon a 9.6. brn lthat htrafel lncolsi algoritmus vgrehajtst, amikor azt a bntny
problma megoldsra alkalmazzuk. Mutassa be azt az rtk-szekvencit, amelyet a clok vltoz vesz fel, s
rendezze egy fa formba.
9.13.
A kvetkez Prolog kd egy P prediktumot hatroz meg:
P(X,[X Y])
P(X,[Y Z]):-P(X,Z)
a. Mutasson be bizonytsi fkat s megoldsokat ezekre a lekrdezsekre: P(A[1,2,3])s P(2,[1,A,3])

b. Milyen standard opercis listt reprezentl a P?
9.14.
Ebben a feladatban megvizsgljuk egy sorbarendezs megvalstst a Prologban.
a. rjon Prolog-klzokat, amelyek definiljk a rendezs(L) prediktumot, amely akkor s csakis akkor igaz, ha
az L lista emelked sorrendben van rendezve.
b. rjon egy Prolog-defincit erre a prediktumra: perm(L,M), amely akkor s csakis akkor igaz, ha az L a
permutcija az M-nek.
c. Definilja a rendez(L, M)-et (az M egy vlogatott verzija az L-nek) a perm s a rendezs hasznlatval.
d. Futtassa a rendez prediktumot minl hosszabb listkon, amg el nem veszti a trelmt. Mekkora a
programjnak az idkomplexitsa?
e. rjon egy gyorsabb rendez algoritmust Prologban, mint amilyen pldul a beszrsos vlogats vagy a
gyorsvlogats (quicksort).
9.15.
Ebben a feladatban megvizsgljuk az jrar szablyok rekurzv alkalmazst a logikai programozs
felhasznlsval. Egy jrar szably (vagy demodultor az OTTER terminolgiban) egy egyenlet egy
megadott irnnyal. Pldul az x + 0 x jrar szably azt sugallja, hogy minden, az x + 0-hoz illeszked
kifejezst fel kell cserlni x-re. Az jrar szablyok alkalmazsa kzponti rsze az egyenletkvetkeztet
rendszereknek. Ezt a prediktumot fogjuk hasznlni: jrar(X, Y) az jrar szablyok reprezentlsra. Pldul
a korbbi jrar szablyt gy rtuk: jrar(X+0, X). Nhny term primitv, s nem lehet tovbb egyszersteni;
gy teht ezt fogjuk rni: primitv(0) , ami azt jelenti, hogy a 0 egy primitv term.
a. rjon egy defincit az egyszerst(X,Y) prediktumra, amely akkor igaz, amikor az Y az egyszerstett
vltozata X-nek teht amikor mr tbb jrar szably nem alkalmazhat az Y egyik rszkifejezsre sem.
b. rjon egy szablygyjtemnyt az aritmetikai opertorokat tartalmaz kifejezsek egyszerstsre, s
alkalmazza az egyszerstsi algoritmust nhny minta kifejezsre.
c. rjon egy jrar szablygyjtemnyt a szimbolikus differencilsra, s hasznlja az egyszerstsi
szablyaival egytt, hogy differenciljon, s egyszerstsen aritmetikai kifejezseket tartalmaz
kifejezseket, belertve a hatvnyozst.
9.16.
Ebben a feladatban megvizsgljuk a keressi algoritmusok alkalmazst a Prologban. Ttelezzk fel, hogy a
kvetkez(X, Y) akkor igaz, ha az Y llapot az X llapotot kveti; s ha a cl(X) akkor igaz, amikor az X a
clllapot. rjon egy defincit a megold(X,P)-re, ami azt jelenti, hogy a P az tvonal (az llapotok listja),
amely az X-szel kezddik, a clllapotban vgzdik, s szablyos lpsekbl ll, amelyeket a kvetkez hatroz
284
meg. Valsznleg a mlysgi keress a legknnyebb mdja annak, hogy ezt vgrehajtsa. Mennyire lenne
knny egy heurisztikus keressi vezrls hozzadsa?
9.17.
Hogyan alkalmazhat a rezolci annak megmutatsra, hogy egy mondat
a. rvnyes-e?
b. kielgthetetlen-e?
9.18.
Abbl a mondatbl, hogy a lovak llatok kvetkezik-e, hogy egy l feje egy llat feje. Demonstrlja, hogy
ez a kvetkeztets rvnyes, ha vgrehajtjuk a kvetkez lpseket:
a. Fordtsa le a premisszt s a kvetkezmnyt az elsrend logika nyelvre. Hasznljon hrom prediktumot:
Feje(h, x), L(x) s llat(x)!
b. Neglja a kvetkezmnyt, s konvertlja a premisszt s a neglt kvetkezmnyt konjunktv norml formra!
c. Mutassa meg a rezolci felhasznlsval, hogy a kvetkezmny valban kvetkezik a premisszbl!
9.19.
Tekintsk a kvetkez kt elsrend logikai mondatot:
(A): x y (x y)
(B): y x (x y)
a. Legyenek a vltozk lehetsges rtkei a termszetes szmok 0, 1, 2, , , s jelentse a prediktum azt,

hogy nagyobb vagy egyenl. Fordtsa le ezeket a mondatokat magyarra ebben az interpretciban!
b. Igaz-e (A) ebben az interpretciban?
c. Igaz-e (B) ebben az interpretciban?
d. Maga utn vonja-e az (A) mondat a (B) mondatot?
e. Maga utn vonja-e a (B) mondat az (A) mondatot?
f. Prblja meg a rezolci felhasznlsval bizonytani, hogy (A) kvetkezik (B)-bl! Tegye meg ezt akkor is,
ha azt gondolja, hogy (B) nem vonja maga utn (A)-t; folytassa az eljrst addig, amg a bizonyts mr nem
folytathat. Tntesse fel az egyest helyettestseket minden rezolcis lpsnl! Ha a bizonyts sikertelen,
magyarzza meg, hogy hol, hogyan s mirt akad meg!
g. Most prblja meg igazolni azt, hogy (B) kvetkezik (A)-bl!
9.20.
A rezolci vltozkkal val lekrdezsekre ltrehozhat nem konstruktv bizonytsokat, ezrt egy specilis
eljrst kell bevezetnnk a definit vlaszok kinyersre. Magyarzza meg, hogy ez a problma mirt nem merl
fel csak definit klzokat tartalmaz tudsbzisokkal!
9.21.
Ebben a fejezetben azt mondtuk, hogy a rezolci nem hasznlhat egy mondathalmaz sszes logikai
kvetkezmnynek a generlsra. Van olyan algoritmus, ami kpes erre?
285
10. fejezet - Tudsbzis reprezentci

Ebben a fejezetben megmutatjuk, hogy az elsrend logikt hogyan kell hasznlni a valdi vilg olyan
legfontosabb aspektusainak brzolsra, mint a cselekvs, a tr, az id, a mentlis esemnyek s a bevsrls.
Az utols hrom fejezet a tudsalap gens technolgijt mutatta be, avagy az tlet- s az elsrend logika
szintaxist, szemantikjt, bizonytselmlett s az ilyen logikkat hasznl gens implementcijt. Ebben a
fejezetben azzal a krdssel foglalkozunk, hogy milyen tartalmat tegynk az gens tudsbzisba, azaz, hogy a
vilgrl szl tnyeket hogyan reprezentljuk.
A 10.1. alfejezet bevezeti az ltalnos ontolgia gondolatt, amely vilgban mindent a kategrik hierarchijba
szervez. A 10.2. alfejezet az objektumok s a szubsztancik alapvet kategriival foglalkozik. A 10.3. alfejezet
a cselekvsek reprezentcijt elemzi, amelyek a tudsalap gens megtervezse szempontjbl kzponti
fontossgak, tovbb bemutatja a tr-id darabkk, az esemnyek (events) ltalnosabb fogalmt. A 10.4.
alfejezet a hiedelmekkel foglalkozik, a 10.5. alfejezet pedig az egszet egybefogja az internetes bevsrls
kontextusban. A 10.6. s a 10.7. alfejezet a bizonytalan s a vltoz ismeretekkel dolgoz specializlt
kvetkeztet rendszerekkel foglalkozik.
1. Ontolgiaszervezs
Jtk trgyterleteken a reprezentci megvlasztsa nem annyira lnyeges. Knny egy konzisztens
fogalomkszletet kialaktani. Az olyan komplex terleteken azonban, mint pldul az interneten trtn
bevsrls vagy egy robot vezrlse vltoz fizikai krnyezetben, ltalnosabb s rugalmasabb reprezentcira
van szksg. Ebben a fejezetben megmutatjuk, hogy ilyen reprezentcikat hogyan lehet ltesteni, olyan
ltalnos fogalmakra fkuszlva, mint a Cselekvs, az Id, a FizikaiObjektum s a Hiedelem, amelyek szmos
trgyterleten fordulnak el. Ezen absztrakt fogalmak reprezentlst nha ontolgiaszervezsnek (ontological
engineering) nevezik. Az ontolgiaszervezs kapcsolatban ll a 8.4. alfejezetben lert tudsszervezs
folyamatval, de a hatsa szlesebb kr.
A vilgrl mindent reprezentlni ijeszt perspektva. Valjban termszetesen nem fogjuk mindennek a
komplex lerst megadni ez mg egy 1000 oldalas knyvnek is sok lenne , de megjelljk vilgosan annak a
helyt, ahova egy tetszleges terletrl szl j tuds beilleszthet. gy pldul definilni fogjuk, hogy mit is
jelent fizikai objektumnak lenni, s a klnbz objektumok rszletei robotok, tv-kszlkek, knyvek vagy
brmi ms ksbb illeszthetk ebbe a keretbe. A fogalmak egy ltalnos kerett fels ontolginak (upper
ontology) nevezzk, mert az az ltalnos konvenci, hogy a grfszer brzolsnl az ltalnosabb fogalmak
fell helyezkednek el, a konkrtabb fogalmak pedig alul (lsd 10.1. bra).
Mieltt az ontolgit tovbb tekintennk, egy fontos figyelmeztetst kell tennnk. A tuds tartalmnak s
szervezsnek a megvitatsra elsrend logikt vlasztottunk. A valdi vilg bizonyos aspektusait ezen a
nyelven nehz lesz kifejezni. Egy alapvet tulajdonsgot knytelenek lesznk kihagyni: azt, hogy minden
ltalnosts all lteznek kivtelek, vagy hogy a rszletesebb informci hinyban csupn az alaprtelmezst
tekinthetjk, vagy pedig hogy minden ltalnosts csak egy bizonyos mrtkig rvnyes. Br a paradicsom
piros hasznos szably, van zld, srga s narancssrga paradicsom is. Hasonl kivteleket ebben a
rszfejezetben majdnem mindegyik llts esetn lehet tallni. A kivtelek s a bizonytalansg kezelse nagyon
fontos kpessgek, azonban egy ltalnos ontolgia megrtshez viszonytva ortogonlisak. Ezrt a kivtelek
s az alaprtelmezs megvitatst a 10.6. alfejezetre, a bizonytalan informci sokkal ltalnosabb tmjt pedig
a 13. fejezetre hagyjuk.
Milyen haszna van egy fels ontolginak? Gondoljunk vissza a 8.4. alfejezet ramkri ontolgijra.
Megkonstrulsnl igen sok egyszerst felttelezssel ltnk. gy pldul az idt teljes egszben ki is
hagytuk. A jelek rgztettek voltak, s a jeltovbbterjedsrl nem is esett sz. Az ramkrk struktrja
vltozatlan maradt. Az ltalnossg fel gy tudnnk lpni, hogy a jeleket konkrt idpillanatokban definilnnk
s foglalkoznnk a vezetkek hosszval, valamint a vezetkekben s a berendezsekben fellp jelterjedsi
ksleltetsekkel. Ezzel szimullni tudnnk az ramkr idztsi tulajdonsgait; s valban az ramkrtervezk
gyakran folyamodnak is az ilyen elemzshez. A kapuk rdekesebb osztlyait is be lehetne vezetni, pldul lerva
a technolgit (TTL, MOS, CMOS stb.) s a bemeneti/kimeneti specifikcikat is. Ha a megbzhatsggal vagy
diagnzissal szeretnnk foglalkozni, engedlyezni kellene, hogy az ramkr struktrja spontn mdon
megvltozhasson. A szrt kapacitsok figyelembevtelhez a tisztn topolgiai reprezentcival fel kellene
hagyni, s t kellene trni a geometriai tulajdonsgok valsghbb lersra.
286
Tudsbzis reprezentci
10.1. bra - A vilg ontolgijnak felsbb szintjei, amelyek a fejezetben ksbb

trgyalt tmkat mutatjk. Minden l azt jelzi, hogy az als fogalom a fels fogalom egy
specializldsa.
Hasonl megfontolsok rvnyesek, ha a wumpus vilgt nzzk. Br foglalkozunk az idvel, ennek struktrja
igen egyszer. A dolgok csak az gens cselekvsvel egy idben trtnnek, s minden vltozs azonnali jelleg.
Egy ltalnosabb, a valdi vilghoz jobban illeszked ontolgia engedlyezn pldul, hogy az egyidej
vltozsoknak legyen idbeli kiterjedsk. Arra, hogy egy konkrt ngyzetben csapda van, a Csapda konstanst
hasznltuk, mert minden csapda azonos volt. Engedlyezni lehetne a csapdk tbb fajtjt is, a csapdk
osztlyhoz tartoz, eltr tulajdonsg pldnyokat hasznlva. Hasonl mdon tbb llatfajtt is be tudnnk
vezetni a wumpuson kvl. Elkpzelhet, hogy a rendelkezsre ll rzkelsekbl az llat konkrt fajtjt
nehz lenne megllaptani. Az gens megsegtsre a wumpus vilg biolgiai taxonmijt fel lehetne lltani,
hogy gyenge nyomravezet jelekbl kpes legyen megjsolni az llat viselkedst.
Az ilyen mdostsok rvn minden specilis rendeltets ontolgiban lehetsges egy nagyobb ltalnossg
fel elmozdulni. A nyilvnval krds ilyenkor az, hogy konverglnak-e ezek a mdostsok egy ltalnos cl
ontolgihoz? vszzadokon t foly filozfiai s szmtsi kutatsok utn a vlasz az, hogy lehetsges.
Ebben a fejezetben egy lehetsges vltozatot mutatunk be, amely az vszzadok sorn szletett gondolatok
szintetizlst kpviseli. Az ltalnos cl ontolginak kt olyan f jellemzje van, ami azt a specilis
rendeltets ontolgik sokasgtl megklnbzteti:
Az ltalnos ontolgit (a trgytartomnyra vonatkoz aximk hozzadsval) tbb-kevsb minden
specilis rendeltets trgytartomnyban kell tudnunk alkalmazni. Lehetsg szerint teht egyetlen
reprezentcis problmval sem lehet ravaszkodni vagy azt a sznyeg al sprni.
Minden kellen ignyes trgytartomnyban a tuds egyes rszeit egyesteni kell, hiszen a kvetkeztets s a
problmamegolds egyszerre tbb terletet is ignyelhet. Egy robot ramkrjavt rendszer esetn pldul az
ramkrkrl a villamos sszekttetsek s a fizikai elrendezs szempontjbl kell tudnunk kvetkeztetni, de
az id az ramkr-idztsi analzis s a munkakltsgek szempontjbl egyarnt lnyeges. Az idt ler
lltsokat teht ssze kell tudnunk kombinlni a fizikai elrendezst ler lltsokkal, s ezeknek az
lltsoknak egyformn jl kell mkdnik nanomsodpercekre s percekre is, valamint nanomterekre s
mterekre is.
Miutn az ltalnos ontolgit megalkottuk, felhasznljuk az internetes bevsrls trgytartomnyra. Ez a
trgytartomny tbb mint alkalmas arra, hogy az ontolginkkal ksrletezznk. Sok helyet hagy az olvas
rszre is, hogy a reprezentciba a sajt kreativitst is bevihesse. Gondoljunk pldul arra, hogy egy
interneten bevsrl gensnek rengeteg tmt s szerzt kell ismernie, hogy az Amazon.com-tl knyveket
vsroljon, lelmiszerek egsz vlasztkrl kell tudnia, hogy a Peapod.com-nl lelmiszert vsroljon, s
mindenrl, amit egy bolhapiacon tallni lehet ismeretekkel kell rendelkeznie, hogy az Ebay.com1-nl az alkalmi
j zletekre vadsszon.
Az olvas elnzst krjk, ha rajtunk kvl es okok miatt ezen online boltok valamelyike a knyv olvassnak pillanatban mr nem
mkdik.
1
287
2. Kategrik s objektumok
Fontos
Az objektumok kategrikba (categories) val szervezse a tudsreprezentci szempontjbl
ltfontossg. Br a vilggal val klcsnhats az egyedi objektumok szintjn trtnik, a
kvetkeztetsek zme a kategrik szintjn valsul meg. A bevsrl clja egy kosrlabda megvsrlsa
s nem egy konkrt kosrlabdapldnynak, mondjuk KL9-nek a megvtele. Ha az objektumok
osztlyozst elvgeztk, kategrik segtsgvel megjsolhatjuk az objektumok tulajdonsgait.
rzkel jelek alapjn kvetkeztetnk bizonyos objektumok jelenltre, az rzkelt tulajdonsgokbl
kvetkeztetnk, hogy az objektumok milyen kategrikhoz tartoznak, majd a kategrikra vonatkoz
ismereteket felhasznlhatjuk, hogy az objektumokra vonatkozan elrejelzseket hozzunk. gy pldul
a zld, foltos fellet, a tekintlyes nagysg s az ovlis vagy gmbszer alak alapjn grgdinnyre
kvetkeztethetnk; a grgdinnyre vonatkoz ismereteink alapjn pedig arra, hogy az felhasznlhat
lenne gymlcssalta ksztshez.
Az elsrend logikban a kategrik reprezentlsra kt alapvet vlasztsunk lehet: a prediktumok s az
objektumok. Hasznlhatunk egy KosrLabda(l) prediktumszimblumot, vagy a kategrit KosrLabda
objektumknt reifiklhatjuk (reification). Mondhatjuk akkor, hogy Eleme(l, KosrLabda) (rvidtve l
KosrLabda) annak a kifejezsre, hogy l a kosrlabda-kategria eleme. Azt mondjuk, hogy
Rszhalmaza(KosrLabda, Labda) (rvidtve KosrLabda Labda) annak a kifejezsre, hogy a KosrLabda a
Labda egy alkategrija vagy rszhalmaza. Egy kategrit tekinthetnk az elemeibl ll halmaznak, de egy
sokkal bonyolultabb objektumnak is kpzelhetjk, olyannak, amire az Eleme s a Rszhalmaza relcik
definiltak.
A kategrik rklds (inheritance) rvn szolgljk a tudsbzis szervezst s egyszerstst. Ha
kijelentjk, hogy az lelem kategria minden egyes pldnya ehet, s felttelezzk, hogy a Gymlcs lelem,
az Alma viszont a Gymlcs kategria egy alosztlya, akkor tudjuk, hogy minden alma ehet. Azt mondjuk,
hogy az egyes almk az ehetsgi tulajdonsgukat rkltk (inherit), jelen esetben az lelem kategrihoz
val tartozs rvn.
Az alosztly-relcik a kategrikat taxonmiba vagy taxonomikus hierarchiba (taxonomy, taxonomic
hierarchy) szervezik. A taxonmikat tudomnyos terleteken vszzadok ta alkalmaztk. gy pldul a
rendszerez biolgia az sszes l s kihalt faj taxonmijt igyekszik megadni, a knyvtrtudomny az sszes
tudomnyos terletet tfog taxonmijt a Dewey Decimlis rendszert alaktotta ki, az adhatsgok s
ms kormnyzati szervek a foglalkozsok s termkek kiterjedt taxonmijt hoztk ltre. A taxonmik
ahogy a tovbbi elemzseinkben ltni fogjuk fontos aspektusai a jzan sz tudsnak is.
A kategrikrl az elsrend logikban knny lltsokat megfogalmazni az objektumok s a kategrik
egymshoz val rendelsvel vagy a kategrihoz tartoz egyedek szerinti kvantifikls rvn:
Egy objektum egy kategria egyede, pldul:
KL9 KosrLabda
Egy kategria egy msik kategria alosztlya, pldul:

KosrLabda Labda
Egy kategria sszes egyede egy bizonyos tulajdonsggal rendelkezik, pldul:

x KosrLabda Gmbly(x)
Egy kategria egyedeit bizonyos tulajdonsgaik alapjn fel lehet ismerni, pldul:
Narancsszin(x) Gmbly(x) tmr(x) = 24 x Labda x KosrLabda
Egy kategrinak nmagban bizonyos tulajdonsgai vannak, pldul:

Kutya HonostottFajta
288
Jegyezzk meg, hogy mivel a Kutya egy kategria s a HonostottFajta kategrinak egy egyede, gy a
HonostottFajta a kategrik kategrija. A kategrik kategriinak a kategriirl is lehetne beszlni, de
ennek kevs a haszna.
Br az alosztly- s az egyedrelcik a kategrik szempontjbl a legfontosabbak, olyan kategrik kztti
relcikat is ki szeretnnk fejezni, amelyek egymsnak nem alosztlyai. Ha pldul azt mondjuk, hogy a Hm s
a Nstny az llat alosztlyai, ezzel nem mondtuk azt, hogy egy hm nem lehet nstny. Azt mondjuk, hogy kt
vagy tbb kategria diszjunkt (disjoint), ha kzs egyedei nincsenek. Ha tudjuk azt is, hogy a hmek s a
nstnyek klcsnsen kizrjk egymst, attl mg nem tudjuk, hogy egy llatnak, amely nem hm, nstnynek
kell lennie, hacsak nem mondjuk ki, hogy a hmek s a nstnyek az llatok kimert felosztst (exhaustive
decomposition) kpezik. A diszjunkt kimert feloszts a partci (partition). Ezt a hrom fogalmat az albbi
pldk illusztrljk:
Diszjunkt({llat, Zldsg})
KimertFeloszts({Amerikai, Kanadai, Mexiki}, szakAmerikai)
Partci({Hm, Nstny}, llat)
(Jegyezzk meg, hogy az szakAmerikai KimertFeloszts-a nem Partci, mert vannak ketts
llampolgrsg szemlyek is.) E hrom prediktum defincija az albbi:
Diszjunkt(s) (c1, c2 c1 s c2 s c1 c2 Metszet(c1, c2) = { })
KimertFeloszts(s, c) (i i c c2 c2 s i c2)
Partci(s, c) Diszjunkt(s) KimertFeloszts(s, c)
Kategrikat gy is definilhatunk, hogy megadjuk a tagsguk elgsges s szksges feltteleit. Pldul egy
agglegny egy felntt, nem hzas frfi:
x Agglegny NemHzas(x) x Felntt x Frfi
Ahogy errl a termszetes fajtkrl szl rvid kitrben sz lesz, a kategrik szigor logikai defincija nem
mindig lehetsges, s nem is mindig szksges.
2.1. Fizikai sszettel

Az a gondolat, hogy egy objektum rsze lehet egy msik objektumnak, nem jkelet. Valakinek az orra rsze a
fejnek, Romnia Eurpa rsze, ez a fejezet a knyvnk egy rsze. Hogy megmondhassuk, hogy egy dolog
rsze egy msiknak, egy ltalnos Rsze relcit fogunk hasznlni. Az objektumokat teht Rsze hierarchiba
lehet szervezni, ami hasonlt a Rszhalmaza hierarchira:
Rsze(Bukarest, Romnia)
Rsze(Romnia, KeletEurpa)
Rsze(KeletEurpa, Eurpa)
Rsze(Eurpa, Fld)
A Rsze relci tranzitv s reflexv, azaz:

Rsze(x, y) Rsze(y, z) Rsze(x, z)
Rsze(x, x)
Ebbl addan kikvetkeztethet, hogy Rsze(Bukarest, Fld)

Az sszetett objektumok (composite object) kategriit gyakran ezen objektumok rszei kztt rtelmezett
strukturlis relcikkal jellemezzk. Pldul egy ktlbnak pontosan kt lba van, ami egy testhez van
rgztve:
KtLb(a) l1, l2, b Lb(l1) Lb(l2) Test(b) Rsze(l1, a) Rsze(l2, a)
289
Rsze(b, a) Rgztett(l1, b) Rgztett(l2, b) l1 l2
[l3 Lb(l3) Rsze(l3, a) (l3 = l1 l3 = l2)
A pontosan kett jells egy kicsit fura. Knytelenek vagyunk kijelenteni, hogy kt lb van, s ezek nem
azonosak, s ha valaki egy harmadik lbbal jn el, annak azonosnak kell lennie a kett valamelyikvel. A 10.6.
alfejezetben ltni fogjuk, hogy a ler logiknak nevezett formalizmus a pontosan kett tpus korltozsokat
egyszerbben fejezi ki.
A kategrikra vonatkoz Partci relci mintjra egy RszPartci relcit definilhatunk (lsd 10.6.
feladat). Egy objektum a RszPartci-jban felsorolt rszeibl ll, s bizonyos tulajdonsgaira ezekbl a
rszekbl lehet kvetkeztetni. gy pldul egy sszetett objektum tmege a rszeihez tartoz tmegek sszege.
Jegyezzk meg, hogy ez a kategrikra nem vonatkozik: egy kategrinak nincs tmege annak ellenre, hogy az
elemeinek lehet tmege.
Hasznos olyan sszetett objektumokat is definilni, amelyeknek meghatrozott rszei vannak, de konkrt
struktrjuk nincsen. Elfordulhat, hogy azt szeretnnk mondani, hogy: A zacskban 3 kg alma van. Ksrtst
rezhetnnk, hogy a zacskban-alma halmazhoz slyt rendeljk, ez azonban hiba lenne, mert egy halmaz
absztrakt matematikai fogalom, aminek vannak elemei, de slya nincs. Ahelyett egy j fogalomra van
szksgnk, amit ktegnek (bunch) fogunk nevezni. Ha az almk pldul az Alma1, az Alma2 s az Alma3, akkor
a:
Kteg({Alma1, Alma2, Alma3})
a hrom almbl (mint rszbl, de nem mint elembl) ll sszetett objektumot jelli. A kteget egy
kznsges, br nem strukturlt objektumknt hasznlhatjuk. Jegyezzk meg, hogy Kteg({x}) = x.Tovbb,
hogy a Kteg(Alma) az sszes almbl ll sszetett objektum, amit az Alma kategrival sszetveszteni nem
szabad.
A Kteg-et a Rsze relcival tudjuk definilni. Az s minden eleme, eleme a Kteg({s})-nek is:
x
x s Rsze(x, Kteg(s))
Tovbb, a Kteg(s) a legkisebb objektum, amely ezt a felttelt teljesti. Ms szval a Kteg(s) rsznek kell
lennie minden olyan objektumnak, amely az s sszes elemt rszeknt tartalmazza:
y [x x s Rsze(x, y)] Rsze(Kteg(s), y)
Ezek az aximk a logikai minimalizlsnak (logical minimization) nevezett ltalnos mdszer egy pldjt
jelentik. A logikai minimalizls azt jelenti, hogy egy objektumot bizonyos feltteleket kielgt legkisebb
objektumnak definilunk.
2.2. Mrtkek
A vilgnak mind a tudomnyos, mind a jzan sz elmleteiben az objektumoknak magassga, tmege, ra van
s gy tovbb. Az ezekhez a tulajdonsgokhoz elrt rtkek a mrtkek (measures). Kznsges, kvantitatv
mrtkeket knny reprezentlni. Kpzeljk el, hogy az univerzum absztrakt mrtkobjektumokat tartalmaz,
mint pldul a hossz, ami az itt lthat vonalszegmens hossza:
Nevezhetjk ezt a hosszat 1,5 hvelyknek vagy 3,81 cm-nek. Ugyanannak a hossznak teht a nyelvnkben tbb,
klnbz neve is lehet. Logikailag ez gy lehetsges, hogy egy egysgfggvnyt (unit function) egy szmmal
kombinlunk. (Egy alternatv smval a 10.8. feladatban foglalkozunk.) Ha L1 a vonalszegmens neve, akkor azt
rhatjuk, hogy:
Hossz(L1) = Hvelyk(1,5) = Centimter(3,81)
Az egysgek kztti konverzit olyan lltsokkal lehet megoldani, amelyek az egyik egysg tbbszrst a
msik egysggel teszik azonoss:
Centimter(2,54 l) = Hvelyk(l)
290
Hasonl aximkat a fontokra s kilogrammokra, a msodpercekre s a napokra, a dollrokra s a centekre is

felrhatunk. A mrtkekkel az objektumokat az albbi mdon tudjuk lerni:
tmr(KosrLabda12) = Hvelyk(9,5)
r(KosrLabda12) = $(19)
d Napok Tartam(d) = ra(24)
Jegyezzk meg, hogy a $(1) nem egy egydollros bank! Az egydollros bankbl lehet kett, de a $(1) nev
objektumbl csak egy van. Jegyezzk meg azt is, hogy mg a Hvelyk(0) s Centimter(0) ugyanarra a
zrushosszra hivatkozik, ms zrusmrtkekkel, mint pldul a Msodperc(0) nem azonosak.
Egyszer, kvantitatv mrtkeket reprezentlni knny. Ms mrtkek tbb problmt okoznak, mert nincs
hozzjuk elfogadott rtkskla. A gyakorlat nehz, a desszert finom s a vers szp, azonban e kvalitsokhoz
nehz szmokat rendelni. Valaki megksrelhetn az ilyen tulajdonsgokat teljesen elutastani, mint olyanokat,
melyeknek a logikai kvetkeztets szempontjbl nincs hasznuk, vagy ami mg rosszabb megksrelhetne a
szpsgre egy numerikus sklt rknyszerteni. Ez slyos hiba lenne, mert ilyen lpsre nincs is szksg. A
mrtkek legfontosabb tulajdonsga nem az, hogy valamilyen konkrt numerikus rtkkel rendelkeznek, hanem,
hogy rendezettek.
Annak ellenre, hogy a mrtkek nem szmok, sszehasonltsukra a > rendez szimblumot fogjuk hasznlni.
gy pldul hihetjk azt, hogy a Norvig rta feladatok nehezebbek, mint azok, amiket Russell rt, s hogy egy
nehezebb feladatnl kevesebb pontot lehet elrni:
e1 Feladatok e2 Feladatok rta(Norvig, e1) rta(Russell, e1)
Nehzsg(e1) > Nehzsg(e2)
e1 Feladatok e2 Feladatok Nehzsg(e1) Nehzsg(e2)
VrhatEredmny(e1) < VrhatEredmny(e2)
Ez elg is ahhoz, hogy valaki eldnthesse, melyik feladattal rdemes foglalkoznia, brmennyire nem
hasznltunk semmifle numerikus rtket a nehzsg kifejezsre. (Azrt azt meg kell tudnunk llaptani, hogy
melyik feladatot ki rta.) A mrtkek kztti effle monoton relci az alapja a kvalitatv fizika (qualitative
physics) terletnek. Ez az MI egy rszterlete, amely azt vizsglja, hogy hogyan lehetne a fizikai rendszerekre
kvetkeztetni anlkl, hogy a rszletes egyenletekbe s a numerikus szimulcikba belebonyoldnnk. A
kvalitatv fizikval a trtneti megjegyzsekben foglalkozunk.
Fontos
Termszetes fajtk
Egyes kategriknak szigor defincii vannak. Egy objektum akkor s csak akkor hromszg, ha egy
hromoldal sokszg. A valdi vilgban viszont a kategrik tbbsge termszetes fajtj (natural
kind) anlkl, hogy brmilyen letisztult defincija lenne. Tudjuk pldul, hogy a paradicsomok
mlyvrs sznek s nagyjbl gmbszerek szoktak lenni, a tetejkn, ahol a szruk csatlakozott,
egy kis bemlyedssel rendelkeznek, nagyjbl 58 cm tmrjek, s vkony, de ers brrel, bell
hssal, magvakkal s lvel rendelkeznek. Azt is tudjuk azonban, hogy eltrsek is vannak. Egyes
paradicsomok narancssznek, az retlen paradicsom zld, egyesek kisebbek, illetve nagyobbak, mint
az tlag, a miniparadicsomok egysgesen kismretek. Ahelyett hogy a paradicsomok tkletes
defincijra trekednnk, inkbb egy tulajdonsghalmazzal rendelkeznk, amely arra szolgl, hogy
azonostsunk bizonyos objektumokat, amelyek nyilvnvalan tipikus paradicsomok, ms objektumok
esetn azonban lehet, hogy a felismers csdt mond. (Lehet egy paradicsom szrs, mint egy
szibarack?)
Egy logikai gens rszre ez problmt jelent. Az gens nem lehet biztos abban, hogy az ltala rzkelt
objektum valban egy paradicsom, s ha mgis biztos lenne benne, nem tudn eldnteni, hogy a tipikus
paradicsom tulajdonsgai kzl az rzkelt objektum melyekkel rendelkezik. Ez a problma egyenes
kvetkezmnye annak, hogy az gens egy hozzfrhetetlen krnyezetben mkdik.
291
Egy hasznos megkzelts sztvlasztani mindazt, ami a kategria minden egyedre igaz, attl, ami
csupn a kategria tipikus egyedeire igaz. A Paradicsom kategria mellett szksg van mg a
Tipikus(Paradicsom) kategrira. A Tipikus fggvny egy kategrit egy olyan alosztlyra kpez le,
amely csak tipikus egyedekbl ll:
Tipikus(c) c
A termszetes fajtkra vonatkoz tuds tbbsge tulajdonkppen tipikus egyedekrl szl:

x Tipikus(Paradicsom) Piros(x) Gmbly(x)
Ily mdon kpesek vagyunk a kategrikra vonatkoz fontos tnyeket feljegyezni anlkl, hogy pontos
defincikat kellene megadnunk.
Azzal, hogy a termszetes kategrik tbbsge esetn az egzakt definci megalkotsa nehzsgekbe
tkzik, rszletesen Wittgenstein foglalkozott a Philosophical Investigations c. mvben (Wittgenstein,
1953). A jtkok pldjt hasznlta fel, hogy kimutassa, a kategria egyedei inkbb egyfajta csaldi
hasonlsgban s nem valami szksges s elgsges jellegzetessgekben osztoznak.
Quine szintn tmadta a szigor definci hasznossgt (Quine, 1953). Azt mutatta ki, hogy az
agglegny defincija, mint egy nem hzas felntt frfi is gyans. Valaki megkrdjelezhetn
pldul, hogy A Ppa agglegny rtelmes llts-e. Br nem kifejezetten hamis, ez a
fogalomhasznlat mgis szerencstlen, mert az olvasnak nem szndkolt kvetkeztetsek levonst
teszi lehetv. A feszltsget fel lehetne oldani megklnbztetst tve a tudsreprezentciban val
bels hasznlatra alkalmas logikai definci s a helyes nyelvszeti hasznlat jobban rnyalt kritriumai
kztt. A msik megkaphat az elsbl a levont kvetkeztetsek szrsvel. Az is lehetsges, hogy a
nyelvszeti hasznlat kudarcai visszacsatolsknt hatnak a bels definci mdostsa rdekben,
flslegess tve a szrst.
2.3. Szubsztancik s objektumok

A vilgot lehetne gy szemllni, hogy primitv objektumokbl (rszecskkbl) s az azokbl felpl sszetett
objektumokbl ll. Az olyan nagy objektumok, mint pldul az almk vagy az autk szintjn vgzett
kvetkeztetssel meg tudunk birkzni a primitv objektumok risi szmbl ered bonyolultsggal. A valsg
tekintlyes rsze azonban az egyedests (individuation) az elklnl objektumokra val felbontsnak
ltszlag ellenll. A valsgnak ezt a rszt az anyag (stuff) ltalnos nvvel fogjuk illetni. Pldakppen
ttelezzk fel, hogy van elttem egy malac s egy kevs vaj. 2 Azt mondhatom, hogy malacbl egy van, de a vaj
objektum nem megszmllhat, hiszen akrmilyen rsze a vaj objektumnak szintn vaj objektum, legalbbis
amg az igazn kicsi rszekhez el nem jutunk. Ez az anyag s a dolgok kztti f klnbsg. Sajnos nem lesz kt
malacunk, ha a malacot kettszeljk.
Vegyk szre, hogy a magyar nyelv az anyag s a dolgok kztt klnbsget tesz.3 Azt mondjuk egy malac,
de bizonyos ttermi vagy bolti gyakorlattl eltekintve, nem mondhatjuk azt, hogy egy vaj. A nyelvszek
klnbsget tesznek a megszmllhat fnevek (count nouns), mint pldul malacok, gdrk vagy ttelek, s
a nem megszmllhat fnevek (mass nouns), mint pldul vaj, vz s energia kztt. Nhny verseng
ontolgirl azt lltjk, hogy e klnbsgeket kpes kezelni. Az egyiket itt rjuk le, a tbbirl a trtneti
feljegyzsekben lehet olvasni.
Hogy az anyagot jl reprezentlhassuk, egy nyilvnval dologgal kezdnk. Ontolginkban az anyag nagyobb
ktegeit kell tudnunk objektumknt kezelni. Pldul a vajban felismerjk azt a vajat, amit tegnap este az
asztalon hagytunk, esetleg felemelhetjk, megmrhetjk, eladhatjuk, vagy akrmi mst csinlhatunk vele. Ilyen
rtelemben ez egy objektum, pontosan olyan, mint egy malac. Nevezzk Vaj3-nak. Definilni fogjuk a Vaj
kategrit is. Ennek elemei, informlisan, mindazok az objektumok, amikre azt lehet mondani: Ez vaj, a Vaj3at is belertve. A nagyon kicsi, de most elhanyagolt alkotrszek szerepre vonatkoz intsrl nem
megfeledkezve, a vaj objektum minden rsze szintn vaj objektum:
x Vaj Rsze(y, x) y Vaj
Most mr mondhatjuk, hogy vaj kb. 30 foknl olvad meg:

2
3
A szvegben eredetileg aardvark (fldimalac) szerepel, ami egy malacszer dl-afrikai llatfajta. (A ford.)
A szvegben eredetileg termszetesen angol plda szerepel an aardvark s a butter/butter. (A ford.)
292
Vaj(x) OlvadsiPont(x, Celsius(30))
A vaj srga, kevsb sr, mint a vz, szobahmrskleten puha, magas zsrtartalm stb. Msrszt a vajnak nincs
konkrt nagysga, alakja vagy slya. Specializltabb kategrikat is definilhatunk, mint pldul NemSzottVaj,
ami szintn egy anyag, mert a nem szott vaj objektum akrmilyen rsze szintn nem szott vaj objektum. Ha
azonban az EgyKilVaj kategrit definiljuk, amely az sszes, egy kil sly vaj objektumot tartalmazza, nincs
tbb anyagunk! Ha egy kil vajat kettvgunk, nem kapunk ktszer egy kil vajat ami a valdi vilg azon
bosszant dolgainak egyike, amivel sajnos egytt kell lni.
Valjban arrl van sz, hogy vannak n. bels (intrinsic) tulajdonsgok: ezek inkbb maghoz az objektum
szubsztancijhoz tartoznak, mint az objektum egszhez. Ha valamit kettvgunk, a rszei a bels
tulajdonsgukat megtartjk legyen ez srsg, forrspont, z, szn, a tulajdonos stb. A kls (extrinsic)
tulajdonsgok ppen az ellenkezt jelentik: olyan tulajdonsgokat, mint a slyt, hosszat, alakot, funkcit stb.,
amelyeket a rszekre bontsnl megtartani nem lehet.
Az objektumok olyan osztlya, amelyek defincijban csakis bels tulajdonsgok szerepelnek, a szubsztancik,
illetve a nem megszmllhat fnevek osztlya. Az az osztly, amelynek defincijban brmilyen kls
tulajdonsg is szerepel, a megszmllhat fnevek osztlya. Az anyag kategria a legltalnosabb
szubsztanciakategria, egyetlen bels tulajdonsga sincs. A dolog a diszkrt objektumok legltalnosabb
kategrija, egyetlen kls tulajdonsga sincs. Minden fizikai objektum mindkt kategriba tartozik, gy a
kategrik egytt lteznek ugyanazokra az entitsokra utalnak.
3. Cselekvsek, szitucik s esemnyek

A cselekvsek eredmnyeirl kvetkeztetni kulcsfontossg egy tudsalap gens szmra. A 7. fejezetben
pldkat lttuk olyan tletlltsokra, amelyek lerjk, hogy a cselekvsek hogyan hatnak a wumpus vilgra. A
6.2. szakasz - A hely s az irny nyomkvetse rszben lv (7.3) egyenlet azt lltja pldul, hogy az gens
lokcija hogyan vltozik az gens mozgsval. Az tletkalkulus egyik htrnya, hogy cselekvs lersrl
kln msolatokkal kell rendelkeznnk azokra az idpontokra, amikor a cselekvst vgre fogjk hajtani. Ebben
az alfejezetben lert, az elsrend logikra alapoz reprezentcis mdszer ezt a problmt elkerli.
3.1. A szitucikalkulus ontolgija

Az aximk tbbszrs msolatainak az elkerlsre nyilvnval mdszer az id szerinti kvantifikls azaz
azt mondani, hogy t-re a t-beli cselekvsnek ez a t + 1-beli eredmnye. A t + 1 tpus explicit idpillanatok
helyett ebben az alfejezetben szitucikkal dolgozunk, amelyek a cselekvsek vgrehajtsbl add llapotok
jellsei. E megkzelts neve szitucikalkulus (situation calculus) s az albbi ontolgira tmaszkodik:
A 8. fejezethez hasonlan a cselekvsek logikai termek, pldul az Elre, a Fordulj(Jobbra). Egyelre
felttelezzk, hogy a krnyezetben csakis egy gens tartzkodik. (Ha tbb lenne, egy tovbbi argumentummal
megjellhetjk, hogy melyik gens hajtja vgre a cselekvst).
A szitucik (situations) logikai termek, amelyekhez tartozik egy (ltalban S0-nak jellt) kezdeti szituci
s minden ms szituci, amely a szitucira vonatkoz cselekvs vgrehajtsbl addott. Ha az a
cselekvst az s szituciban hajtottk vgre, az eredmnyezett szitucit Eredmny(a, s) (nha Csinld-nak
nevezett) fggvny nevezi meg. A gondolatot a 10.2. bra illusztrlja.
A foly esemnyek (fluents) olyan fggvnyek s prediktumok, amelyek szitucirl szitucira vltoznak.
Ilyen pldul az gens lokcija vagy a wumpus jlte. A sztr szerint a foly valamilyen folyadkszer
viselkedsre utal. Hasznlatunkban a szitucik menti lefolyst vagy vltozst jelenti. Tart(G1, S0) pldul
azt mondja, hogy az gens a kezdeti S0 szituciban a G1 aranyat nem tartja a kezben. Kor(Wumpus, S0) a
wumpus S0-beli letkorra vonatkozik.
Engedlyezzk az idtlen, rk (atemporal, eternal) prediktumokat s fggvnyeket is. Pldaknt
tekinthetjk az Arany(G1) vagy a BalLba(Wumpus) prediktumokat.
Az egyedi cselekvseken tlmenen hasznos, ha a cselekvsek sorozatairl is tudunk kvetkeztetni. A sorozat
eredmnyt az egyedi cselekvsek eredmnye alapjn definilhatjuk. Elszr azt fogjuk mondani, hogy egy res
sorozat vgrehajtsa a szitucit vltozatlanul meghagyja:
Eredmny([], s) = s
293
10.2. bra - Szitucikalkulusban minden szituci (az S0-t kivve) valamilyen cselekvs
eredmnye
Egy nem res sorozat vgrehajtsa nem ms, mint az els cselekvs vgrehajtsa, majd az eredmnyl add
szituciban a marad sorozatnak a vgrehajtsa:
Eredmny([a]sorozat, s) = Eredmny(sorozat, Eredmny(a, s))
Egy szitucikalkulus gensnek tudnia kellene egy adott cselekvssorozat eredmnyt kikvetkeztetni, ez az n.
elrevett feladat (projection task). A megfelel konstruktv kvetkeztetsi mechanizmus birtokban
kpesnek kellene lennie arra is, hogy egy kvnatos eredmnyt biztost sorozatot megtalljon, ez az n.
tervksztsi feladat (planning task).
Egy mdostott wumpus vilgrl fogunk pldt venni, ahol az gens orientcijval nem trdnk, s ahol az
gens egy helyrl egy szomszdos helyre Megy. Tegyk fel, hogy gens az [1, 1]-nl s arany az [1, 2]-nl van.
A cl az aranyat az [1,1] helyen birtokoljuk. A foly esemny prediktumok a Nla(o, x, s) s Tart(o, s). A
kezdeti tudsbzis az albbi lerst tartalmazhatn:
Nla(gens, [1, 1], S0) Nla(G1, [1, 2], S0)
Ez azonban mg nem elg, mert nem mondtuk, hogy az S0-ban mi nem igaz (a problma tovbbi elemzst lsd
a 7. szakasz - Kvetkeztets alaprtelmezett informcival rszben). A teljes lers az albbi:
Nla(o, x, S0) [(o = gens x = [1, 1]) (o = G1 x = [1, 2])]
Tart(o, S0)
Arra is szksg van, hogy kijelentsk, G1 egy arany, s [1, 1] s [1, 2] szomszdosak:
Arany(G1) Szomszdos([1, 1], [1, 2]) Szomszdos([1, 2], [1, 1])
Valaki bizonyra azt szeretn bebizonytani, hogy gens a cljt elri, ha az [1, 2]-re tmegy, ott megfogja az
aranyat s az [1, 1]-re visszatr, azaz:
Nla(G1, [1, 1], Eredmny([Megy([1, 1], [1, 2]), Megfog(G1), Megy([1, 2], [1, 1])], S0)
294
Annl rdekesebb lehetsg az arany birtoklst biztost tervet kszteni, amit a milyen cselekvssorozat
eredmnye az arany az [1, 1]-en? krds megvlaszolsval lehet megtenni.
sorozat Nla(G1, [1, 1], Eredmny(sorozat, S0))
Nzzk, hogy e krdsek megvlaszolshoz mivel kellene a tudsbzist kiegszteni.
3.2. Cselekvsek lersa a szitucikalkulusban

A szitucikalkulus legegyszerbb vltozatban minden cselekvst kt aximval lehet lerni. A lehetsgi
axima (possibility axiom) megmondja, hogy a cselekvst mikor lehet elvgezni, a hatsaxima (effect
axiom) pedig azt, hogy a cselekvs vgrehajtsval mi is fog trtnni. Annak jellsre, hogy az s szituciban
az a cselekvs vgrehajtsa lehetsges, a Lehet(a, s) prediktumot fogjuk hasznlni. Az aximk formja az
albbi:
Lehetsgi Axima: Elfelttelek Lehet(a, s)
Hatsaxima: Lehet(a, s) A cselekvs vgrehajtsbl add vltozsok
Ezeket az aximkat a mdostott wumpus vilgra fogjuk felrni. A mondatok rvidsge rdekben el fogjuk
hagyni az egsz mondatra vonatkoz univerzlis kvantorokat. Felttelezzk, hogy az s vltoz a szitucikra, az
a vltoz a cselekvsekre, az o vltoz az objektumokra (az genseket belertve), a g vltoz az aranyra, az x s
az y vltozk pedig a helyre vonatkoznak.
Az erre a vilgra vonatkoz lehetsgi axima azt mondja, hogy egy gens a szomszdos helyek kztt
mozoghat, az aktulis helyen megfoghatja az aranyat s elengedheti az aranyat, amelyet tartott:
Nla(gens, x, s) Szomszdos(x, y) Lehet(Megy(x, y), s)
Arany(g) Nla(gens, x, s) Nla(g, x, s) Lehet(Megfog(g), s)
Tart(g, s) Lehet(Elenged(g), s)
A hatsaxima azt lltja, hogy ha egy cselekvs lehetsges, akkor a cselekvs vgrehajtsbl add
szituciban bizonyos tulajdonsgok (foly esemnyek) rvnyesek lesznek. Az x-rl az y-ra menni cselekvs
eredmnye az y-ban tartzkodni, az aranyat megfogni eredmnye az aranyat tartani, vgl az aranyat elengedni
eredmnye az aranyat nem tartani:
Lehet(Megy(x, y), s) Nla(gens, y, Eredmny(Megy(x, y), s))
Lehet(Megfog(g), s) Tart(g, Eredmny(Megfog(g), s))
Lehet(Elenged(g), s) Tart(g, Eredmny(Elenged(g), s))
Az aximk megllaptsval tudjuk-e bizonytani, hogy a tervnk biztostja a cl elrst? Sajnos mg nem!
Elszr minden jl mkdik: a Megy([1, 1], [1, 2]) valjban lehetsges az S0-ban, s a Megy hatsaximja
meggyzhet minket, hogy az gens tnyleg elri az [1, 2]-t:
Nla(gens, [1, 2], Eredmny(Megy([1, 1], [1, 1 ]), S0))
Most tekintsk a Megfog(G1) cselekvst. Ki kell mutatni, hogy ez lehetsges az j szituciban, azaz:
Nla(G1, [1, 2], Eredmny(Megy([1, 1], [1, 2]), S0))
Fontos
Sajnos a tudsbzisunkban az ilyen konklzit semmi sem tmasztja al. Intuitve persze megrtjk,
hogy az gens Megy cselekvse az arany helyzetre nincs hatssal, gy az mg mindig az [1, 2]-ben
van, ahogy ott volt az S0 szituciban is. A problma az, hogy a hatsaxima kijelenti, hogy mi vltozik,
de nem mond semmit arrl, hogy mi nem vltozik.
A vltozatlanul megmarad dolgok reprezentlsa az n. keretproblma (frame problem). A keretproblmra
hatkony megoldst kell tallnunk, mert a valdi vilgban az id tbbsgben majdnem minden vltozatlan
marad. Minden egyes cselekvs a foly esemnyeknek csak kis tredkt befolysolja.
295
Az egyik megkzelts az expblicit keretaximk (frame axioms) felrsa, amelyek azt mondjk, hogy mi
marad vltozatlan. Az gens mozgsai pldul ms objektumok helyzett vltozatlanul hagyjk, hacsak azokat
az gens nem tartja magnl:
Nla(o, x, s) (o gens) Tart(o, s) Nla(o, x, Eredmny(Megy(y, z), s))
Ha sszesen F foly esemny s A cselekvs lenne, akkor O(AF) keretaximra lenne szksgnk. Msfell, ha
minden cselekvsnek legfeljebb E hatsa lenne, ahol az E tipikusan jval kisebb, mint F, akkor a trtnteket
sokkal kisebb, O(AE) nagysg tudsbzissal is ki tudnnk fejezni. Ez a reprezentcis keretproblma
(representational frame problem). A vele szorosan kapcsold kvetkeztetsi keretproblma (inferential
frame problem) egy t-lpses cselekvssorozat eredmnyeinek O(Et) idben, s nem O(Ft) vagy O(AEt)
idben val kivettse. Sorban egyms utn az sszes problmval fogunk foglalkozni. Azonban egy problma
mgis marad biztostani, hogy egy cselekvs sikeres elvgzshez minden felttelt sikerlt megfogalmazni.
gy pldul a Megy kudarccal fenyeget, ha az gens tkzben meghal. Ez az n. kvalifikcis problma
(qualification problem), melynek teljes megoldsa nincs.
3.3. A reprezentcis problma megoldsa

A reprezentcis problma megoldsa csak egy kis vltozst ignyel abban, hogy az aximkat hogyan rjuk fel.
Ahelyett hogy felrnnk minden cselekvs hatst, azzal foglalkozunk inkbb, hogy egy foly esemny idben
hogyan evolvl.4 Az ltalunk hasznlt aximkat kvet llapot aximknak (successor-state axioms) hvjk.
Alakjuk a kvetkez:
Kvet-llapot Axima:
Cselekvs lehetsges
(Foly esemny igaz az eredmny llapotban A cselekvs hatsa igazz tette
Igaz volt a cselekvs eltt s a cselekvs nem vltoztatta)
Felttelezve, hogy lehetetlen cselekvsekkel nem foglalkozunk, vegyk szre, hogy a definciban szerepel
helyett. Ez azt jelenti, hogy a foly esemny akkor s csak akkor lesz igaz, ha a jobb oldali rsz igaz. Ms szval
minden foly esemnynek a kvetkez llapotban rvnyes igazsgrtkt a cselekvsnek s az aktulis
llapotban rvnyes rtknek a fggvnyeknt hatrozzuk meg. Ez azt jelenti, hogy a kvetkez llapot
teljesen meghatrozott az aktulis llapottl kiindulva, s gy ptlagos keretaximkra nincs szksg.
Az gens helyre rvnyes kvet llapot axima azt mondja, hogy gens egy cselekvs utn az y-ban lesz, ha a
cselekvs lehetsges, s az az y-ba val mozgsbl ll, vagy ha az gens mr az y-ban tartzkodott, s a
cselekvsnek a mozgshoz nem volt kze:
Lehet(a, s)
(Nla(gens, y, Eredmny(a, s)) (a = Megy(x, y))
(Nla(gens, y, s) (a Megy(y, z)))
A Tart aximja azt fejezi ki, hogy gens tarja a g-t, ha a cselekvs a g megfogst jelentette, s a cselekvs
lehetsges volt, vagy ha az gens mr tartotta a g-t s a cselekvs nem annak elengedse volt:
Lehet(a, s)
(Tart(g, Eredmny(a, s)) (a = Megfog(g)) (Tart(g, s) (a Elenged(g)))
Fontos
A kvet llapot aximk a reprezentcis keretproblmt megoldjk, mert az aximk ssz-szma
O(AE) literl. Az E hatsok s az A cselekvsek mindegyike pontosan egyszer kerl emltsre. A
literlok F klnbz axima kztt vannak sztosztva, gy egy axima tlagos nagysga AE/F.
Ez lnyegben az a megkzelts, amit a 7. fejezetben a logikai ramkr-gens tervezsnl alkalmaztunk. Az olyan aximkat, mint a
(7.4) s a (7.5), valban kvet llapot aximknak lehet nzni.
4
296
Az les szem olvas szreveszi, hogy ezek az aximk a Nla foly esemnyt kezelik az gens szmra, de
nem gy az arany esetben. Mg mindig nem tudjuk bebizonytani, hogy ez a hromlpses terv eljut a clhoz,
az arany elrshez az [1, 1]-ben. Amire szksgnk lenne mg, az annak a kijelentse, hogy az gens x-tl y-ig
val mozgsnak implicit hatsa (implicit effect), hogy minden, ltala megfogott arany is vele fog mozogni
(ahogy az aranyon a hangya, a hangyn a bacilus stb.). Az implicit hatsok kezelst ramifikcis
problmnak (ramification problem) nevezzk. A problmt ltalnossgban ksbb vitatjuk meg. A jelenlegi
specilis trgyterleten e problma a Nla szmra kiss ltalnosabb kvet llapot aximk felrsval
megoldhat. Az j aximk, amelyek a rgieket magukban foglaljk, azt fejezik ki, hogy minden o objektum yban tartzkodik, ha az gens az y-ba ment, s az o maga az gens, vagy brmi, amit az gens tart; vagy ha az o
mr az y-ban volt, s az gens nem ment sehov, mikzben az o maga az gens, vagy brmi, amit az gens tart.
Lehet(a, s)
Nla(o, y, Eredmny(a, s)) (a = Megy(x, y) (o = gens Tart(o, s)))
(Nla(o, y, s) (z y z a = Megy(y, z)
(o = gens Tart(o, s))))
Egy tovbbi technikai nehzsggel szmolnunk kell. Az ilyen aximkat felhasznl kvetkeztetsi eljrsnak
kpesnek kell lennie az azonossg hinyt kimutatni.A legegyszerbb eset a kt konstans esete, pldul gens
G1. Az elsrend logika ltalnos szemantikja lehetv teszi, hogy a klnbz konstansok ugyanazt az
objektumot jelentsk, a tudsbzisnak tartalmaznia kell teht az ilyen eseteket kitilt aximt. Az egyedi
elnevezsek aximja (unique names axiom) a konstansok azonossghinyt fejezi ki, a tudsbzisban ltez
minden konstansprra. Ha a ttelbizonyt rendszer az azonossghinyt felttelezi, ahelyett hogy explicit mdon
a tudsbzisban ez le lenne rva, az egyedi elnevezsek felttelezsrl (unique names assumption) beszlnk.
Az azonossghinyt ki kell jelentennk a cselekvsekre is: a Megy([1, 1], [1, 2]) cselekvs s a Megy([1, 2], [1,
1]), vagy a Megfog(G1) cselekvs nem ugyanaz. Elszr azt fogjuk mondani, hogy a cselekvsek minden tpusa
klnbz semmilyen Megy cselekvs nem lehet egy Megfog cselekvs. A cselekvsnevek minden prjra:
A(x1, , xm) B(y1, , yn)
Most kijelentjk, hogy kt, ugyanahhoz a cselekvshez tartoz cselekvsterm ugyanazt a cselekvst jelenti, ha a
benne szerepl objektumok mind azonosak:
A(x1, , xm) = B(y1, , ym) x1 = y1 xm = ym
Ezeket az lltsokat egyttesen egyedi cselekvs aximknak (unique action axioms) nevezzk. A kezdeti
llapotlers, a kvet llapot aximk, az egyedi elnevezsek aximk s az egyedi cselekvsaximk
egyttese elegend annak bizonytshoz, hogy a javasolt terv megvalstja a clt.
3.4. A kvetkeztetsi keretproblma megoldsa

Kvet llapot aximk a reprezentcis keretproblmt ugyan megoldjk, de a kvetkeztetsi keretproblmt
nem. Tekintsnk egy olyan t-lps p tervet, hogy St = Eredmny(p, S0). Hogy eldnthessk, mely foly
esemny igaz St-ben, szksges minden egyes F keretaximt minden t idlpsben kirtkelni. Mivel az
aximknak tlagosan AE / F a nagysguk, O(AEt) kvetkeztetssel kell szmolnunk. A munka zme r fog
menni arra, hogy a foly esemnyeket az egyik szitucirl a msikra vltozatlanul msoljuk t.
A kvetkeztetsi keretproblma megoldsra kt lehetsgnk van. Elszr is, eldobhatjuk a szitucikalkulust,
s kitallhatjuk az aximk egszen j felrsi mdjt. Ez trtnt meg az olyan formalizmusokban, mint a foly
esemny kalkulus (fluent calculus). Msodszor, megvltoztathatjuk magt a kvetkeztetsi eljrst, hogy a
keretaximkat hatkonyabban dolgozza fel. Erre utalst ad magnak az egyszer megkzeltsnek az O(AEt)
jellege. De mirt fgg ez a cselekvsek A szmtl, amikor pontosan tudjuk, hogy mindegyik idlpsben
melyik cselekvs kerl vgrehajtsra? Hogy belssuk, hogyan tudnnk a dolgokon javtani, nzzk meg elszr
a keretaximk formtumt:
Lehet(a, s)
Fi(Eredmny(a, s)) (a = A1 a = A2 )
Fi(s) (a A3) (a A4)
297
Vagyis mindegyik axima emlt teht nhny cselekvst, amelyek a foly esemnyt igazz, s nhnyat,
amelyek azt hamiss teszik. Ezt a krlmnyt formalizlhatjuk a PozHats(a, Fi) s a NegHats(a, Fi)
prediktumok bevezetsvel. A PozHats(a, Fi) azt jelenti, hogy az a cselekvs az Fi-t igazz, a NegHats(a, Fi)
pedig azt, hogy hamiss teszi. A fenti axima ezzel a kvetkezkppen rhat t:
Lehet(a, s)
Fi(Eredmny(a, s)) PozHats(a, Fi) [Fi(s) NegHats(a, Fi)]
PozHats(A1, Fi)
PozHats(A2, Fi)
NegHats(A3, Fi)
NegHats(A4, Fi)
Az, hogy ez mennyire automatizlhat, a keretaximk pontos formtumn mlik. Hogy az ilyen aximkra
alapozva hatkony kvetkeztetsi eljrst dolgozhassunk ki, hrom dolgot kell mg megtenni:
1. Indexeljk a PozHats s a NegHats prediktumokat az els argumentumaik szerint, hogy amikor adott egy
t idpontban bekvetkez cselekvs, a hatsait O(1) idben meg lehessen keresni.
2. Indexeljk az aximkat gy, hogy amikor vilgos mr, hogy egy cselekvs hatsa Fi, O(1) id alatt ki
lehessen keresni az Fi-re vonatkoz aximkat. Ekkor a cselekvs hatsai kztt nem szerepl foly esemny
aximival nem is kell trdni.
3. Minden szitucit reprezentljunk egy megelz szituci plusz egy nvekmnyknt. gy, amikor lpsrl
lpsre nem vltozik semmi, nem kell semmifle munkt vgeznnk. A rgebbi megkzeltsben O(F)
munka ment volna r, hogy minden foly esemny esetn a megelz Fi(s) felttelezsbl Fi(Eredmny(a, s))
felttelezst generljunk.
Minden idlpsnl teht megnzzk az aktulis cselekvst, megkeressk a hatsait s az igaz foly esemnyek
halmazt felfrisstjk. Minden idlpsben tlagosan E ilyen frisstssel kell szmolnunk, ami az ered
komplexitsra O(Et)-t ad. Ez megadja a kvetkeztetsi keretproblma megoldst.
3.5. Id- s esemnykalkulus

A szitucikalkulus akkor mkdik jl, ha egy gens diszkrt, azonnal lezajl cselekvseket hajt vgre. Ha
cselekvseknek idtartamuk is van, s egymssal t is lapoldhatnak, a szitucikalkulus nehzkess kezd vlni.
Emiatt e krdsekkel egy ms megkzeltsen bell prblkozunk, amit esemnykalkulusnak (event calculus)
fogunk nevezni s amely inkbb az idpontokon, mint a szitucikon alapul. (Az esemny s a cselekvs
fogalmakat felvltva is hasznlhatjuk. Egy esemny informlisan a cselekvsek tgabb osztlyt jelenti, az
explicit genst nlklz cselekvseket belertve. Az esemnyeket az esemnykalkulusban knnyebben
kezelhetjk, mint a szitucikalkulusban.)
Az esemnykalkulusban a foly esemnyek idpillanatokra s nem szitucikra vonatkoznak, s a kalkulust gy
terveztk, hogy az idintervallumokrl is lehessen kvetkeztetni. Az esemnykalkulus axima azt mondja ki,
hogy egy foly esemny igaz egy idpontban, ha a foly esemnyt valamilyen mltbeli esemny
kezdemnyezte, s idkzben a foly esemnyt semmilyen kzbens esemny nem lltotta le. Az Inicializl s
a Lellt relcik a szitucikalkulus-beli Eredmny relcihoz hasonl szerepet tltenek be. Az Inicializl(e, f,
t) azt jelenti, hogy az e esemny t idpontban trtn bekvetkezse az f foly esemnyt igazz teszi, mg a
Lellt(w, f, t) jelentse, hogy f igaz rtke megsznt. A Trtnik(e, t) azt fogja jelenteni, hogy az e esemny a t
idpontban trtnik, a Levg(f, t, t2)-t pedig arra fogjuk hasznlni, hogy lerhassuk, hogy az f-et valamilyen
esemny a t s a t2 idpontok kztt lelltotta. Formlisan az axima a kvetkez:
Esemnykalkulus Axima:
T(f, t2) e, t Trtnik(e, t) Inicializl(e, f, t) (t < t2) Levg(f, t, t2)
Levg(f, t, t2) e, t1 Trtnik(e, t1) Lellt(e, f, t1) (t < t1) (t1 < t2)
298
A kapott funkcionalits hasonlt a szitucikalkulusra, azonban az idpontokrl s az idintervallumokrl is

nyilatkozhatunk. gy kpesek vagyunk a Trtnik(Kikapcs(LmpaKapcs1), 1:00)-val azt mondani, hogy a
lmpakapcsolt pontosan 1:00-kor kapcsoltk ki.
Az esemnykalkulus szmos tovbbfejlesztst dolgoztk ki, hogy a kzvetett hatsokkal, a nem zrus
idtartalm esemnyekkel, a folyamatosan vltoz esemnyekkel, a nemdeterminisztikus hatsokkal, a kauzlis
korltozsokkal s ms bonyodalmakkal is tudjanak dolgozni. Egyes krdsekkel a kvetkez alfejezetben
fogunk tallkozni. A tisztessg kedvrt megjegyezzk, hogy teljesen elfogadhat megoldsok mig sem
szlettek, azonban legyzhetetlen akadlyok sem merltek fel.
3.6. ltalnostott esemnyek

Egyelre kt f fogalommal a cselekvsekkel s az objektumokkal foglalkoztunk. Ideje most utnanzni
annak, hogyan illeszkednek ezek a fogalmak egy olyan befogad ontolgiba, ahol mind a cselekvsek, mind az
objektumok a fizikai univerzum aspektusnak foghatk fel. Egy konkrt univerzumrl feltesszk, hogy trbeli
s idbeli dimenzija is van. A wumpus vilg a ktdimenzis rcs ltal definilt trbeli dimenzival s diszkrt
idvel rendelkezett. A vilg trben hromdimenzis s idben egydimenzis, 5 mely dimenzik mindegyike
folytonos. Egy ltalnostott esemny (generalized event) a tbbdimenzis univerzum egy rsznek a trid darabknak aspektusaibl ll ssze. Ez az absztrakci az eddig ltott fogalmak tbbsgt ltalnostja, a
cselekvseket, a lokcikat, az idket, a foly esemnyeket s a fizikai objektumokat belertve. Az ltalnos
tletet a 10.3. bra szemllteti. Mostantl kezdve az esemny egyszer fogalommal az ltalnostott
esemnyeket fogjuk nevezni.
A msodik vilghbor pldul egy olyan esemny, amely a tr-id klnbz pontjaiban trtnt meg, ezt a
szablytalan szrke folt jelzi. Az esemnyt a rszesemnyekre (subevents)6 bonthatjuk szt:
RszEsemny(AngliaiCsata, MsodikVilgHbor)
Hasonlkppen a msodik vilghbor a 20. szzad rszesemnye:

RszEsemny(MsodikVilgHbor, HuszadikSzzad)
A 20. szzad az idnek egy intervalluma. Intervallumok a tr-id olyan darabki, amelyek kt idpont kztt az
egsz teret tartalmazzk. A Periodus(e) fggvny az e esemnyt bezr legkisebb intervallumot jelli. A
Tartam(i)
egy
intervallum
ltal
foglalt
id
hossza,
mondhatjuk
teht,
hogy
Tartam(Periodus(MsodikVilgHbor)) > v(5).
Ausztrlia egy hely, egy darabka rgztett trbeli hatrokkal. A hatrok idben vltoznak, geolgiai vagy
politikai okoknl fogva. A Benne prediktumot fogjuk hasznlni az olyan rszesemny relci megjellsre,
amely akkor ll fenn, ha egy esemny trbeli vetlete Rsze egy msik esemny vetletnek:
Benne(Sydney, Ausztrlia)
A Hely(e) fggvny az e esemnyt befogad legkisebb helyet jelenti.

Mint minden ms objektumot, az esemnyeket szintn lehet kategrikba szervezni. A MsodikVilgHbor
pldul a Hbor kategriba tartozik. Azt, hogy Angliban 1640-ben polgrhbor zajlott, a kvetkezkppen
mondhatjuk:
w w PolgrHbor RszEsemny(w, 1640) Benne(Lokci(w), Anglia)
Az esemnykategria fogalma segt megvlaszolni azt a krdst, amit igyekeztnk elkerlni, amikor a 10.3.
alfejezetben a cselekvsek hatsairl beszltnk. Mire hivatkoznak pontosan az olyan logikai termek, mint a
Megy([1, 1], [1, 2])? Esemnyek ezek?
10.3. bra - ltalnostott esemnyek. Az univerzumnak trbeli s idbeli dimenzija

van. Ezen az brn csak egy trbeli dimenzit mutatunk. Minden esemny az
univerzum Rsze. Az olyan esemny, mint a MsodikVilgHbor a tr-id egy
A fzrelmletet tanulmnyoz nhny fizikus a 10 vagy tbb dimenzi mellett foglal lls, msok diszkrt vilgrl beszlnek, a 4-D
folytonos tr-id azonban a jzan sz kvetkeztetsi cloknak megfelel reprezentci.
6
Jegyezzk meg, hogy a RszEsemny a Rsze relci specilis esete, s ugyangy tranzitv s reflexv.
5
299
tartomnyban trtnik, melynek hatrai kiss szabadon vlaszthatk, s idben

vltozk. Egy Intervallum, mint amilyen a HuszadikSzzad, rgztett s korltos idbeli,
valamint maximlis trbeli kiterjedssel rendelkezik. A Hely, amilyen pldul
Ausztrlia, nagyjbl rgztett trbeli s maximlis idbeli kiterjedssel rendelkezik.
A vlasz, taln meglep, de az, hogy nem. Ennek megrtshez nzznk meg kt azonos cselekvst tartalmaz
tervet, mint pldul:
[Megy([1, 1], [1, 2]), Megy([1, 2], [1, 1]), Megy([1, 1], [1, 2])]
Ebben a tervben a Megy([1, 1], [1, 2]) nem lehet egy esemny neve, mert kt klnbz esemny van, amelyek
klnbz idpontban trtnnek meg. Helyette a Megy([1, 1], [1, 2]) egy esemnykategria neve azok az
esemnyek, amikor az gens az [1, 1]-rl az [1, 2]-re lp t. A hromlpses terv azt mondja ki, hogy e hrom
esemnykategria pldnyai fognak elfordulni.
Jegyezzk meg, hogy ez az els alkalom, amikor a kategrik megnevezsre komplex termeket vetettnk be,
egyszer konstansszimblumok helyett. Ez nem jelent j nehzsget. Az argumentumstruktrt valjban a
hasznunkra is fordthatjuk. Az argumentumok eliminlsa az ltalnosabb kategrik bevezetst teszi lehetv:
Megy(x, y) MegyHov(y) Megy(x, y) MegyHonnan(x)
Hasonlan, argumentumok hozzadsval mg specifikusabb kategrikat hozhatunk ltre. Ms gensek

cselekvseinek lershoz pldul hozzadhatjuk az genseket jell argumentumot. gy ahhoz, hogy azt
mondhassuk, hogy tegnap Shankar New Yorkbl jdelhibe utazott, azt rhatnnk, hogy:
e e Repl(Shankar, NewYork, jdelhi) RszEsemny(e, Tegnap)
Az llts e formja annyira gyakori, hogy kln rvidtst fogunk r alkalmazni: E(c, i), aminek az a jelentse,
hogy a c esemnykategria egy eleme egy i intervallum, vagy az esemny rszesemnye:
E(c, i) e e c RszEsemnye(e, i)
gy:
E(Repl(Shankar, NewYork, jdelhi), Tegnap)
300
3.7. Folyamatok
Az eddig ltott esemnyek meghatrozott struktrval rendelkez diszkrt esemnyek (discrete events) voltak.
Shankar utazsnak van kezdete, kzepe s vge. Ha flbeszaktjuk, az esemny megvltozik nem lesz tbb
egy New York s jdelhi kztti utazs, hanem helyette egy New York s egy Eurpban valahol fekv pont
kztti utazs. A Repl(Shankar) ltal jellt esemnykategrinak ezzel szemben ms a jellege. Ha Shankar
replsnek egy rvid intervallumt vesszk, mondjuk a harmadik 20 perces idszakaszt (amikor is
trelmetlenl vrja mr a msodik csomag mzben prklt fldimogyort), ez az esemny mg mindig a
Repl(Shankar) egy rsze. Valjban ez akrmilyen rszintervallum esetben is igaz.
Az ilyen tulajdonsg esemnyek kategriit folyamat- (process) kategriknak, illetve folytonos esemny
(liquid event) kategriknak nevezzk. Egy folyamat akrmilyen rszintervalluma ugyanannak a
folyamatkategrinak a tagja. A diszkrt esemnyekre kialaktott jellst alkalmazva mondhatjuk pldul, hogy
Shankar valamikor tegnap replt:
E(Repl(Shankar), Tegnap)
Gyakran ki szeretnnk jelenteni, hogy valamilyen folyamat egy teljes intervallumon keresztl tartott, s nem
csak annak valamilyen rszintervallumban. Erre T prediktumot fogjuk hasznlni:
T(Dolgozik(Istvn), MaiEbdId)
T(c, i)-nek az a jelentse, hogy egy c tpus esemny az egsz i intervallum ideje alatt tartott azaz az esemny
pontosan akkor kezddik s fejezdik be, amikor az intervallum.
Folykony s nem folykony esemnyek kztti megklnbztets pontosan analg a szubsztancik, avagy az
anyag s az egyedi objektumok kztti klnbsggel. Tny, hogy egyes kutatk folykony esemnyeket
temporlis szubsztanciknak (temporal substances) neveztk el, mg a vajszer dolgok trbeli szubsztancik
(spatial substances).
A folytonos esemnyek a folyamatosan vltoz folyamatokon tlmenen kpesek a folyamatosan nem vltoz
folyamatok lersra is. Ezeket gyakran llapotoknak (states) nevezzk. A Shankar New Yorkban tartzkodik
pldul egy olyan llapotkategria, amit Benne(Shankar, NewYork)-kal lehetne jellni. Azt, hogy Sankar az
egsz mai napot New Yorkban tlttte, gy rhatnnk, hogy:
T(Benne(Shankar, NewYork), Ma)
10.4. bra - sszetett esemnyek brzolsa. (a) T(Mindkett(p, q), i), mskppen T(p o
q, i), (b) T(Egyik(p, q), i), (c) T(VagyVagy(p, q), i).
Primitv llapotok vagy esemnyek kombinlsval bonyolultabb kpzdmnyeket is kialakthatunk. Ez a

megkzelts a foly esemny kalkulus (fluent calculus). A foly esemny kalkulus nem egyedi foly
esemnyeket, hanem foly esemnyek kombinciit reifiklja. Lttuk mr annak a mdjt, hogy az egyszerre
trtn kt dolog esemnyt hogyan reprezentljuk, azaz lttuk a Mindkett(e1, e2) fggvnyt. A foly
kalkulusban ezt ltalban az e1 o e2 infix jellssel rvidtik. Hogy megmondhassuk, hogy pldul valaki stlt
s kzben rggumit rgott, azt rhatjuk, hogy:
p, i (p Ember) T(Stl(p) o RgtRg(p), i)
A o fggvny kommutatv s asszociatv, pontosan gy, mint a logikai konjunkci. Definilhatjuk a

diszjunkci s a negls analgijt is, azzal viszont vatosabban kell eljrnunk, mivel a diszjunkcit ktfle
mdon lehet rtelmesen interpretlni. Amikor azt mondjuk, hogy az gens az utbbi kt percben vagy stlt,
vagy rggumit rgott, gondolhatunk arra, hogy az gens az egsz id alatt az egyik cselekvst vgezte, vagy
301
pedig, hogy a kt cselekvst felvltva tette. E kt lehetsg megjellsre az Egyik s a VagyVagy fggvnyeket
fogjuk hasznlni. A komplex esemnyeket a 10.4. bra szemllteti.
3.8. Intervallumok
Az id fontos minden cselekv gens szmra, s az idintervallumok reprezentlsra szmos erfeszts
trtnt. Az idintervallumok kt fajtjval foglalkozunk: az idpillanatokkal s a kiterjesztett intervallumokkal.
A klnbsg kztk az, hogy csak az idpillanatnak lehet zrus idtartama:
Partci({IdPillanatok, KiterjesztettIntervallumok}, IdIntervallumok)
i IdIntervallumok (Tartam(i) = Msodperc(0)
Most egy idsklt konstrulunk, amelynek pontjait idpillanatokhoz rendeljk hozz; ezzel abszolt
idpontokat kapunk. Az idskla tetszleges lehet. Az idt msodpercekben fogjuk mrni, s kimondjuk, hogy a
0. id az 1900. janur 1-jei (GMT) jfl. A Kezdet s a Vg fggvnyek az idintervallum legkorbbi s a
legksbbi idpillanatt adjk vissza, az Id fggvny egy idpillanathoz tartoz pontot keres ki az idskln.
Az IdTartam fggvny megadja a kezdeti id s a vgid kztti klnbsget.
IdIntervallum(i) IdTartam(i) = (Id(Vge(i)) Id(Kezdete(i)))
Id(Kezdete(AD1900)) = Msodperc(0)
Id(Kezdete(AD2001) = Msodperc(3187324800)
Id(Vge(AD2001)) = Msodperc(3218860800)
IdTartam(AD2001) = Msodperc(31536000)
Hogy a szmokat knnyebb legyen olvasni, vezessnk be egy hatrgumentum Dtum fggvnyt (ra, percek,
msodpercek, hnap, nap s v), melynek visszaadott rtke egy pont az idskln:
Id(Kezdete(AD2001)) = Dtum(0, 0, 0, 1, Janur, 2001)
Dtum(0, 20, 21, 24, 1, 1995) = Msodperc(3000000000)
Kt intervallum Tallkozik, ha az egyiknek a vgideje megegyezik a msiknak a kezdeti idejvel. Mr egyedl a

Tallkozik segtsgvel is lehetsges olyan tovbbi prediktumokat definilni, mint az Eltte, az Utna, a
Kzben s az tlapoldik. Azonban sokkal intuitvebb, ha a definilsuk az idskla pontjainak segtsgvel
trtnik (lsd 10.5. brn a grafikus reprezentcit).
Tallkozik(i, j) Id(Vge(i)) = Id(Kezdete(j))
Eltte(i, j) Id(Vge(i)) < Id(Kezdete(j))
Utna(j, i) Eltte(i, j)
Kzben(i, j) Id(Kezdete(j)) Id(Kezdete(i)) Id(Vge(i)) Id(Vge(j))
tlapoldik(i, j) k Kzben(k, i) Kzben(k, j)
Annak megadsra, hogy II. Erzsbet uralkodsa VI. Gyrgy uralkodst kvette, Elvis uralkodsa viszont az
1950-es vekkel tlapoldott, a kvetkezt rhatjuk:
Utna(Uralkodsa(II.Erzsbet), Uralkodsa(VI.Gyrgy))
tlapoldik(tvenesvek, Uralkodsa(Elvis))
Kezdete(tvenesvek) = Kezdete(AD1950)
Vge(tvenesvek) = Vge(AD1950)
10.5. bra - Az idintervallumok prediktumai
302
3.9. Foly esemnyek s objektumok

Emltettk, hogy fizikai objektumokat ltalnostott objektumoknak lehet tekinteni, abban az rtelemben, hogy
egy objektum a tr-id egy darabkja. Az USA pldul egy olyan esemnynek kpzelhet el, amely mondjuk
1776-ban, 13 llam unijaknt kezddtt s ma, 50 llam unijaknt, mg folyamatban van. Az USA vltoz
aspektusait llapot foly esemnyekkel rhatjuk le. Mondhatjuk pldul, hogy valamikor, az 1999. vben a
lakossga 271 milli f volt:
E(Lakossg(USA, (271000000), AD1999)
Egy msik ilyen aspektus, amely a szerencstlensgektl eltekintve, ngy- vagy nyolcvenknt vltozik, az
orszg elnke. Felvehet, hogy az Elnk(USA) egy olyan logikai term, amely klnbz idkben klnbz
objektumokat jelent. Ez sajnos nem lehetsges, mert egy term egy adott modellstruktrban pontosan egy
objektumot jell meg. (Az Elnk(USA, t) jellhetne klnbz objektumokat t rtknek megfelelen, az
ontolgink azonban az idpontokat s a foly esemnyeket sztvlasztja.) Egyetlen lehetsg, hogy az
Elnk(USA) egy olyan egyedi objektumot jell, amely klnbz idkben klnbz emberekbl ll. Az
Elnk(USA), mint objektum, George Washington volt 1789-tl 1796-ig, John Adams volt 1796-tl 1800-ig stb.
(lsd 10.6. bra). Azt, hogy George Washington 1790-ben elnk volt, a kvetkezkppen rhatjuk le:
T(Elnk(USA) = GeorgeWashington, AD1790)
Azonban vatosnak kell lenni. Ebben a mondatban az = inkbb egy fggvny, s nem egy standard logikai
opertor. Az interpretci nem az, hogy GeorgeWashington s az Elnk(USA) 1790-ben logikailag azonosak. A
logikai azonossg nem olyan dolog, ami idben vltozhat. A logikai azonossg az egyes objektumok azon
rszesemnyei kztt ll fenn, amelyeket az 1790-es elnki peridus definilt.
Ne tvessze ssze a GeorgeWashington fizikai objektumot az atomok egy gyjtemnyvel. George Washington
logikailag nem azonos semmilyen konkrt atomgyjtemnnyel, mert az az atomhalmaz, amibl ll, idben
lnyegesen vltozik. Neki rvid lettartama van, minden atomnak sajt hossz lettartama van. Bizonyos
peridusban metszik egymst, amikor is az atom temporlis szelete a RszEsemnye George-nak, majd kln
tjukat jrjk.
10.6. bra - Az Elnk(USA) objektum smaszer brzolsa ltezsnek els 15 vben
303
4. Mentlis esemnyek s mentlis objektumok

Az eddig megkonstrult genseknek hiedelmeik vannak, tovbb az gensek j hiedelmek kikvetkeztetsre is
kpesek. Ennek ellenre hiedelmekre s kvetkeztetsre vonatkoz tudssal egy gens sem rendelkezik. Az
egygenses problmaterleteken egy gensnek a sajt tudsrl s kvetkeztet eljrsrl meglv tudsa
hasznos a kvetkeztets irnytsban. Ha pldul valaki tudatban van annak, hogy Romnia fldrajzrl
semmit sem tud, nem kell risi erfesztseket tennie, hogy az Arad s Bukarest kztti legrvidebb utat
kiszmtsa. Kvetkeztethetnk a sajt tuds llapotunkrl annak rdekben, hogy terveket ksztsk annak
megvltoztatsra pldul azltal, hogy Romnia trkpt megvsroljuk. Tbbgenses problmaterleteken
fontos, hogy egy gens ms gensek mentlis folyamataira tudjon kvetkeztetni. Egy romn rendr nyilvn jl
tudja, hogy melyik a legjobb t Bukarest fel, gy az gens krhet tle segtsget.
Vgeredmnyben teht olyan mentlis objektumok s az azokat manipull mentlis folyamatok modelljre van
szksgnk, amelyek msvalaki fejben (vagy msvalami tudsbzisban) tallhatk meg. A modellnek
valsghnek kell lennie, azonban nem kell a rszletekre kitrnie. Nem kell, hogy kpesek legynk megjsolni,
hogy egy konkrt gens a kvetkeztetseit hny milliszekundum alatt lltja el, vagy hogy egy konkrt vizulis
ingerrel szembestve, mely neuronok tzelnek az llat agyban. Boldogok lesznk, ha kikvetkezhetjk, hogy
romn rendr eligazt minket Bukarest irnyba, ha tudja az utat, s azt hiszi, eltvedtnk.
4.1. A hiedelmek formlis elmlete

Az gensek s a mentlis objektumok kztti olyan kapcsolatokkal kezdnk, mint a Hiszi, a Tudja s az
Akarja. Az ilyen relcikat tletlogikai attitdknek (propositional attitudes) nevezzk, mert egy gens
attitdjt rjk le egy tletlogikai lltssal szemben. Tegyk fel, hogy Lujza hisz valamit, azaz Hiszi(Lujza, x).
Vajon milyenfajta dolog az x? Elszr is vilgos, hogy x logikai llts nem lehet. Ha Repl(Superman) egy
logikai llts, akkor nem mondhatjuk azt, hogy Hiszi(Lujza, Repl(Superman)), mert prediktumok
argumentumaknt csak termeket (s nem lltsokat) fogadunk el. Ha azonban a Repl egy fggvny, akkor a
Repl(Superman) mr j jellt egy mentlis objektumra, s a Hiszi lehet az a relci, amely egy genst
sszekapcsol ezzel az tlet jelleg foly esemnnyel. Egy llts talaktsa objektumm nem ms, mint
reifikls7 (reification).
gy tnik meg is kaptuk, amit akartunk: egy gensnek azt a kpessgt, hogy kvetkeztetni tudjon ms gensek
hiedelmeirl. Sajnos e megkzeltsnek vannak nehzsgei. Ha Clark s Superman egy s ugyanaz a szemly
(azaz Clark = Superman), akkor Clark repl s Superman repl egy s ugyanaz az esemnykategria, azaz
Repl(Clark) = Repl(Superman). Azaz el kell fogadnunk, hogy ha Lujza azt hiszi, hogy Superman tud replni,
el kell hinnie, hogy Clark tud replni, akkor is, ha nem hiszi, hogy Clark Superman. Azaz:
A reifikls sz a latin res, avagy dolog szbl szrmazik. John McCarthy a dolgosts (thingification) elnevezst javasolta, de ez nem
terjedt el.
7
304
(Superman = Clark) (Hiszi(Lujza, Repl(Superman)) Hiszi(Lujza, Repl(Clark)))
Bizonyos rtelemben ez igaz is. Egy bizonyos szemlyrl, akit nha Clarknak hvnak, Lujza azt hiszi, hogy tud
replni. Ms rtelemben azonban ez nincs rendjn. Ha megkrdezzk Lujzt, hogy Clark tud-e replni?,
minden bizonnyal nemmel vlaszolna. A reifiklt objektumok s esemnyek jl mkdnek a Hiszi els
rtelmezse esetn, a msodikhoz viszont az szksges, hogy reifikljuk ezen objektumok s esemnyek
lerst, gy Clark s Superman klnbz lersok legyenek, annak ellenre, hogy ugyanarra az objektumra
vonatkoznak.
Azt a tulajdonsgot, hogy egy termet egy vele ekvivalens termmel szabadon helyettesthetnk, formlisan
referencilis tlthatsgnak (referential transparency) nevezzk. Elsrend logikban minden relci
referencilisan tlthat. Szmunkra az lenne a j, ha a Hiszi (s ms tletlogikai attitdk is) olyan
relcikknt lennnek definilhatk, melynek msodik argumentuma elmosdott (opaque) azaz, ahol
ekvivalens termeket egymssal nem lehet helyettesteni az rtelmezs megvltoztatsa nlkl.
Ennek kt mdja van. Az els a logika egy j vltozatnak az n. modlis logiknak (modal logic) a
hasznlata, amelyben az olyan tletlogikai attitdk, mint a Hiszi s a Tudja referencilisan elmosdott modlis
opertorok (modal operators) lesznek. Ezzel a megkzeltssel az irodalmi s trtneti megjegyzsek
keretben foglalkozunk. A msodik, a tovbbiakban kifejtett megkzelts a hatkony elmosdottsg elrse a
klnben referencilisan tlthat nyelvben a mentlis objektumok n. szintaktikai elmlete (syntactic theory)
rvn. Ez azt jelenti, hogy mentlis objektumokat fzrekkel (strings) reprezentlunk. Az eredmny az gens
tudsbzisnak egy olyan durva modellje, ahol a tudsbzis az gens ltal elhitt lltsokat reprezentl
fzrekbl ll. Egy fzr nem ms, mint egy szimblumlistt megjell komplex term, gy a Repl(Clark)
esemnyt a [R, e, p, , l, (, C, l, a, r, k, )] karakterfzrrel reprezentljuk, amit Repl(Clark)-knt fogunk
rvidteni. A szintaktikai elmlet eleme az egyedi fzr axima (unique string axiom), amely azt mondja ki,
hogy kt fzr akkor s csak akkor azonos, ha azonos karakterekbl ll. Ebben a megfogalmazsban a Clark =
Superman ellenre Clark Superman.
Most meg kell adnunk a fzr reprezentcis nyelv rszre a szintaxist, a szemantikt s a bizonytsi elmletet,
pontosan gy, ahogyan ezt a 7. fejezetben tettk. A klnbsg az, hogy ezeket most mind elsrend logikban
kell definilnunk. A Jelent fggvnnyel kezdnk, amely a fzrt arra az objektumra kpezi le, amit jell. A Neve
egy olyan fggvnnyel definilhat, amely egy objektumot az azt megnevez fzrre kpezi le. A Clark s a
Superman jells jelentse egy objektum, amire a VasEmber konstansszimblummal fogunk hivatkozni, s
aminek a neve a tudsbzisban lehet Clark, Superman vagy valamilyen ms konstans, mondjuk X11.
Jelent(Clark) = VasEmber Jelent(Superman) = VasEmber
Neve(VasEmber) = X11
A kvetkez lps a kvetkeztetsi szablyok definilsa egy logikai gens szmra. Kvnhatnnk pldul,
hogy egy logikai gens kpes legyen Modus Ponenst elvgezni: ha elhiszi a p-t, s elhiszi, hogy p q, akkor
elhiszi a q-t is. Az axima els verzija valahogy gy nzhetne ki:
Logikaigens(a) Hiszi(a, p) Hiszi(a, p q) Hiszi(a, q)
Ez azonban helytelen, mert a p q fzr tartalmazza ugyan a p s q betket, de semmi kze az olyan
fzrekhez, amelyekben a p s q vltozk rtkei szerepelnek. A helyes megfogalmazs az albbi:
Logikaigens(a) Hiszi(a, p) Hiszi(a, Concat(p, , q)) Hiszi(a, q)
ahol a Concat egy fzrfggvny, amely az elemeit konktenlja. A Concat(p, , q)-t le fogjuk rvidteni p
q-ra. Azaz x elfordulsa egy fzren bell azt jelenti, hogy az x vltoz rtkt be kell helyettesteni. A
Lisp-programozk ebben felismerik a backquote opertort, a Pearl-programozk pedig a $-vltoz interpolcit.
Ha Modus Ponensen kvl ms kvetkeztetsi szablyokat is hozzvesznk, olyan krdsek megvlaszolsra
lesznk kpesek, mint a Feltve, hogy a logikai gens ezeket a premisszkat ismeri, kpes-e azt a konklzit
kikvetkeztetni?. A kznsges kvetkeztetsi szablyokon tlmenen szksgnk van hiedelemspecifikus
szablyokra is. gy pldul az albbi szably azt mondja ki, hogy ha egy logikai gens elhisz valamit, akkor azt
is elhiszi, hogy elhiszi azt.
Logikaigens(a) Hiszi(a, p) Hiszi(a, Hiszi(Neve(a) , p))
305
Az ilyen gens, aximinkbl addan, minden rvnyes konklzit kpes azonnal kikvetkeztetni. Ezt a
jelensget logikai mindentudsnak (logical omniscience) hvjk. Szmos ksrlet trtnt arra, hogy korltos
racionalits genseket definiljunk, amelyek vges id alatt korltozott szm kvetkeztetsre kpesek. Ezek
egyike sem teljesen kielgt, azonban e megfogalmazsok lehetv teszik, hogy korltos gensekrl igen
korltozott terjedelm jslsokat vgezznk.
4.2. Tuds s hiedelem

A filozfusok vszzadok ta tanulmnyoztk a hinni s a tudni kztti kapcsolatot. ltalnosan elfogadott,
hogy tuds a bizonytott, igaz hiedelem. Azaz, ha megtmadhatatlanul j oknl fogva hisznk valamiben, s
ez a valami igaz is, akkor ezt a valamit tudjuk is. A megtmadhatatlanul j oknl fogva lnyeges, hogy ne
mondhassunk olyat, hogy: Tudom, hogy ez a feldobott rme fejjel felfel fog leesni, s ne legyen igazunk az
esetek felben.
Legyen a Tudja(a, p) jelentse az, hogy egy a gens tudja, hogy a p llts igaz. A tuds ms fajtjt is lehet
definilni. Nzzk pldul a tudja, hogy vagy, vagy defincijt:
TudjaVagyVagy(a, p) Tudja(a, p) Tudja(a, p)
Pldnkat folytatva, Lujza tudja, hogy Clark vagy tud replni, vagy nem, ha tudja, hogy Clark tud replni, vagy
ha tudja, hogy Clark nem tud replni.
A tudja, mi koncepci valamivel bonyolultabb. Ksrtst rezhetnk arra, hogy azt lltsuk, egy gens tudja,
mi Bla telefonszma, ha ltezik egy x, amirl az gens azt tudja, hogy x = TelefonSzma(Bla). De ez gy nem
j, mert pldul az gens tudhatja, hogy Aliz s Bla telefonszma ugyanaz (azaz TelefonSzma(Aliz) =
TelefonSzma (Bla)), de ez sokat nem segt, ha Aliz telefonszmt sem tudja. A tudja, mi jobb defincija azt
mondja ki, hogy az gensnek valami olyan x-et kell ismernie, amely egy szmjegyekbl ll fzr s amely Bla
telefonszma:
TudjaMi(a, TelefonSzma(b))
x Tudja(a, x = TelefonSzma(b)) x SzmjegyFzr
Termszetesen ms krdsek esetn az elfogadhat vlasznak msok lesznek a kritriumai. Arra a krdsre,
hogy Mi New York llam fvrosa?, a j vlasz Albany, s nem az, hogy az a vros, ahol a vroshza ll.
Hogy ez lehetsges legyen, a TudjaMi-t hromargumentumos relciv alaktjuk t: lesz benne egy gens, egy
term s egy prediktum, amelynek igaznak kell lennie a vlaszra alkalmazva. Pldul:
TudjaMi(gens, Fvros(NewYork), SajtNv)
TudjaMi(gens, TelefonSzma(Bla), SzmjegyFzr)
4.3. Tuds, id s cselekvs

A valdi esetek tbbsgben az gensnek az idben vltoz sajt vagy ms gensek hiedelmeivel kell
foglalkoznia. Az gensnek terveket kell sznie, amelyek a sajt hiedelmeinek vltozsaival jrnak egytt mint
amilyen pldul egy trkp vsrlsa, hogy Bukarestbe talljon. Ms prediktumokhoz hasonlan lehetsges a
Hiszi reifiklsa, s egy idperidus alatt trtn hiedelmek megtrgyalsa. gy mondhatjuk pldul, hogy Lujza
ma hiszi, hogy Superman tud replni:
T(Hiszi(Lujza, Repl(Superman), Ma)
Ha a hiedelem objektuma egy olyan llts, amely idben vltozhat, ezt a T opertorral a fzren bell rhatjuk
le. Ekkor mondhatnnk azt, hogy Lujza ma hiszi, hogy Superman tegnap tudott replni:
T(Hiszi(Lujza, T(Repl(Superman), Tegnap), Ma)
Ha mr az idben evolvl hiedelmeket le tudjuk rni, felhasznlhatjuk az esemnykalkulus mechanizmust,

hogy hiedelmeket tartalmaz terveket ksztsnk. A cselekvseknek lehetnek tuds-elfelttelei (knowledge
preconditions) s tudshatsai (knowledge effects). Annak a cselekvsnek pldul, hogy valakinek a
telefonszmt trcszzuk, az az elfelttele, hogy tudjuk a szmot, s annak a cselekvsnek, hogy a
telefonszmot a knyvbl kikeressk, az a hatsa, hogy a szmot tudni fogjuk. Ezt az utols cselekvst az
esemnykalkulus mechanizmusval az albbi mdon rhatjuk le:
306
Inicilizl(Kikeres(a, TelefonSzma(b)),
TudjaMi(a, TelefonSzma(b), SzmjegyFzr), t)
Az informcigyjt s az azt felhasznl terveket sokszor rviden futsi idej vltozknak (runtime
variables) nevezzk, ami a korbban lert rtkbehelyettest vltoz konvencijhoz szorosan kapcsoldik.
Bla telefonszmnak a kikeressre, majd a trcszsra vonatkoz tervet az albbi alakban fel lehet rni:
[Kikeres(gens, TelefonSzma(Bla), n), Trcsz(n)]
Itt n egy futsi idej vltoz, aminek rtkt a Kikeres cselekvs fogja rgzteni, s amit majd a Trcsz
cselekvs felhasznlhat. Az ilyen tervek srn elfordulnak a rszben megfigyelhet trgyterleteken. Ltni
fogunk erre pldkat a kvetkez alfejezetben s a 12. fejezetben.
5. Az internetes bevsrls vilga

Ebben az alfejezetben az internetes bevsrlssal kapcsolatos tuds egy rszt fogjuk kdolni. Egy olyan
vsrl-kutat genst fogunk tervezni, amely segti a vsrlnak az interneten megtallni a termkek ajnlatait.
A vsrl gens a vsrltl a termk lerst kapja s feladata a termk eladst hirdet weblapok listjt
ellltani. Egyes esetekben a vsrl lersa pontos lesz, mint amilyen pldul a Coolpix 995 digitlis
fnykpezgp a feladat ekkor a legjobb ajnlatot tev boltot megtallni. Ms esetekben a lers csak rszben
lesz specifiklt, mint pldul a 300 dollrnl olcsbb digitlis fnykpezgp, s az gens knytelen lesz
klnbz termkeket sszehasonltani.
A vsrl gens krnyezete az egsz vilghl ami semmikppen sem egy jtkkrnyezet. Ugyanaz a
komplex, folyamatosan evolvl krnyezet, amit az emberek millii mindennap hasznlnak. Az gens rzetei
weblapok, de amg egy emberi webfelhasznl a lapokat a kpernyre kivettett pixelek formjban ltja, a
vsrl gens a lapokat karakterfzrek alakjban fogja rzkelni, ahol kznsges szavak keverednek a HTML
jellnyelv formattl utastsaival. A 10.7. bra egy weblapot mutat s a hozz tartoz HTML-karakterfzrt.
A vsrl gens rzkelsi problmjnak lnyege a hasznos informcinak az ilyen fajtj rzetbl val
kiemelse.
Vilgos, hogy weblapokat rzkelni egyszerbb, mint mondjuk, Kairban taxi vezetse kzben rzkelseket
szerezni. Az internetes rzkels mgsem mentes a bonyodalmaktl. A 10.7. brn lthat weblap igen egyszer
a valdi vsrlsi lapokhoz kpest, ahol tallkozni lehet olyan elemekkel, mint stik, Java, Javascript, Flash,
robot kizr protokollok, elgpelt HTML, hangfjlok, filmfelvtelek s egy JPEG kp rszeknt megjelen
szvegek. Egy gens, amely kpes az internet egszvel elbnni, majdnem olyan bonyolult, mint egy robot,
amely a valdi vilgban kpes mozogni. Mi egy egyszer gensre sszpontostunk, amely e bonyodalmak zmt
nem fogja figyelembe venni.
Az gens els feladata, hogy relevns termkajnlatokat talljon (majd ksbb megltjuk, hogy a relevns
ajnlatok kzl hogyan kell kivlasztani a legjobbat). Legyen a lekrdezs a termknek a felhasznl ltal
begpelt lersa (pldul laptop), akkor egy weblap a lekrdezs szempontjbl relevns ajnlat, ha a lap
relevns s tnyleg egy ajnlat. A lappal kapcsolatos URL-t is nyomon fogjuk kvetni:
RelevnsAjnlat(lap, url, lekrdezs) Relevns(lap, url, lekrdezs) Ajnlat(lap)
A legmodernebb laptopot bemutat lap relevns lenne, ha azonban a vsrlsra nem ad lehetsget, nem ajnlat.
Egyelre azt fogjuk mondani, hogy egy lap ajnlat, ha a lapon egy HTML-hivatkozson, vagy rlapon bell a
vsrol vagy az ra szavakat tartalmazza. Ms szval, ha a lap tartalmaz egy <a vsrol </a> alak
fzrt, akkor ez egy ajnlat. A vsrol helyett lehetne az ra, illetve az a helyett a form. Felrhatjuk
ennek axiomatikus alakjt:
10.7. bra - Egy absztrakt online bolt weblapja, ahogy egy bngszt hasznl ember
ltja (fell), s a hozz tartoz HTML-fzr, ahogy azt a bngsz vagy a vsrl gens
ltja (alul). A HTML-ben a < s a > kztti karakterek a jell direktvk, amelyek
meghatrozzk, hogy a lapot hogyan kell kijelezni. Az <i>Vlasszon</i> fzr pldul
jelzi, hogy dlt betre kell tkapcsolni, a Vlasszon szt kijelezni s a dlt bet
hasznlatt befejezni. Egy lapazonost, mint amilyen a http://absz-bolt.com/zene az n.
egysges erforrs azonost (uniform resource locator, URL).Az <a
307
href="url">hivatkozs</a> bejells jelzi, hogy az url fel ltesteni kell egy

hipertextkapcsolatot a hivatkoz szveg (anchor text) hivatkozssal.
Ajnlat(lap) (Cmkben(a, fzr, lap)

Cmkben(form, fzr, lap))
(Benne(vsrol, fzr)) Benne(ra, fzr))
Cmkben(cmke, fzr, lap) Benne(< + cmke + fzr + </ + cmke, lap)
Benne(alfzr, fzr) i
fzr[i : i + Hossza(alfzr)] = alfzr
Most szksges relevns lapokat tallni. A stratgia az online bolt honlapjtl kezdeni, s azokkal a lapokkal
foglalkozni, amelyet a relevns linkek mentn el lehet rni.8 gensnk szmos boltrl fog tudni, pldul:
Amazon OnlineBolt HonLap(Amazon, amazon.com)
Ebay OnlineBolt HonLap(Ebay, ebay.com)
ltBolt OnlineBolt HonLap(ltBolt, lt-bolt.com)
E boltok termkeit termkkategrikba soroljk, s a f kategrikhoz linkeket biztostanak a honlaptl

kiindulva. Kisebb kategrikat a relevns linkek lncnak kvetsvel lehet elrni, s vgl az ajnlatokhoz is
eljutunk. Ms szval, egy lap a lekrdezs szempontjbl relevns, ha a bolt honlapjtl a relevns
kategriakapcsolat lncn t elrhet, s egy tovbbi link kvetsvel a termkajnlathoz is eljutunk:
Relevns(lap, url, lekrdezs)
bolt, hon bolt OnLineBolt Honlap(bolt,hon)
url2 RelevnsLnc(hon, url2, lekrdezs) Link(url2, url)
lap = VeddElLapot(url)
A Link(tl, ig) prediktum jelentse, hogy a tl URL-tl az ig URL-ig ltezik egy hiperhivatkozs (lsd 10.13.
feladat). Hogy a RelevnsLnc-ot definilhassuk, nem valamilyen rgi hiperhivatkozst kell kvetnnk, hanem
azokat, amelyeknl a csatolt hivatkoz szveg jelzi, hogy a hivatkozs a lekrdezs szempontjbl relevns.
Erre a LinkSzveg(tl, ig, szveg)-et fogjuk hasznlni, melynek jelentse, hogy ltezik egy hivatkozs tl-tl igig, szveg-gel mint hivatkoz szveggel. A start s a vge URL-ek kztti hivatkozslnc a d lers
A hivatkozskvet stratgia alternatvja egy internetkeres gpnek a hasznlata. Az internetkeressrl, az informcikinyers mgtt
hzd technolgikrl a 23.2. alfejezetben lesz sz.
8
308
szempontjbl relevns, ha minden hivatkozs hivatkoz szvege a d szempontjbl relevns kategrianv. A

lnc ltezst egy rekurzv definci biztostja, az res lnccal (start = vge) mint kiindul llapottal:
RelevnsLnc(start, vge, lekrdezs) (start = vge)
(u, szveg LinkSzveg(start, u, szveg)
RelevnsKategriaNv(lekrdezs, szveg)
RelevnsLnc(u, vge, lekrdezs))
Most definilnunk kell, hogy egy lekrdezs szempontjbl egy szveg mikor lesz egy RelevnsKategriaNv.
Elszr tudnunk kell a fzreket s az ltaluk megnevezett kategrikat kapcsolatba hozni. J lesz erre a Nv(s,
c), amely azt lltja, hogy az s fzr a c kategria neve mondhatjuk pldul hogy Nv(laptop,
LaptopSzmtgp). A Nv prediktumra tovbbi pldk a 10.8. brn tallhatk. A kvetkez a relevancia
definilsa. Tegyk fel, hogy a lekrdezs a laptop. RelevnsKategriaNv(lekrdezs, szveg) igaz lesz,
feltve, hogy az albbiak kzl egy teljesl:
A szveg s a lekrdezs ugyanazt a kategrit nevezi meg pldul laptop szmtgp s laptop.
A szveg egy szuperkategrit nevez meg, mint pldul szmtgp.
A szveg egy alkategrit nevez meg, mint pldul ultraknny laptop.
A RelevnsKategriaNv logikai defincija az albbi:
RelevnsKategriaNv(lekrdezs, szveg)
c1, c2 Nv(lekrdezs, c1) Nv(szveg, c2) (c1 c2) (c2 c1) (10.1)
Msklnben a hivatkoz szveg irrelevns, mert egy, ezen a vonulaton kvli kategrit nevez meg, mint
pldul a mainframe szmtgp vagy pzsit s kert.
Hogy kpesek legynk relevns kapcsolatokat kvetni, lnyeges, hogy rendelkeznnk kell a termkek gazdag
kategriahierarchijval. E hierarchia legfels rsze hasonlthat pldul a 10.8. brn lthat hierarchira. Nem
lenne j tlet az sszes lehetsges bevsrlsi kategrit listzni, mert a bevsrlnak mindig lehetnek j
kvnalmai, s a termkgyrtk mindig j termkekkel fognak elrukkolni, hogy a vsrlkat kielgtsk
(elektromos trdmelegt?). Egy, mondjuk ezer kategribl ll ontolgia azonban a vsrlk tbbsge
szmra hasznos eszkznek fog bizonyulni.
10.8. bra - (a) A termkkategrik taxonmija. (b) Ezen kategrik szmra a

hivatkoz szvegek.
309
A termkhierarchin tlmenen rendelkeznnk kell a kategrianevek gazdag sztrval. Az let sokkal

egyszerbb lenne, ha a kategrik s az azokat megnevez fzrek kztt egy-egyrtelm kapcsolat llna fenn.
A szinonima (synonymy) problmjt kt nv, pldul laptop szmtgp s laptop ugyanazon kategria
szmra mr lttuk. Van mg tovbb az egyrtelmsts (ambiguity) problmja egy nv kt vagy tbb
klnbz kategria szmra. Ha pldul a 10.8. (b) brn lthat tudsbzishoz a:
Nv(CD, DiplomataJrm)
mondatot is hozzadjuk, akkor a CD kt klnbz kategrit fog megnevezni.

A szinonimk s az egyrtelmsts lnyegesen megnvelheti az gens ltal kvetend utak szmt, s nha
megneheztheti annak eldntst, hogy egy adott lap tnyleg relevns-e. Sokkal komolyabb problma, hogy a
felhasznl ltal begpelhet lersok vagy a bolt ltal hasznlt kategrianevek vlasztka igen szles lehet. A
link pldul a laptop-rl szlhat, holott a tudsbzis csak laptopok-rl tud, vagy pedig a felhasznl egy
szmtgpet keres, amely elfrne a Boeing 737 turistaosztlyn az tkezasztalkn. Lehetetlen elre vgig
felsorolni egy kategria megnevezseinek minden vltozatt, gy az gensnek bizonyos esetekben tovbb kell
kvetkeztetnie, hogy kidertse, rvnyes-e a Nv relci. A legrosszabb esetben ez a termszetes nyelv teljes
megrtst ignyeln, mely tma trgyalst a 22. fejezetig ksleltetjk. A gyakorlatban nhny egyszer
szably, mint pldul engedlyezni, hogy a laptop illeszkedjen a laptopok kategrira, igen jl szuperl. A
10.5. feladatban megkrjk majd az olvast, hogy egy ilyen szablykszletet fejlesszen ki, azt kveten, hogy az
online boltokban egy kicsit krbenzett.
Az elbbi bekezdsben megadott logikai definci, valamint a termkkategrikat s a megnevezsi
konvencikat tartalmaz megfelel tudsbzisok birtokban kszek vagyunk-e mr, hogy a lekrdezsnkre
vonatkoz relevns ajnlatok halmazt kikvetkeztet algoritmust alkalmazzuk? Mg nem! A hinyz elem a
VeddElLapot(url) fggvny, amely egy adott url cmen lv HTML lapra hivatkozik. Az gens nem
rendelkezik a tudsbzisban minden URL lap tartalmval, s az ilyen tartalom kitallsra vonatkoz explicit
szablyokkal sem rendelkezik. Ehelyett elintzhetjk, hogy amikor egy rszcl a VeddElLapot fggvnyre
hivatkozik, a megfelel HTTP eljrs fog meghvdni. A kvetkeztet gp szmra ily mdon mintha az egsz
vilghl jelenne meg a tudsbzisban. Ez az n. procedurlis kibvtsknt (procedural attachment) ismert
ltalnos mdszer egy pldja, ahol az egyes prediktumokat s fggvnyeket specilis rendeltets eljrsokkal
kezeljk.
5.1. Ajnlatok sszehasonltsa

Tegyk fel, hogy az elbbi rszfejezet kvetkeztetsi eljrsa a laptop lekrdezsnkre tbb ajnlatlapot is
adott vissza. Az ajnlatok sszehasonltshoz az gensnek a lapokbl relevns informcit r, sebessg,
diszkkapacits, sly stb. ki kell nyerni. Az elbb emltett okoknl fogva, valdi weblapok esetn, ez igen
nehz feladatnak bizonyulhat. E problma kezelsnek megszokott mdja a laprl informcit kinyer n.
csomagolprogramok (wrappers) hasznlata. Az informcikinyers technolgijval a 23.3. alfejezetben
foglalkozunk. Egyelre felttelezzk, hogy csomagolprogram ltezik, s egy lap s a tudsbzis birtokban a
tudsbzishoz tnyeket ad hozz. A lapra tipikusan csomagolprogramok egsz hierarchijt lehetne alkalmazni.
Egy ltalnosat a dtumok s az rak kinyershez, egy specifikusabbat, hogy a szmtgpes termkek
attribtumait tallja meg, vgl, ha szksges, egy weboldal-specifikust, amely az adott bolt
weboldalformtumt is tudja. Ha az lt-bolt.com egy weboldalt tartalmaz:
YVM ThinkBook 970. ra: 300.000.- Ft
szveggel, amit mindenfle technikai specifikci kvet, a csomagoltl elvrnnk, hogy az albbi informcit
nyerje ki:
lc, ajnlat lc LaptopSzmtgp ajnlat TermkAjnlat
KpernyNagysg(lc, Cm(32)) KpernyTpus(lc, SznLCD)
MemriaNagysg(lc, Mbyte(512)) CPUSebessg(lc, GHz(2,4))
AjnlottTermk(ajnlat, lc) Bolt(ajnlat, AbsztBolt)
URL(ajnlat, abszt-bolt.com/szg/34356.html)
ra(ajnlat, Ft(300000)) Dtum(ajnlat, Ma)
310
Ez a plda nhny olyan problmt hivatott megmutatni, amelyek akkor jelentkeznek, ha a kereskedelmi
tranzakcikhoz szksges tudsszervezst komolyan vesszk. Vegyk szre pldul, hogy az r az ajnlatnak,
s nem magnak a termknek az attribtuma. Ez fontos, mert egy adott bolt ajnlata naprl napra vltozhat, akr
ugyanarra az egyedi laptopra nzve. Egyes kategrik esetn mint pldul a hzak s a festmnyek esetn
ugyanazt az egyedi objektumot klnbz kzvettk egy idben klnbz ron is ajnlhatjk. Tbb
bonyodalom is elkpzelhet, amelyek kezelsvel nem foglalkoztunk. Ilyen pldul annak a lehetsge, hogy az
r fgghet a fizets mdjtl, vagy hogy a vsrlra bizonyos kedvezmnyek vonatkozhatnak. sszegezve, sok
rdekes munka mg htramaradt.
Az utols feladat a kiemelt ajnlatok sszehasonltsa. Tekintsk pldul az albbi hrom ajnlatot:
A: 2,4 GHz CPU, 512 Mbyte RAM, 80 Gbyte diszk, DVD, CDRW, 350000 Ft
B: 2,0 GHz CPU, 1 Gbyte RAM, 120 Gbyte diszk, DVD, CDRW, 400000 Ft
C: 2,2 GHz CPU, 512 Mbyte RAM, 80 Gbyte diszk, DVD, CDRW, 400000 Ft
A C-t az A dominlja. Az A olcsbb s gyorsabb, klnben ugyanolyan. ltalnossgban azt mondjuk, hogy X
dominlja Y-t, ha X legalbb egy attribtum esetben kedvezbb rtk, s semmilyen ms attribtum esetben
sem rosszabb. Az A s a B kzl egyik sem dominlja a msikat. Hogy megllaptsuk, melyik a jobb, tudnunk
kell, hogy a vsrl hogyan mrlegeli a CPU sebessgt s rt a memrihoz s a diszkkapacitshoz kpest.
Tbbszrs attribtum esetben a preferencik ltalnos trgyalst a 16.4. alfejezet tartalmazza. Most az
gensnk egyszeren ki fogja jelezni a vsrl lersval megegyez, nem dominlt ajnlatok listjt. Ebben a
pldban sem az A, sem a B nem dominlt. Jegyezzk meg, hogy ez az eredmny azon a feltevsen alapul, hogy
mindenki jobban kedveli az olcsbb rakat, a gyorsabb processzorokat s a nagyobb trat. Bizonyos
attribtumok, mint pldul a notebook kpernymrete, a vsrl partikulris preferenciitl fggenek (a
hordozhatsg a lthatsggal szemben). Az ilyenekrl a vsrl gensnek a felhasznlt kell krdeznie.
A lert vsrl gens egy egyszer rendszer, s szmos finomtsa lehetsges. Mgis elegend a kpessge arra,
hogy a megfelel terletspecifikus tudssal a vsrlt tnylegesen tudja segteni. Deklaratv konstrukcija miatt
knnyen felsklzhat bonyolultabb alkalmazsokhoz. Ennek az alfejezetnek a f clja az volt, hogy
kimutassuk, hogy bizonyos tudsreprezentci klnskppen a termk hierarchija szksges az ilyen
tpus gensek szmra, s ha mr az ilyen formj tuds rendelkezsre ll, a tbbi mr nem is olyan nehz egy
tudsalap gens szmra.
6. Kvetkeztet rendszerek kategrik szmra

Lttuk, hogy a kategrik alapvet ptkocki brmely nagyobb mret reprezentcis smnak. Ebben az
alfejezetben a kategrik szervezshez s a kategrikkal val kvetkeztetshez clzottan megtervezett
rendszereket mutatjuk be. Kt szoros kapcsolatban lv rendszercsaldrl beszlhetnk. A szemantikus hlk
(semantic network) grafikus segtsget nyjtanak a tudsbzis vizualizlsban, s hatkony algoritmusokat
biztostanak, hogy egy objektum tulajdonsgait a kategrihoz val tartozsbl kikvetkeztessk. A ler
logikk (description logics) formlis nyelvet adnak a kategriadefincik konstrulshoz s kombinlshoz,
valamint hatkony algoritmusokat annak eldntshez, hogy a kategrik kztt fennll-e a rszhalmaz- s a
szuperhalmaz-relci.
6.1. Szemantikus hlk

1909-ben Charles Peirce egy egzisztencilis grfoknak (existential graphs) elnevezett grafikus jellsrendszert
javasolt, ami az elnevezse szerint a jv logikja. Ezzel kezdett vette a logika s a szemantikus hlk
szszlinak hossz vitja. Sajnos a vita elfedte azt a tnyt, hogy a szemantikus hlk legalbb a jl definilt
szemantikval elltottak a logika egy formjt jelentik. Bizonyosfajta lltsok szmra a szemantikus hlk
nyjtotta jells gyakran knyelmesebb, azonban ha az emberi interfsz problmktl eltekintnk, a mgtte
felsorakoz fogalmak az objektumok, a relcik, a kvantifikls stb. mind ugyanazok.
A szemantikus hlknak tbb vltozata van, mindegyik kpes azonban az egyedi objektumokat, az objektumok
kategriit s az objektumok kztti relcikat reprezentlni. A tipikus grafikus jells objektumok, illetve
kategrik neveit ovlis keretekben vagy dobozokban mutatja, cmkzett lekkel sszekapcsolva. A 10.9. brn
pldul a Mria s a NnemSzemly kztt Tagja kapcsolat van, ami annak a logikai lltsnak felel meg, hogy
Mria NnemSzemly. Hasonlan a Mria s a Jnos kztti Hga kapcsolat annak az lltsnak felel meg,
311
hogy Hga(Mria, Jnos). A kategrikat a Rszhalmaza llel kapcsolhatjuk ssze. A krumplik s a nyilak
rajzolsa annyira szrakoztat, hogy knny ksrtsbe esni. Tudjuk pldul, hogy minden szemly anyja egy
nnem szemly, szabad-e akkor a Szemly-tl a NnemSzemly-ig egy Anyja lt hzni? A vlasz nem,
merthogy az Anyja egy relci egy szemly s az anyja kztt, a kategriknak viszont nincsen anyjuk.9 Emiatt
a kapcsolatra a 10.9. brn egy kln jellst hasznltunk egy ketts vonallal trtn bekeretezst. Ez a
kapcsolat azt lltja, hogy:
x x Szemly [y Anyja(x, y) y NnemSzemly]
Esetleg azt is llthatnnk, hogy egy szemlynek kt lba van, azaz:

x
x Szemly Lba(x, 2)
Mint korbban, most is vatosnak kell lennnk, nehogy azt lltsuk, hogy kategrinak van kt lba. A 10.9.
bra egyszeres vonallal vgzett keretezse jelzi az egy kategria minden tagjnak tulajdonsgaira vonatkoz
lltst.
A szemantikus hl jellsrendszere igen alkalmas a 10.2. alfejezetben bevezetett tpus rkldses
(inheritance) kvetkeztets vgrehajtsra. gy szemly rvn, Mria rkli azt a tulajdonsgot, hogy kt lba
van. Ahhoz, hogy kitalljuk, hny lba van Mrinak, az rkldses algoritmus kveti a Tagja lt a Mri-tl
az t tartalmaz kategriig, majd a Rszhalmaza lt a hierarchiba felfel, amg egy olyan kategrit nem tall
meg, amelyhez ltezik egy bekeretezett Lba l ebben ez esetben ez Szemly kategria lesz. Ennek az
rkldses algoritmusnak az egyszersge s hatkonysga a logikai ttelbizonythoz kpest, a szemantikus
hlk egyik f vonzereje volt.
Az rklds komplikldik, amikor egy objektum egyszerre tbb kategrihoz tartozhat, vagy pedig amikor
egy kategria tbb kategria rszhalmaza. Ezt az esetet tbbszrs rkldsnek (multiple inheritance)
nevezzk. Az ilyen helyzetben a rkldses algoritmus esetleg kt vagy tbb, egymssal ellenttes vlaszt tall
a felkrsre. Ennl fogva a tbbszrs rklds bizonyos objektumorientlt programozsi (object-oriented
programming, OOP) nyelvekbl, mint amilyen pldul a Java, ami az osztlyhierarchiban rkldst hasznl,
ki van zrva. Szemantikus hlkban a tbbszrs rkldst ltalban megengedjk, de ennek rszletes
trgyalst a 10.7. alfejezetre hagyjuk.
10.9. bra - Egy szemantikus hl ngy objektummal (Jnos, Mria, 1 s 2) s ngy

kategrival. A relcikat a cmkzett lek jellik
Bizonyos rendszerek nem tudtak klnbsget tenni egy kategria tagjnak tulajdonsgai s kategria mint egsz tulajdonsgai kztt. Ez
egyenes ton vezethet inkonzisztencikhoz, ahogy ezt Drew McDermott kiemelte az Artificial Intelligence Meets Natural Stupidity cm
cikkben (McDermott, 1976). Ms gyakori problma volt a rszhalmaz s a tagsg kapcsolatoknl alkalmazott IsA vlasztssal, az angol
hasznlatnak megfelelen: a cat is a mammal (a macska egy emls) s Fifi is a cat (Fifi egy macska). E tmkrl tbbet lsd 10.25.
feladat.
9
312
A kvetkeztets msik kznsges formja az inverz kapcsolatok (inverse links) hasznlata. Pldul a
VanHga a Hga inverze, azaz:
p, s VanHga(p, s) Hga(s, p)
Ezt az lltst megfogalmazhatjuk szemantikus hlval, feltve hogy a kapcsolatok reifikltak (reified), azaz
nll objektumnak tekinthetk. gy pldul VanHga objektumot az Inverze llel lehetne sszekapcsolni a
Hga objektummal. Ha egy lekrdezs azt firtatn, hogy ki Jnosnak a Hga, az rkldses algoritmus
felfedezheti, hogy a VanHga a Hga inverze, s a lekrdezst gy megvlaszolhatja, hogy a VanHga
kapcsolatot Jnos-tl Mri-ig kveti vgig. Az inverz informci nlkl esetleg szksges lehetne az sszes
nnem szemlyt megvizsglni, van-e netn Hga kapcsolata Jnossal. Ez amiatt van gy, mert a szemantikus
hl kzvetlen indexelst csak az objektumok, a kategrik s a bellk indul kapcsolatok esetn biztost. Az
elsrend logika nyelvben ez annak felel meg, mintha a tudsbzist a prediktumok csakis els argumentumai
szerint indexelnnk.
Az olvas taln felfedezte mr a szemantikus hl jellsnek egy nyilvnval htrnyt az elsrend logikhoz
kpest. A krumplik kztti lek csak binris relcikat reprezentlnak. A Repl(Shankar, NewYork, jdelhi,
Tegnap) lltst a hlban kzvetlenl megfogalmazni nem tudjuk. Az n rtk lltsok hatst megkaphatjuk
azonban, ha az lltst magt egy, az esemnyek megfelel kategrijhoz tartoz esemnyknt reifikljuk (lsd
10.3. alfejezet). A 10.10. bra ehhez a konkrt esemnyhez tartoz szemantikus hlstruktrt mutat. Jegyezzk
meg, hogy a binris relcikra vonatkoz korltozs a reifiklt fogalmak gazdag ontolgijt teszi szksgess.
Az ebben a fejezetben kifejlesztett ontolgia zme tnylegesen a szemantikus hls rendszerekben gykerezik.
10.10. bra - A szemantikus hl egy rszlete, amely a Repl(Shankar, NewYork,

jdelhi, Tegnap) logikai llts reprezentcijt valstja meg
313
lltsok reifiklsa lehetv teszi, hogy az elsrend logika minden rgztett, fggvnymentes atomi lltsa
reprezentlhat szemantikus hls jellssel. Univerzlisan kvantifiklt lltsok bizonyos tpusai
reprezentlhatk a kategrikra alkalmazott inverz kapcsolatok, valamint egyszeresen s ktszeresen
bekeretezett lek alkalmazsval, ettl mg persze az elsrend logiktl messze vagyunk. A negls, a
diszjunkci, a begyazott fggvnyszimblumok s az egzisztencilis kvantifikls mind hinyzik. Manapsg
lehetsges a jells kiterjesztse, hogy az az elsrend logikval ekvivalens legyen ilyenek pldul a Piercefle egzisztencilis grfok vagy Hendrix-fle particionlt szemantikus hlk (Hendrix, 1975) ez viszont a
szemantikus hlk f elnyt az rkldses folyamat egyszersgt s tlthatsgt semmisti meg. A
tervezk nagy hlkat pthetnek, s mg mindig lehetnek j tleteik, hogy mely lekrdezsek lesznek
hatkonyak, mert (a) az rkldses eljrs lpseit knny vizualizlni, (b) egyes esetekben a lekrdezs
nyelve olyan egyszer, hogy bonyolult lekrdezseket feltenni nem is lehet. Azokban az esetekben, amikor a
kifejezer tlsgosan korltozott, szmos szemantikus hlrendszer a procedurlis kiegsztshez
(procedural attachment) folyamodik, hogy a hinyokat kitltse. A procedurlis kiegszts egy olyan mdszer,
amikor egy bizonyos relcira vonatkoz lekrdezs (nha llts) egy, a relcihoz megtervezett specilis
eljrs, s nem egy ltalnos rkldses algoritmus meghvst eredmnyezi.
A szemantikus hlk egyik legfontosabb aspektusa, hogy kpesek a kategrik szmra az alaprtelmezett
rtkeket (default values) reprezentlni. A 10.9. bra gondos vgignzsvel szrevehetjk, hogy Jnosnak egy
lba van annak ellenre, hogy egy szemly, s minden szemlynek kt lba van. Egy tisztn logikai
tudsbzisban ez egy ellentmonds lenne, de a szemantikus hlban az az llts, hogy minden szemlynek kt
lba van, egy alapeseti llts, azaz egy szemlyrl felttelezzk, hogy kt lba van, ha nincs ezzel ellentmond
specifikusabb informci. Az alapeseti szemantikt termszetesen az rkldses kvetkeztets knyszerti ki,
mert a kapcsolatokat magtl az objektumtl (itt Jnostl) felfel kveti, s megll, hacsak egy rtket meg nem
tall. Azt mondjuk, hogy az alapeseti rtket egy specifikusabb rtk fellrhatja (overridden). Vegyk szre,
hogy lbak szmt fell tudnnk rni egy EgyLbSzemly kategria ltestsvel, ami a Szemly Rszhalmaza
lenne, s amelynek Jnos lenne a tagja.
A hl szigoran logikai szemantikjt megtarthatjuk, ha azt mondjuk, hogy a Lba llts a Jnosra vonatkoz
kivtelt tartalmazza:
x x Szemly x Jnos Lba(x, 2)
Egy rgztett hl esetn ez szemantikusan megfelel, azonban ha sok kivtelnk lesz, kevsb tmr lesz a
felrsunk, mint a hls jells maga. Tbb lltssal frisstett hl esetn az ilyen megkzelts sajnos kudarcra
van tlve amit valjban mondani szeretnnk az az, hogy minden, egyelre mg ismeretlen egylb szemly
szintn kivtelnek szmt. Ezzel a tmval s az alapeseti kvetkeztetssel ltalban bvebben a 10.7. alfejezet
foglalkozik.
6.2. Ler logikk

Az elsrend logika szintaxist gy terveztk, hogy egyszer legyen objektumokrl kijelentseket tenni. A ler
logikk (description logics) olyan jellsek, amelyeket a kategrik definciinak s tulajdonsgainak
knnyebb lersra terveztek. A ler logikk a szemantikus hlkbl alakultak ki, vlaszul arra a nyomsra,
hogy a hlk jelentst formalizljuk, hangslyozva emellett a taxonmia szervezsi elvknt val hasznlatt.
314
A ler logika alapvet kvetkeztetsi feladata a rszvizsglat (subsumption) annak ellenrzse, hogy egy
kategria rsze-e egy msiknak a definciik alapjn s az osztlyozs (classification) annak ellenrzse,
hogy egy objektum egy kategriba tartozik-e. Bizonyos rendszerek egy kategriadefinci
konzisztenciavizsglatt (consistency) is tartalmazzk arra, hogy a tagsgi kritrium logikailag kielgthet-e.
10.11. bra - A lersok szintaxisa a CLASSIC nyelv egy rszhalmazban
A CLASSIC nyelv (Borgida s trsai, 1989) egy tipikus ler logika. A 10.11. bra mutatja a CLASSIC lersok
szintaxist (az rthetsg kedvrt a nyelv kulcsszavait magyar fordtsban adjuk meg a ford.).10 Azt az lltst
pldul, hogy az agglegnyek ntlen, felntt frfiak, kvetkezkppen rhatnnk le:
Agglegny = s(Ntlen, Felntt, Frfi)
Ennek elsrend logikai ekvivalense a kvetkez lenne:

Agglegny(x) Ntlen(x) Felntt(x) Frfi(x)
Vegyk szre, hogy a ler logika hatkonyan teszi lehetv azt, hogy a prediktumokon direkt logikai
mveleteket hajtsunk vgre anlkl, hogy elszr mondatokat alkotnnk, amiket azutn sszekapcsolunk
ktszavakkal. Brmilyen lers a CLASSIC-ban kifejezhet elsrend logikval, de bizonyos lersok a
CLASSIC-ban sokkal vilgosabbak. Pldul az emberek egy olyan halmaznak lershoz, akiknek legalbb
hrom fiuk van, s a fik mind munkanlkliek, s a felesgeik orvosok, valamint maximum kt lnyuk van,
akik vagy fizika, vagy matematika tanszken professzorok, azt hasznlnnk, hogy:
s(Frfi, Legalbb(3, Fi), Legfeljebb(2, Lny),
Mind(Fi, s(Munkanlkli, Hzas, Mind(Felesg, Orvos))),
Mind(Lny, s(Professzor, Betlt(Tanszk, Fizika, Matematika))))
Gyakorlatknt meghagyjuk ennek lefordtst elsrend logikra.

A ler logikk taln egyik legfontosabb aspektusa a kvetkeztets nyomon kvethetsgre tett hangsly. Egy
problmaeset megoldsa a lersval kezddik, majd annak megkrdezsvel folytatdik, hogy rsze-e a
lehetsges megolds a kategrik egyiknek. Standard elsrend logikban a vlasz idejnek megjslsa
gyakran lehetetlen. Gyakran a felhasznlra vr a reprezentci olyan talaktsa, hogy kikerlje azokat a
mondathalmazokat, amelyek miatt gy tnik, hogy a rendszernek tbb htbe telik a problma megoldsa. A
ler logikk viszont azt biztostjk, hogy a rszvizsglat megoldhat legyen polinomilis id alatt a problma
lerstl fggen.11
Vegyk szre, hogy a nyelv nem engedi meg annak lltst, hogy az egyik fogalom vagy kategria egy msiknak a rsze. Ez egy
tgondolt irnyvonal: a kategrik kztti rszviszonyt a kategrik bizonyos aspektusaibl kell tudni levezetni. Ha ez nem sikerl, akkor
valami hinyzik a lersbl.
11
A CLASSIC nyelv a gyakorlatban hatkony rszvizsglatot biztost, a legrosszabb eset azonban exponencilis futsidej.
10
315
Ez a gyakorlatban csodlatosan hangzik, mg az ember r nem jn, hogy a kvetkez kt konzekvencia

valamelyike lehetsges csak: a nehz problmkat vagy nem lehet kifejezni, vagy exponencilisan nagy lerst
ignyelnek! Mindenesetre a kezelhetsg eredmnyei vetnek nmi fnyt arra, hogy milyen konstrukcik
okoznak bajt, s gy segtik a felhasznlt annak megrtsben, hogyan viselkednek klnbz reprezentcik.
Pldul a ler logikkbl ltalban hinyzik a negls s a diszjunkci. Ezek mindketten arra knyszertik az
elsrend logikai rendszert, hogy lnyegben egy exponencilis eset analzisen menjen keresztl a teljessg
biztostsa rdekben. A negls s a diszjunkci ugyanezen ok miatt van kizrva a Prolog nyelvbl is. A
CLASSIC csak egy korltozott formj diszjunkcit engedlyez a Kitlt s az EgyBelle szerkezetekben, ami
lehetv tesz diszjunkcit explicit mdon megszmolt egyedek felett, de nem a lersok felett. Diszjunktv
lerssal az egymsba gyazott defincik knnyen exponencilis szm alternatv thoz vezethetnek,
amelyekben az egyik kategria knnyen rsze lehet egy msiknak.
7. Kvetkeztets alaprtelmezett informcival

Az elbbi alfejezetben lttunk egy egyszer pldt egy alaprtelmezett sttussal rendelkez lltsra: az
embereknek kt lba van. Ezt az alaprtelmezett rtket specifikusabb informcival, mint pldul a
Kkszakllnak egy lba van, fellrhatjuk. Lttuk, hogy a szemantikus hl rkldsi mechanizmusa az
alaprtelmezett rtkek fellrst egyszer s termszetes mdon oldja meg. Ebben a rszben az
alaprtelmezett rtkeket mlyebben tanulmnyozzuk annak rdekben, hogy az alaprtelmezett rtkek
szemantikjt alaposabban megrtsk, s ne szortkozzunk csupn a procedurlis mechanizmus megadsra.
7.1. Nyitott s zrt vilgok

Tegyk fel, hogy egyetemen a szmtstudomnyi tanszk hirdettbljt nzzk, s azt az zenetet ltjuk,
hogy: Az albbi tantrgyakat fel lehet venni: SZT 101, SZT 102, SZT 106 s VIM 101. Prbljuk most
megvlaszolni, vajon hny trgyat lehet felvenni? Ha a vlasza az, hogy ngy, ez megegyezik egy tipikus
adatbzis vlaszval. Ha adott egy relcis adatbzisa:
Tantrgy(SZT, 101), Tantrgy(SZT, 102), Tantrgy(SZT, 106),
Tantrgy(VIM, 101) (10.2)
ngy llts megfeleljvel, a count * from Tantrgy SQL-felkrs 4-es vlasszal tr vissza. Msfell egy
elsrend logikai rendszer vlasza az lenne, hogy egy s vgtelen kztt valahny, s nem ngy. Ennek
magyarzata, hogy a Tantrgy llts nem zrja ki, hogy ms, nem emltett tantrgyakat is fel lehessen venni, s
azt sem, hogy az emltett tantrgyak mind klnbzk.
A plda mutatja, hogy az adatbzisok s az emberi kommunikci konvencija az elsrend logiktl legalbb
kt aspektusban klnbzik. Elszr, az adatbzisok (s az emberek) felttelezik, hogy a megadott informci
teljes, vagyis hogy az igazknt ki nem jelentett rgztett atomi formulkrl felttelezhetjk, hogy hamisak. Ez az
n. zrt vilg felttelezs (closed-world assumption, CWA). Msodszor, elfogadjuk ltalban, hogy
klnbz nevek klnbz objektumokat jelentenek. Ez az n. egyedi elnevezsek felttelezs (unique
names assumption, UNA), amit a cselekvs-nevek kontextusban elszr a 10.3. alfejezetben vezettnk be.
Az elsrend logika e konvencikhoz nem folyamodik, gy preczebbnek kell lennie. Hogy kijelentsk, csak
ngy klnbz tantrgyat lehet vlasztani, azt kellene rni, hogy:
Tantrgy(d, n) [d, n] = [SZT, 101] [d, n] = [SZT, 102]
[d, n] = [SZT, 106] [d, n] = [VIM, 101] (10.3)
A (10.3) egyenletet a (10.2) lezrsnak12 (completion) nevezzk. A lezrs ltalban minden prediktumhoz
egy defincit, egy akkor s csak akkor lltst rendel hozz. Minden definciban mindegyik, a prediktumot
a fejben tartalmaz definit klzhoz egy diszjunkci fog tartozni. 13 A lezrst ltalnossgban az albbi mdon
szerkesztik meg:
1. Gyjtsk ki az ugyanolyan (P) prediktum nvvel s (n) aritssal rendelkez klzokat.
12
13
A felfedezjrl, Keith Clarkrl nha Clark-lezrsnak is nevezik.

Jegyezzk meg, hogy ez egyben a 10.3. alfejezetben megadott kvet llapot aximk alakja is.
316
2. Minden klzt az n. Clark Norml Formra (Clark Normal Form) transzformljuk: cserljk a:
P(t1,, tn) Trzs
kifejezst, ahol a ti-k termek, a:

P(t1,, tn) w1 wm [v1,, vn] = [t1,, tn] Trzs
kifejezsre, ahol a vi-k az jonnan bevezetett vltozk s a wi-k az eredeti klz vltozi. Hasznljuk minden klz
esetn a vi vltozk ugyanazon halmazt. Eredmnyknt a:
P(v1,, vn) B1
.
.
.
P(v1,, vn) Bk
klzok halmazt kapjuk.

3. Kombinljuk ezeket ssze egy nagy diszjunktv klzz:
P(v1,, vn) B1 Bk
4. Zrjuk le azltal, hogy a -at ekvivalencira cserljk:

P(v1,, vn) B1 Bk
A Clark-lezrs egy pldjt szablyokat s rgztett tnyeket tartalmaz tudsbzis esetn a 10.12. brn
lthatjuk. Hogy hozzadhassuk az egyedi elnevezsek felttelezst is, egyszeren adjuk meg az azonossgi
relci Clark-lezrst, ahol csak azok az ismert tnyek, hogy SZT = SZT s 101 = 101 stb. Ennek
megvalstst gyakorlskppen meghagyjuk az olvasnak.
10.12. bra - Horn-klzok egy halmaznak Clark-lezrsa. Az eredeti Horn-program

(balra) ngy tantrgyat emlt explicit mdon, s azt is lltja, hogy minden egszre a 101
s a 130 kztt ltezik egy matematikai trgy, meg azt is, hogy minden SZT trgyhoz a
100-as (BSc) sorozatban ltezik egy megfelel tantrgy a 200-as (MSc) sorozatban. A
Clark-lezrs (jobbra) azt mondja, hogy ms tantrgy nincs is. A lezrssal s az egyedi
elnevezsek felttelezssel (valamint az Egsz prediktum nyilvnval defincijval)
egytt eljutunk a kvnt konklziig, miszerint pontosan 36 tantrgy van: 30
matematikai s 6 SZT trgy.
A zrt vilg felttelezs lehetv teszi, hogy megtalljuk egy relci minimlmodelljt (minimal model). Ez
azt jelenti, hogy a Tantrgy relcihoz a legkevesebb elemet tartalmaz modellt tallhatjuk meg. A (10.2)
egyenletben a Tantrgy minimlmodellje ngyelem, kevesebb mr ellentmondshoz vezet. Horn-klz
317
tudsbzisok esetn mindig ltezik egy egyrtelm minimlmodell. Jegyezzk meg, hogy az egyedi elnevezsek
felttelezs mellett ez az azonossgi relcira is vonatkozik: minden term csakis sajt magval azonos. Paradox
mdon ez azt jelenti, hogy a miniml modellek egyben maximlisak abban az rtelemben, hogy annyi
objektumot tartalmaznak, amennyi csak lehetsges.
Lehetsges egy Horn-program Clark-lezrst kpezni, majd a kvetkeztetsek levonsa vgett egy
ttelbizonytnak tadni. Hatkonyabb azonban ltalban egy olyan specilis rendeltets kvetkeztet gpet
hasznlni, mint amilyen a Prolog, amelynl a zrt vilg s az egyedi elnevezsek felttelezsek a kvetkeztetsi
mechanizmusba be vannak ptve.
Akik a zrt vilg felttelezshez folyamodnak, vatosan kell megvlasztaniuk az ltaluk hasznlt kvetkeztetst.
Egy npszmllsi adatbzisban pldul, sszer a zrt vilg felttelezst hasznlni, ha a kvetkeztets a
vrosok populcijrl trtnik, de nyilvn helytelen konklzi lenne elfogadni, hogy a jvben nem szletnek
gyerekek, csakis annak alapjn, hogy az adatbzis a jvbeli szletsi bejegyzseket nem tartalmazza. A zrt
vilg felttelezs az adatbzist teljess (complete) teszi abban az rtelemben, hogy minden atomi lekrdezsre
vagy pozitv, vagy negatv vlaszt kapunk. Ha valamely tnyllsrl (mint pldul a jvbeli szletsek) tnyleg
tudatlanok vagyunk, a zrt vilg felttelezst hasznlni nem szabad. Egy komplikltabb tudsreprezentcis
rendszerben a felhasznlnak esetleg szabad lenne specifiklni a zrt vilg felttelezs hasznlatt ler
szablyokat.
7.2. Negls mint kudarc s stabil modell szemantika

A 7. s a 9. fejezetekben lttuk, hogy Horn-klz formj tudsbzisnak kedvez szmtstechnikai tulajdonsgai
vannak. Sok alkalmazsban azonban nem knyelmes azt biztostani, hogy klzok trzseiben csak pozitv
literlok legyenek. Szeretnnk pldul azt mondani, hogy Kimehetsz, ha nem esik, anlkl hogy olyan
prediktumokhoz kellene folyamodni, mint a NemEsik. Ebben a rszben annak a lehetsgt kutatjuk, hogy a
Horn-klzokhoz az explicit negls egy formjt adjuk hozz a negls mint kudarc (negation as failure)
tlett felhasznlva. Az tlet az, hogy egy negatv not P literlt igaznak bizonythatunk, hasonlan, mint
ahogy P bizonytsa kudarcba fulladhat. Ez az alapeseti kvetkeztets egy formja, ami a zrt vilg
felttelezshez szorosan kapcsoldik: ttelezzk fel, hogy valami hamis, ha nem bizonythat, hogy igaz. Hogy
a negls mint kudarc-ot a logikai opertortl megklnbztethessk, megjellsre a not-ot fogjuk
hasznlni.
A Prolog megengedi a not opertort egy klz trzsben. Tekintsk pldul az albbi Prolog programot:
IDEmeghajt Meghajt not SCSImeghajt
SCSImeghajt Meghajt not IDEmeghajt
SCSIvezrl SCSImeghajt
Meghajt
Az els szably azt mondja, hogy ha szmtgpben merevlemez-meghajtnk van, s ez nem SCSI, akkor IDEnek kell lennie. A msik szably azt mondja, hogy ha ez nem IDE, akkor SCSI-nek kell lennie. A harmadik azt
mondja, hogy az SCSI-meghajt ltezse egy SCSI-vezrlt ttelez fel, vgl a negyedik kijelenti, hogy tnyleg
van egy meghajt. Ennek a programnak kt minimlmodellje van:
M1 = {Meghajt, IDEmeghajt}
M2 = {Meghajt, SCSImeghajt, SCSIvezrl}
A minimlmodellek nem kpesek a negls mint kudarc-ot hasznl programok szndkolt szemantikjt
kifejezni. Tekintsk a kvetkez programot:
P not Q
Ennek kt minimlmodellje van: {P} s {Q}. Az elsrend logika szemszgbl van ennek rtelme, mivel a P
Q a P Q-val ekvivalens. A Prolog szemszgbl azonban aggdni kellene: Q soha nem jelenik meg a nyl
bal oldaln, hogyan lehet ht egy kvetkezmny?
Egy alternatva a stabil modell (stable model), ami egy olyan minimlmodell, ahol minden atomnak igazolsa
(justification) van, azaz ltezik hozz olyan szably, amelyben a fej az atom, s ahol a trzs minden literlja
318
kielgtett. Formlisan M egy H program egy stabil modellje, ha M a H az M-re vonatkoz redukltjnak
(reduct) egy egyrtelm minimlmodellje. Egy H program redukltjt gy definiljuk, hogy H-bl elszr
minden olyan szablyt trlnk, amely trzsben a not A literl szerepel, ahol A a modell rsze, majd a marad
szablyokban a negatv literlokat trljk. Mivel H redukltja most mr egy Horn-klz lista, egy egyrtelm
minimlmodellel kell rendelkeznie.
A P not Q redukltja a {P}-re nzve maga a {P}, aminek minimlmodellje {P}. gy {P} egy stabil modell. A
{Q}-ra vonatkoz redukci egy res program, aminek minimlmodellje {}. {Q} teht nem stabil modell, mert
Q-nak a (10.5) egyenletben nincs igazols. Egy msik plda a (10.4) redukltjra az M1-re nzve:
IDEmeghajt Meghajt
SCSIvezrl SCSImeghajt
Meghajt
Ennek minimlmodellje M1, gy M1 egy stabil modell. A vlaszhalmaz programozs (answer set
programming) a logikai programozsnak a negls mint kudarc-cal bvtett fajtja, amely gy mkdik, hogy a
logikai programot rgztett formba transzformlja, majd stabil modelleket (amelyeket vlaszhalmazoknak
answer sets is neveznek) keres, tletkalkulus modell-ellenrzsi technikkat felhasznlva. A vlaszhalmazprogramozs leszrmazottja teht mind a Prolognak, mind az olyan gyors tletkalkulus-beli kielgthetsgi
ttelbizonytknak, mint a WALKSAT. A vlaszhalmaz programozst sikerrel alkalmaztk tervksztsi
problmkra, hasonlan az tletkalkulus-beli kielgthetsgi ttelbizonytkhoz. A vlaszhalmaz-programozs
elnye ms tervksztkkel szemben a rugalmassga: a tervkszt opertorokat s a knyszereket logikai
programokkal fejezi ki, s gy azok nem ktdnek a konkrt tervksztsi formalizmus korltozott
formtumhoz. A vlaszhalmaz-programozs htrnya ugyanaz, mint minden tletkalkulus szint technik: ha
az univerzumban tl sok objektum ltezik, egy exponencilis lassulssal kell szmolnunk.
7.3. Krlrs s alapeseti logika

Kt pldt lttunk, ahol ltszlag termszetes kvetkeztetsi folyamatok megsrtik a logika a 7. fejezetben
bebizonytott monotonits (monotonicity) tulajdonsgt.14 Az els pldban egy szemantikus hlban egy
kategria sszes tagja ltal megrklt tulajdonsgot egy alkategrira vonatkoz specifikusabb informci
fellrhatja. A msik pldban a zrt vilg felttelezsbl szrmaztatott neglt literlokat pozitv literlok
hozzadsa szintn fellbrlja.
Ha egy kicsit magunkba nznk, rjvnk, hogy a monotonits ilyen srlsei a jzan sz kvetkeztetsben igen
elterjedtek. gy tnik, az emberek gyakran elhamarkodott kvetkeztetseket vonnak le. Ha az utcn parkol
kocsit ltunk, mindenki elhiszi, hogy a kocsinak ngy kereke van, holott csak hrom kerk ltszik (ha valaki a
negyedik kerk ltezsben ktelkedik, akkor vegye fontolra azt a krdst, vajon a hrom lthat kerk valdie, vagy csupn a valdinak egy paprmsa.) A valsznsg-elmlet nyilvn igazolhatja, hogy a negyedik kerk
nagy valsznsggel ltezik, az emberek tbbsgben az a lehetsg, hogy a gpkocsinak esetleg nincs ngy
kereke, egyltaln fel sem merl, hacsak valami j tnylls erre nem dert fnyt. A ngy kerk konklzijt
teht alapesetknt kezeljk, a ktelkedsre okot ad tnyek hinyban. Ha j tnyek rkeznek szrevesszk
pldul, hogy a tulajdonos a kereket elviszi, s a gpkocsi egy emeln ll akkor a konklzit vissza kell vonni.
Az ilyen kvetkeztetsrl azt mondjuk, hogy nemmonoton (nonmonoton), mert a hiedelemek halmaza idvel,
ahogy az j evidencik megjelennek, nem nvekszik monoton mdon. Az ilyen viselkeds lersra
nemmonoton logikkat (nonmonoton logics) fejlesztettek ki, mdostott igazsgdefincival s
vonzatrelcival. Kt ilyen intenzven tanulmnyozott logikt fogunk megnzni: a krlrst s az alapeseti
logikt.
A krlrst (circumscription) a zrt vilg felttelezs ersebb s preczebb vltozatnak lehetne tekinteni. Az
tlet, hogy konkrt prediktumokat specifiklunk, amelyekrl felttelezzk, hogy amennyire csak lehetsges
hamisak azaz minden objektumra hamisak, kivve azokat, amelyekre tudjuk, hogy igazak. Tegyk fel
pldul, hogy ki akarjuk jelenteni azt az alaprtelmezett szablyt, hogy a madarak tudnak replni. Vezessk be
az Abnormlis1(x) prediktumot, s rjuk fel:
Madr(x) Abnormlis1(x) Repl(x)
Emlkezznk vissza, hogy a monotonits megkveteli, hogy minden vonzatllts igaz maradjon, amikor a tudsbzishoz j lltsokat
adunk hozz. Azaz ha TB , akkor TB .
14
319
Ha azt mondjuk, hogy az Abnormlis1-et krl kell rni (circumscribed), a krlr kvetkeztet felttelezheti,
hogy Abnormlis1(x), hacsak az Abnormlis1(x)-et nem fogja igaznak tallni. Ez lehetv teszi, hogy a
Repl(Tweety) konklzit levonjuk a Madr(Tweety) premissza alapjn, azonban a konklzi csak addig igaz,
amg az Abnorml(Tweety)-t ki nem jelentjk.
A krlrst a modellpreferencia-logika (model preference logic) egy pldjnak is tekinthetjk. Az ilyen
logikkban egy llts vonzatrelciban van (alapeseti sttuson), ha igaz a tudsbzis minden preferlt
modelljben, ellenttben a klasszikus logika igazsgkvetelmnyvel, hogy minden modellben legyen igaz.
Krlrs esetben egy modell egy msiknl preferltabb, ha kevesebb abnormlis objektuma van. 15 Nzzk
meg, hogy ez az tlet hogyan mkdik szemantikus hlban fellp tbbszrs rklds esetn. A tbbszrs
rklds standard pldja az n. Nixon-gymnt.16 Az eredete az a megfigyels, hogy Richard Nixon egy
kvker vallsi szekthoz tartozott (s gy alapesetben pacifista) s republiknus is volt (s gy alapesetben ppen
nem pacifista). Ezt az albbi mdon rhatjuk fel:
Republiknus(Nixon) Kvker(Nixon)
Republiknus(x) Abnormlis2(x) Pacifista(x)
Kvker(x) Abnormlis3(x) Pacifista(x)
Ha az Abnormlis2-t s az Abnormlis3-at krlrjuk, kt preferlt modellt kapunk: az egyikben igaz az

Abnormlis2(Nixon) s a Pacifista(Nixon), a msikban igaz az Abnormlis3(Nixon) s a Pacifista(Nixon). A
krlr kvetkeztet rendszer teht megfelelen tudatlannak mutatkozik a pacifista Nixon gyben. Ha ezentl
szeretnnk kijelenteni, hogy a vallsos meggyzdsek elsbbsget lveznek a politikai nzetekkel szemben, a
prioritsos krlrs (prioritized circumscription) formalizmust hasznlhatjuk, hogy azoknak a
modelleknek adjunk elsbbsget, ahol az Abnormlis3 minimlizlva van.
Az alaprtelemzett logika (default logic) egy olyan formalizmus, ahol alaprtelmezett szablyokat (default
rules) lehet rni feltteles, nemmonoton kvetkeztetsek generlshoz. Egy alaprtelmezett szably a
kvetkezkppen nz ki:
Madr(x) : Repl(x) /Repl(x)
A szably jelentse, hogy ha a Madr(x) igaz, s ha a Repl(x) a tudsbzissal konzisztens, akkor a Repl(x)-et
alaprtelmezsben lekvetkeztethetjk. ltalnossgban egy alaprtelmezett szably formja a:
P : J1, , Jn/C
ahol P-t elfelttelnek, C-t konkluzinak s a Ji-ket igazolsoknak nevezik ha ezek kzl brmelyik
igazolhatan hamis, a konklzit levonni nem szabad. A C-ben s a Ji-ben elfordul minden vltoznak P-ben
is meg kell jelennie. A Nixon-gymnt pldjt alaprtelmezett logikban egy tnnyel s kt alaprtelmezett
szabllyal fejezhetjk ki:
Republiknus(Nixon) Kvker(Nixon)
Republiknus(x) : Pacifista(x)/ Pacifista(x)
Kvker(x) : Pacifista(x) /Pacifista(x)
Egy alaprtelmezett szably jelentsnek interpretlshoz az alaprtelmezett elmlet kiterjesztst (extension)

kell definilnunk, az elmlet konklziinak maximlis halmazaknt. Egy S kiterjeszts teht az eredetileg ismert
tnyekbl s az alaprtelmezett szablyokbl levont konklzihalmazbl ll gy, hogy S-bl semmilyen ms
konklzit levonni mr nem lehet, s S-beli alaprtelmezett konklzi minden igazolsa S-sel konzisztens. A
krlrsban trgyalt preferlt modellekhez hasonlan a Nixon-gymntra kt lehetsges kiterjesztsnk van:
egy, amelyben pacifista s egy, amelyben nem az. Lteznek prioritsos smk, ahol egyes alaprtelmezett
szablyoknak precedencit lehet biztostani ms szablyokkal szemben, s ezzel a nem egyrtelm helyzeteket
valamelyest fel lehet oldani.
A zrt vilg felttelezsnl egy modell egy msiknl preferltabb, ha kevesebb igaz atomja van azaz a preferlt modellek
minimlmodellek. A CWA s a definit klz tudsbzis kztt ltezik termszetes kapcsolat, mert az ilyen tudsbzisban az elrecsatolt
kvetkeztets rvn elrt fix pont az egyrtelm minimlmodell (4.2. szakasz - Elre- s htrafel lncolsrszben).
16
A gymnt elnevezs a kt ton fut rkldsi lnc grfszer alakjtl szrmazik. (A ford.)
15
320
1980 ta, amikor is a nemmonoton logikkat els zben javasoltk, igen nagy elrehalads trtnt a matematikai
tulajdonsguk megrtsben. A ksi 1990-es vektl kezdve a logikai programozson alapul gyakorlati
rendszerek gretesnek bizonyultak a tudsreprezentcis eszkzk szerepben. Vannak azonban mg meg nem
vlaszolt krdsek. gy pldul ha a gpkocsiknak ngy kerekk van hamis, mit is jelent, ha egy ilyen llts a
tudsbzis rsze? Milyen az alaprtelmezett szablyok egy j halmaza? Ha minden szablyrl kln-kln nem
tudjuk eldnteni, hogy a tudsbzisunkhoz tartozik-e, akkor igen komoly problmnk van a modularits
hinyval. Vgl, hogyan lehet alaprtelmezett sttussal rendelkez hiedelmeket a dntshozatalban
felhasznlni? Ez taln az alaprtelmezett kvetkeztets legnehezebb problmja. A dntsek sokszor
kompromiszszumokkal jrnak egytt, s gy szksg van klnbz cselekvsek eredmnyeknt megjelen
hiedelmek erssgt sszehasonltani. Azokban az esetekben, amikor ugyanilyen jelleg dntsket sokszor
hozunk meg, lehetsg addik, hogy az alaprtelmezett szablyokat kszb-valsznsgi lltsokknt
rtelmezzk. Pldul a fkjeim rendben vannak alaprtelmezett szably valjban azt jelenti, hogy annak a
valsznsge, hogy a fkjeim rendben vannak, feltve, hogy ms informcim nincs, elegenden magas ahhoz,
hogy az optimlis dnts szmomra az, hogy induljak tnak a fkek ellenrzse nlkl. Amikor a dnts
kontextusa megvltozik pldul amikor egy slyosan megrakott teherkocsit vezetnk egy lejts hegyi ton ,
az alaprtelmezett szably hirtelen alkalmatlann vlik, akkor is, ha semmilyen j evidencink nincs, ami azt
sugalln, hogy a fkek hibsak. Az ilyen mrlegelsek nhny kutatt arra vezettek, hogy mrlegeljk, hogyan
gyazzk be az alaprtelmezett kvetkeztetst a valsznsg-elmletbe.
8. Igazsg-karbantart rendszerek
Az elbbi rszben arrl rveltnk, hogy egy tudsreprezentcis rendszer ltal levont sok kvetkeztetsnek
csupn alaprtelmezett s nem tkletesen biztos sttusa lehet. Az ilyen kikvetkeztetett konklzikbl nhny
szksgszeren hibsnak fog bizonyulni, s j informci fnyben vissza kell vonnunk. Ez a hiedelemrevzi
(belief revision) folyamata.17 Tegyk fel, hogy a tudsbzis tartalmazza P lltst az elrecsatolt algoritmussal
levont alaprtelmezett konklzit vagy egyszeren egy hibs felttelezst , s szndkunkban ll vgrehajtani
az LLT (TB, P)-t. Hogy az ellentmondst elkerljk, elszr vgre kell hajtani a VISSZAVON (TB, P)-t. Ez
elg egyszernek tnik. Problma akkor jelentkezik, ha P-bl tovbbi lltsokat kvetkeztettnk le s
jegyeztnk fel a tudsbzisba. A P Q implikcit pldul felhasznltuk a Q tudsbzishoz val
hozzadshoz. A nyilvnval megolds a P-bl kikvetkeztetett sszes llts visszavonsa kudarcba fut,
mert ilyen lltsoknak P-n tlmenen ms igazolsuk is lehet. Ha R s R Q is bekerlt a tudsbzisba, akkor
Q-t mgsem kell eltvoltanunk. Az igazsg-karbantart rendszereket (truth maintenance systems) ilyen
bonyodalmakat kezelsre terveztk.
Az igazsg-karbantarts egyszer mdja, hogy nyomon kvetjk, ahogyan sorban hozzadjuk a mondatokat a
tudsbzishoz, a mondatok P1-tl Pn-ig trtn megszmozsval. Amikor a VISSZAVON (TB, Pi) hvs
megtrtnik, a rendszert a Pi hozzadsa eltti llapotba lltjuk vissza, a Pi-t s a Pi-bl levont sszes
kvetkeztetst visszavonva. Ha szksges, akkor a Pi+1 s a Pn kztti mondatok ismt hozzadhatk. Ez
egyszer megolds, s garantlja, hogy a tudsbzis konzisztens lesz, de azt jelenti, hogy a Pi visszavonsa n i
llts visszavonst s jbli kijelentst, valamint ezen lltsokbl trtn kvetkeztetsek visszavonst s
jbli lefuttatst ignyli. Olyan rendszerekben, ahol sok tny kerl hozzadsra, az ilyen megolds nem
praktikus.
Hatkonyabb megkzelts az igazolsalap igazsg-karbantart rendszer vagy JTMS (justification-based
truth maintenance system). Egy JTMS-ben a tudsbzis minden mondatt olyan igazolssal (justification)
ltjk el, amely meghatrozza azokat a mondatokat, amelyekbl lekvetkeztettk azokat. Pldul ha a tudsbzis
mr tartalmazza a P Q-t, akkor az LLT (P) hatsra a Q-t hozzadjuk, az {P, P Q} igazolssal.
ltalnossgban bizonyos mondatoknak egynl tbb igazolsa lehet. Az igazolsok felhasznlhatk hatkony
visszavonsokra. A VISSZAVON (P) hvst kveten, a JTMS pontosan azokat a mondatokat fogja a
tudsbzisbl eltvoltani, amelyeknl P minden igazols rsze. gy, ha egy Q mondatnak a {P, P Q} lenne az
egyetlen igazolsa, akkor trldne; ha az {P, P R Q} igazolsa is ltezne, mg mindig visszavonsra
kerlne, de ha az {R, P R Q} igazolsa is ltezne, akkor megmaradna. Ily mdon a P visszavonshoz
szksges id csakis azon mlik, hogy P-bl hny lltst vezettnk le, s nem azon, hogy P hozzadsa utn
hny llts kerlt mg be a tudsbzisba.
A hiedelemrevzit sokszor a hiedelemfrisstssel (belief update) lltjk szembe, amelyrl akkor van sz, amikor a tudsbzis inkbb a
vilgbeli vltozsok hatsra, s nem a rgztett vilgrl befut j informci hatsra kerl fellvizsglsra. A hiedelemfrissts
sszekapcsolja a hiedelemrevzit az idre s a vltozsra vonatkoz kvetkeztetssel. Kapcsolatban ll a 15. fejezetben lert szrs
(filtering) folyamatval.
17
321
A JTMS felttelezi, hogy az egyszer figyelembe vett mondatokat mskor is hasznlni fogjuk, gy ahelyett, hogy
trlnnk a tudsbzisbl, amikor elvesztik az sszes igazolst, csak megjelljk ket, mint kintlevket. Ha egy
ksbbi llts visszalltja az igazolsok egyikt, akkor a mondat ismt bentlev jellst kap. Ily mdon a
JTMS megtartja a hasznlt sszes kvetkeztetsi lncot, s nem kell jra lekvetkeztetnie azokat a mondatokat,
amelyek igazolsa ismt rvnyess vlik.
Azon tl, hogy a TMSek a hibs informcit visszavonjk, felhasznlhatk a tbbszrs hipotetikus helyzet
elemzsnek a felgyorstshoz is. Tegyk fel, hogy a Romn Olimpiai Bizottsg helyszneket keres a 2048-ban
Romniban megrendezend olimpiai jtkokhoz az sz, a knnyatltikai s a lovas versenyszmok szmra.
Legyen az els hipotzis a kvetkez: Helyszn(szs, Piteti), Helyszn(Knnyatltika, Bukarest) s
Helyszn(Lovasverseny, Arad). A vlaszts logisztikai kvetkezmnyeinek kidertshez, s gy a helysznek
kvnatossgnak meghatrozshoz igen sok kvetkeztets szksges. Ha figyelembe akarjuk venni a
Helyszn(Knnyatltika, Nagyszeben)-t, a TMS elkerli annak a szksgessgt, hogy jra nullbl induljunk
ki. Egyszeren viszavonjuk a Helyszn(Knnyatltika, Bukarest)-t, s hozzadjuk a Helyszn(Knnyatltika,
Nagyszeben)-t, s a TMS a szksges revzikat magra vllalja. A Bukarestre vonatkoz kvetkeztetsi lncok
Nagyszeben esetn jrafelhasznlhatk, feltve, hogy a konklzik ugyanazok lesznek.
Egy felttelezsalap igazsg-karbantart rendszert (assumption-based truth maintenance system,
ATMS) arra terveztek, hogy ezt a fajta hipotetikus vilgok kztti kontextustkapcsolst kifejezetten
hatkonny tegye. Egy JTMS-ben az igazolsok karbantartsa lehetv teszi, hogy az egyik llapotbl gyorsan
egy msikba lpjnk t nhny visszavonssal s kijelentssel, de minden idpillanatban csak egyetlen llapotot
reprezentlunk. Egy ATMS az sszes llapotot egyszerre reprezentlja, amivel valaha is foglalkoztunk. Mg egy
JTMS egyszeren bent- vagy kintlevnek jelli a mondatokat, egy ATMS nyomon kveti, minden egyes
mondatra, hogy a mondatot mely felttelezsek tennk igazz. Ms szavakkal minden egyes mondatnak van egy
cmkje, amely a felttelezs halmazokat tartalmaz halmazbl ll. A mondat csak azon esetben ll fenn, amikor
egy felttelezs halmaz sszes felttelezse fennll.
Az igazsg-karbantart rendszerek mechanizmust biztostanak magyarzatok (explanations) generlshoz is.
Technikailag, P mondat magyarzatt olyan E mondatok halmazval definiljuk, melyekre E maga utn vonja
P-t. Ha E mondatai igazak, akkor E egyszeren P igazolshoz egy szksgszer alap. Azonban a magyarzat
rszei lehetnek felttelezsek (assumptions) is olyan lltsok, amelyek nem igazak, de ha igazak lennnek,
elegendk lennnek P igazolshoz. Lehetsges pldul, hogy nincs elg tny bebizonytani, hogy az aut nem
fog indulni, de egy j magyarzat rsze lehet az elromlott akkumultor. Ez, sszekapcsolva a gpkocsik
mkdsre vonatkoz tudssal, elegend, hogy a megfigyelt jelensget megmagyarzza. Az esetek
tbbsgben egy minimlis E magyarzatot fogunk preferlni, azaz olyan magyarzatot, amelynek nincs olyan
megfelel rszhalmaza, amelyik szintn egy magyarzat lenne. Egy ATMS a gpkocsi nem indul
problmhoz magyarzatokat generl azltal, hogy tetszleges sorrendben felttelezseket tesz (mint pldul
benzin a tankban vagy hibs az akkumultor), akkor is, ha azok egy rsze ellentmondsos. Elg majd a
gpkocsi nem indul llts cmkjt megnzni, hogy az lltst igazol felttelezsek halmazt megismerjk.
Az igazsg-karbantart rendszereket megvalst algoritmusok egy kicsit komplikltak, s itt nem trgyaljuk
ket. Az igazsg-karbantartsi problma komplexitsa legalbb olyan nagy, mint az tletlogikai kvetkeztets
azaz NP-teljes. Ezrt nem vrhat el az, hogy az igazsg-karbantarts csodaszer legyen. Ugyanakkor, ha
krltekinten hasznljk, a TMS-rendszer lnyegesen javthat egy logikai rendszer komplex krnyezeteket s
hipotziseket kezel kpessgn.
9. sszefoglals
Ez a fejezet eddig a knyv legrszletesebb fejezete. Azzal, hogy sokfle tuds reprezentlsnak rszleteivel
foglalkozunk, remlheten rzkeltetni tudtuk az olvasval, hogy hogyan hozhatk ltre valdi tudsbzisok. A
lnyegi tmk az albbiak:
Nagymret tudsreprezentci egy ltalnos rendeltets ontolgit ignyel, a specifikus problmaterletek
szervezshez s az egymssal val sszekapcsolshoz.
Egy ltalnos ontolginak a tuds szles vlasztkt kell lefednie, s elvben kpesnek kell lennie brmilyen
problmaterlet kezelsre.
Bemutattunk egy fels ontolgit (upper ontology), amely a kategrikon s az esemnykalkuluson alapul.
Foglalkoztunk strukturlt objektumokkal, az idvel s a trrel, a vltozssal, folyamatokkal, szubsztancikkal
s hiedelmekkel.
322
A cselekvseket, az esemnyeket s az idt vagy szitucikalkulusban, vagy az olyan nagyobb kifejezerej

reprezentcikban, mint az esemnykalkulus vagy a foly esemny kalkulus fejezhetjk ki. Az ilyen
reprezentcik rvn egy gens cselekvsi terveket konstrulhat logikai kvetkeztets segtsgvel.
Egy gens mentlis llapotait a hiedelmeket jelent fzrekkel lehet reprezentlni.
Az internetes bevsrlsi problmaterlet rszletes elemzst mutattuk be ltalnos ontolgia bevetsvel,
megmutatva, hogy egy bevsrl gens hogyan hasznlhatja a problmaterleti tudst.
A kategriahierarchia szervezshez specilis rendeltets rendszereket terveztek, mint pldul a
szemantikus hlk (semantic nets) s a ler logikk (description logics). A kvetkeztets fontos esete az
rklds (inheritance), mely rvn az objektumok tulajdonsgait a kategriatagsgukbl ki lehet
kvetkeztetni.
A logikai programokban a zrt vilg felttelezst (closed-world assumption) implementljuk, hogy
rengeteg negatv informci megadst elkerlhessk. A legjobb, ha ezt alapeseti helyzetnek tekintjk, amit
tovbbi informci fellrhat.
A nemmonoton logikk (nonmonotonic logics), amilyen pldul a krlrs (cirumscription) vagy az
alapeseti logika (default logic), az ltalnos alapeseti kvetkeztets lersra kszltek. Nemmonoton
kvetkeztetst a vlaszhalmaz-programozs (answer set programming) lnyegesen gyorstja, hasonlan
ahhoz, ahogy a WALKSAT meggyorstja az tletlogikai kvetkeztetst.
Az igazsg-karbantart rendszerek (truth maintenance systems) hatkonyan kezelik a tudsfelfrisstst s
a tudsrevzit.

Hihetnek hangzik (Briggs, 1985), hogy a formlis tudsreprezentci kezdete a ssztrai szanszkrit nyelvtanrl
alkotott klasszikus indiai elmletekkel kezddtt az i. e. els vezredben.18 A nyugati vilgban az kori grg
matematikusok ltal hasznlt defincik tekinthetk a tudsreprezentci legkorbbi megjelensnek. Tny,
hogy a mszaki szhasznlat vagy egy mestersges nyelv kialaktsa, brmilyen terletrl van is sz, tekinthet
a tudsreprezentci egyfajta formjnak.
Az MI-ben a reprezentcikrl folytatott korai vitk inkbb a problmareprezentcira, mint a
tudsreprezentcira irnyultak [lsd pldul a misszionriusok s kanniblok problmjrl szl Amareltl
szrmaz elemzst (Amarel, 1968)]. Az 1970-es vekben az MI-ben a hangsly a szakrt rendszerek
(tudsalap rendszereknek is nevezett) fejlesztsn volt, amelyek a megfelel problmaterleti tuds
birtokban, szkebb definilt feladatok esetn, az emberi szakrtk hatkonysgt megkzeltettk, vagy akr
tl is szrnyaltk. Az els szakrt rendszer, a DENDRAL, pldul a tmegspektromter (a szerves vegyi anyagok
struktraelemzst segt berendezs) kimeneti adatait kpes volt szakrt vegyszek szintjn interpretlni
(Feigenbaum s trsai, 1971; Lindsay s trsai, 1980). Br a DENDRAL sikere meghatroz volt abban, hogy az
MI kutati rbredjenek a tudsreprezentci fontossgra, a benne alkalmazott reprezentcis formalizmusok
igen specifikusak voltak, s kifejezetten a vegyszeti problmaterlethez alaktottk ki azokat. Idvel a kutatk
a szabvnyostott tudsreprezentcis formalizmusok s az ontolgik fel fordultak, hogy gy a korbban mg
fel nem trt terleteken alkalmazand j szakrt rendszerek ellltsi nehzsgeit cskkentsk. Eme kutats
rvn olyan terletre merszkedtek ki, amit korbban a tudomnyfilozfusok s a nyelvszettel foglalkoz
filozfusok mveltek. Az elmletek munkba lltsval az MI terletn kialakult j diszciplna sokkal
mlyebb s gyorsabb elrehaladshoz vezetett a korbbi idkhz kpest, amikor ezek a problmk kizrlag a
filozfia trgyt kpeztk (br idnknt elfordult a spanyolviasz ismtelt felfedezse is).
tfog taxonmik, illetve osztlyozsok megalkotsa az kori idkig nylik vissza. Az osztlyozsi s
kategorizlsi smk fontossgt nyomatkosan hangslyozta Arisztotelsz. Halla utn hallgati rvn
megszerkesztett Organon, amely logikai munkk gyjtemnye volt, tartalmazta a Kategrik c. tanulmnyt is,
amelyben Arisztotelsz megksrelt kimert osztlyozst adni arra, amit ma fels ontolginak neveznk.
Alacsonyabb szint osztlyozs cljra bevezette a faj (genus) s a fajta (species) fogalmakat, br e fogalmak
akkor nlklztk a ma velk asszocilt precz s specifikusan biolgiai jelentst. A biolgiai osztlyozs mai
rendszert, belertve a binomilis nmenklatrt (technikai rtelemben a faj-, fajtaalap osztlyozst) is,
Carolus Linnaeus vagy mskppen Carl von Linn (17071778), svd biolgus tallta fel. A termszetes
18
A szanszkrit nyelv tbb vltozata kzl a ssztrai szanszkrit a valls s a tudomny nyelve. (A ford.)
323
fajtkkal s a pontatlan kategriahatrokkal kapcsolatos problmkkal tbbek kzt Wittgenstein, Quine, Lakoff
s Schwartz foglalkozott (Wittgenstein, 1953; Quine, 1953; Lakoff, 1987; Schwartz, 1977).
Az rdeklds a nagymret ontolgik irnt nvekszik. A CYC projekt (Lenat, 1995; Lenat s Guha, 1990)
kapcsn egy kb. 60 000 tnyt s 6000 fogalmat tartalmaz fels ontolgit hoztak nyilvnossgra, s egy sokkal
nagyobb globlis ontolgit szabadalmaztattak. Az IEEE ltrehozta a P1600.1 albizottsgot a Standard Upper
Ontology Working Groupot, az Open Mind Initiative viszont tbb mint 7000 internetfelhasznlt krt fel, hogy
tbb mint 400 000 tnyt vigyenek be kzhasznlat fogalmakrl. A weben alakulban vannak az olyan
standardok, mint az RDF, az XML s a szemantikus hl (Berners-Lee s trsai, 2001), mbr azokat mg nem
hasznljk szles krben. A Formal Ontology in Information Systems (FOIS) konferencikon sok rdekes cikket
publiklnak mind terletspecifikus, mind ltalnos ontolgikrl.
A jelen fejezetben kialaktott taxonmia a szerzktl szrmazik, s rszben azokon a tapasztalatokon alapul,
melyeket a CYC projektbl nyertek, rszben Hwang, Schubert s Davis munkjra tmaszkodva (Hwang s
Schubert, 1993; Davis, 1990). Jzan sz reprezentcis projekt inspirl viti Hayes The Naive Physics
Manifestjban jelentek meg (Hayes, 1978; 1985b).
Az idt, a vltozst, a cselekvseket s az esemnyeket mind az MI-ben, mind a filozfiban s az elmleti
szmtstudomnyban intenzven tanulmnyoztk. A legrgebbi megkzelts a temporlis logika (temporal
logic), ami egy specilizlt logika, ahol minden modell egy teljes trajektrit r le az (ltalban lineris vagy
elgaz) idben, a statikus relcis struktrk helyett. A logika modlis opertorokat (modal operators)
tartalmaz, amelyeket lltsokra alkalmaznak. A p azt jelenti, hogy p a jvben minden pillanatban igaz lesz,
a p pedig azt, hogy p a jvben valamikor igaz lesz. A temporlis logika tanulmnyozst az kori
Grgorszgban Arisztotelsz, valamint a Megara s a sztoikus iskola kezdemnyezte. A modern idkben
elsnek Findlay vetette fel az idrl val kvetkeztets formlis kalkulusnak a gondolatt (Findlay, 1941),
azonban a legnagyobb hatsnak Arthur Prior munkssga szmt (Prior, 1967). J tanknyvek Rescher s
Urquhart, valamint van Benthem munki (Rescher s Urquhart, 1971; van Benthem, 1983).
Az elmleti szmtstudomny kutati rgta rdekldtek az irnt, hogy szmtsi cselekvsek szekvencijaknt
rtelmezett programok tulajdonsgait hogyan lehetne formalizlni. A modlis logikt szmtgpes
programokrl val kvetkeztetsre Burstall vezette be (Burstall, 1974). Rvidesen utna Vaughan Pratt a
dinamikus logikt (dynamic logic) dolgozta ki (Pratt, 1976), amelyben a modlis opertorok programok vagy
ms cselekvsek hatst jelzik (lsd mg Harel, 1984). gy pldul ha dinamikus logikban egy program neve,
akkor [] p azt jelenti, hogy p igaz lesz a vilg minden olyan llapotban, amely az programnak a jelenlegi
llapotbl val indtsbl szrmazik. Az p pedig azt jelenti, hogy p igaz lesz a vilg legalbb egy
olyan llapotban, amely az program mostani llapotbl val indtsbl szrmazik. Programok konkrt
elemzsre a dinamikus logikt Fischer s Ladner hasznlta (Fischer s Ladner, 1977). Pnueli programokrl
val kvetkeztetsre klasszikus temporlis logikt javasolt (Pnueli, 1977).
A temporlis logikban az idt ltalban a nyelv modellelmletbe gyazzk be. Az MI-ben a tendencia az volt,
hogy az idpontokra s az esemnyekre vonatkoz aximkat explicit mdon a tudsbzisban rjuk fel, anlkl
hogy az idnek a logikban valamilyen specilis sttust adnnk. Az ilyen megkzelts egyes esetekben
nagyobb rugalmassgot s ttekinthetsget biztost. Radsul az elsrend logikban kifejezett temporlis
logika nagyobb esllyel integrlhat az ebben a formalizmusban felhalmozott ms tudsanyaggal.
Az MI-ben az id s a cselekvs legkorbbi kezel appartusa John McCarthy szitucikalkulusa volt
(McCarthy, 1963). A QA3 volt az els MI-rendszer, amely nagyban felhasznlta a cselekvsre vonatkoz
ltalnos rendeltets elsrend logikai kvetkeztetst (Green, 1969b). Kowalski fejlesztette ki az lltsok
reifiklst a szitucikalkuluson bell (Kowalski, 1979b).
A keretproblmt, mint olyant, elsknt McCarthy s Hayes ismertk fel (McCarthy s Hayes, 1969). Szmos
kutat a problmt megoldhatatlannak tartotta az elsrend logikn bell, s ez intenzv kutatshoz vezetett a
nemmonoton logikk irnyba. A filozfusok Dreyfustl (Dreyfus, 1972) Crockettig (Crockett, 1994) a
keretproblmt az egsz MI-vllalkozs szksgszer kudarca egyik tnetnek tartottk. A reprezentcis
keretproblma rszleges megoldsa kvet-llapot aximk segtsgvel Ray Reitertl szrmazik (Reiter, 1991).
A kvetkeztetsi keretproblma megoldsa Holldobler s Schneeberger munkjra vezethet vissza (Holldobler
s Schneeberger, 1990), amit most foly esemny kalkulusnak neveznk (Thielscher, 1999). Jelen fejezetben
bemutatott elemzs Lin s Reiter, valamint Thielscher elemzsein alapul (Lin s Reiter, 1997; Thielscher, 1999).
A szitucikalkulusban a cselekvsrl val kvetkeztets teljes, korszer trgyalst Shanahan s Reiter
knyvei adjk (Shanahan, 1997; Reiter, 2001b).
324
A keretproblma rszleges megoldsval jra fellngolt az rdeklds a cselekvsekrl val kvetkeztets

deklaratv megkzeltsei irnt, amelyeket az 1970-es vek elejtl a specilis tervkszt rendszerek httrbe
szortottak (lsd 11. fejezet). A kognitv robotika (cognitve robotics) zszlaja alatt lnyeges elrehalads
trtnt az id s a cselekvs logikai reprezentcija tern. A GOLOG programozsi nyelv a cselekvsek s a
tervek kifejezsre a logikai programozs teljes kifejez erejt felhasznlja (Levesque s trsai, 1997a). A
nyelvet a parallel cselekvsek (Giacomo s trsai, 2000), a sztochasztikus krnyezetek (Boutilier s trsai, 2000)
s az rzkels (Reiter, 2001a) kezelsre is kiterjesztettk.
Az esemnykalkulust Kowalski s Sergot vezettk be folytonos id kezelssre (Kowalski s Sergot, 1986).
Ennek szmos vltozata is szletett (Sadri s Kowalski, 1995). Shanahan ad rla egy j s rvid ttekintst
(Shanahan, 1999). Ugyanerre a clra James Allen vezette be az idintervellumokat (Allen 1983, 1984) azzal
rvelve, hogy azok a szituciknl termszetesebb eszkzt jelentenek a kiterjed s a konkurrens esemnyek
lersra. Peter Ladkin konkv idintervallumokat (intervallumok szakadsokkal, lnyegben a kznsges
konvex idintervallumok unii) vezetett be, s az idreprezentcihoz alkalmazta a matematikai absztrakt
algebra mdszertant (Ladkin, 1986a; Ladkin, 1986b). Allen szisztematikusan vizsglta az id
reprezentlshoz ma hozzfrhet technikk szles vlasztkt (Allen, 1991). Shoham lerta az esemnyek
reifikcijt, s e clbl egy j smt vezetett be (Shoham, 1987). Lnyeges egybeess lelhet fel az e
fejezetben emltett esemnyalap ontolgia s Donald Davidson filozfus esemnyelemzse kztt (Davidson,
1980). Hasonl jelleg a folyadkok Pat Hayestl szrmaz ontolgija is (Hayes, 1985a).
A szubsztancik ontolgiai sttusnak krdse hossz trtnet. Platn szerint a szubsztancik a fizikai
objektumoktl teljesen eltr absztrakt entitsok. A Vaj3 Vaj helyett inkbb BlVan(Vaj3, Vaj)-at mondana.
Ez elvezet a szubsztancik egy olyan hierarchijhoz, ahol pldul SzatlanVaj a Vaj-nl specifikusabb
szubsztancia. A jelen fejezetben elfogadott llspontot, miszerint a szubsztancik objektumok kategrii,
Richard Montague vette vdelmbe (Montague, 1973). Ezt az llspontot a CYC projektben is elfogadtk. Ezzel
szemben egy komoly, m nem kivdhetetlen tmadst intzett Copeland (Copeland, 1993). A fejezetben emltett
alternatv megkzeltst, ahol a vaj egy egyedi objektum, ami az univerzum sszes vajszer objektumbl ll,
eredetileg Lesniewski lengyel logikus javasolta (Lesniewski, 1916). Mereolgija (mereology) (a nv a
rsz grg nevbl szrmazik) a rsz-egsz relcit matematikai halmazelmlet helyettestsre hasznlja a
clbl, hogy az olyan absztrakt entitsokat, mint a halmazok, eltntesse. A mereolgia olvashatbb vltozatt
Goodman s Leonard adtk (Leonard s Goodman, 1940). Goodman The Structure of Appearance c. mvben
ezeket az tleteket klnbz problmk megoldsra alkalmazza a tudsreprezentcik terletn (Goodman,
1977). Br a mereologikus megkzelts nhny aspektusa nehzkes pldul a rsz-egsz relcin alapul
kln rkldsi mechanizmusra van szksg , a megkzeltst Quine is tmogatja (Quine, 1960). A
tudsreprezentciban val hasznlatnak kimert elemzst Harry Bunt adta meg (Bunt, 1985).
A mentlis objektumokat s llapotokat a filozfiban s az MI-ben is intenzven tanulmnyoztk. A
filozfiban a modlis logika (modal logic) a tudsrl val kvetkeztets klasszikus eszkze. Modlis logika az
elsrend logikt bizonyos modlis opertorokkal, mint a B (hisz, believes) s a K (tud, knows) kiterjeszti, ezek
az opertorok nem a termekre, hanem az lltsokra vonatkoznak. A modlis logika bizonytselmlete a
behelyettestst a modlis kontextusra korltozza, s gy referencilis tlthatatlansghoz vezet. A tuds modlis
logikjt Jaakko Hintikka tallta fel (Hintikka, 1962). A modlis logika szemantikjt Saul Kripke definilta
lehetsges vilgok (possible worlds) segtsgvel (Kripke, 1963). Durvn fogalmazva egy vilg lehetsges egy
gens rszre, ha konzisztens mindazzal, amirl az gensnek tudomsa van. Ebbl mr meg lehet fogalmazni a
K opertorra vonatkoz kvetkeztetsi szablyokat. Robert C. Moore (Moore, 1980; 1985a) kapcsolatba hozza
tuds modlis logikjt azzal a kvetkeztetsi stlussal, amely az elsrend logikban kzvetlen mdon a
lehetsges vilgokra hivatkozik. A modlis logika ijeszten titokzatos terlet lehet, azonban elosztott
szmtgpes rendszereknl az informcirl val kvetkeztetst illeten jelents alkalmazsra tallt. A modlis
megkzeltshez rszletes bevezett Fagin Reasoning about Knowledge c. knyve ad (Fagin, 1995). A ktvente
megrendezett Theoretical Aspects of Reasoning About Knowledge (TARK) konferencik mutatjk be a
tudselmlet alkalmazst az MI-ben, a gazdasgi tudomnyokban s az elosztott rendszerekben.
A mentlis objektumok szintaktikai elmlett rszletesen elszr Kaplan s Montague tanulmnyoztk, akik
megmutattk, hogy az elmlet, megfelel elvigyzatossg hinyban, paradoxonokhoz vezet (Kaplan s
Montague, 1960). Mivel ez a hiedelmeket egy fizikai rendszer konfigurciival kapcsolja ssze, s ehhez
rendelkezik egy termszetes modellel egy emberi agy vagy egy szmtgp formjban, ez az elmlet az MI
terletn az utbbi vekben igen npszer volt. Az elmletet korltos hatkonysg kvetkeztet gpek lersra
Konolige s Haas hasznlta, Morgenstern viszont megmutatta, hogyan hasznlhat elfelttelek brzolsra
tervkszts esetn (Konolige, 1982; Haas, 1986; Morgenstern, 1987). A megfigyelsi cselekvsek tervezsnek
a 13. fejezetben tallhat mdszerei szintaktikai elmleten alapulnak. A tuds szintaktikai s modlis
elmleteinek kivl sszehasonltsa tallhat a (Davis, 1990)-ben.
325
Arisztotelsz Kategrik c. mvhez kommentrt fzve Porfiriusz grg filozfus (kb. i. e. 234305) rajzolt fel
valamit, amit els szemantikus hlnak lehetne minsteni. Charles S. Peirce korszer logikra alapozva
egzisztencilis grfokat fejlesztett ki, mintegy kifejlesztve az els modern logikt hasznl szemantikus hl
formalizmust (Peirce, 1909). Az MI-n bell a szemantikus hlk kutatst Ross Quillian kezdemnyezte
(Quillian, 1961), a nyelvfeldolgozs s az emberi memria irnti rdekldsbl kiindulva. Marvin Minsky
nagy hats cikkben a szemantikus hlk kereteknek (frames) nevezett vltozatt mutatta be (Minsky, 1975).
A keret egy objektum vagy egy kategria reprezentcija ms objektumokkal vagy kategrikkal kpzett
relciival. Br a cikk rdekldst keltett magnak a tudsreprezentcinak a terlete irnt, mgis kritizltk,
hogy a Minsky cikkt megelz objektumorientlt programozs eszkzeit, illetve az rklds s az
alaprtelmezett rtkek hasznlatt jbl felknlja (Dahl s trsai, 1970; Birtwistle s trsai, 1973). Nem
vilgos, hogy az objektumorientlt programozsrl szl ksbbi cikkeket viszonzskppen mennyire
befolysolta a szemantikus hlkkal kapcsolatos korai MI-munka.
A szemantika krdse klnsen lesen merl fel Quillan szemantikus hljval kapcsolatban (s mindazokkal
kapcsolatban, akik Quillan megkzeltst kvettk), a szemantikus hlban mindentt jelen lev s nagyon
bizonytalan ISA-kapcsolatok, valamint egyb korai tudsreprezentcis formalizmusok mint amilyenek
MERLIN (Moore s Newell, 1973) misztikus lapos s fedi opercii miatt. Az MI-kutatk figyelmt
Woods hres Whats In a Link? c. cikke irnytotta a precz szemantika kialaktsnak szksgessgre a
tudsreprezentcis formalizmusban (Woods, 1975). Brachman dolgozta fel ezt a tmt s a problmra
megoldsokat is javasolt (Brachman, 1979). Patrick Hayes The Logic of Frames c. cikke mg mlyebbre vgott
azt lltva, hogy a keret formalizmusnak tbbsge nem ms, mint egy j szintaktika az elsrend logika egy
rszre (Hayes, 1979). Drew McDermott Tarskian Semantics, or, No Notation Without Denotation! c. cikkben
amellett rvelt, hogy az elsrend logika modellalap szemantikjt kell alkalmazni mindenfle
tudsreprezentcis formalizmus esetben (McDermott, 1978b). Ez vitatott krds maradt. Megemltend, hogy
McDermott maga is fellvizsglta llspontjt A Critique of Pure Reason (McDermott, 1987) c. cikkben. A
NETL (Fahlman, 1979) egy kifinomult szemantikus hl rendszer volt, melynek ISA-kapcsolatai (amit virtulis
msolsnak virtual copy , azaz VC-kapcsolatnak hvtak) sokkal inkbb a keretrendszerek vagy az
objektumorientlt programozsi nyelvek rklds jellemvonsnak jellsn alapult, mint a
rszhalmazkapcsolaton, s sokkal pontosabban volt definilva, mint Quillian kapcsolatai a Woods eltti idkbl.
A NETL klnsen rdekes, mivel prhuzamos hardveren szndkoztak megvalstani, hogy gy lekzdhessk a
nagy szemantikus hlkbl trtn informci-visszakeress problmjt. David Touretzky az rkldst
rigorzus matematikai analzisnek vetette al (Touretzky, 1986). Selman s Levesque a kivtelekkel kiegsztett
rklds komplexitst taglalja, megmutatva, hogy ez a legtbb formalizmusban NP-teljes (Selman s
Levesque, 1993).
A ler logikk fejldse csupn egy hossz kutatsi folyamat jelenlegi llsa, mely az elsrend logika olyan
hasznlhat rszhalmazainak megtallst clozza, melyekre a kvetkeztets szmtstechnikai alapon
kezelhet. Hector Levesque s Ron Brachman megmutattk, hogy bizonyos logikai konstrukcik, pldul a
diszjunkci s a negls bizonyos hasznlata felels elsdlegesen a logikai kvetkeztets kezelhetetlensgrt
(Levesque s Brachman, 1987). A KL-ONE rendszerre (Schmolze s Lipkis, 1983) alapozva szmos olyan
rendszert fejlesztettek ki, melyek tervezse magban foglalta az elmleti komplexitsanalzis eredmnyeit.
Leginkbb emltsre mlt ilyen rendszerek a KRYPTON (Brachman s trsai, 1983) s a CLASSIC (Borgida s
trsai, 1989). Az eredmny a kvetkeztets sebessgnek lnyeges nvekedse lett, s a kvetkeztet rendszerek
komplexitsa s kifejezkszsge kztti hatsok sokkal jobb megismerse. A kutatsok llst Calvanese
foglalta ssze (Calvanese s trsai, 1999). Ms rszrl, ahogy Doyle s Patil rvelnek, egy nyelv
kifejezkszsgnek korltozsa vagy lehetetlenn teszi bizonyos problmk megoldst, vagy a nyelv nem
logikai eszkzkkel trtn kitgtsra sztnz (Doyle s Patil, 1991).
A nemmonoton kvetkeztets mind a hrom f formalizmust a krlrst (McCarthy, 1980), az
alaprtelmezett logikt (Reiter, 1980) s a modlis nemmonoton logikt (McDermott s Doyle, 1980) az AI
Journal egyetlen klnszmban publikltk. A vlaszhalmaz-programozst a negls mint kudarc
kiterjesztsnek vagy a krlrs finomtsnak lehet nzni. A mgtte lv stabil modell szemantikt Gelfond
s Lifschitz vezettk be (Gelfond s Lifschitz, 1988). A vezet vlaszhalmaz-programozsi rendszerek a DVL
(Eiter s trsai, 1998) s SMODELS (Niemel s trsai, 2000). A diszkmeghajt plda a SMODELS felhasznli
kziknyvbl szrmazik (Syrjnen, 2000). A vlaszhalmazprogramozs hasznlatt a tervkszts szmra
Lifschitz trgyalja (Lifschitz, 2001). A nemmonoton logika klnbz megkzeltseirl j ttekintst ad
Brewka (Brewka s trsai, 1997). A logikai programozs negls mint kudarc megkzeltsvel s a Clarklezrssal Clark foglalkozik (Clark, 1978). Van Emden s Kowalski azt mutattk ki, hogy minden negls
nlkli Prolog programnak ltezik egyrtelm minimlmodellje. Az utbbi vekben tani lehetnk, ahogy
nvekszik az rdeklds a nemmonoton logika nagymret tudsreprezentcis rendszerekben val alkalmazsa
326
irnt. Egy nemmonoton rkldsi rendszer els sikeres kereskedelmi alkalmazsa taln a BENINQ rendszerek
volt a biztostsi felttelek megtudakolshoz (Morgenstern, 1998). A Logic Programming and Nonmonoton
Reasoning (LPNMR) konferencik kiadvnyai sok klnbz, logikai programozson alapul nemmonoton
kvetkeztet rendszerrl szmolnak be.
Az igazsg-karbantart rendszerek tanulmnyozsa TMS (Doyle, 1979) s RUP rendszerekkel (McAllester,
1980) kezddtt, mindkett alapveten JTMS-rendszer volt. Az ATMS megkzeltst Johan de Kleer cikkeinek
sorozata rta le (De Kleer, 1986c; 1986a; 1986b). A Building Problem Solvers (Forbus s De Kleer, 1993)
rszletesen elmagyarzza, hogyan hasznlhatk a TMS-ek MI-alkalmazsokban. Nayak s Williams
megmutatjk, hogy egy hatkony TMS hogyan teszi lehetv, hogy a NASA-rhajk mveleteit vals idben
megtervezhessk (Nayak s Williams, 1997).
Nyilvnval okoknl fogva a jelen fejezet a tudsreprezentci minden terletvel elmlylten nem foglalkozik.
A hrom f kihagyott tmakr az albbi:
Kvalitatv fizika (qualitative physics): A tudsreprezentci egy olyan rszterlete, amely specilisan a
fizikai objektumok s folyamatok logikai nemnumerikus elmletnek megkonstrulsval foglalkozik. A
kvalitatv fizika elnevezst Johan de Kleer alkotta meg (de Kleer, 1975), br llthat, hogy a kutats Fahlman
BUILD rendszervel indult meg (Fahlman, 1974). A BUILD egy komplex tervkszt rendszer volt, bonyolult
kockatornyok ptshez. Fejlesztse sorn Fahlman szrevette, hogy az erfesztsek zme (becslse szerint
80%-a) nem magra a tervksztsre fordtdott, hanem a klnbz kocka rszstruktrk stabilitsnak
eldntsre. Fahlman egy hipotetikus naiv fizikai jelleg folyamatot vzol, hogy megmagyarzza, mirt
kpesek a kisgyerekek BUILD-szer problmkat megoldani a BUILD-del vgzett fizikai modellezsnl
hasznlt, nagy sebessg lebegpontos aritmetika nlkl. Hayes a trtnetek a tr-id 4-dimenzij,
Davidson esemnyeire hasonlt szeletei felhasznlsval megalkotja a folyadkok igen bonyolult naiv
fizikjt (Hayes, 1985a). Hayes volt az els, aki bebizonytotta, hogy ha egy csapbl folyamatosan folyik a
vz, mikzben a lefolyt bedugaszoljuk, a kd vgl tlcsordul, s azt is, hogy aki beleesik a tba, az teljesen
elzik. De Kleer s Brown, valamint Ken Forbus megksreltk a vilg egyfajta, a fizikai egyenletek
kvalitatv absztrakcijn alapul ltalnos rendeltets elmletnek a fellltst (De Kleer s Brown, 1985;
Forbus, 1985). Az utbbi idben a kvalitatv fizika eljutott addig a pontig, ahol mr lehetsges a komplex
fizikai rendszerek szles vlasztknak az elemzse (Sacks es Joskowicz, 1993; Yip, 1991). Kvalitatv
technikkat hasznltak teljesen j tervezs rk, szlvdtrlk s hatlb stlrobotok
megkonstrulshoz is (Subramanian, 1993; Subramanian s Wang, 1994). A terlethez j bevezet
olvasmny a Readings in Qualitative Reasoning about Physical Systems c. gyjtemny (Weld s De Kleer,
1990).
Trbeli kvetkeztets (spatial reasoning): A wumpus s a bevsrl vilgban a naviglshoz szksges
kvetkeztets trivilis a valdi vilg gazdag trbeli struktrjhoz kpest. A trrl trtn jzan sz
kvetkeztets legteljesebb ksrlete Ernest Davis (Davis, 1986; 1990) munkjban tallhat. Cohn
rgikapcsoldsi kalkulusa (Cohn s trsai, 1997) az alapja az egyfajta kvalitatv trbeli kvetkeztetsnek,
ami elvezetett a fldrajzi informcis rendszerek j fajtihoz. A kvalitatv fizikhoz hasonlan, gy tnik,
hogy egy gens sokig elboldogul egy teljes metrikus reprezentci hasznlata nlkl. Ha egy ilyen
reprezentcira van szksg, hasznlhatk a robotikban kifejlesztett megoldsok (lsd 25. fejezet).
Pszicholgiai kvetkeztets (psychological reasoning): A pszicholgiai kvetkeztets magban foglalja egy
mkdkpes pszicholgia kifejlesztst a mestersges gensek szmra, hogy az gensek kpesek legyenek
sajt magukra s ms gensekre vonatkoz kvetkeztetseket meghozni. Ennek gyakran az n. npi
pszicholgia (folk psychology) az alapja, amely egy olyan elmlet, amirl azt gondoljuk, hogy az emberek
sajt maguk s msok megtlsben hasznljk. Amikor az MI-kutatk mestersges genseiket ms
gensekre vonatkoz kvetkeztetst tmogat pszicholgiai elmletekkel ltjk el, ezen elmletek alapja
gyakran a logikai gens rendszertervnek a kutat ltal megfogalmazott lersa. A pszicholgiai kvetkeztets
pillanatnyilag a termszetes nyelv megrtsnek kontextusn bell a leghasznosabb, ahol elsdleges
fontossg a beszl intencijt megjsolni.
Az ezen a terleten foly munkk legfrissebb forrst a Principles of Knowledge Representation and Reasoning
nemzetkzi konferencik kiadvnyai jelentik. A Readings in Knowledge Representation (Brachman s
Levesque, 1985) s a Formal Theories of the Commonsense World (Hobbs s Moore, 1985) a
tudsreprezentci kivl antolgii. Az elbbi a reprezentcis nyelvek s formalizmusok trtnelmileg fontos
publikciira sszpontost, az utbbi pedig magnak a tudsnak az akkumullsra helyezi a hangslyt. Davis,
Stefik s Sowa knyvei j bevezet munkk a tudsreprezentcikhoz (Davis, 1990; Stefik, 1995; Sowa, 1999).
327
9.2. Feladatok
10.1.
rja fel a wumpusvilg-beli Lj cselekvs hatst ler lltsokat. rja le a wumpusra kifejtett hatst, s ne
felejtse, hogy a lvshez az gensnek nylra van szksge.
10.2.
A szitucikalkuluson bell fogalmazzon meg egy olyan aximt, amelyben a 0. idpillanatot az S0 szitucival
kapcsolja ssze, valamint egy olyan msik aximt, ahol a t idpillanatot az S0-bl a t szm cselekvs
szekvencijval ellltott szitucival kapcsolja ssze.
10.3.
Ebben a feladatban egy t megtervezsvel foglalkozunk egy robot szmra, kt vros kztt. A robot
alapcselekvse a Megy(x, y), mely rvn az x vrosbl az y vrosba kerl t, ha a kt vros kztt ltezik
kzvetlen t. A Kzvetlent(x, y) akkor s csak akkor igaz, ha az x s az y kztt ltezik egy kzvetlen
tszakasz. Felttelezhetjk, hogy az ilyen tnyek a rendszer tudsbzisba mr bekerltek (1.2. szakasz - A
problmk megfogalmazsa rszben lv trkpet). A robot Aradnl kezd, s Bukarestet kell elrnie.
a. Adja meg robot kezd llapotnak egy alkalmas logikai lerst.
b. rjon fel egy alkalmas logikai krdst, amelynek megoldsai megadjk a clhoz vezet lehetsges utakat.
c. rja fel a Megy cselekvst ler logikai lltst.
d. Tegyk most fel, hogy kt vros kztt a kzvetlen t kvetse a kzvetlen t hosszval arnyos zemanyagfogyasztst jelent. A robot teli tankkal indul. Bvtse reprezentcijt, hogy ezek a szempontok helyet
kapjanak benne. A cselekvs lersnak olyannak kell lennie, hogy az elbb megfogalmazott krds
megvlaszolsnak tovbbra is a lehetsges terveket kell megadnia.
e. rja le a kezdeti szitucit, s adja meg a Megy cselekvst ler j szablyt, illetve szablyokat.
f. Tegyk most fel, hogy a csompontok nmelyike benzinkt is egyben, ahol a robot az zemanyagtankjt
teletltheti. Bvtse ennek megfelelen a reprezentcijt, s rja fel a benzinkutak lershoz szksges j
szablyokat, a TeleTlt cselekvst is belertve.
10.4.
Olvasnival. Vizsglja meg annak a lehetsgt, hogy az esemnykalkulust az egyidej esemnyek kezelsvel
bvthesse. Elkerlhet-e az aximk kombinatorikus robbansa?
10.5.
A fejezetben kifejlesztett reprezentcit felhasznlva s kiterjesztve adja meg az albbi hat llts
reprezentcijt.
a. 0 C s 100 C kztt cseppfolys a vz.
b. A vz 100 C-nl forr fel.
c. Jnos palackjban megfagyott a vz.
d. Az svnyvz egyfajta vz.
e. Jnos palackjban svnyvz van.
f. Minden folyadknak van fagysi pontja.
g. Egy liter vz slya tbb, mint egy liter alkohol slya.
328
Ismtelje meg a feladatot mereolgiai megkzeltsen alapul reprezentcit felhasznlva, amelyben pldul a
Vz egy objektum, amely a vilg minden vizt, mint az objektum rszt tartalmazza.
10.6.
rja fel a:
a. KimertRszFeloszts
b. RszPartci
c. PronkntKlcsnsenKizr
defincijt a KimertFeloszts, a Partci s a KlcsnsenKizr defincijval analg mdon. Igaz-e, hogy
RszPartci(s, Ktege(s))? Ha igen, bizonytsa be, ha nem, adjon meg egy ellenpldt, s definiljon elgsges
feltteleket, amelyek mellett igaz lesz.
10.7.
rjon fel egy olyan lltshalmazt, amely lehetv teszi a klnll paradicsomok (vagy ms objektumok)
rmegllaptst, ha adott a kilnknti r. Az elmlet kiterjesztsvel tegye lehetv egy zacsk paradicsom
rnak a kiszmtst.
10.8.
Mrtkeket reprezentl alternatv smban az egysgfggvnyeket egy absztrakt hosszsg objektumra
alkalmazzuk. Az ilyen smban azt lehetne rni, hogy: Centimterek(Hossz(L1)) = 15. Hogyan viszonyul ez a
sma a fejezetbelihez? A szempontok tbbek kztt az tvltsi aximk, az absztrakt mennyisgek elnevezsei
(mint pldul ezer forint) s az eltr egysgekben kifejezett absztrakt mrsek sszehasonltsa (50 hvelyk
tbb, mint 50 cm).
10.9.
Konstruljon a valutk tvltsi rfolyamra egy olyan reprezentcit, amely lehetv teszi a napi fluktucik
figyelembevtelt.
10.10.
Ebben a feladatban az esemnykategrik s azon idintervallumok kztti relcikkal foglalkozunk,
amelyekben az esemnyek megtrtnnek.
a. Definilja a T(c, i) prediktumot a Kzben s a segtsgvel.
b. Adja meg a precz magyarzatt annak, hogy a konjunktv esemnykategria lersnl mirt nincs szksg a
ktfle jellsmdra.
c. Adja meg a T(Egyik(p, q), i) s a T(VagyVagy(p, q), i) formlis defincijt.
d. Magyarzza meg, mirt rtelmes a ktfajta diszjunkcival analg mdon az esemnyek ktfajta neglsval
rendelkezni. Nem-nek s Sohasem-nek nevezze el ket, s adja meg a formlis defincijukat.
10.11.
Definilja a Rgztett prediktumot, ahol a Rgztett(Helye(x)) azt jelenti, hogy az x objektum helye az idben
rgztett.
10.12.
Definilja az Eltte, az Utna, a Kzben s az tlapoldik prediktumokat a Tallkozik prediktum s a Kezdet
s a Vg fggvnyek segtsgvel, de az Id fggvny s a < prediktum nlkl.
10.13.
329
A 10.5. alfejezetben a Link s a LinkSzveg prediktumokat hasznljuk weblapok kztti kapcsolat lersra.
Tbbek kzt a Cmkben s a VeddElLapot prediktumok felhasznlsval rja fel a Link s a LinkSzveg
definciit.
10.14.
A vsrlsi folyamat egyik rsze, amivel e fejezetben nem foglalkoztunk, az egyes ttelek kztti kompatibilits
ellenrzse. Ha a kliens pldul egy szmtgpet rendel, illeszkedik-e az a megfelel perifrikhoz? Ha
digitlis kamert rendel, megvan-e a hozz val memriakrtya s szrazelem? rjon fel egy olyan tudsbzist,
amely eldnti, hogy a ttelek adott halmaza kompatibilis-e. s ezt a tudsbzist fel lehessen hasznlni cserkre,
illetve tovbbi ttelek vsrlsra vonatkoz javaslatok generlsra, ha mgsem lennnek kompatibilisek.
Bizonyosodjon meg arrl, hogy a tudsbzis legalbb a termkek egy krvel jl mkdik, s knnyen
terjeszthet ki msokra is.
10.15.
Adjon szablyokat a Nv(s, c) prediktum defincijnak olyan esetekre trtn kiterjesztshez, hogy az olyan
fzrek, mint pldul a laptop szmtgp tbb bolthoz tartoz idevg kategrianvre illeszkedjen.
Ksreljen meg ltalnos rvny defincit alkotni. A defincit tesztelje tz online boltra s az ltaluk hrom
kategrira hasznlt elnevezsekre. A laptop kategria esetn pldul a Notebooks, Laptops, Notebook
szmtgpek, Notebook, Notebooks s Laptops s Notebook PC neveket talltuk. Az egyes
elnevezseket explicit Nv tnyekkel, msok a tbbes szmot, a konjunkcit stb. kezel szablyokkal
lefedhetk.
10.16.
A vsrl vsrlslersra vonatkoz pontatlan illeszkeds teljes megoldsa nagyon nehz, s szksgess teszi
a termszetes nyelvfeldolgozsi s informci-kinyersi technikk egsz sort (lsd 22. s 23. fejezet). Egy kis
lps megengedni a felhasznlnak, hogy a klnbz attribtumok minimlis s maximlis rtkeit
hatrozhassa meg. Megkveteljk, hogy a vsrl a termkek lershoz az albbi nyelvtant vegye ignybe:
Lers Kategria [Kapcsolat Mdost]*
Kapcsolat vals,
Mdost AttribtumAttrribtum Op rtk
Op =><
Itt a Kategria a termk kategrija, az Attribtum a termk valamilyen tulajdonsga, mint pldul CPU vagy
r, s az rtk egy konkrt termk attribtumnak az rtke. A szmtgp, min 2,5 GHz CPU, 250 000 Ft
alatt lekrdezst teht gy kell kifejezni, hogy szmtgp, CPU > 2,5 GHz s r < 250 000 Ft.
Implementlja az ilyen nyelven megfogalmazott termklersokat elfogad bevsrl genst.
10.17.
Az internetes bevsrlsrl szl lersunk nlklzte az alapvet fontossg lpst a termk tnyleges
megvsrlst. Adja meg a vsrls formlis logikai lerst esemnykalkulusra tmaszkodva. Azaz definilja
az esemnyek olyan sorozatt, amelyek megtrtnnek, ha a vsrl hitelkrtyval fizet, s vgl sor kerl a
szmlzsra s az ru leszlltsra.
10.18.
rja le a valamit valamirt kereskeds esemnyt. A vsrlst egyfajta kereskedsknt rja le, ahol a
kereskedsben az egyik rszt vev termk a pnz.
10.19.
Olvasnival. A kt megelz feladatban a tulajdonviszony igen egyszer fogalmt hasznltuk. A vsrl
pldul gy indul, hogy a forint bankjegyek mr a tulajdonban vannak. A modell kezd sztesni, ha pldul a
pnze bankban van, hiszen ilyenkor semmilyen konkrt bankjegymennyisg nincs, amirl ki lehetne jelenteni,
hogy a tulajdonban van. A helyzetet a klcsn, a brls, a haszonbrls s a lettbe helyezs mg tovbb
330
bonyoltja. Vizsglja meg a tulajdonviszony jzan sz s jogi koncepciit, s javasoljon egy olyan smt,
amelyben ezek formlisan kifejezhetk.
10.20.
A feladata egy tancsad rendszer kifejlesztse, amely az informatika szak hallgatinak ajnlan, hogy milyen
trgyakat vlasszanak a kpzs feltteleinek teljestshez (az intzmnyre jellemz felttelekkel dolgozzon).
Elszr dntse el, hogy az sszes informci reprezentlshoz milyen szkszletet fog hasznlni, majd vgezze
el a reprezentci ptst. Megfelel krdsekkel rje el, hogy a rendszer egy leglis kpzsi programot adjon
vissza. A rendszernek az egyes hallgatk ignyeihez kell illeszkednie, pldul a fakultatv trgyak javaslatnl.
Javasoljon mdszereket a rendszer tkletestsre, felhasznlva pldul a hallgati preferencikra, a terhelsre,
a j/rossz eladkra vonatkoz informcikat. Minden egyes tudsfajta esetn magyarzza meg, hogy hogyan
lehetne azt logikailag kifejezni. Knnyen be tudn-e a rendszere fogadni ezt az informcit gy, hogy egy
hallgat rszre a legjobb kpzsi programot ajnlja fel?
10.21.
A 10.1. bra a dolgok hierarchijnak fels szintjeit mutatja. Terjessze ki az brt gy, hogy a lehet legtbb
valdi kategrit tartalmazzon. Erre j mdszer, ha a mindennapi letvel kapcsolatos minden dolgot ler. Ez
objektumokat s esemnyeket fog magban foglalni. Kezdje a reggeli felkelssel, rendszeresen haladjon tovbb,
megfigyelve, hogy mit rint, mit csinl, mire gondol. Egy vletlen mintavtel eredmnye lehetne pldul a
kvetkez: zene, hrek, tej, sta, kocsivezets, benzin, Skla, sznyeg, beszlgets, Kovcs tanr r,
csirkeprklt, nyelv, 150 Ft, napi jsgok stb.
El kellene kszteni egy egysges hierarchiaft (egy nagy paprlapon) s egy listt az objektumokrl s a
kategrikrl, az egyes kategriaegyedek ltal kielgtett egy vagy tbb relcival egytt. Mindegyik
objektumnak egy kategrihoz kell tartoznia, s minden kategrinak a hierarchia rsznek kell lennie.
10.22.
(Doug Lenat egy pldjnak adaptcija.) A feladat az, hogy elegend, logikai formban kifejezett kapcsold
tudst gyjtsn ssze, hogy az albbi egyszer mondatra vonatkoz krdssort meg tudja vlaszolni:
Tegnap Jnos a Sklba ment, s vett kt kil paradicsomot s fl kil darlt hst.
Kezdje azzal, hogy a mondat tartalmt egy sor kijelentssel reprezentlja. ttekinthet logikai struktrj
lltsokat kell rnia (pldul lltsok arrl, hogy az objektumoknak bizonyos tulajdonsgai vannak, hogy az
objektumok bizonyos relciban vannak egymssal, s hogy egy adott tulajdonsgot teljest minden objektum
egy msik tulajdonsggal is rendelkezik). Az albbiak felteheten segtsgre lesznek:
Milyen osztlyokra, egyedekre, relcikra stb. lesz szksge? Mik ezeknek a szuper- s alosztlyai? (Tbbek
kzt esemnyekre s idrendi rendezsre is szksge lesz.)
Milyen mdon lehetnnek ezek a rszei egy ltalnosabb hierarchinak?
Milyenek a kzttk lv knyszerek s relcik?
Mennyire rszletesen kell lerni az egyes fogalmakat?
A megkonstruland tudsbzisnak kpesnek kell lennie a tovbbiakban kzlt krdslistt megvlaszolni. A
krdsek kzl nhny kzvetlenl magval a trtnettel foglalkozik, de a tbbsgk a httrtudst a sorok
kztti olvasst ignyli. Foglalkozni kell azzal, hogy milyen dolgokat lehet egy bevsrlkzpontban
vsrolni, hogy a kivlasztott ttelek vsrlsnl mi trtnik, hogy mi a vsrolt ttelek rendeltetse stb.
Ksrelje meg a reprezentcijt a lehet a legltalnosabbra kialaktani. Egy trivilis pldval szemllve, ne azt
lltsa, hogy Az emberek a Sklban ennivalt vsrolnak, mert ez nem segt azok kezelsben, akik mshol
szoktak vsrolni. Ne azt lltsa, hogy Jnos darlt hssal s paradicsommal spagettit ksztett, mert ez
semmilyen ms dolog kezelsben nem segt. Ne rejtsen vlaszokat a krdsekbe, a (c) krds pldul azt
krdezi, hogy Vsrolt Jnos hst?, s nem azt, hogy Vsrolt-e Jnos fl kil darlt hst?.
Adja meg a krdseket megvlaszol kvetkeztets smjt. Ennek sorn minden bizonnyal j fogalmakat is
kell krelnia s j lltsokat kell megfogalmaznia stb. Ha lehetsges, hasznljon egy logikai kvetkeztet
331
rendszert, hogy kimutassa a tudsbzis elgsgessgt. Sok dolog, amit ler, a valsgban csak kzeltleg lesz
igaz. Ne trdjn ezzel tl sokat, a cl azt a jzan sz tudst kinyerni, ami a krdsek megvlaszolst
egyltaln lehetsgess teszi. E krdskr igazn teljes megvlaszolsa rendkvl nehz, valsznleg meg is
haladja a mai tudsreprezentcik lehetsgeit.
a. Jnos gyerek vagy felntt? [Felntt]
b. Van Jnosnak most legalbb 2 db paradicsoma? [Igen]
c. Vsrolt Jnos hst? [Igen]
d. Ltta-e Jnos Marit, ha Mari ugyanabban az idben vsrolt paradicsomot? [Igen]
e. A paradicsomot a bevsrlkzpontban ksztik-e? [Nem]
f. Mit fog csinlni Jnos a paradicsommal? [Megeszi]
g. Kaphat-e a Sklban dezodor? [Igen]
h. Hozott-e Jnos magval elg pnzt a bevsrlkzpontba? [Igen]
i. A vsrlst kveten kevesebb pnze van-e Jnosnak? [Igen]
10.23.
Az elbbi plda tudsbzishoz ksztsen szksges bvtseket/mdostsokat gy, hogy megvlaszolhatk
legyenek az albbi krdsek. Mutassa ki, hogy a tudsbzis tnyleg kpes ezeket megvlaszolni, s a
jelentsben szmoljon be a javtsokrl, mirt volt a javtsokra szksg, s arrl is, hogy a javtsok
lnyegtelenek, illetve lnyegesek voltak.
a. Vannak-e a Sklban ms emberek, amikor Jnos ott vsrol? [Igen a szemlyzet!]
b. Vegetrinus-e Jnos? [Nem]
c. A Sklban ki a dezodor tulajdonosa? [Skla Rt.]
d. Kapott-e Jnos 1 kg darlt hst? [Igen]
e. A szomszdos MOL benzinktnl van-e benzin? [Igen]
f. Belefr-e a paradicsom Jnos kocsijba? [Igen]
10.24.
Emlkezzen arra, hogy a szemantikus hl rkldsi informcijt logikailag alkalmas implikcis lltsokkal
ki lehet fejezni. Ebben a feladatban megfontoljuk az ilyen lltsokra pl rkldsi kvetkeztets
hatkonysgt.
a. Vegyk egy hasznltaut-katalgus informcitartalmt hogy az 1999-es Mitsubishi Carisma rtke 3
milli Ft. Tegyk fel, hogy az sszes informci (a tbb tzezer modell rszre) a fejezetben ajnlott logikai
szablyok formjban van megfogalmazva. rjon fel hrom ilyen szablyt, az egyik az 1999-es Carismrl
szljon. Hogyan hasznln a szablyokat, hogy egy konkrt gpkocsi rtkt megtallhassa (pldul XY, ami
egy 1999-es Carisma), ha adott egy htrafel lncolt ttelbizonyt, mint amilyen pldul a Prolog?
b. Hasonltsa ssze az ennek a problmnak a megoldsra alkalmazott htrafel lncolt kvetkeztetsi mdszer
s a szemantikus hlban hasznlt rkldsi sma hatkonysgt.
c. Magyarzza meg, hogy az elrefel lncolt kvetkeztets hogyan teszi lehetv egy logikai rendszer szmra
ugyanannak a problmnak egy hatkony megoldst, feltve, hogy a tudsbzis csak 10 000 szablyt
tartalmaz az rakrl.
d. rjon le egy olyan helyzetet, ahol sem az elrefel, sem a htrafel lncolt kvetkeztets nem teszi lehetv a
konkrt gpkocsira vonatkoz rlekrdezs hatkony megvalstst.
332
e. Tud olyan megoldst ajnlani, ami lehetv teszi, hogy ezt a fajta lekrdezst a logikai rendszerek
mindegyikben hatkonyan tudjuk kezelni? (Segtsg: emlkezzen arra, hogy az ugyanahhoz a kategrihoz
tartoz kt gpkocsinak ugyanaz az ra.)
10.25.
Felttelezhet, hogy egy szemantikus hlban a sima s az egy vonallal bekeretezett kapcsolat kztti
szintaktikai klnbsgttel felesleges, mert az utbbi kapcsolatok csak a kategrikhoz tartoznak. Az rkldsi
algoritmusnak elg lenne feltteleznie, hogy a kategrihoz csatolt sima kapcsolat szndkoltan a kategria
minden tagjra vonatkozik. Mutassa meg a lehetsges hibk megadsval, hogy az rv hamis.
333
11. fejezet - Tervkszts

Ebben a fejezetben lthatjuk, hogy hogyan hasznlhatja ki egy gens a problma szerkezett egy sszetett
cselekvsi terv kialaktshoz.
Egy cl elrsre irnyul cselekvssorozat kialaktst tervksztsnek (planning) nevezzk. Tervkszt
gensekre eddig kt pldt lttunk: a 3. fejezet keressalap problmamegold genst s a 10. fejezetben
bemutatott logikai tervkszt genst. Ez a fejezet elssorban az olyan nagyobb bonyolultsg tervezsi
feladatokra val felsklzssal foglalkozik, melyek meghaladjk az eddig ismertetett megkzeltsek
kpessgeit.
A 11.1. fejezet egy kifejez, de mgis megfelelen korltozott nyelvet mutat be az llapotokat s cselekvseket
tartalmaz tervksztsi feladatok lersra. Ez a nyelv szoros kapcsolatban ll a 7. s 10. fejezetben szerepl
tletlogikai, illetve elsrend lersokkal. A 11.2. fejezet megmutatja, hogy az elre- s a htrafel keres
algoritmusok hogyan tudjk elnysen kihasznlni ezt a reprezentcit, elssorban a lers szerkezetbl
automatikusan levezethet heurisztikk segtsgvel. (Ez analg az 5. fejezetben bemutatott, a
knyszerkielgtsi problmhoz kialaktott heurisztika elksztsvel.) A 11.311.5. alfejezetben olyan
tervkszt algoritmusok kerlnek bemutatsra, amelyek felhasznlva a problma reprezentcijt,
kpessgeikben tlmutatnak az elre-, illetve htrafel keressen. Nevezetesen olyan eljrsokat vizsglunk
meg, amelyek nem csak teljesen rendezett cselekvsek sorozatt kpesek figyelembe venni.
Ebben a fejezetben csak olyan krnyezetekre szortkozunk, melyek teljesen megfigyelhetk, determinisztikusak,
vgesek, statikusak (azaz ahol vltozsok csak akkor trtnnek, amikor az gens cselekszik), diszkrtek (idben,
cselekvsekben, objektumokban s hatsokban). Ezeket klasszikus tervksztsi (classical planning)
krnyezeteknek nevezzk. Ezzel ellenttben a nem klasszikus tervkszts a rszben megfigyelhet vagy a
sztochasztikus krnyezetek kezelsre szolgl, s itt megjelennek eltr, a 12. s 17. fejezetben bemutatott,
algoritmusok s genstervek.
1. A tervksztsi problma
Fontoljuk meg, hogy mi trtnne, ha egy kznsges, a standard keressi algoritmusokat mlysgi keress, A*
stb. hasznl problmamegold gens vals nagymret problmkkal kerlne szembe. Ez segthet abban,
hogy jobb tervkszt genseket tervezznk.
A legkzenfekvbb nehzsg, hogy a problmamegold genst lebnthatnk a szksgtelen cselekvsek.
Vegyk pldul a Mestersges intelligencia modern megkzeltsben c. knyv internetes megvsrlsnak a
feladatt. Tegyk fel, hogy minden egyes 10 jegy ISBN szm megvsrlsa egy-egy cselekvs, ez sszesen 10
millird cselekvst jelent. A keressi algoritmusnak mind a 10 millird cselekvs vgllapott meg kellene
vizsglnia, hogy megtallja a clnak megfelelt, nevezetesen, hogy birtokoljuk a 9635454112 ISBN szm
knyvet. Msrszrl egy rtelmes tervkszt gensnek kpesnek kell lenni arra, hogy a pontos cl
Birtokol(ISBN9635454112) lersbl visszafel dolgozva kzvetlenl eljusson a Vsrol(ISBN9635454112)
cselekvshez. Hogy ezt megtehesse, az gensnek arra az ltalnos tudsra van szksge, hogy a Vsrol(x)
kvetkezmnye a Birtokol(x). Ha adott ez a tuds, a tervez egy egyszerstsi lpsben el tudja dnteni, hogy a
Vsrol(ISBN9635454112) a helyes cselekvs.
A kvetkez nehzsg, egy j heurisztika (heuristic function) meghatrozsa. Tegyk fel, hogy az gens
feladata ngy klnbz knyv megvsrlsa. Ebbl 10 40 ngylpses terv addik, azaz nem krdses, hogy egy
megfelel heurisztika nlkli keress rtelmetlen. Az ember szmra egy llapot kltsgnek becslsre
kzenfekv heurisztika a tovbbiakban mg megvsroland knyvek szma. Sajnos ez nem nyilvnval egy
problmamegold gens szmra, hisz az a cltesztet egy fekete dobozknt ltja, mely minden llapotra
mindssze egy igaz-hamis rtket ad vissza. Ennek kvetkezmnyekpp a problmamegold gens nem
autonm; azaz emberi beavatkozst ignyel minden j problmnl az alkalmazhat heurisztika megadsra.
Msrszrl, ha az gensnek rendelkezsre ll a cl lersa, mint rszclok konjunkcija, akkor hasznlhat egy
egyszer feladatfggetlen heurisztikt: a mg nem teljestett rszclok szmt. A knyvvsrlsi feladat esetn a
cl Birtokol(A) Birtokol(B) Birtokol(C) Birtokol(D) lenne, s a Birtokol(A) Birtokol(C) llapot
kltsge 2. gy az gens szmra automatikusan elrhet a helyes heurisztika erre s ms problmkra is. A
fejezet ksbbi rszben ltni fogjuk, hogy hogyan lehet ltrehozni olyan kifinomultabb heurisztikkat, ami a
clstruktrjn tl szmba veszi a vgrehajthat cselekvseket is.
334
Tervkszts
Vgl a problmamegold gens nem hatkony, mert nem tudja kihasznlni a problmadekompozci
(problem decomposition) lehetsgt. Vegyk pldul a kvetkez feladatot: tbb csomagot kell kiszlltanunk
a megfelel cmekre, melyek Ausztrlia klnbz pontjain tallhatk. J megkzelts, ha megkeressk a
clpontokhoz legkzelebb es reptereket, s felosztjuk a teljes problmt tbb rszfeladatra; repterenknt egyre.
Az egy reptren keresztl irnytott csomagok esetn a tovbbi dekompozci lehetsge a clvrostl fgg. Az
5. fejezetben lttuk, hogy egy ilyen felbonts kpessge hozzjrul a knyszerkielgtsi feladatmegoldk
hatkonysghoz. A tervksztkre ugyanez igaz: a legrosszabb esetben n csomag legjobb kiszlltsi tervnek
elksztse O(n!), mg ha a feladat k egyenl rszre bonthat ez mindssze O((n/k)! k) komplexits feladat.
Ahogy az 5. fejezetben megjegyeztk, a teljesen dekomponlhat problmk jk, de ritkk. 1 A legtbb
tervkszt rendszer felptse klnsen a 11.3. fejezetben bemutatsra kerl rszben rendezett tervkszt
felptse azon a felttelezsen alapul, mely szerint a legtbb vals, letszer problma majdnem
dekomponlhat (nearly decomposable). Ez annyit jelent, hogy a tervkszt dolgozhat fggetlen
rszclokon, de a rsztervek sszekombinlsa tovbbi feladatokat eredmnyezhet. Nhny feladat esetn ez a
felttelezs nem helytll, mert az egyik rszcl kidolgozsa gyakran megbontja a msik rszclt. Ezek a
rszclok kztti klcsnhatsok azok, amelyek a fejtrket (mint a nyolcas kirak) valjban fejtrv teszik.
1.1. A tervksztsi problmk nyelve

A fent lertak alapjn a tervksztsi problmk reprezentcijnak ami az llapotokat, cselekvseket s
clokat jelenti lehetsget kellene biztostania a tervkszt algoritmus szmra, hogy a feladat logikai
struktrjt kihasznlhassa. Ennek kulcsa, hogy olyan nyelvet talljunk, ami kellen kifejez ahhoz, hogy a
problmk egy szles krt lerja, ugyanakkor kellen szigor ahhoz, hogy a lersokon hatkony algoritmusok
mkdhessenek. Ebben a fejezetben elszr krvonalazzuk a klasszikus tervksztk ltal hasznlt alapnyelvet,
ami STRIPS nven ismert.2 Ksbb rmutatunk a szmos mdostsi lehetsgbl nhnyra a STRIPS-szer
nyelvekben.
Az llapotok lersa. A tervksztk a vilgot logikai felttelekre dekomponljk, s az llapotokat a pozitv
literlok konjunkcijaknt rjk le. Tekintsk az tletlogikai literlokat; pldul a Szegny Ismeretlen
reprezentlhatja egy szerencstlen gens llapott. Elsrend literlokat is felhasznlunk; pldul Ott(Repl1,
Melbourne) Ott(Repl2, Sydney) a csomagszlltsi feladat egy llapott rhatja le. Az elsrend logikai
llapotlersok literljainak alap- s fggvnymentes literlnak (ground and function-free) kell lennik. Az
olyan literlok, mint az Ott(x, y) vagy az Ott(Apja(Ferenc), Sydney) nem megengedettek. A zrt vilg
felttelezst (closed-world assumption) hasznljuk, ami annyit tesz, hogy a nem felsorolt lltsokat hamisnak
vesszk.
A clok lersa. A cl egy rszlegesen definilt llapot, melyet pozitv alapliterlok konjunkcija reprezentl,
mint Gazdag Hres vagy Ott(P2, Tahiti). Az s tletlogikai llapot kielgti a c clt (goal satisfiction), ha s
tartalmazza a c-ben szerepl sszes atomot (s esetleg mg tovbbiakat). Pldul a Gazdag Hres Szomor
llapot kielgti a Gazdag Hres clt.
A cselekvsek lersa. A cselekvst a kvetkez kt llapot hatrozza meg: az elfelttel, aminek teljeslni kell
az akci vgrehajtshoz, s a kvetkezmny, ami a vgrehajts eredmnyeknt lp fel. Pldul kt lloms
kztti repls lersa az albbi:
Cselekvs(Repl(p, honnan, hova),
Elfelttel: Ott(p, honnan) Repl(p) Repltr(honnan) Repltr(hova)
Kvetkezmny: Ott(p, honnan) Ott(p, hova))
Ezt pontosabban cselekvsi smnak (action schema) nevezzk, ami azt takarja, hogy ez szmos klnbz
cselekvst reprezentl, ami a p, honnan s a hova vltozk klnbz behelyettestseivel szrmaztathat.
ltalnossgban a cselekvsi sma hrom f rszbl ll:
A cselekvs megnevezse s paramterlistja pldul a Repl(p, honnan, hova) a cselekvs azonostsra
szolgl.
Vegyk szre, hogy mg a csomagkiszlltsi feladat sem teljesen dekomponlhat. Vannak esetek, amikor jobb a csomagokat mgis egy
tvolabbi reptrre irnytani, ha ezzel megsprolhatunk egy kln repljratot a kzelire. Mindemellett a legtbb szlltcg inkbb a mr
bejratott dekomponlt megoldsokhoz ragaszkodik, hogy cskkentse a szmtsi s szervezsi nehzsgeket.
2
A STRIPS a STandford Research Institute Problem Solver rvidtse.
1
335
Tervkszts
Az elfelttel (precondition), fggvnyektl mentes pozitv literlok konjunkcija, azt mutatva, hogy milyen
feltteleknek kell elzetesen teljeslni a cselekvs vgrehajtshoz.
A kvetkezmny (effect), fggvnyektl mentes literlok konjunkcija, ami lerja, hogy az llapot hogyan
vltozik, amikor a cselekvs vgrehajtsra kerl. A cselekmny eredmnyekpp add kvetkezmnyrszben
szerepl P pozitv literl igaz rtket kap, mg a P hamis rtket vesz fel. A kvetkezmnyrszben szerepl
vltozknak a cselekvs elfelttelei kztt is szerepelni kell.
Az olvashatsg javtsa rdekben nhny tervkszt kvetkezmnyrszt sztvlasztja egy hozzads listra
(add list) a pozitv s egy trls listra (delete list) a negatv literloknak.
Most hogy a tervksztk reprezentcijnak szintaxist definiltuk, adjuk meg a szemantikt is. Ennek
legegyszerbb mdja, ha lerjuk, hogy a cselekvsek hogyan mdostjk az llapotot. (Egy msik lehetsges
mdszer, hogy egy direkt fordtst specifiklunk a kvetkez llapot aximkra, melyek szemantikja az
elsrend logikbl szrmazik. Lsd 11.3. feladat.) Elszr is azt mondjuk, hogy egy cselekvs alkalmazhat
(applicable) minden llapotban, ami kielgti az elfeltteleket; egybknt a cselekvs hatstalan. Egy
elsrend sma esetben az alkalmazhatsg elrse az elfelttelek egy behelyettestst vonja maga utn.
Tegyk fel pldul, hogy a jelen llapot lersa:
Ott(P1, JFK) Ott(P2, SFO) Repl(P1) Repl(P2)
Repltr(JFK) Repltr(SFO)
Ez teljesti az
Ott(p, honnan) Repl(p) Repltr(honnan) Repltr(hova)
elfelttelt a {p/P1, honnan/JFK, hova/SFO} behelyettestsekkel (s msokkal is lsd 11.2. feladat). gy a

konkrt Repl(P1, JFK, SFO) cselekvs alkalmazhat.
Az s llapotbl kiindulva az alkalmazhat a cselekvs vgrehajtsnak eredmnye az s' llapot, ami azonos ssel, kivve, hogy az a cselekvs kvetkezmnyrszben szerepl pozitv P literlokat az s-hz adjuk, mg
brmilyen P negatv literlt eltvoltjuk s-bl. gy a Repl(P1, JFK, SFO) cselekvs utn az llapot a
kvetkez:
Ott(P1, SFO) Ott(P2, SFO) Repl(P1) Repl(P2)
Vegyk szre, hogy a mr szerepl pozitv kvetkezmnyeket nem szrjuk be mg egyszer, illetve ha egy
negatv literl nem szerepel az llapotlersban, akkor a kvetkezmny ezen rsze figyelmen kvl hagyhat. Ez
a definci testesti meg az gynevezett STRIPS felttelezst (assumption): minden a kvetkezmnyben nem
szerepl literl vltozatlan marad. gy a STRIPS elkerli a 10. fejezetben bemutatott reprezentcis keret
problmt (representional frame problem).
Vgezetl definilhatjuk a tervksztsi problma megoldst (solution). Legegyszerbb formjban ez csak
egy cselekvssorozat, melyet a kiindulsi llapotbl vgrehajtva a clllapotot eredmnyezi. A fejezet tovbbi
rszeiben a megoldsok cselekvsek rszben rendezett sorozatai is lehetnek, amennyiben minden
cselekvssorozat, ami megfelel ennek a rszben rendezsnek, megolds.
1.2. Kifejezkpessg s kiterjesztsek

A sokfle megkts, korltozs amit a STRIPS nyelv tartalmaz, abban a remnyben kerlt beptsre, hogy a
tervkszt algoritmusok egyszerbbek s hatkonyabbak lehessenek, anlkl hogy a vals problmk lerst
megneheztenk. Egyike a legfontosabb megktseknek, hogy a literloknak fggvnymenteseknek kell lennik.
Ezzel a megktssel biztosthatjuk, hogy egy adott problmhoz tartoz brmely akci sma tletkalkulus
formra, azaz vltozmentes tletlogikai cselekvs reprezentcik vges halmazra hozhat. (A tma bvebb
lerst lsd a 9. fejezetben.) Pldul a lgi szlltsi problmakrben 10 repl s 5 repltr esetn a Repl(p,
honnan, hova) sma 10 5 5 = 250 tletlogikai cselekvsre fordthat. A 11.4. s 11.5. alfejezet tervkszti
kzvetlenl az tletkalkulusra hozott lerssal dolgoznak. Ha fggvnyszimblumokat is megengednk, akkor
vgtelen sok llapot s cselekvs hatrozhat meg.
336
Tervkszts
11.1. bra - A Strips s az ADL nyelv sszehasonltsa a tervksztsi feladatok

reprezentcijnak szempontjbl. Mindkt esetben a clok gy viselkednek, mint egy
paramterek nlkli cselekvs elfelttelei.
Napjainkra, nyilvnvalv vlt, hogy a STRIPS nem elgg kifejez nhny vals problmakrhz. Ennek
eredmnyekppen szmos nyelvvltozatot dolgoztak ki. A 11.1. bra rviden sszefoglalja az egyik
legfontosabbat, a cselekvsler nyelvet (Action Description Language ADL) gy, hogy sszehasonltja azt
a STRIPS alapverzijval. ADL nyelven a Repls lersa az albbi:
Cselekvs(Repl(p : Repl, honnan : Repltr, hova : Repltr),
Elfelttel: Ott(p, honnan) (honnan hova)
Kvetkezmny: Ott(p, honnan) Ott(p, hova))
A p : Repl rsmd az elfelttelek a paramterlistjban a Repl(p) egy rvidtse, ami nem nveli a
kifejezkpessget, de javtja az olvashatsgot. (Mindemellett reduklja a ltrehozhat tletlogikai
cselekvsek szmt.) A (honnan hova) elfelttel azt a tnyt fejezi ki, hogy egy replt kiindulsi s
clllomsa nem lehet azonos. Ezt a STRIPS nyelvben nem lehetne tmren kifejezni.
A mestersges intelligenciban hasznlt vltozatos tervkszt formalizmusokat egy szabvnyos szintaxisba
rendszerezik, amit tervksztsi terlet defincis nyelvnek (Planning Domain Definition Language
PDDL) neveznek. Ez a nyelv lehetv teszi a kutatk szmra, hogy benchmark problmkat cserljenek ki
egyms kztt, s sszevessk az eredmnyeket. A PDDL rsznyelveket tartalmaz az ADL s a 12. fejezetben
bemutatsra kerl hierarchikus feladathlzatok szmra.
A STRIPS s az ADL jellsrendszere szmos vals problmakrre megfelel. A kvetkez alfejezetek nhny
egyszer pldt mutatnak be. Nhny szmottev megkts azrt mg megmaradt. A legnyilvnvalbb, hogy
kzvetlenl nem tartalmazzk a cselekvsek vghatsait (ramifications). Pldul ha vannak emberek,
csomagok vagy porcick egy repln, akkor mindannyian helyet vltoztatnak egy repls sorn. Ezeket a
vltozsokat lerhatjuk, mint a repls egyenes kvetkezmnyeit, gy termszetesebbnek tnik a replgp
tartalmnak helyt, mint a gp helynek logikai kvetkezmnyt brzolni. Az ilyen llapotmegktsekre
(state constraints) a 11.5. alfejezet tartalmaz pldkat. A hagyomnyos tervkszt rendszerek meg sem
prbljk megoldani a kvalifikcis problmt (qualification problem), azaz a nem reprezentlt krlmnyek
problmjt, melyek a cselekvs meghisulst okozhatjk. A 12. fejezetben ltni fogjuk, hogy a kvalifikcis
problma hogyan kzelthet meg.
337
Tervkszts
1.3. Plda: Lgi teherszllts

A 11.2. bra egy teherszlltsi problmt mutat be, ami a teher be-, illetve kirakodst s llomsok kztti lgi
szlltst tartalmazza. A problma hrom cselekvssel rhat le: Berakods, Kirakods s Repls. A
cselekvsek kt prediktumot rintenek: a Benne(c, p) jelentse, hogy a c teher a p replgpben van, s az
Ott(x, a) jelentse, hogy az x objektum (teher vagy replgp) az a repltren tallhat. Vegyk szre, hogy a
teher nincs Ott sehol, ha Benne van egy replgpben, azaz az Ott valjban azt jelenti, hogy az objektum
elrhet a megadott helyen. Tapasztalattal kell rendelkezni a cselekvsdefincik terletn, ahhoz hogy az
ilyen rszleteket konzisztensen brzoljuk. A kvetkez terv megoldsa a feladatnak:
[Berakods(C1, P1, SFO), Repls(P1, SFO, JFK, Kirakods(C1, P1, JFK)
Berakods(C2, P2, JFK), Repls(P2, JFK, SFO, Kirakods(C2, P2, SFO)]
11.2. bra - A STRIPS-problma replterek kztti lgi teherszlltsi feladathoz
A mi reprezentcink tisztn STRIPS nyelv. Nevezetesen ez engedlyezi, hogy egy repl kiindul s
clllomsa azonos repltr legyen. Az ADL egyenltlensg opertorai ezt kizrhatnk.
1.4. Plda: A ptkerk problma

Vegyk a kerkcsere problmjt. Pontosabban a clunk az, hogy egy j ptkerk legyen felszerelve az aut
tengelyre, ahol a kiindul llapotban egy lapos kerk van felszerelve, mg a j ptkerk a csomagtartban
tallhat. Az egyszersg kedvrt a mi feladatunk elg absztrakt, azaz nincsenek beragadt csavarok vagy egyb
ms nehzsgek. Csak ngy cselekvs van: a ptkerk kivtele a csomagtartbl, a lapos kerk eltvoltsa a
tengelyrl, a ptkerk felszerelse s az aut magra hagysa reggelig. Felttelezzk, hogy az aut egy igen
rossz krnyken ll, ahol az aut magra hagysa azt eredmnyezi, hogy reggelre eltnnek a kerekek.
A 11.3. bra a feladat ADL lerst tartalmazza. Vegyk szre, hogy ez a megads pusztn tletlogikai. A
STRIPS nyelven tlmutat, hogy a TeddFel(Ptkerk, Tengely) cselekvshez a Ott(Ptkerk, Tengely) neglt
elfelttel tartozik. Ezt elkerlhetnnk egy SzabaddTesz(Tengely) hasznlatval, amint azt a kvetkez
pldban ltni fogjuk.
11.3. bra - Az egyszer ptkerk problma
338
Tervkszts
1.5. Plda: A kockavilg

Az egyik leghresebb tervksztsi terlet a kockavilg (blocks world) problma. A terlet asztallapon
elhelyezett kockkbl ll.3 A kockkat egymsra rakhatjuk, de egy kockn kzvetlenl mindig csak egyetlen
msik helyezhet el. A kockkat egy robotkarral mozgathatjuk, amely fel tud venni egy kockt, majd azt vagy
az asztalra, vagy egy msik kocka tetejre le tudja tenni. A robotkar egyszerre csak egy kockt tud felemelni,
vagyis olyat nem, amelynek a tetejn egy msik kocka van. A cl mindig egy vagy tbb kockaoszlop ptse,
amelyekben a kockk egymshoz kpesti elhelyezkedse meghatrozott. A cl lehet pldul kt oszlop ptse,
amelyek kzl az egyikben az A kocka a B tetejn van, a msikban pedig a C kocka van a D tetejn.
A Rajta(b, x) jellst hasznljuk annak lersra, hogy a b kocka az x-en van, ahol az x egy msik kockt vagy
az asztallapot jelenti. A Mozgat(b, x, y) cselekvs a b kockt a x tetejrl az y tetejre mozgatja. A b kocka
mozgatsnak elfelttele, hogy rajta semmi ne legyen. Ennek lersa az elsrend logikban a x Rajta(x, b)
vagy x Rajta(x, b). Az ADL nyelvben ezek elfelttelek lehetnnek. A STRIPS nyelv keretei kztt
maradhatunk az res(x) prediktum bevezetsvel, ami akkor igaz, ha semmi nincs x-en.
A Mozgat cselekvs a b kockt az x-rl az y-ra mozgatja, ha mind a b, mind pedig az y res. A mozgats utn az
x res, de az y mr nem. A Mozgat formlis lersa STRIPS-ben a kvetkez:
Cselekvs(Mozgat(b, x, y),
Elfelttel: Rajta(b, x) res(b) res(y)
Kvetkezmny: Rajta(b, y) res(x) Rajta(b, x) res(y))
Sajnos ez a cselekvs nem kezeli jl az res prediktumot, ha az x vagy az y az asztalon van.

Ha x = Asztal, a cselekvs kvetkezmnyei kztt szerepel az res(Asztal) is, de az asztalnak nem kell kirlnie
a mozgats utn, ha pedig y = Asztal, megjelenik az res(Asztal) elfelttel, holott az asztalnak nem kell
resnek lenni ahhoz, hogy brmit is tehessnk r. Ennek kikszblsre kt dolgot tehetnk. Elszr is
bevezetnk egy j cselekvst, amellyel egy b kockt az asztalra tehetnk:
Cselekvs(AsztalraTesz(b, x, y),
Elfelttel: Rajta(b, x) res(b)
Kvetkezmny: Rajta(b, Asztal) res(x) Rajta(b, x))
Msodszor az res(b) prediktumot gy rtelmezhetjk, hogy b tetejn van elg szabad hely, ahov a kockt
letehetjk. Ezek szerint az res(Asztal) mindig igaz. Az egyetlen problma, hogy semmi nem gtolja a
tervksztt abban, hogy a Mozgat(b, x, Asztal) cselekvst alkalmazza az AsztalraTesz(b, x) helyett. Vagy egytt
A tervkszts kutatsban hasznlt kockavilg sokkal egyszerbb, mint az SHRDLU verzi, amit az 3.3. szakasz - Korai lelkeseds, nagy
elvrsok (19521969) rszben mutattunk be.
3
339
Tervkszts
lnk ezzel a problmval (amely egybknt a szksgesnl nagyobb keressi teret eredmnyez, de nem vezet
hibs vlaszokhoz), vagy bevezethetjk a Kocka prediktumot, s a Mozgat cselekvs elfeltteleihez
hozztehetjk a Kocka(x) Kocka(b) rszt.
11.4. bra - A kockavilg tervksztsi problmja: egy hrom kockbl ll torony

ptse. A [Mozgat(B, Asztal, C), Mozgat(A, Asztal, B)] cselekvssor egy lehetsges
megolds.
Vgl itt van mg az olyan hibs mveletek esete, mint a Mozgat(B, C, C), amely hatstalan kellene legyen,
ehelyett azonban ellentmond kvetkezmnyekhez vezet. ltalban nem foglalkozunk az ilyen jelleg
problmkkal, mert nemigen vannak hatssal az ellltott tervekre. A helyes megkzelts, hogy
egyenltlensgi elfeltteleket vezetnk be, amint azt a 11.4. bra mutatja.
2. Tervkszts llapottr-keresssel
Most fordtsuk figyelmnket a tervkszt algoritmusok fel. A legkzenfekvbb megkzelts az llapottrkeress. Mivel a tervksztsi problmk cselekvseinek lersa tartalmazza az elfeltteleket s a
kvetkezmnyeket, a keress mindkt irnyban vgrehajthat: vagy elrefel egy kiindulsi llapotbl, vagy
visszafel a cltl, amint azt a 11.5. bra is mutatja. Mindezeken tl felhasznlhatjuk az explicit cselekvs- s
clreprezentcikat, hogy automatikusan hatkony heurisztikkat szrmaztassunk.
2.1. Elrefel keress az llapottrben

Ez elrefel keresssel trtn tervkszts hasonlt a 3. fejezetben bemutatott problmamegold
megkzeltshez. Ezt progresszv tervksztsnek nevezzk, mert elrefel haladva dolgozik.
A feladat kiindul llapotbl indulva vgignzzk a lehetsges cselekvssorozatokat, amg olyat nem tallunk,
ami a clllapothoz vezet. A tervksztsi problma llapottr-keressi problmaknt formalizlva a kvetkez:
A keress kiindulsi llapota (initial state) megegyezik a tervksztsi problma kiindulsi llapotval.
ltalnossgban minden llapot pozitv alapliterlok egy halmaza; az itt nem szerepl literlok hamisak.
Egy llapotban minden olyan cselekvs (action) alkalmazhat, aminek az elfelttelei teljeslnek. A
cselekvs vgrehajtsa utn kvetkez llapotot gy lltjuk el, hogy a kvetkezmnyrsz pozitv literljait
hozzadjuk, negatv literljait pedig trljk. (Elsrend logika esetn az elfelttelekbl az egyestt
alkalmazni kell a kvetkezmnyliterlokra.) Megjegyezzk, hogy annak kvetkezmnyeknt, hogy egy
explicit cselekvs reprezentcit hasznlunk, egyetlen llapottmenet-fggvny mkdik az sszes
tervkszt problmra.
A clteszt (goal test) ellenrzi, hogy az adott llapot kielgti-e a tervksztsi problma cljt.
A lpskltsg (step cost) minden cselekvsre tipikusan 1. Habr knny lenne a klnbz cselekvsekhez
klnbz kltsgeket hozzrendelni, ezt a STRIPS tervksztkben nagyon ritkn alkalmazzk.
340
Tervkszts
11.5. bra - A tervkszts kt megkzeltse. (a) Elrefel (progresszv) llapottrkeress, a kiindul llapotbl indulva s a problma cselekvseit hasznlva halad a cl
fel. (b) Visszafel (regresszis) llapottr-keress: valsznsgi llapot keress (lsd
6.1. szakasz - Szenzor nlkli problmk rszben) a clllapot(ok)bl indulva a
cselekvsek inverzt alkalmazva keresi visszafel a kezdeti llapotot.
Emlkezznk vissza, hogy a fggvnyszimblumok hinyban a tervksztsi problma llapottere vges, ezrt
teljes grf keressi algoritmusok, mint pldul az A* keress, egyben teljes tervkszt algoritmusok is.
A tervksztk kutatsnak korai napjaitl (kb. 1961-tl) egszen mostanig (kb. 1998-ig) az a felttelezs lt,
hogy az elrefel keres algoritmusok nem elgg hatkonyak a gyakorlati alkalmazsra. Ma mr, tekintsnk
csak vissza a 11.1. alfejezetre, ezt nem nehz megindokolni. Elszr is az elrefel keress nem foglalkozik a
lnyegtelen cselekvsek problmjval, mivel minden llapotban minden alkalmazhat cselekvst figyelembe
vesz. Msodszor pedig ez a megkzelts gyorsan elakad egy j heurisztika nlkl. Vegyk pldul a lgi
csomagszlltsi problmt 10 repltrrel, egyenknt 5-5 replvel s 20 darab csomaggal. A cl, hogy az A
repltr sszes terht a B repltrre szlltsuk. Van egy egyszer megoldsa a feladatnak: tegyk be mind a
20 csomagot az egyik A-beli replgpbe, ezzel repljnk B-be, s ott rakodjunk ki. A megolds megkeresse
ellenben nagyon nehz lehet, hiszen az tlagos elgazsi faktor risi: mind az 50 repl 9 msik reptrre tud
replni, mg mind a 200 csomag kirakhat (ha be volt rakva), vagy berakhat a reptr brmelyik repljbe.
tlagosan mondjuk 1000 lehetsges cselekvs hajthat vgre, gy a keressi fban a kzenfekv megolds
mlysgig kzel 100041 csompont van. Ebbl nyilvnval, hogy egy megfelel heurisztikra lesz szksg,
hogy ezt a keresst hatkonny tegyk. A htrafel keress ttekintse utn nhny lehetsges heurisztikt
mutatunk be.
2.2. Htrafel keress az llapottrben

Az llapottrben trtn htrafel keresst a ktirny keress egy rszeknt a 3. fejezetben rviden mr
bemutattuk. Ott megjegyeztk, hogy a htrafel keress megvalstsa nagyon nehz lehet, ha a clllapotokat
az explicit megads helyett megktsekkel hatrozzuk meg. Nevezetesen nem mindig nyilvnval, hogy hogyan
generljuk le a clllapotok halmaznak a lehetsges eldllapotait (predecessors). Ltjuk majd, hogy a
STRIPS reprezentci esetn ez meglehetsen egyszer, mert az llapothalmazokat azokkal a literlokkal
rhatjuk le, amelyeknek igaz rtkeknek kell lenni az adott llapotokban.
A htrafel keress f elnye az, hogy lehetv teszi szmunkra, hogy csak a relevns (relevant) cselekvseket
vegyk figyelembe. Egy cselekvs relevns egy konjunktv cl szempontjbl, ha elri a cl egy konjunktjt.
341
Tervkszts
Pldul a 10-replteres lgi csomagszlltsi problmnk esetben a cl az, hogy a 20 csomag a B repltren
legyen, vagy pontosabban
Ott(C1, B) Ott(C2, B) Ott(C20, B)
Vegyk az Ott(C1, B) literlt. Htrafel dolgozva, olyan cselekvseket kereshetnk, melyeknek ez a

kvetkezmnye. Ilyen csak egy van: Kirakods(C1, p, B), ahol a p replgp meghatrozatlan.
Vegyk szre, hogy szmos irrelevns cselekvs is van, ami szintn a clllapotra vezet. Pldul elrepthetnk
egy res gpet a JFK repltrrl (John Fitzgerald Kennedy repltr New Yorkban) az SFO-ra (San Francisco
repltere), ami a clllapothoz vezet egy olyan eldllapotbl, melyben a replgp a JFK-n van, s minden
clfelttel teljesl. Egy htrafel keress, ami megengedi a hatstalan cselekvseket mg teljes, de sokkal
kevsb hatkony. Ha ltezik megolds, akkor azt egy olyan htrafel keress is megtallja, amely csak relevns
cselekvseket enged meg. A htrafel keress szktse a relevns cselekvsekre, gyakran jval alacsonyabb
elgazsi tnyezt eredmnyez, mint az elrefel keress. Pldul a lgi szlltsi problmnk esetn a
kiindulsi llapotbl elrefel kzel 1000 cselekvs hajthat vgre, mg a clbl visszafel indulva mindssze
20.
A visszafel keresst regresszis (regression) tervksztsnek is nevezik. A regresszis keress meghatroz
krdse a kvetkez: melyek azok az llapotok, amelyekbl egy adott cselekvs a clhoz vezet? Ezen llapotok
lersnak szmtst a cl adott llapoton keresztli regresszlsnak (regressing) nevezzk. Hogy lssuk
ennek menett, vegyk a lgi szlltsi feladatot. Adott a cl az
Ott(C1, B) Ott(C2, B) Ott(C20, B)
s a relevns cselekvs a Kirakods(C1, p, B), ami az els literlt adja. A cselekvs csak akkor mkdik, ha az
elfelttelei teljeslnek. Ebbl kifolylag az eldllapotnak tartalmaznia kell a Benne(C1, p) Ott(p, B)
elfeltteleket. Mindezeken tl az Ott(C1, B) rszcl nem lehet igaz a megelz llapotban.4 gy a megelz
llapot lersa az albbi:
Benne(C1, p) Ott(p, B) Ott(C2, B) Ott(C20, B)
Ennek tetejbe, ha elvrjuk, hogy egy cselekvs kielgtsen egy literlt, azt is biztostanunk kell, hogy nem ront
el egy msikat. Az olyan cselekvst, ami megfelel ennek az elvrsnak konzisztensnek (consistent) nevezzk.
Pldul a Berakods(C2, p) cselekvs nem lenne konzisztens az aktulis cllal, mert neglja az Ott(C2, B) literlt.
Most, hogy a relevancit s a konzisztencit definiltuk, megadhatunk egy ltalnos mdszert a htrafel
keress eldllapotnak keresshez. Adott egy G cl lersa. Legyen az A cselekvs relevns s konzisztens. A
megfelel eldllapot a kvetkez:
Az A minden pozitv kvetkezmnyt, ami szerepel G-ben, trljk.
Az A minden, mg nem szerepl elfelttelt hozzadjuk.
A standard keressi algoritmusok brmelyike felhasznlhat a keressre. A lellsi felttel, hogy a generlt
eldllapot lerst a keress kiindulsi llapota kielgtse. Az elsrend esetben, ehhez nhny vltoz
behelyettestsre is szksg lehet az eldllapotnak lersban. Pldul az elz bekezds eldllapotnak
lerst a
Benne(C1, P12) Ott(P12, B) Ott(C2, B) Ott(C20, B)
kiindulsi llapot a {p/P12} behelyettestssel teljesti. A behelyettestseket arra a cselekvsre kell vgrehajtani,
ami az llapottl a clhoz vezet, gy eredmnyezve a [Kirakods(C1, P12, B)] megoldst.
2.3. llapottr-keressi heurisztikk

Sem az elre-, sem pedig a htrafel keress nem hatkony egy j heurisztika nlkl. Emlkezznk vissza a 4.
fejezetbl, hogy egy heurisztikus fggvny egy llapot clllapottl val tvolsgt becsli; a STRIPS esetn
minden cselekvs kltsge 1, gy a tvolsg az alkalmazand cselekvsek szma. Az alaptlet, hogy nzzk a
cselekvs kvetkezmnyeit s a clokat, s becsljk meg, hogy hny lpsre van szksg a clok elrsre. A
Ha a rszcl igaz lenne az eldllapotban, akkor a cselekvs mg mindig a clllapothoz vezetne. Ellenben az ilyen cselekvsek
hatstalanok (irrelevnsak), mivel nem teszik igazz a clt.
4
342
Tervkszts
pontos szm meghatrozsa NP-teljes problma, de a legtbb esetben tallhatk kellen pontos becslk, melyek
nem nagyon szmtsignyesek. Szintn kpesek lehetnk egy elfogadhat (admissable) heurisztika
szrmaztatsra, azaz olyanra, ami nem becsl tl. Ez az A* keresssel egytt hasznlhat optimlis
megoldsok megkeressre.
Kt megkzeltst lehet kiprblni. Az egyik, hogy a megadott feladatlersbl egy relaxlt problmt (relaxed
problem) szrmaztatunk, ahogy azt a 4. fejezetben bemutattuk. A relaxlt problmra (ami vrhatan knnyen
megoldhat) adott optimlis megolds kltsge elfogadhat heurisztikt ad az eredeti problmra. A msodik
megkzelts sorn felttelezzk, hogy a tiszta oszd meg s uralkodj algoritmus mkdni fog. Ezt nevezzk a
rszclfggetlensg (subgoal independence) felttelezsnek: a rszclok konjunkcijnak megoldsi kltsgt,
az egymstl fggetlenl megoldott rszclok kltsgeinek sszegvel becsljk. A rszclfggetlensg
felttelezs lehet optimista vagy pesszimista. Akkor optimista, hogyha vannak negatv klcsnhatsok a
rszclokhoz ksztett rsztervek kztt (pldul amikor az egyik rszterv egy cselekvse trl egy clt, melyet
egy msik rszterv rt el). Akkor pesszimista s egyben elfogadhatatlan is, ha a rsztervek redundns
cselekvseket tartalmaznak (pldul kt cselekvs eggyel helyettesthet az sszefslt tervben).
Vizsgljuk meg, hogyan szrmaztathatunk relaxlt tervksztsi problmkat. Mivel az elfelttelek s a
kvetkezmnyek explicit megadsai rendelkezsre llnak, az eljrs ezeket a reprezentcikat mdostja.
(Vessk ssze ezt a megkzeltst a keressi feladatokkal, ahol az llapottmenet-fggvny egy fekete doboz.)
A legegyszerbb tlet, hogy laztsuk a problmt gy, hogy eltvoltjuk az sszes elfelttelt a cselekvsekbl.
Ekkor minden cselekvs mindig alkalmazhatv vlik, s minden literl elrhet egy lpsben (ha van
alkalmazhat cselekvs, egybknt a cl elrse lehetetlen). gy tnhet, ez azt jelenti, hogy a clok
konjunkcijhoz vezet lpsszm azonos a kielgtetlen clliterlok szmval, de nem egszen; (1) lehet kt
cselekvs, melyek klcsnsen trlik a msik ltal teljestett clliterlt, (2) nhny cselekvs tbb clt is elrhet.
Ha kombinljuk a relaxlt problmt s a rszcl fggetlensgi felttelezst, mindkt problmt kikszbltnek
vehetjk, s az elll heurisztika pontosan a mg kielgtetlen clok szma.
Sokszor pontosabb heurisztika nyerhet, ha legalbb a tbb clt kielgt cselekvsek pozitv klcsnhatsait
figyelembe vesszk. Elszr tovbb relaxljuk a problmt azltal, hogy eltvoltjuk a negatv kvetkezmnyeket
(lsd 11.6. feladat). Ezutn kiszmtjuk, hogy mennyi az a minimlis cselekvsszm, melyek pozitv
kvetkezmnyeinek unija kielgti a clt. Vegyk pldul a
Cl(A B C)
Cselekvs(X, Kvetkezmny: A P)
Cselekvs(Y, Kvetkezmny: B C Q)
Cselekvs(Z, Kvetkezmny: B P Q)
A minimlis halmaz az {X, Y} cselekvs, ami az {A, B, C} clt kielgti, gy a fedhalmaz-heurisztika szerinti
kltsg 2. Ez javt a rszcl fggetlensg felttelezsen, ami 3-as kltsget adna. Egyetlen apr problma van: a
fedhalmaz problma NP-teljes. Az egyszer fedhalmaz-keressi algoritmus garantltan visszaad egy rtket,
ami egy log n-es faktor pontossggal az igazi minimumrtk, ahol n a cl literljainak szma, s a gyakorlatban
rendszerint ennl sokkal pontosabb. Sajnos a moh algoritmus elveszti a heurisztika elfogadhatsgnak
garancijt.
Az is lehetsges, hogy a relaxlt problmt a negatv kvetkezmnyek eltvoltsval lltjuk el anlkl, hogy
az elfeltteleket elhagynnk. Ez annyit tesz, hogy ha egy cselekvs kvetkezmnye A B az eredeti
problmban, akkor A a relaxlt problmban. Ez annyit tesz, hogy nem kell foglalkoznunk a rsztervek kztti
negatv klcsnhatsokkal, mert egyetlen cselekvs sem trlhet egy msik ltal ellltott literlt. Az gy
elll relaxlt feladat megoldsnak kltsge az res-trlsi-lista (empty-delete-list) heurisztikt adja. A
heurisztika meglehetsen pontos, de kiszmtsa egy (egyszer) tervkszt algoritmus futtatst ignyli. A
gyakorlatban a relaxlt problma megoldsa elg gyors ahhoz, hogy megrje alkalmazni.
Az itt bemutatott heurisztika mind a progresszv (elrefel), mind pedig a regresszv (htrafel) irnyba
hasznlhat. A knyv rsnak pillanatban az res-trlsi-lista heurisztikt hasznl elrefel keresk a
listavezetk. Ez valsznleg vltozik, ahogy jabb heurisztikk s keressi technikk jelennek meg. Mivel a
tervkszts exponencilis komplexits,5 nincs olyan algoritmus, amely minden problmra hatkony lesz, de
Technikailag a STRIPS-alap tervkszts PSPACE-teljes, kivve, ha a cselekvseknek csak pozitv elfelttelei vannak egy
kvetkezmny literllal (Bylander, 1994).
5
343
Tervkszts
szmos gyakorlati feladat oldhat meg ezen fejezet heurisztikival sokkal tbb, mint ami nhny ve
megoldhat volt.
3. Rszben rendezett tervkszts

Az elre- s htrafel keress a teljesen rendezett terv keress specilis fajti. Ezek a cselekvseknek csak
szigoran lineris sorozatait trjk fel, melyek kzvetlenl kapcsoldnak a kiindulshoz vagy a clhoz. Ez
annyit tesz, hogy nem hasznlhatjk ki a problmadekompozci lehetsgeit. Ahelyett hogy a rszproblmkon
kln dolgoznnak, mindig arrl kell dntenik, hogy hogyan sorrendezzk a rszproblmk cselekvseinek
sszessgt. Elnysebb lenne egy olyan megkzelts, ami tbb rszclon dolgozik fggetlenl, ezeket tbb
rsztervvel megoldja, majd sszerakja a rszterveket.
Egy ilyen megkzeltsnek megvan az az elnye is, hogy rugalmas a terv sszelltsnak sorrendjben. A
tervkszt gy nem knyszerl arra, hogy a lpseken idrendi sorrendben dolgozzon, hanem elszr inkbb a
nyilvnval vagy fontos dntseken dolgozhat. Pldul egy Berkeleyben lv tervkszt gens, amely
Monte Carlba igyekszik, elszr egy San FranciscoPrizs jratot vizsgl meg, majd amikor ismeri a pontos
indulsi s rkezsi dtumokat, foglalkozhat a reptrre kijuts, illetve az onnan tovbbjuts problmjval.
Azt az ltalnos stratgit, mely szerint egy vlasztst ksleltetnk egy keress sorn, legkisebb megkts
(least commitment) stratginak nevezzk. A legkisebb megktsnek nincs formlis defincija, s
nyilvnval, hogy valamennyi megkts szksges, klnben a keress nem haladna. Az informlis definci
ellenre a legkisebb megkts nagyon hasznos megkzelts annak meghatrozsra, hogy a dntseket mikor
kell meghozni egy keressi problmban. Az els pldnk jval egyszerbb, mint egy nyarals megtervezse.
Vegyk a cipfelvtel egyszer esett. Ezt formlisan a kvetkez tervksztsi problmval rhatjuk le:
Cl(JobbCipFenn BalCipFenn)
Kiinduls()
Cselekvs(JobbCip, Elfelttel: JobbZokniFenn, Kvetkezmny: JobbCipFenn)
Cselekvs(JobbZokni, Kvetkezmny: JobbZokniFenn)
Cselekvs(BalCip, Elfelttel: BalZokniFenn, Kvetkezmny: BalCipFenn)
Cselekvs(BalZokni, Kvetkezmny: BalZokniFenn)
A tervksztnek kt cselekvssorozattal kell elllnia, a JobbZokni-t a JobbCip kveti, hogy a cl els

konjunktjt elrjk s a BalZokni-t a BalCip kveti a msodik konjunkthoz. A kt cselekvssorozat
kombinlhat, hogy teljes tervet nyerjnk. gy a tervkszt a kt rszsorozatot egymstl fggetlenl kezelheti
anlkl, hogy fellltana brmi megktst arra, hogy az egyik sorozat egy cselekvse a msikhoz kpest elbb
vagy ksbb kvetkezik. Brmely olyan tervkszt algoritmust, ami kt cselekvst be tud illeszteni egy tervbe
anlkl, hogy meghatrozn azok sorrendjt, rszben rendezett tervksztnek neveznk (partial-order
planner). A 11.6. bra a cip s zokni felvtelre ksztett rszben rendezett tervet szemllteti. Vegyk szre,
hogy a megoldst a cselekvsek grfja brzolja, nem egy szekvencia. rdemes megfigyelni az Indt s a Befejez
technikai cselekvseket, melyek a terv kezdett, illetve vgt jellik. Ezeket cselekvsnek nevezni
egyszersti a dolgokat, mert gy a terv minden lpse egy cselekvs. A rszben rendezett megolds hat teljesen
rendezett megoldsnak felel meg, melyek mindegyike a rszben rendezett megoldsnak egy sorba rendezse
(linearization).
11.6. bra - Egy rszben rendezett terv a zokni s a cip felvtelhez, s a hat lehetsges
sorba rendezs a teljesen rendezett tervhez
344
Tervkszts
A rszben rendezett tervkszts megvalsthat, mint egy keress a rszben rendezett tervek terben. (Ezentl
ezeket egyszeren csak terv-nek nevezzk.) Egy res tervvel indulunk. Ezutn a terv finomtsnak mdjait
keressk egszen addig, mg el nem llunk a teljes tervvel, ami megoldsa a problmnak. A cselekvsek
ebben a keressben nem a val vilg cselekvsei, hanem terveken vgrehajtott mveletek: egy lps hozzadsa
a tervhez, a cselekvsekhez egy sorrend rendelse, ami egy cselekvst egy msik el helyez s gy tovbb.
A tovbbiakban definilni fogjuk az RRT algoritmust a rszben rendezett tervksztshez. Hagyomnyosan az
RRT-t mint egy nll programot szoks bemutatni, ehelyett mi a rszben rendezett tervksztst, mint a
keressi problma egy pldnyt fogjuk megfogalmazni. Ez lehetv teszi, hogy az alkalmazhat tervfinomt
lpsekre koncentrljunk ahelyett, hogy azt vizsglnnk, hogyan trkpezi fel a keressi teret az algoritmus.
Valjban, ha a keressi feladatot megfogalmaztuk a nem informlt vagy heurisztikus keressi mdszerek szles
vlasztka ll rendelkezsre.
Emlkezznk vissza, hogy a keressnk llapotai (tbbnyire mg befejezetlen) tervek lesznek. Hogy elkerljk
a vals cselekvsekkel val keveredst, itt tervekrl s nem llapotokrl fogunk beszlni. Minden terv a
kvetkez ngy komponensbl ll, ahol az els kett a terv lpseit definilja, mg az utols kett naplzsra
szolgl, hogy abbl meghatrozzuk, hogyan bvthetk a tervek:
Cselekvsek (actions) halmaza, amelyek a terv lpseit adjk. Ezeket a tervksztsi problma
cselekvshalmazbl vesszk. Egy res terv csak az Indt s a Befejez cselekvseket tartalmazza. Az Indtnak nincsenek elfelttelei, mg a kvetkezmnyrsze a tervksztsi feladat kiindulsi llapotnak literljait
tartalmazza. A Befejez cselekvsnek nincsen kvetkezmny rsze, mg elfelttelei megegyeznek a clllapot
literljaival.
Rendezsi knyszerek (ordering constraints). Minden rendezsi knyszer A B alak, amit B eltt Anak olvasunk, s azt jelenti, hogy az A-t valamikor a B eltt kell vgrehajtani, de nem felttlenl kzvetlen
eltte. A rendezsi knyszerek egy megfelel rszben rendezst kell lerjanak. Brmilyen ciklus (mint az A
B s a B A) ellentmondst jelent, ezrt olyan rendezsi knyszer nem adhat a tervhez, amely ciklust hozna
ltre.
Okozati kapcsolatok (causal links). Az A s B cselekvsek kztti okozati kapcsolatot
-vel
jelljk s gy olvassuk, hogy A teljesti p-t B-hez. Pldul a

okozati
kapcsolat jelentse, hogy a JobbZokniFenn egy kvetkezmnye a JobbZokni cselekvsnek s elfelttele a
JobbCip-nek. Tartalmazza azt a megktst is, hogy a JobbZokniFenn-nek igaznak kell maradnia a
JobbZokni cselekvstl a JobbCip cselekvsig. Ms szavakkal, a terv nem mindig bvthet egy j C
cselekvssel, ami tkzik egy okozati kapcsolattal. Egy C cselekvs tkzik az
-vel, ha C
345
Tervkszts
kvetkezmnye a p, s ha C az A utn s B eltt jhet (a rendezsi knyszereknek megfelelen). Nhny

szerz az okozati kapcsolatokat vdett tartomnyoknak (protection intervals) nevezi, mert az
megvdi p-t a neglstl az AB intervallumban.
Nyitott elfelttelek (open preconditions). Egy elfelttel nyitott, ha nem teljesl a terv egy akcijnak
hatsra. A tervksztk feladata, hogy a nyitott elfelttelek halmazt res halmazra cskkentse,
ellentmondsok bevezetse nlkl.
Pldul a 11.6. brn bemutatott teljes terv a kvetkez komponenseket tartalmazza (nem tntettk fel a
rendezsi knyszereket, amelyek minden cselekvst az Indt utn s a Befejez el helyeznek):
Cselekvsek:{JobbZokni, JobbCip, BalZokni, BalCip, Indt, Befejez}
Rendezsek: {JobbZokni JobbCip, BalZokni BalCip}
Nyitott elfelttelek: {}
Fontos
Konzisztens tervnek (consistent plan) nevezzk azt a tervet, amelyben nincsenek ciklusok a rendezsi
megktsekben s nincsenek ellentmondsok az okozati kapcsolatokkal. Egy konzisztens terv, mely
nyitott elfelttelektl mentes, a megolds (solution). Rvid gondolkodssal belthat: egy rszben
rendezett megolds minden sorba rendezse egy teljesen rendezett megolds, melynek vgrehajtsa az
indul llapotbl egy clllapotra vezet. Ez annyit tesz, hogy a terv vgrehajtst a teljesen rendezett
tervekrl kiterjeszthetjk a rszben rendezett tervekre. Egy rszben rendezett terv vgrehajtsa sorn
ismtlden mindig vlasztunk egy kvetkez cselekvst, a lehetsges kvetkez cselekvsek
brmelyikt. A 12. fejezetben ltni fogjuk, hogy az gens szmra a terv vgrehajtsnak rugalmassga
nagyon hasznos lehet, ha a krnyezet nem az elvrtaknak megfelelen mkdik. A rugalmas
sorrendezs egyszersti a kisebb tervek sszekombinlst nagyobbakk, mert minden rszterv
trendezheti a cselekvseinek sorrendjt, hogy elkerlje a ms tervekkel val tkzst.
Most mr kszen llunk arra, hogy formalizljuk azt a keressi problmt, amit az RRT megold. Egy olyan
formalizlssal kezdnk, ami az tletlogikai tervksztsi problmkra alkalmas, az elsrend logikai
megoldssal jr komplikcikat ksbbre hagyjuk. Mint rendszerint, a definci tartalmazza a kiindul
llapotot, a cselekvseket s a cltesztet.
A kiindulsi terv egy Indt s egy Befejez cselekvst, egy Indt Befejez rendezst tartalmaz, s nincsenek
okozati kapcsolatok. A Befejez minden elfelttele nyitott.
Az llapottmenet-fggvny nknyesen kivlasztja B egy p nyitott elfelttelt s legenerl egy kvetkez
tervet egy A cselekvs minden olyan lehetsges konzisztens megvlasztshoz, mely teljesti p-t. A
konzisztencit a kvetkezkpp biztostjuk:
1. Az
okozati kapcsolatot s az A B rendezsi megktst hozzadjuk a tervhez. Az A cselekvs
lehet a terv egy mr ltez vagy egy j cselekvse. Amennyiben j, hozzadjuk a tervhez az Indt A s
az A Befejez megktsekkel.
2. Feloldunk minden konfliktust, az j okozati kapcsolat s az sszes ltez cselekvs, valamint az A
cselekvs (ha j) s minden ltez okozati kapcsolat kztt. Egy az
s C kztt fennll
konfliktust azltal oldunk fel, hogy C-t valamikor kvl helyezzk a vdett intervallumon a B C vagy a
C A hozzadsval. Amennyiben konzisztens tervet adnak, beszrjuk a kvet llapotokat,
valamelyikhez vagy akr mindketthz.
A clteszt ellenrzi, hogy a terv megoldsa-e az eredeti tervksztsi problmnak. Mivel csak konzisztens
terveket lltunk el, a cltesztnek csak azt kell ellenrizni, hogy vannak-e nem nyitott elfelttelek.
346
Tervkszts
Emlkezznk, hogy keressi algoritmus ltal vizsglt cselekvsek ebben a felrsban sokkal inkbb tervfinomt
lpsek, mint vals cselekvsek a feladattrbl. Az t kltsge ezrt szigor rtelembe vve irrelevns, hiszen az
egyetlen ami fontos, az azon terv vals cselekvseinek kltsge, amire ez az t vezetett. Mindazonltal
lehetsges egy tvonalkltsg-fggvny specifiklsa, ami a vals terv kltsgeit tkrzi: minden vals
cselekvsnek a tervhez val hozzadst egysgnyi kltsggel, mg a finomt lpseket 0 kltsggel vesszk
figyelembe. gy g(n), ahol n a terv, egyenl lesz a tervben tallhat vals cselekvsek szmval. Egy
heurisztikus h(n) becsls szintn alkalmazhat.
Els rnzsre azt gondolhatjuk, hogy az llapottmenet-fggvnynek minden nyitott p-hez tartalmaznia kellene
egy kvetkez llapotot, nem csak egyhez. Ez azonban, redundns lenne s nem lenne hatkony, ugyanazon
okbl, amirt a knyszerkielgtsi algoritmusok nem szrnak be minden lehetsges vltozhoz utdot: a nyitott
elfelttelek kezelsi sorrendje (csakgy, mint a knyszerkielgtsi problma vltozinak kezelsi sorrendje)
kommutatv. (Lsd 2. szakasz - A visszalpses keress alkalmazsa knyszerkielgtsi problmkra rszben.)
gy tetszleges sorrendet vlaszthatunk, s az algoritmusaink mg mindig teljesek. A helyes rendezs
megvlasztsa gyorsabb keresshez vezethet, de minden sorrendezs ugyanazokra a megoldsjelltekre vezet.
3.1. Plda a rszben rendezett tervksztsre

Most nzzk meg, hogy az RRT hogyan oldja meg a 11.1. alfejezetben szerepl ptkerk problmt. A
problma a lerst a 11.7. brn megismteljk.
11.7. bra - Az egyszer kerkcsere problma
A megolds keresse egy kezdeti tervbl indul, ami egy Indt cselekvst tartalmaz az Ott(Ptkerk,
Csomagtart) Ott(LaposKerk, Tengely) kvetkezmnnyel s egy Befejez cselekvst az Ott(Ptkerk,
Tengely) elfelttellel. Ezutn kvet llapotokat lltunk el gy, hogy egy nyitott elfelttelt vlasztunk a
munkhoz (visszavonhatatlanul), majd vlasztunk az ehhez vezet lehetsges cselekvsek kzl. Most nem
foglalkozunk a heurisztikkkal, amik segthetik ezt a dntst; ltszlag vletlenszer dntst hozunk. Az
esemnyek sorrendje a kvetkez:
1. Vegyk az egyetlen nyitott elfelttelt, a Befejez cselekvs Ott(Ptkerk, Tengely) felttelt. Vlasszuk ki az
egyetlen alkalmazhat cselekvst, a Felszerel(Ptkerk, Tengely)-t.
2. Vegyk a Felszerel(Ptkerk, Tengely) cselekvs Ott(Ptkerk, Fld) elfelttelt. Vlasszuk az
Eltvolt(Ptkerk, Csomagtart) cselekvst, ami az egyetlen alkalmazhat cselekvs az elfelttel
biztostshoz. A vgs terv a 11.8. brn lthat.
11.8. bra - A nem teljes rszben rendezett terv a kerkcsere problmhoz, miutn
megvlasztottuk a cselekvseket az els kt nyitott elfelttelhez. A dobozok
cselekvseket testestenek meg, a bal oldalon az elfelttelekkel, a jobb oldalon pedig a
347
Tervkszts
kvetkezmnyekkel. (Az Indt cselekvst kivve a kvetkezmnyeket elhagytuk.) A

fekete nyilak az okozati kapcsolatokat mutatjk, melyek a nyl fejnl szerepl lltst
vdik.
3. Vegyk a Felszerel(Ptkerk, Tengely) cselekvs Ott(LaposKerk, Tengely) elfelttelt. Hogy

ellenkezznk egy kicsit, vlasszuk az Otthagyjszakra cselekvst, a kzenfekv Eltvolt(LaposKerk,
Tengely) helyett. Vegyk szre, hogy az Otthagyjszakra cselekvsnek szintn kvetkezmnye a
Ott(Ptkerk, Fld), ami tkzik az
okozati kapcsolattal. Hogy feloldjuk ezt az tkzst, egy rendezsi megktst illesztnk be, ami az
Otthagyjszakra cselekvst az Eltvolt(Ptkerk, Csomagtart) el rendeli. Az gy elll terv a 11.9. brn
lthat. (Mirt oldja ez fel az tkzst s mirt nincs erre ms lehetsg?)
4. Most az egyetlen fennmarad nyitott elfelttel az Ott(Ptkerk, Csomagtart), ami az Eltvolt(Ptkerk,
Csomagtart) cselekvs elfelttele. Az egyetlen cselekvs, ami ezt elrheti, a meglv Indt cselekvs, de az
Indt s az Eltvolt(Ptkerk, Csomagtart) kztti okozati kapcsolat tkzik az Otthagyjszakra
cselekvs Ott(Ptkerk, Csomagtart) kvetkezmnyvel. Most nincs md arra, hogy feloldjuk az tkzst
az Otthagyjszakra cselekvssel: nem sorolhatjuk az Indt el (mert semmi nem kerlhet az Indt el), s
nem rendelhet az Eltvolt(Ptkerk, Csomagtart) utn (mert mr van egy rendezs, ami el helyezi). Ezrt
muszj visszalpnnk, trlnnk az Eltvolt(Ptkerk, Csomagtart) cselekvst s a kt utols okozati
kapcsolatot, s visszalpnnk a 11.8. brn bemutatott llapothoz.
11.9. bra - A terv alakulsa, az Otthagyjszakra vlasztsa utn, amit a

Ott(LaposKerk, Tengely) elrshez vlasztottunk. Hogy elkerljk az tkzst az
Ott(Ptkerk, Csomagtart)-t vd, az Eltvolt(Ptkerk, Csomagtart)-bl indul
okozati kapcsolattal, az Otthagyjszakra cselekvst egy rendezsi megktssel az
Eltvolt(Ptkerk, Csomagtart) el helyeztk, amit a szaggatott nyllal jelltnk.
sszefoglalva, a tervkszt bebizonytotta, hogy az Otthagyjszakra nem hasznlhat fel kerkcserre.

5. Vegyk jra a Felszerel(Ptkerk, Tengely) cselekvs Ott(LaposKerk, Tengely) elfelttelt. Ez
alkalommal vlasszuk az Eltvolt(LaposKerk, Tengely) cselekvst.
6. Vegyk jra az Eltvolt(Ptkerk, Csomagtart) cselekvs Ott(Ptkerk, Csomagtart) elfelttelt, s
vlasszuk az Indt cselekvst, hogy ezt elrjk. Ez alkalommal nincsenek tkzsek.
7. Vegyk az Eltvolt(LaposKerk, Tengely cselekvs Ott(LaposKerk, Tengely) elfelttelt, valamint ennek
elrshez az Indt cselekvst. Ez egy teljes s konzisztens tervet ad, vagy ms szavakkal egy megoldst,
amint azt a 11.10. bra mutatja.
348
Tervkszts
11.10. bra - A kerkcsere problma vgs megoldsa. Vegyk szre, hogy az

Eltvolt(Ptkerk, Csomagtart) s az Eltvolt(LaposKerk, Tengely) tetszleges
sorrendben vgrehajthat a Felszerel(Ptkerk, Tengely) eltt.
Br ez a plda nagyon egyszer, jl szemllteti a rszben rendezett tervkszts erssgt. Elszr is az okozati
kapcsolatok a keressi tr (fa) egy korai szktshez metszshez vezettek, mert kizrtak olyan terleteket,
amelyek a feloldhatatlan tkzsek miatt nem tartalmaznak megoldsokat. Msodszor a 11.10. bra megoldsa
egy rszben rendezett terv. Ebben az esetben ennek elnye nem nagy, mert csak kt lehetsges sorba rendezs
ltezik, mgis egy gens szmra elnys lehet ez a rugalmassg, pldul ha a kereket sr forgalomban kellene
lecserlni.
A plda szintn rmutat nhny javtsi lehetsgre. Pldul egy prblkozs dupln trtnt: az Indt az
Eltvolt(Ptkerk, Csomagtart) cselekvshez kapcsoldik mg mieltt az tkzs visszalpst vltana ki, s a
visszalps hatsra a kapcsolat felbomlik, br nem vesz rszt az tkzsben. A keress folytatsakor a
kapcsolat jra ltrejn. Ez tipikus az idrendi visszalps esetn s elkerlhet, ha fggsgvezrelt visszalpst
hasznlunk.
3.2. Rszben rendezett tervkszts ktetlen vltozkkal

Ebben a fejezetben a vltozkat tartalmaz elsrend cselekvs reprezentcira alkalmazott rszben rendezett
tervkszts sorn felmerl komplikcikkal foglalkozunk. Tegyk fel, hogy a kockavilg (lsd 11.4. bra)
problmt kell megoldani a Rajta(A, B) nyitott elfelttellel s a
Cselekvs(Mozgat(b, x, y),
Elfelttel: Rajta(b, x) res(x) res(y)
Kvetkezmny: Rajta(b, y) res(x) Rajta(b, x) res(y))
cselekvssel. Ez a cselekvs teljesti a Rajta(A, B) literlt, mert a Rajta(b, u) kvetkezmny egyesthet a

Rajta(A, B)-vel a {b/A, y/B} behelyettestssel. Alkalmazzuk teht ezt a behelyettestst a cselekvsre, aminek
az eredmnye a
Cselekvs(Mozgat(A, x, B),
Elfelttel: Rajta(A, x) res(x) res(B)
Kvetkezmny: Rajta(A, B) res(x) Rajta(b, x) res(B))
Ez az x vltozt ktetlenl hagyja. Ez annyit tesz, hogy a cselekvs annyit mond, hogy mozgasd A-t
valahonnan, de azt nem, hogy honnt. Ez egy msik plda a legkisebb megkts elvre: elhalaszthatjuk a
dntseket egszen addig, amg a terv egy msik lpse ezt meghozza neknk. Tegyk fel pldul, hogy a
Rajta(A, D) a kiindul llapotunk. Az x-et D-vel behelyettestve az Indt cselekvs hasznlhat fel, hogy elrjk
a Rajta(A, x)-et. A mdszer, hogy tbb informcit kivrunk, mieltt megvlasztjuk x-et, gyakran sokkal
hatkonyabb, mint az x minden rtknek kiprblsa s a visszalps, ha ez sikertelen.
A vltozk jelenlte az elfelttelekben s a cselekvsekben nehezti az tkzsek detektlst s feloldst.
Pldul amikor a Mozgat(A, x, B) a terv rsze lesz, a
okozati kapcsolatra is szksg van. Ha van egy M2 cselekvs Rajta(A, z) kvetkezmnnyel, akkor ez csak
akkor okoz tkzst, ha a z rtke B. Hogy kezeljk ezt a lehetsget, kiterjesztjk a tervek reprezentcijt,
349
Tervkszts
hogy tartalmazzanak z X alak egyenltlensgi knyszereket (inequality constraints), ahol z egy vltoz s
X egy vltoz vagy egy konstansszimblum. Ebben az esetben az tkzst a z B hozzadsval oldhatjuk fel,
ami azt jelenti hogy a terv ksbb B kivtelvel brmire behelyettestheti z-t. Brmikor amikor egy
behelyettestst hajtunk vgre a tervben, ellenriznnk kell, hogy az nem ellenkezik-e az egyenltlensgi
korltokkal. Pldul egy x/y behelyettests tkzik az x y knyszerrel. Az ilyen ellenttek nem oldhatk fel,
ezrt a tervkszt visszalpsre knyszerl.
A 12.6. alfejezetben egy bvebb pldt adunk a rszben rendezett tervksztsre, ami a vltozkat tartalmaz
kockavilg problma.
3.3. Heurisztikk a rszben rendezett tervksztsre

A teljesen rendezett tervksztssel sszehasonltva a rszben rendezett tervkszts egyrtelm elnye, hogy a
problma rszfeladatokra bonthat. A htrnya, hogy nem reprezentlja megfelelen az llapotokat, gy
nehezebb megbecslni, hogy a rszben rendezett terv milyen messze van a cltl. Jelenleg jval kevesebb az
ismeretanyag arrl, hogy hogyan adhat pontos heurisztika a rszben rendezett tervksztshez, mint a teljesen
rendezett tervksztsek esetn.
A legkzenfekvbb heurisztika, hogy megszmoljuk az eltr nyitott elfeltteleket. Ez javthat azltal, ha
kivonjuk azon nyitott elfelttelek szmt, melyek illeszkednek az Indt llapot egy literljaival. Hasonlan a
teljesen rendezett esethez ez tlbecsli a kltsget, ha vannak cselekvsek, melyek tbb clt rnek el, s
alulbecsl, ha negatv klcsnhatsok vannak a terv lpsei kztt. A kvetkez alfejezet egy olyan
megkzeltst mutat be, ami lehetv teszi, hogy sokkal pontosabb heurisztikkat kapjunk egy relaxlt
problmbl.
A heurisztikus fggvnyt arra hasznljuk, hogy kivlasszuk a tovbb finomtand tervet. Ezzel a vlasztssal az
algoritmus kvet llapotokat generl egyetlen kivlasztott nyitott elfelttelbl kiindulva. Mint a
vltozkivlaszts a knyszerkielgtsi algoritmusban, ez a vlaszts nagy hatssal van a hatkonysgra. A
knyszerkielgtsi problma legjobban-korltozott-vltoz (most-constrained-variable) heurisztikja
alkalmazhat a tervkszt algoritmusokra, s ltszlag jl mkdik. Az alaptlet, hogy vlasszuk azt a nyitott
felttelt, mely a lehet legkevesebb mdon elgthet ki. Ennek a heurisztiknak kt specilis esete van. Elszr,
ha egy nyitott felttel nem rhet el egyetlen cselekvssel sem, akkor a heurisztika kivlasztja. Ez j tlet,
hiszen a teljesthetetlensg korai rzkelse sok munkt megsprolhat. Msodszor, ha egy nyitott felttel csak
egyflekpp teljesthet, akkor clszer kivlasztani, hiszen ez egy elkerlhetetlen dnts, ami tovbbi
megktseket eredmnyezhet a ksbbi vlasztsokhoz. Habr minden nyitott felttelhez meglehetsen
kltsges kiszmolni, hogy azok hnyflekppen teljesthetk, s ez nem is mindig ri meg, a ksrletek azt
mutatjk, hogy a kt specilis eset kezelse jelents gyorsulst eredmnyezhet.
4. Tervksztsi grfok
Az sszes javasolt heurisztika a teljesen rendezett s a rszben rendezett tervksztsre pontatlansgokkal
terhelt. Ez a fejezet bemutatja, hogy egy specilis adatszerkezet a tervksztsi grf (planning graph)
felhasznlhat, hogy jobb heurisztikus becslseket nyerjnk. Ezek a heurisztikk brmely eddig trgyalt keressi
technikval hasznlhatk. Egy msik lehetsg, hogy a megoldst kzvetlenl a tervksztsi grfbl nyerjk ki
egy erre kilezett algoritmussal, mint amilyen pldul a GRAPHPLAN.
A tervksztsi grf a terv idrendi lpseinek megfelel szintekbl ll, ahol a 0-dik szint a kiindul llapot.
Minden szint egy literlhalmazt s egy cselekvshalmazt tartalmaz. A literlok durvn azok, melyek igazak
lehetnek az adott lpsnl, az addig vgrehajtott cselekvsek fggvnyben. Ismt durvn fogalmazva, a
cselekvsek azok, melyeknek az elfelttelei teljeslhetnek az adott idlpsben attl fggen, hogy aktulisan
mely literlok teljeslnek. Azrt mondjuk, hogy durvn, mert a tervksztsi grf csak a cselekvsek kztti
lehetsges negatv klcsnhatsok egy korltozott rszhalmazt tartalmazza, ezrt a tervksztsi grf optimista
lehet a literl teljestshez szksges minimlis lpsek szmval kapcsolatban. Mindazonltal a tervksztsi
grfban ez a lpsszm egy j becsls arra, hogy milyen nehz egy literlt teljesteni a kiindulsi llapotbl.
Mg fontosabb, hogy a tervksztsi grfot gy definiltuk, hogy knnyen elkszthet legyen.
A tervksztsi grf csak tletlogikai tervksztsi problmkra alkalmazhat olyanokra, melyek nem
tartalmaznak vltozkat. Ahogy a 11.1. alfejezetben emltettk, mind a STRIPS, mind az ADL reprezentci
tletlogikra alakthat. A nagyszm entitst tartalmaz problmkat ez jelentsen felduzzaszthatja a
350
Tervkszts
cselekvssmk szmban. Ennek ellenre a tervksztsi grfok hatkony eszkznek bizonyultak a nehz
tervksztsi problmk megoldsban.
A tervksztsi grfokat egy egyszer pldn mutatjuk be. (Az sszetettebb feladatok olyan grfhoz vezetnek,
amelyek nem frnnek ki egy oldalra.) A 11.11. bra a feladatot, mg a 11.12. bra az ehhez tartoz grfot
mutatja. Az S0 llapotszintrl indulunk, ami a problma kiindul llapotnak felel meg. Ezt az A0
cselekvsszinttel folytatjuk, amibe azokat a cselekvseket helyezzk, melyek elfelttelei az elz szinten
teljeslnek. Minden cselekvs ssze van ktve az S0-ban tallhat elfeltteleivel, illetve az S1-ben tallhat
kvetkezmnyeivel, ami ebben az esetben az S0-ban nem szerepl literlok bevezetst jelenti S1-ben.
11.11. bra - A legyen sti s egynk is problma
A tervksztsi grfnak a nem cselekvst ugyangy kell reprezentlni, mint a cselekvseket. Ez annyit tesz, hogy
a szitucikalkulus keretaximinak megfelel mkdsre van szksg, ami alapjn egy literl kt llapon
keresztl igaz maradhat, ha nincs ezt mdost cselekvs. Egy tervksztsi grfban ezt megrz cselekvsekkel
(persistence actions) oldjuk meg. Minden pozitv s negatv C literlhoz egy megrz cselekvst szrunk be C
elfelttellel s C kvetkezmnnyel. A 11.12. bra az A0 szinten egyetlen vals cselekvst az Eszik(Sti)-t
tartalmazza, kt megrz cselekvssel, amit kicsi ngyzetek jellnek.
Az A0 tartalmazza az sszes cselekvst, ami az S0 llapotban elfordulhat, de ugyanilyen fontos, hogy rgzti a
cselekvsek kztti tkzseket is, amelyek megakadlyozzk, hogy egyszerre trtnjenek. A 11.12. bra szrke
vonalai ezeket a klcsns kizrsi (mutual exclusions vagy mutex) kapcsolatokat jellik. Pldul az
Eszik(Sti) klcsns kizrsban van a Van(Sti) vagy a Megevett(Sti) megrzsvel. Hamarosan ltjuk, hogy
a mutex kapcsolatokat hogyan szmthatjuk.
11.12. bra - A legyen sti s egynk is problma tervksztsi grfja az S2 szintig. A

tglalapok az akcikat jelentik (a kicsi ngyzetek a megrz cselekvsek), az egyenesek
az elfeltteleket s a kvetkezmnyeket jellik. A klcsns kizrsokat velt szrke
vonalak jellik.
Az S1 az sszes olyan literlt tartalmazza, ami az A0 szint akciinak brmely rszhalmazt vlasztva elrhet.
Szintn tartalmaz mutex kapcsolatokat (szrke vonalakat) jellve az olyan literlokat, melyek nem
teljeslhetnek egyszerre, a vlasztott cselekvsektl fggetlenl. Pldul a Van(Sti) s a Megevett(Sti)
klcsnsen kizrjk egymst. Az A0 kivlasztott cselekvseitl fggen az eredmny vagy az egyik vagy a
msik lehet, de a kett egyszerre nem. Ms szavakkal az S1, csakgy, mint a regresszis llapottr-keress, tbb
llapotot reprezentl, a kizrsi kapcsolatok pedig knyszerek, melyek a lehetsges llapotok halmazt
definiljk.
351
Tervkszts
s ez gy megy tovbb. Az Si llapot- s az Ai cselekvsszintek kztt mozgunk, egszen addig, mg elrnk egy
szintet, ahol kt egymst kvet szint azonos. Ekkor azt mondjuk, hogy a grf kiegyenltdtt (leveled off).
Minden egymst kvet szint azonos, gy tovbbi kiterjesztsre nincsen szksg.
Egy olyan struktrt kaptunk, ahol az Ai szint tartalmaz minden Si-ben alkalmazhat cselekvst, a knyszerekkel
egytt, melyek megmondjk, hogy melyik cselekvspr nem hajthat vgre egyidejleg. Minden Si szint
tartalmazza az sszes literlt, ami az Ai1 sszes lehetsges cselekvshalmaznak hatsra teljesl, a
knyszerekkel egytt, amelyek a nem lehetsges literlprokat jellik ki. Fontos megjegyezni, hogy a
tervksztsi grf elksztsi folyamathoz nem kell vlasztanunk a cselekvsek kztt, ami kombinatorikus
keresst eredmnyezne. Ezzel szemben, a tervksztsi grf konstrukcija csak a lehetetlen vlasztsokat rgzti,
mutex kapcsolatok felhasznlsval. Egy ilyen tervksztsi grf elksztsnek bonyolultsga egy
alacsonyrend polinomilis komplexits a cselekvsek szmt tekintve, ahol az llapottr exponencilis a
literlok szmban.
Most mutex kapcsolatokat definilunk, mind a cselekvsek, mind a literlok szmra. Egy adott szinten, a mutex
kapcsolat akkor rvnyes kt cselekvs kztt, ha a kvetkez hrom felttel valamelyike fennll:
Inkonzisztens hatsok: egy cselekvs neglja egy msik kvetkezmnyt. Pldul az Eszik(Sti) s a
Van(Sti) megrzse inkonzisztens hats, mert a Van(Sti) kvetkezmny tekintetben ellenttesek.
Interferencia: egy cselekvs egyik kvetkezmnye a neglsa egy msik cselekvs elfelttelnek. Pldul az
Eszik(Sti) interferl a Van(Sti) megrzsvel, mert neglja az elfelttelt.
Versenyhelyzet: egy cselekvs elfelttele klcsnsen kizr egy msik elfelttelvel. Pldul a St(Sti) s
az Eszik(Sti) mutexek, mert versenyeznek a Van(Sti) elfelttel tekintetben.
Kt azonos szineten lv literl kztt mutex kapcsolat ll fenn, ha az egyik a msik negltja, vagy brmely
lehetsges cselekvspr, amely a kt literlt elrheti, egymst klcsnsen kizr. Ezt az llapotot inkonzisztens
httrnek nevezzk. Pldul a Van(Sti) s a Megevett(Sti) kizrjk egymst S1-ben, mert az egyetlen md a
Van(Sti) teljestsre egy megrz cselekvs, ami mutex a Megevett(Sti) egyetlen elrsi lehetsgvel,
nevezetesen az Eszik(Sti) cselekvssel. Az S2 szinten a kt literl mr nem mutex, mert j elrsi lehetsgek
vannak hozzjuk, mint a St(Sti) s a Megevett(Sti) megrz cselekvse, melyek nem zrjk ki egymst.
4.1. Tervksztsi grfok heurisztikus becslsekre

Fontos
A tervksztsi grf, ha egyszer mr ltrehoztuk, nagyon gazdag informciforrs a problmrl.
Pldul egy literl, ami nem tallhat meg az utols szinten, egyetlen tervvel sem rhet el. Ez a
megfigyels a visszafel keressben hasznlhat a kvetkezkpp: brmely elrhetetlen literlt
tartalmaz llapot kltsge h(n) = . Hasonlan a rszben rendezett tervksztsnl brmely tervnek a
kltsge egy elrhetetlen nyitott elfelttellel, h(n) = .
Ez az tlet tovbb ltalnosthat. Minden cl literl elrsi kltsgt becslhetjk azzal a szinttel, ahol elszr
megjelenik a tervksztsi grfban. Ezt a cl szint kltsgnek (level cost) nevezzk. A 11.12. brn a Van(Sti)
szint kltsge 0, a Megevett(Sti) szint kltsge 1. Knny megmutatni (lsd 11.9. feladat), hogy ezek a
kzeltsek elfogadhatk az egyedlll clokra. A becsls azonban lehet, hogy nem tl j, mert a tervksztsi
grfok tbb cselekvst megengednek szintenknt, mg a heurisztika csak a szintek szmt tartalmazza, s nem a
cselekvsek szmt. Ebbl kifolylag a heurisztikk szmtsban, gyakori a soros tervksztsi grf (serial
planning graph) hasznlata. A soros grf szerint egy adott idpillanatban csak egyetlen cselekvs hajthat
vgre, ami mutexekkel rhet el gy, hogy a megrz cselekvsek kivtelvel, minden cselekvs kz mutex
kapcsolatot tesznk. A soros tervkszt grfbl kinyert szintkltsgek gyakran egsz elfogadhat kzeltst
adjk a vals kltsgeknek.
Hrom egyszer megkzelts ltezik, hogy clliterlok konjunkciihoz kltsget becsljnk. A maximlis
szint (max-level) heurisztika egyszeren a clok kzli maximlis szintkltsgt veszi, ami elfogadhat, de nem
felttlen nagyon pontos. A szintsszeg (level sum) heurisztika a rszcl fggetlensgi felttelezsbl a clok
szintkltsgeinek sszegt adja. Ez nem elfogadhat, de nagyon jl mkdik olyan gyakorlati problmkra,
amelyek nagymrtkben rszekre bonthatk. Ez sokkal pontosabb, mint a 11.2. alfejezetben bemutatott nemkielgtett-clok-heurisztika. A mi feladatunkban a Van(Sti) Megevett(Sti) konjunktv clhoz rendelhet
heurisztikus becsls 0 + 1 = 1, mg a helyes vlasz 2. Mindezeken tl, ha eltvoltjuk a St(Sti) cselekvst, a
352
Tervkszts
becsls mg mindig 1, de a konjunktv cl ekkor mr elrhetetlen. Vgezetl, a halmazszint (set-level)

heurisztika azt a szintet keresi meg, ahol a konjunktv cl sszes literlja megjelenik a tervksztsi grfban, s
nincsenek kzttk klcsnsen kizr prok. A heurisztika a korrekt 2 rtket adja az eredeti feladatra s
vgtelent a St(Sti) nlkli feladatra. Ez elnyben van a maximlis szint heurisztikval szemben, s
kimagaslan jl mkdik azon feladatokban, ahol sok klcsnhats van a rsztervek kztt.
Lvn egy pontos heurisztika ksztsre szolgl eszkz, a tervksztsi grf tekinthet gy, mint egy relaxlt
problma, ami hatkonyan megoldhat. Hogy a relaxlt problma termszett megrtsk, pontosan meg kell
rtennk, hogy mit jelent, ha egy g literl megjelenik a tervksztsi grf Si szintjn. Idelis esetben garancit
szeretnnk arra, hogy ltezik egy terv i cselekvs szinttel, ami elri g-t, illetve ha g nem jelenik meg, akkor nincs
is ilyen terv. Sajnos ezt garantlni majdnem ugyanolyan nehz, mint megoldani az eredeti tervksztsi
problmt. A tervksztsi grf a garancia msodik rszrl gondoskodik (ha g nem jelenik meg, akkor nincs
terv), de ha g megjelenik, akkor a tervksztsi grf csak annyit gr, hogy van egy terv, ami vrhatan elri g-t,
nincsenek nyilvnval hibk. Egy nyilvnval hiba definci szerint egy olyan hiba, ami gy detektlhat,
hogy kt cselekvst vagy kt literlt tekintnk egyszerre, vagy ms szavakkal a mutex relcikat vizsgljuk.
Lehetnek sszetettebb hibk, melyek hrom, ngy vagy tbb cselekvst tartalmaznak, de a tapasztalatok azt
mutatjk, hogy nem ri meg ezekkel foglalkozni. Ez hasonl a knyszerkielgtsi problmknl tanultakkal,
hogy a megolds megkeresse eltt gyakran megri a 2-konzisztencia szmts, de a 3- vagy a magasabb
konzisztencia kiszmtsa ritkbban kifizetd (lsd 5.2. alfejezet).
4.2. A Graphplan algoritmus

Ez a fejezet bemutatja, hogy hogyan nyerhet ki kzvetlenl a terv a tervksztsi grfbl, ahelyett hogy azt
csak a heurisztikkhoz hasznljuk. A GRAPHPLAN algoritmusnak (11.13. bra) kt f lpse van, melyek
ciklikusan vltakoznak. Elszr ellenrzi, hogy minden clliterl jelen van-e az adott szinten anlkl, hogy
mutex kapcsolatok lennnek kzttk. Ebben az esetben, az aktulis grfban ltezhet megolds, gy az
algoritmus megprblja azt kinyerni. Ellenkez esetben bvti a grfot gy, hogy az aktulis szinthez a
cselekvseket, a kvetkezhz az llapotliterlokat adja: ez a folyamat folytatdik addig, amg megtalljuk a
megoldst, vagy bebizonyosodik, hogy nem ltezik megolds.
11.13. bra - A GRAPHPLAN algoritmus. A GRAPHPLAN algoritmus egy megolds kinyer s

egy grf-bvt lps kztt alternl. A MEGOLDS-KINYERS a befejezstl visszafel
keresve ellenrzi, hogy tallhat-e megolds. A GRF-BVTS adja a cselekvseket az
adott szinthez s az llapotliterlokat a kvetkezhz.
Kvessk vgig a GRAPHPLAN mkdst a 11.1. alfejezet kerkcsere problmjn! A teljes grf a 11.14. brn
lthat. A GRAPHPLAN els lpsben inicializlja a tervksztsi grfot egy egyszint (S0 szint) grfra, ami a
kiindulsi llapot t literljt tartalmazza. Az Ott(Ptkerk, Tengely) clliterl nincs jelen az S0-ban, ezrt nem
kell meghvnunk a MEGOLDS-KINYERST, hiszen biztosak vagyunk benne, hogy mg nincs megolds. Ehelyett
a GRF-BVTS hozzad hrom cselekvst, melyeknek az elfelttele mr teljesl az S0 szinten (pldul az
sszes cselekvs, kivve a Felszerel(Ptkerk, Tengely) cselekvst). Hozzadja tovbb a megrzcselekvseket S0 sszes literljhoz. A cselekvsek kvetkezmnyeit az S1 szinthez adjuk hozz. A GRFBVTS ezek utn mutex kapcsolatokat keres, s hozzadja ezeket a grfhoz.
353
Tervkszts
11.14. bra - A kerkcsere problma tervksztsi grfja az S2 szintre bvts utn. A

mutex kapcsolatokat szrke vonalak jellik. Csak nhny fontos mutexet mutatunk,
mert az bra olvashatatlann vlna, ha az sszeset jellnnk. A megoldst
megvastagtott vonalak s kiemelsek jellik.
Az Ott(Ptkerk, Tengely) cselekvs mg mindig nincs jelen az S1 llapotban, ezrt most sem hvjuk meg a
MEGOLDS-KINYERS lpst. A GRF-BVTS hvssal a 11.14. brn lthat tervksztsi grfot kapjuk. Most,
hogy a cselekvsek teljes sklja rendelkezsre ll, ideje nhny pldt nzni a mutex kapcsolatokra s a
hatsaikra:
Nem konzisztens hatsok: az Eltvolt(Ptkerk, Csomagtart) mutex kapcsolatban van az Otthagyjszakra
cselekvssel, mert az egyik kvetkezmnye az Ott(Ptkerk, Fld), mg a msik ennek negltja.
Interferencia: az Eltvolt(Ptkerk, Tengely) mutex az Otthagyjszakra cselekvssel, mert az egyiknek
elfelttele az Ott(Laposkerk, Tengely), mg a msiknak ennek negltja a kvetkezmnye.
Versenyhelyzet: a Felszerel(Ptkerk, Tengely) mutex az Eltvolt(Laposkerk, Tengely) cselekvssel, mert az
egyiknek elfelttele az Ott(Laposkerk, Tengely), mg a msik ennek negltja.
Inkonzisztens tart: az Ott(Ptkerk, Tengely) s az Ott(Laposkerk, Tengely) klcsnsen kizrak az S2ben, mert az Ott(Ptkerk, Tengely) csak a Felszerel(Ptkerk, Tengely) cselekvssel rhet el, ami mutex a
megrz cselekvssel, mely az Ott(Laposkerk, Tengely) egyetlen elrse. A mutex kapcsolatok gy azonnal
rzkelik a konfliktust, ami abbl addik, hogy kt objektumot ugyanazon idpontban azonos helyre
prblunk tenni.
Ez alkalommal visszamegynk a ciklus kezdetre. A cl minden literlja jelen van S2-ben, s egyik sem ll
klcsns kizrsban egyetlen msikkal sem. Ez azt jelenti, hogy egy megolds ltezhet, s a MEGOLDSKINYERSmegtallhatja. Lnyegben a MEGOLDS-KINYERS egy ktrtk knyszerkielgtsi problmt old
meg, melynek vltozi a szintek cselekvsei, s az rtkeik pedig azt jelzik, hogy benne vannak-e vagy
nincsenek benne a tervben. Ehhez egy egyszer knyszerkielgtsi algoritmust hasznlhatunk, vagy
definilhatjuk a MEGOLDS-KINYERS-t mint egy keressi problmt. Itt a keress minden llapota a
kielgtetlen clok egy halmazt tartalmazza, valamint egy mutatt a tervksztsi grf egy szintjre. Ezt a
keressi problmt a kvetkezkppen definiljuk:
A kiindulsi llapot a tervksztsi grf utols szintje (Sn) a tervksztsi problma cljaival egyetemben.
Az Si szint llapotban rendelkezsre ll cselekvsek sszessge, az Ai1 cselekvseinek azon
konfliktusmentes rszhalmaza, melyek kvetkezmnyei elrik az llapotban lv clokat. Az eredmnyknt
elll llapot szintje Si1, cljai pedig a kivlasztott cselekvsek elfelttelei. A konfliktusmentessgen
olyan cselekvsek halmazt rtjk, amelyek kztt nincs kett, amelyek klcsnsen kizrnk egymst, s az
elfeltteleik kztt sem szerepelnek klcsnsen kizr prok.
A cl, hogy elrjnk az S0 szinten egy llapotot gy, hogy minden cl teljesljn.
354
Tervkszts
Minden cselekvs kltsge 1.

Ehhez a problmhoz az S2 szintrl indulunk, az Ott(Ptkerk, Tengely) cllal. Az egyetlen vlasztsunk, hogy
elrjk ezt a clt, a Felszerel(Ptkerk, Tengely) cselekvs. Ez az S1 keressi llapothoz visz minket, melynek
cljai az Ott(Ptkerk, Fld) s az Ott(Laposkerk, Tengely). Az elbbit az Eltvolt(Ptkerk, Csomagtart)
cselekvssel rhetjk el, mg a ksbbit az Eltvolt(Laposkerk, Tengely) vagy az Otthagyjszakra
cselekvsek egyikvel. Az Otthagyjszakra klcsnsen kizr kapcsolatban van a Eltvolt(Ptkerk,
Csomagtart)-val, ezrt az egyetlen megolds, hogy az Eltvolt(Ptkerk, Csomagtart) s az
Eltvolt(Laposkerk, Tengely) cselekvseket vlasztjuk. Ez az S0 keressi llapotra vezet, az Ott(Ptkerk,
Csomagtart) s az Ott(Laposkerk, Tengely) clokkal. Mindkett jelen van az llapotban, gy megvan a
megoldsunk: az Eltvolt(Ptkerk, Csomagtart) cselekvs s az Eltvolt(Laposkerk, Tengely) az A0 szinten,
melyet az A1-ben a Felszerel(Ptkerk, Tengely) kvet.
Tudjuk, hogy a tervkszts polinomilis helyigny, s hogy a tervksztsi grf elksztse polinomilis idej,
ezrt tudjuk, hogy a megolds kinyerse legrosszabb esetben kezelhetetlen. Ebbl kifolylag valamifajta
heurisztika segtsgre lesz szksgnk, hogy a cselekvsek kzl vlasszunk a visszafel keress sorn. A
gyakorlatban jl mkdik egy moh algoritmus, mely a literlok kztt a szintkltsg alapjn vlaszt. Brmely
clhalmazra a kvetkez sorrendben jrunk el:
1. Elsknt a legmagasabb szintkltsg literlt vlasztjuk.
2. Hogy teljestsk ezt a literlt, vlasszuk elszr a legegyszerbb elfelttelekkel rendelkez cselekvst, azaz
vlasszuk azt az akcit, melynek elfeltteleire a szintkltsgek sszege (vagy maximuma) a legkisebb!
4.3. A Graphplan algoritmus lellsa

Eddig tsiklottunk a lells krdse fltt. Lehetnk-e biztosak abban, hogy amennyiben egy problmnak nincs
megoldsa, a GRAPHPLAN algoritmus nem kerl vgtelen ciklusba, itercinknt bvtve a tervksztsi grfot? A
vlasz igen, de ennek bizonytsa tlmutat ennek a knyvnek a keretein. Itt csak a f tleteket krvonalazzuk,
klnsen azokat, melyek a tervksztsi grfok ltalnos tulajdonsgaira vilgtanak r.
Az els lps, hogy szrevegyk, hogy a tervksztsi grfok bizonyos tulajdonsgai monoton nvekvk vagy
cskkenk. X monoton nvekv azt jelenti, hogy az X-ek halmaza az i-edik szinten az i + 1-edik szint
halmaznak (nem felttlenl valdi) rszhalmaza. A tulajdonsgok a kvetkezk:
Monoton nvekv literlok. Ha egy literl megjelenik egy adott szinten, akkor az ezt kvet sszes szinten
megjelenik. Ez a megrz cselekvsek miatt van, azaz, ha egy literl megjelenik, a megrz cselekvsek
hatsra rkk megmarad.
Monoton nvekv cselekvsek. Ha egy cselekvs megjelenik egy adott szinten, akkor az ezt kvet sszes
szinten megjelenik. Ez a literlok nvekedsnek a kvetkezmnye, azaz, ha egy cselekvs elfelttelei
megjelennek egy szinten, akkor az sszes ezt kvet szinten rendelkezsre llnak, gy a cselekvs is.
A klcsns kizrsok monoton cskkense. Ha kt cselekvs klcsnsen kizrja egymst az Ai szinten,
akkor az sszes ezt megelz szinten, ahol mindketten megjelennek, szintn klcsnsen kizrjk egymst.
Ugyanez igaz a literlok kztti klcsns kizrsokra. Ez az brkon nem mindig lthat, mert ezek a
kvetkez egyszerstst hasznljk: nem brzoljk sem azokat a literlokat, melyek egy adott Si szinten
nem teljeslnek, sem azokat a cselekvseket, amelyek egy adott Ai szinten nem vgrehajthatk. Lthatjuk,
hogy a klcsns kizrsok monoton cskkense igaz, ha figyelembe vesszk, hogy a nem lthat literlok s
cselekvsek minden mssal klcsnsen kizrjk egymst.
A bizonyts egy kicsit sszetett, de a kvetkez esetekkel kezelhet: ha az A s B cselekvsek klcsnsen
kizrjk egymst az Ai szinten, akkor ezt csak a hromfle kizrs egyike okozhatja. Az els kett az
inkonzisztens hatsok, illetve a kvetkeztetsek a cselekvsek tulajdonsgai, gy, ha a cselekvsek
klcsnsen kizrjk egymst az Ai szinten, akkor minden szinten kizrk lesznek. A harmadik eset a
versenyhelyzet, az Si szint feltteleitl fgg: ennek a szintnek tartalmaznia kell az A1 olyan elfelttelt, amely
klcsnsen kizr a B1 elfelttellel. Ez a kt elfelttel akkor lehet klcsnsen kizr, ha egyms negltjai
(amely esetben minden szinten klcsnsen kizrk), vagy ha minden cselekvs, amely teljesti az egyiket,
klcsnsen kizr az sszes cselekvssel, mely a msikat rheti el. Mi mr tudjuk, hogy a rendelkezsre ll
cselekvsek monoton nvekednek, gy indukcival bizonythat, hogy a klcsns kizrsok cskkenk.
355
Tervkszts
Mivel a cselekvsek s a literlok nvekednek, a klcsns kizrsok cskkennek, s mivel csak vges szm
cselekvs s literl van, minden tervksztsi grf szksgszeren kiegyenltdik azaz minden egymst kvet
szint azonos lesz. Ha hinyzik a problma egy clja, vagy a clok kztt vannak klcsnsen kizrk, miutn a
grf kiegyenltdtt, akkor a problma soha nem oldhat meg, gy lellthatjuk a GRAPHPLAN algoritmust, s
hibval trhetnk vissza. Ha a grf kiegyenltdik, s minden cl jelen van kizrsok nlkl, de a MEGOLDSKINYERS sikertelen a megolds megtallsban, akkor lehet, hogy vges lpsszmban bvtennk kell a
grfot, de vgezetl megllhatunk. A meglls problmakre ennl sszetettebb, amit itt nem trgyalunk.
5. Tervkszts tletlogikval
A 10. fejezetben lthattuk, hogy a tervkszts elvgezhet a szitucikalkulus egy ttelnek bizonytsval. A
ttel azt mondja, hogy adott kiindul llapotra s kvetllapot-aximkra, amelyek a cselekvsek
kvetkezmnyeit rjk le, a cl egy adott cselekvssorbl add helyzetben igaz lesz. Ezt a megkzeltst mr
1969-ben sem talltk elgg hatkonynak rdekes tervek megtallsra. Napjaink fejlesztsei az tletlogikhoz
ksztett hatkony magyarzatad algoritmusokra (lsd 7. fejezet) ismt felkeltettk az rdekldst a tervkszts
logikai magyarzatksztsi megkzeltsre.
Az ebben a fejezetben trgyalt megkzelts a ttelbizonyts helyett egy cselekvssor kielgthetsgnek
(satisfiability) vizsglatn alapul. tletlogikai mondatok modelljt fogjuk megtallni, melyek a
kvetkezkppen nznek ki:
kiindul llapot minden lehetsges cselekvslers cl
A mondat tletlogikai szimblumokat fog tartalmazni, melyek a lehetsges cselekvs-elfordulsok megfeleli.

A modell, ami kielgti a mondatot, igaz rtket rendel azokhoz a cselekvsekhez, amelyek rszei a helyes
tervnek, s hamis rtket a tbbihez. Egy olyan clkitzs, mely egy nem helyes terv megfelelje, nem lesz
modell, mivel nem lesz konzisztens azzal a felttelezssel, hogy a cl igaz. Ha a tervksztsi problma
megoldhatatlan, akkor a mondat sem kielgthet.
5.1. Tervksztsi problmk tletlogikai lersa

A STRIPS problmk tletlogikai lersra val fordtst a tudsreprezentcis ciklus egy iskolapldjn
mutatjuk be: egy megfelel aximakszlettel indulunk, s gy talljuk, hogy ezek az aximk hamis, nem vrt
modelleket tesznek lehetv, ezrt tovbbi aximkat adunk hozzjuk.
Kezdjk a nagyon egyszer lgi szlltsi problmval. A kiindul llapotban (0. idpont) a P1 repl az SFO
repltren van, mg a P2 repl a JFK-n. A cl, hogy a P1 legyen a JFK, a P2 pedig az SFO reptren, azaz a
replgpeknek helyet kell cserlnik. Elszr egymstl eltr tletlogikai szimblumokra van szksgnk az
egyes idlpsek kijelentseihez. Az idpillanatok jellshez fels indexeket hasznlunk, mint a 7. fejezetben.
gy a kiindul llapot felrsa az
Ott(P1, SFO)0 Ott(P2, JFK)0
(Emlkezznk arra, hogy az Ott(P1, SFO)0 egy atomi szimblum!) Mivel az tletlogika nem hasznlja a zrt
vilg felttelezst, ezrt a kiindul llapotban definilnunk kell a nem igaz tletlogikai lltsokat is. Ha nhny
llts nem ismert a kiindul llapotban, akkor ezek maradhatnak meghatrozatlanok (nylt vilg felttelezs).
Ebben a pldban az
Ott(P1, JFK)0 Ott(P2, SFO)0
kiindul llapotot specifikljuk. A clt magt egy megadott idlpshez kell kapcsolni. Mivel nem tudjuk a
priori, hogy hny lpsre van szksg a cl elrshez, megprblhatjuk felttelezni, hogy a cl igaz a kiindul
llapotban, T = 0 idpontban. Azaz a kvetkezt lltjuk: Ott(P1, JFK)0 Ott(P2, SFO)0. Ha ez sikertelen, jra
prblkozunk T = 1-gyel, s gy tovbb, amg a legkisebb megfelel tervhosszt el nem rjk. T minden rtkre
a tudsbzis a 0. idponttl a T-ig tart lpseket fed mondatokat fogja tartalmazni. Hogy biztostsuk a lellst,
egy nknyes Tmax fels korltot kell lltanunk. Ezt az algoritmust mutatja a 11.15. bra. Egy msik lehetsges
megkzeltst, mely elkerli a tbbszrs megoldsi ksrleteket, a 11.17. feladatban trgyalunk.
11.15. bra - A SATPLAN algoritmus. A tervksztsi feladatot egy konjunktv norml

formj mondatra fordtjuk le, amelyben minden cl egy megadott T idpillanatban
356
Tervkszts
teljesl, s T-ig minden lpsre tartalmazza az aximkat. (A fordts rszleteit a

szvegben rjuk le.) Ha a kielgthetsgi algoritmus tall modellt, akkor a tervet a
modellben az igaz rtket kapott tletlogikai szimblumokhoz tartoz cselekvsek
kinyersvel kapjuk meg. Ha nem ltezik modell, akkor a folyamatot ismteljk, a clt
egy lpssel ksbbre mozgatva.
A kvetkez krds, hogy hogyan kdoljuk a cselekvs lersokat az tletlogikban. A legegyszerbb

megkzelts, hogy minden cselekvs megjelensre egy tletlogikai szimblumot vezetnk be. Pldul a
Repl(P1, SFO, JFK)0 igaz, ha a P1 replgp az SFO-rl a JFK-ra repl a 0. idpillanatban. Csakgy, mint a 7.
fejezetben, felrjuk az tletlogikai vltozatait a kvetkez llapotaximknak, melyeket a 10. fejezetben a
szitucikalkulushoz fejlesztettnk ki. Adott pldul az
Ott(P1, JFK)1 (Ott(P1, JFK)0 (Repl(P1, JFK, SFO)0 Ott(P1, JFK)0))
(Repl(P1, SFO, JFK)0 Ott(P1, SFO)0) (11.1)
axima. Ennek jelentse, hogy a P1 repl a JFK-n lesz az 1-es idpillanatban, ha a JFK-n volt a 0.
idpillanatban, s onnan nem replt el, vagy ha az SFO-n volt a 0. idpillanatban, s elreplt a JFK-ra. Egy
ilyen aximra minden egyes replgphez, repltrhez s idpillanathoz szksgnk van. Mindezeken tl
minden egyes hozzadott repltr egy j kiindul, illetve ott vgzd tvonalat ad az sszes repltrhez, ezrt
tovbbi diszjunkcikat ad az sszes axima jobb oldalhoz.
Ha ezek az aximk megvannak, akkor egy kielgthetsgi algoritmust futtathatunk a terv megtallsra. Kell,
hogy legyen olyan terv, ami a clt a T = 1 idpillanatban elri, nevezetesen az a terv, melyben a kt replgp
helyet cserl. Tegyk fel, hogy a tudsbzis a kvetkez:
kiindul llapot kvet llapot aximk cl1 (11.2)
mely szerint a cl a T = 1 idpillanatban igaz. Ellenrizhet, hogy az eljrs, melyben a

Repl(P1, SFO, JFK)0 s a Repl(P2, JFK, SFO)0
igaz, s minden ms cselekvsszimblum hamis, modellje a tudsbzisnak. Eddig itt minden rendben. Vannak
ms lehetsges modellek, melyeket a kielgthetsgi algoritmus visszaadhat? Valjban igen. Ezen modellek
mindegyike kielgt terv? Sajnos nem. Vegyk pldul a
Repl(P1, SFO, JFK)0, a Repl(P1, JFK, SFO)0 s a Repl(P2, JFK, SFO)0
cselekvsszimblumok ltal specifiklt meglehetsen butcska tervet. Ez a terv buta, mert a P1 repl az SFOrl indul, ezrt a Repl(P1, JFK, SFO)0 cselekvs vgrehajthatatlan. Mindazonltal a terv modellje a (11.2)
egyenlet mondatnak! Ez annyit jelent, hogy megfelel mindennek, amit eddig a problmrl lltottunk. Hogy
megrtsk mirt, egy kicsit kzelebbrl meg kell vizsglnunk, hogy a kvetkez llapot aximk mit mondanak
el a cselekvsekrl, melyeknek az elfelttelei nem teljeslnek (mint a (11.1) egyenletben). Az aximk
helyesen rjk le, hogy semmi sem trtnik, ha egy ilyen cselekvst vgrehajtunk (lsd 11.15. feladat), de nem
lltjk, hogy egy ilyen cselekvs nem hajthat vgre! Hogy elkerljk az illeglis cselekvseket tartalmaz
357
Tervkszts
tervek ksztst, tovbbi elfelttel aximkat (precondition axioms) kell felvennnk, melyek biztostjk,
hogy egy cselekvs megjelenshez az elfeltteleknek teljeslni kell.6 Pldul szksgnk van az
Repl(P1, JFK, SFO)0 Ott(P1, JFK)0
aximra, mert az Ott(P1, JFK)0 hamis a kiindul llapotban, gy ez az axima biztostja, hogy a Repl(P1, JFK,
SFO)0 minden modellben szintn hamis legyen. Az elfelttel aximk hozzadsval mr csak pontosan egy
modell van, ami teljesti az sszes aximt, amikor a clt az 1-es idpillanatban rjk el, nevezetesen az a
modell, melyben a P1 replgp a JFK-ra, a P2 replgp pedig az SFO-ra repl. Vegyk szre, hogy ez a
megolds kt prhuzamos cselekvst tartalmaz! Csakgy, mint a GRAPHPLAN vagy a rszben rendezett
tervkszts esetn.
Tovbbi meglepetsekre szmthatunk, amikor egy j replteret illesztnk be, a LAX-ot (Los Angeles
repltere). Most minden replgphez minden llapotban kt megengedett cselekvs is tartozik. Amikor egy
kielgthetsgi algoritmust futtatunk, gy talljuk, hogy a Repl(P1 SFO, JFK)0, a Repl(P2, JFK, SFO)0 s a
Repl(P2, JFK, LAX)0-bl ll modell kielgti az aximkat. Azaz a kvet llapot aximk s az elfelttel
aximk megengedik, hogy egy replgp egyszerre kt clllomsra is replhessen! A kiindul llapot a P2
mindkt repltjnak elfeltteleit teljesti, gy a kvet llapot aximk szerint a P2 az SFO-n s a LAX-on
tallhat az 1-es idpillanatban, azaz a cl teljesl. Nyilvnval, hogy tovbbi aximkat kell felvennnk, hogy
kizrjuk ezeket a hibs megoldsokat. Az egyik megkzelts, hogy cselekvskizr aximkat (action
exclusion axioms) vesznk fel, melyek meggtoljk az egyidej cselekvseket. Pdul teljes kizrst rhetnk
el, ha az sszes
(Repl(P2, JFK, SFO)0 Repl(P2, JFK, LAX)0)
alak aximt felvesszk. Ezek az aximk biztostjk, hogy semelyik kt cselekvs ne eshessen azonos
idpontra. Ezek kizrjk a hibs terveket, hatsukra minden terv teljesen rendezett lesz. Ez elveszti a rszben
rendezett tervek rugalmassgt, s azltal, hogy megnveli a terv lpsszmt, a szmtsi id is
meghosszabbodhat.
A teljes kizrs helyett alkalmazhatunk csupn rszleges kizrst, amikor az egyidej cselekvseket csak akkor
zrjuk ki, ha klcsnhatsba kerlnek. A felttelek a mutex cselekvsek megfeleli: kt cselekvs nem hajthat
vgre egyidejleg, ha az egyik neglja a msik egy elfelttelt vagy kvetkezmnyt. Pldul a Repl(P2, JFK,
LAX)0 s a Repl(P2, JFK, SFO)0 egytt nem kvetkezhet be, mert mindkett neglja a msik elfelttelt.
Msrszrl azonban a Repl(P2, JFK, SFO)0 s a Repl(P2, JFK, SFO)0 egytt is bekvetkezhet, hiszen a jratok
nem zavarjk egymst. A rszleges kizrs a teljes rendezs knyszere nlkl kikszbli a hibs terveket.
A kizrsi aximk nha nagyon buta eszkznek tnnek. Ahelyett hogy kiktnnk, hogy egy gp nem replhet
egyszerre kt reptrre, mondhatnnk egyszeren, hogy egyetlen trgy sem lehet egyszerre kt helyen:
p, x, y, t x y (Ott(p, x)t Ott(p, y)t)
Ez a tny a kvet llapot aximkkal kombinlva, azt impliklja, hogy egy repl nem replhet egyszerre kt
reptrre. Az ilyen tnyeket llapotkorltozsoknak (state constraints) nevezzk. Az tletlogikban
termszetesen meg kell adnunk minden egyes llapotkorltozs sszes alappldnyt. A repls feladatra az
llapotkorltozs elegend az sszes hibs terv kizrshoz. Az llapotmegktsek gyakran sokkal tmrebbek,
mint a cselekvskizrsi aximk, ezek azonban a problma eredeti STRIPS reprezentcijbl nem mindig
vezethetk le knnyedn.
sszefoglalva teht a kielgthetsgi tervkszts, a kiindul llapotot, a clt, a kvet llapot aximkat, az
elfeltteleket, valamint a cselekvskizrsok vagy az llapotaximk egyikt tartalmaz mondathoz tartoz
modellek megtallst jelenti. Megmutathat, hogy az aximk ezen halmaza elgsges, abban az rtelemben,
hogy a tovbbiakban nincsenek hibs megoldsok. Az tletlogikai mondatot kielgt brmely modell
megfelel megoldsa az eredeti problmnak, azaz a terv minden sorba rendezse egy megengedett
cselekvssor, ami a clhoz vezet.
5.2. Az tletlogikai lers bonyolultsga
Figyeljk meg, hogy az elfelttel aximk felvtele azt jelenti, hogy nem kell a kvet llapot aximknl a cselekvsekhez
elfeltteleket felvennnk.
6
358
Tervkszts
Az tletlogikai megkzelts legnagyobb htrnya az eredeti problmbl generlt tudsbzis mrete. A

Repl(p, a1, a2) cselekvssma pldul T Replk Replterek 2 szm klnbz lltslogikai
szimblumot eredmnyez. ltalnossgban a cselekvsszimblumok szmnak korltja a T Act O P,
ahol az Act a cselekvssmk szma, O a problmakr objektumainak szma, valamint P a cselekvs
smk maximlis aritsa (paramtereinek szma). A klzok szma mg nagyobb. 10 idlps, 12 replgp s
30 repltr esetn a teljes cselekvskizrsi aximban 583 milli klz van.
Mivel a cselekvsszimblumok szma a cselekvssmk aritsval exponencilisan n, megolds lehet az arits
cskkentse. Ezt a szemantikus hlktl (lsd 10. fejezet) klcsnvett tlet segtsgvel tehetjk meg. A
szemantikus hlk csak binris prediktumokat hasznlnak, az ennl tbb argumentummal rendelkez
prediktumokat egy binris prediktumhalmazra kpezzk le, ami kln ad meg minden prediktumot. Ezt az
tletet a Repl(P1, SFO, JFK)0 cselekvsszimblumra alkalmazva, hrom j szimblumot kapunk:
Repl1(P1)0: a P1 repl a 0. idpontban replt
Repl2(SFO)0: a jrat kiindul llomsa az SFO
Repl3(JFK)0: a jrat clllomsa a JFK
Ez a szimblumfelosztsnak (symbol splitting) nevezett folyamat kikszbli az exponencilis szm

szimblum ignyt. gy most csak T Act P O szimblumra van szksg.
A szimblum feloszts nmagban lecskkenti ugyan a szimblumok szmt, de a tudsbzisban szerepl
aximk szmt nem cskkenti automatikusan. Azaz, ha minden klzban szerepl cselekvsszimblumot
egyszeren csak hrom szimblum konjunkcijra cserlnnk, a tudsbzis mrete nagyjbl azonos maradna.
A szimblumfeloszts valban cskkenti a tudsbzis mrett, mivel nhny sztbontott szimblum feleslegess
vlik bizonyos aximkban, s elhagyhat. Vegyk pldul a (11.1) egyenletben szerepl kvet llapot
aximt, mdostva, hogy tartalmazza LAX-ot, s elhagyva a cselekvs elfeltteleket (melyeket kln
elfelttel aximkkal fednk le):
Ott(P1, JFK)1 (Ott(P1, JFK)0 Repl(P1, JFK, SFO)0 Repl(P1, JFK, LAX)0)
Repl(P1, SFO, JFK)0 Repl(P1, LAX, JFK)0
Az els felttel szerint a P1 a JFK-n lesz, ha a 0. idpontban ott volt, s nem replt el egyetlen msik vrosba
sem. A msodik azt mondja, hogy ott lesz, ha mindegy, hogy honnan, de a JFK-ra repl. A felosztsi
szimblumok hasznlatval, egyszeren elhagyhatjuk azon argumentumokat, melyek rtke nem szmt:
Ott(P1, JFK)1 (Ott(P1, JFK)0 Repl1(P1)0 Repl2(JFK)0) Repl1(P1)0
Repl3(JFK)0
Vegyk szre, hogy az SFO s a LAX mr nem szerepel az aximban. ltalnosabban a felosztsi
szimblumoknak ksznheten a kvet llapot aximk mrete fggetlenn vlik a replterek szmtl.
Hasonl redukci trtnik az elfelttel s a cselekvskizrsi aximkkal (lsd 11.16. feladat). A korbban
bemutatott 10 idlps, 12 repl s 30 reptr esetben a teljes cselekvskizrsi axma mrete 583 milli
klzrl 9360 klzra cskken.
A mdszernek egyetlen htultje van: a felosztsi szimblum reprezentci nem engedi meg a prhuzamos
cselekvseket. Vegyk a Repl(P1, SFO, JFK)0 s a Repl(P2, JFK, SFO)0 prhuzamos cselekvseket. A
felosztott megadsra alaktva a
Repl1(P1)0 Repl2(SFO)0 Repl3(JFK)0
Repl1(P2)0 Repl2(JFK)0 Repl3(SFO)0
kifejezst kapjuk. Innentl mr nem llapthat meg mi trtnt! Tudjuk, hogy P1 s P2 replt, de nem tudjuk
azonostani a jratok kiindul s clllomsait. Ez annyit tesz, hogy egy teljes cselekvskizrsi aximt kell
hasznlni, annak korbban jelzett htrnyaival.
A kielgthetsgen alapul tervksztk nagyon nagy tervksztsi problmkat kpesek kezelni pldul a
tbbtucatnyi dobozbl ll kockavilg problma 30 lpses tervt. A propozcis kdols mrete, valamint a
megolds kltsge nagymrtkben problmafgg, de a legtbb esetben az tletlogikai aximk t rolshoz
szksges memriamret a szk keresztmetszet. Ennek a kutatsnak egy rdekes eredmnye, hogy a
359
Tervkszts
visszalpses algoritmusok (mint a DPLL) gyakran hatkonyabbak voltak a tervksztsi problmk

megoldsban, mint a loklis keressi algoritmusok (pldul a WALKSAT). Ennek oka, hogy az tletlogikai
aximk tbbsge Horn-klz, ami egysg terjesztstechnikkkal kezelhet hatkonyan. Ez a megfigyels hibrid
algoritmusok kifejlesztshez vezetett, melyek a vletlen keressi, a hiba-visszaterjesztsi s az
egysgterjesztsi mdszereket kombinljk.
6. A tervksztsi mdszerek elemzse

A mestersges intelligencia terletn bell, a tervkszts jelenleg nagy figyelemnek rvend. Ennek egyik oka,
hogy egyesti az eddig bemutatott kt nagy terletet, a keresst s a logikt. A tervkszt tekinthet egy
programnak, ami vagy egy megoldst keres, vagy (konstruktvan) bizonytja egy megolds ltezst. A kt
terlet alaptleteinek keresztezse az utbbi vtizedben tbb nagysgrendnyi javulst hozott a hatkonysg
tekintetben, s egyttal megnvelte a tervksztk ipari alkalmazsokban val felhasznlhatsgt. Sajnos mg
mindig nincs tiszta kpnk arrl, hogy mely problmkra mely megoldsok a legalkalmasabbak. Ksbb
valsznleg j technikk kerlnek majd eltrbe, melyek dominlnak majd a meglvk felett.
A tervksztsi feladat elssorban a kombinatorikus robbans kzbentartsrl, kontrolllsrl szl. Egy p elemi
lltst tartalmaz problmatrben 2p llapot lehetsges. sszetett problmakrkben p nagyon nagy lehet.
Vegyk azt, hogy a problmatr objektumainak tulajdonsgai (Pozci, Szn stb.) s relcii (Ott, Rajta, Kzte
stb.) vannak. Az llapotok szma, d objektummal s hrmas relcikkal a problmatrben 2 d^3.
Vgkvetkeztetsknt a legrosszabb esetet felttelezve megllapthatjuk, hogy a tervkszts remnytelen.
Az ilyen pesszimizmus ellen az oszd meg s uralkodj elv hatsos fegyver lehet. A legjobb esetben
amennyiben a problma teljesen dekomponlhat az oszd meg s uralkodj elv exponencilis gyorsulst
hozhat. A dekomponlhatsgot azonban a cselekvsek negatv klcsnhatsai megszntetik. A rszben
rendezett tervkszt ezt egy ers reprezentcs megkzeltssel, az okozati kapcsolatokkal kezelte, de sajnos a
konfliktusok mindegyike csak egy vlasztssal oldhat fel (ami a konfliktusban ll cselekvst vagy a kapcsolat
el, vagy mg sorolja) s ezen vlasztsok szma exponencilisan n. A GRAPHPLAN algoritmus a grf
felptsekor kikerli ezeket a dntseket gy, hogy az tkzseket mutex kapcsolatokkal rgzti anlkl, hogy
a felolds mdjrl dntene. A SATPLAN algoritmus a mutex kapcsolatok hasonl terlett fedi le, de ezt egy
specifikus adatstruktra felhasznlsa helyett az ltalnos CNF alak felhasznlsval teszi. Az, hogy ez
mennyire jl mkdik, a felhasznlt SAT megoldtl fgg.
Nha a problma hatkonyan megoldhat, ha szrevesszk, hogy a negatv klcsnhatsok kizrhatk. Azt
mondjuk, hogy egy feladatnak sorba rendezhet rszcljai (serializable subgoals) vannak, ha ltezik a
rszcloknak egy olyan rendezse, hogy a tervkszt sorrendben elrheti ket anlkl, hogy a korbban mr
elrt rszclokat felszmoln. A kockavilgban pldul, ha a cl egy torony megptse (pdul az A a B-n, ami
pedig az asztalon elhelyezked C-n van), akkor a rszclok fellrl lefel sorrendezhetk: ha elszr elrjk,
hogy C az asztalon van, akkor a tovbbiakban mialatt a tovbbi rszclokat teljestjk ennek
megszntetsre soha nem lesz szksg. Egy tervkszt, ami az alulrl felfel trkkt alkalmazza, a kockavilg
brmely problmjt kpes megoldani visszalps nlkl (br nem mindig a legrvidebb tervet adja).
Egy sszetettebb pldaknt, a NASA Deep Space 1 rhajjt irnyt Tvirnyt gens tervkszt esetn
elhatroztk, hogy az rhajt irnyt lltsok legyenek sorba rendezhetk. Ez taln nem is annyira meglep,
hiszen az rhajt a mrnkk gy terveztk, hogy minl knnyebb legyen irnytani (ms megktsek
figyelembevtelvel). A clok sorrendezhetsgt kihasznlva a Tvirnyt gens tervkszt a keress nagy
rszt megsprolhatta, gy megfelelen gyors volt az rhaj vals idej irnytsra, amit korbban
lehetetlennek tartottak.
A kombinatorikus robbans kordban tartsra tbb lehetsg is van. Az 5. fejezetben lthattuk, hogy a
knyszerkielgthetsgi problmk (CSP-k) visszalpsi szmnak kontrolllshoz szmos megolds ltezik,
mint pldul a fggsgirnytott visszalps. Ezen technikk mindegyike alkalmazhat a tervksztshez is.
Pldul a megolds kinyerse egy tervksztsi grfbl kezelhet egy ktrtk CSP-knt, melynek vltozi azt
jelzik, hogy egy adott cselekvs bekvetkezik-e egy adott idpontban, vagy sem. A CSP megoldhat az 5.
fejezet brmely algoritmusval, pldul a min-konfliktusok algoritmussal. Egy kzeli rokon, a BLACKBOX
rendszerben hasznlt megolds, a tervksztsi grfot CNF kifejezsre fordtja, melybl ezutn egy SAT
megoldval nyeri ki a tervet. Ez a megkzelts jobb, mint a SATPLAN algoritmus, felttelezheten azrt, mert a
tervksztsi grf mr szmos lehetetlen llapotot s cselekvst eltvoltott a feladatbl. A GRAPHPLAN
algoritmusnl is jobban mkdik, valsznleg azrt, mert a kielgthetsgi keress, mint a WALKSAT, nagyobb
rugalmassg a GRAPHPLAN algoritmus ltal hasznlt szigor visszalpses keressnl.
360
Tervkszts
Nem ktsges, hogy a GRAPHPLAN-hoz, a SATPLAN-hoz s a BLACKBOX-hoz hasonl tervksztk

elremozdtottk a tervkszts fejldst azltal, hogy megnveltk a tervkszt rendszerek teljestmnyt, s
tisztztk a kapcsold reprezentcis s komlexitsi krdseket. Ezek a megoldsok azonban eredenden
tletlogikai megoldsok, gy korltozott a problmakr, amelyet kpesek kifejezni. (Pldul nhny tucat
objektumot s helyet tartalmaz logisztikai problmnak megfelel CNF kifejezsekhez gigabjtnyi kapacitsra
van szksg.) Br a tervksztsi grfhoz hasonl struktrk tovbbra is hasznosak lesznek, mint a heurisztikk
forrsa, valsznnek tnik, hogy elsrend reprezentcikra s algoritmusokra lesz szksg a tovbbi
fejldshez.
7. sszefoglals
Ebben a fejezetben a tervksztsi feladatot determinisztikus s teljesen megfigyelhet krnyezetek esetn
definiltuk. Bemutattuk a tervksztsi feladatok lersra hasznlt fbb reprezentcikat, valamint szmos
algoritmikus megkzeltst a megoldsukra. Idzzk fel a fontosabb lltsokat:
A tervkszt rendszerek olyan problmamegold algoritmusok, melyek llapotok s cselekvsek explicit
tletlogikai (vagy elsrend) reprezentciin mkdnek. Ezek a lersok lehetv teszik hatkony
heurisztikk szrmaztatst, valamint ers s rugalmas algoritmusok kifejlesztst a problmamegoldshoz.
A STRIPS nyelv az elfelttelek s kvetkezmnyek segtsgvel rja le a cselekvseket, valamint a kiindulsi
s clllapotokat pozitv literlok konjunkcijaknt adja meg. Az ADL nyelv lazt ezeken a megktseken,
megengedi a diszjunkcit, a neglst s a kvantorokat.
Az llapottr-keress trtnhet elrefel: progreszv (progression) vagy htrafel: regresszv (regression).
Hatkony heurisztikk szrmaztathatk a rszclok fggetlensgt felttelezve s a tervksztsi feladat
klnbz gyengtseivel.
A rszben rendezett tervkszt (RRT) algoritmusok a tervek terben keresnek anlkl, hogy cselekvsek
teljesen rendezett sorozatra jutnnak. A cltl visszafel mkdnek a rszclok elrshez szksges
cselekvseknek a tervhez val hozzadsval. Ezek az algoritmusok klnsen hatkonyak az oszd meg s
uralkodj megkzeltssel kezelhet problmkra.
Egy tervksztsi grf (planning graph) megalkothat inkrementlisan a kiindul llapotbl elindulva.
Minden egyes rteg az adott idpillanatban vgrehajthat szszes cselekvs s literl halmazt tartalmazza,
rgzti a klcsns kizrsokat vagy mutexeket, azaz olyan literlok s cselekvsek kztti relcikat, melyek
egyszerre nem kvetkezhetnek be. A tervksztsi grfok hasznos heurisztikkra vezetnek az llapottr s a
rszben rendezett tervksztk esetn, s kzvetlenl felhasznlhatk a GRAPHPLAN algoritmusban.
A GRAPHPLAN algoritmus a tervksztsi grfot dolgozza fel visszafel keresst alkalmazva a terv
kinyershez. Lehetsget biztost tovbb mg a cselekvsek kztt bizonyos rszben rendezsekre.
A SATPLAN algoritmus a tervksztsi problmt tletlogikai aximkra fordtja, s egy kielgthetsgi
algoritmust hasznl a helyes tervnek megfelel modell megtallsra. Szmos klnbz tletlogikai
reprezentcit fejlesztettek ki klnbz mrtk tmrsggel s hatkonysggal.
A tervkszts f megkzeltsei mindegyiknek vannak nehzsgei, s egyelre nincs egyetrts abban, hogy
melyik a legjobb. A versengs s a mdszerek tvzse komoly elrehaladst eredmnyezett a tervkszt
rendszerek hatkonysgban.

A mestersges intelligenciban a tervezs az llapottr-keressek vizsglatbl, ttelbizonytsbl,
szablyozstechnikbl, illetve a robotika, temezs s ms terletek gyakorlati szksgleteibl ered. Az els
szmottev tervkszt rendszer a STRIPS (Fikes and Nilsson, 1971), ezen hatsok klcsnhatst pldzza. A
STRIPS-et, az SRI-ben zajl Shakey robot projekt szoftvernek tervkszt komponenseknt fejlesztettk ki.
Ennek teljes szablyozsi struktrjt egy eszkz-cl analzist hasznl llapottr-keres rendszer, a GPS, azaz
az ltalnos problmamegold (general problem solver) (Newell s Simon, 1961) mintjra ksztettk. A
STRIPS a QA3 ttelbizonyt rendszer egy verzijt (Green, 1969b) hasznlta fel a cselekvsek elfeltteleinek
teljestsre. Lifschitz a STRIPS precz definciit s elemzseit adja meg (Lifschitz, 1986). Bylander
bizonytotta, hogy az egyszer STRIPS tervkszts PSPACE-teljes (Bylander, 1992). Fikes s Nilsson
361
Tervkszts
trtnelmi ttekintst adnak a STRIPS projektrl, s feltrjk ennek kapcsolatait az jabb tervksztsi
trekvsekkel (Fikes s Nilsson, 1993).
A STRIPS-ben hasznlt cselekvsreprezentcinak sokkal nagyobb hatsa volt, mint algoritmikus
megkzeltsnek. Ezt kveten majdnem minden tervkszt rendszer hasznlta a STRIPS nyelv ilyen vagy
olyan mdostsait. Sajnos a klnbz vltozatok elburjnzsa szksgtelenl megneheztette az
sszehasonltsokat. Az id mlsval jobban megrtettk az egyes formalizmusok korltait s htrnyait. A
cselekvsler nyelv (Action Description Language ADL) (Pednault, 1986) laztotta a STRIPS nyelv nhny
megktst, s lehetv tette a valsghoz kzelibb problmk lerst. Nebel az ADL lerst STRIPS lersra
fordt smkat vizsglja (Nebel, 2000). A problmatr ler nyelvet (Problem Domain Description Language
PDDL) (Ghallab s trsai, 1998) egy szmtgp ltal rthet szabvnyos szintaxisknt vezettk be a STRIPS, az
ADL s egyb nyelvek lersra. A PDDL-t 1998-tl az AIPS konferencin zajl tervksztsi versenyek
szabvnyos nyelveknt hasznltk.
Az 1970-es vek elejnek tervkszti ltalban teljesen rendezett cselekvssorokkal dolgoztak. A
problmadekompozcit gy rtk el, hogy minden rszclhoz egy rsztervet ksztettek, majd ezeket
valamilyen sorrendben sszefztk. Hamarosan felfedeztk, hogy ez a megkzeltst, melyet Sacerdoti lineris
tervksztsnek (linear planning) nevezett (Sacerdoti, 1975), nem teljes. Nem kpes megoldani nhny nagyon
egyszer problmt, mint pdul a Sussman-anomlit (lsd 11.11. feladat), amit Allen Brown a HACKER
rendszerrel vgzett kutatsai sorn fedezett fel (Sussman, 1975). Egy teljes tervksztnek meg kell engedni egy
mondatban a klnbz rsztervekbl szrmaz cselekvsek sszefslst (interleaving). A sorrendezhet
rszclok alaptlete (Korf, 1987) pontosan megfeleltethet azon problmk halmaznak, melyekre az
szszefslsre nem alkalmas tervksztk teljesek.
Az sszefslsi problma egyik megoldsa a clregresszis tervkszts volt, ami egy olyan technika, melyben
egy teljesen rendezett terv lpseit a rszclok kztti konfliktusok elkerlse rdekben jrarendezzk. Ezt
Waldinger vezette be (Waldinger, 1975), s Warren WARPLAN rendszerben (Warren, 1974) szintn
felhasznltk. A WARPLAN-nel kapcsolatban szintn kiemelend, hogy ez volt az els tervkszt, melyet logikai
programozsi nyelven (Prolog) rtak, valamint az egyik legjobb plda arra a kiemelked gazdasgossgra, ami a
logikai programozssal nyerhet: a WARPLAN sszesen szz kdsor, azaz csak tredke az abban az idben
ismert hasonl tervksztk mretnek. Az INTERPLAN (Tate, 1975a; 1975b) a Sussman-anomlia s hasonl
problmk elkerlse rdekben, szintn megengedte a tervlpsek tetszleges sszefslst.
A rszben rendezett tervkszts alaptletei tartalmazzk az tkzsek rzkelst (Tate, 1975a) s az elrt
felttelek klcsnhatsoktl val vdelmt (Sussman, 1975). A rszben rendezett tervek (melyeket akkor
feladathlknak task network neveztek) ksztst a NOAH tervkszt (Sacerdoti, 1975; 1977) s Tate
NONLIN rendszere vezette be (Tate, 1975b; 1977).7
A kvetkez hsz v kutatsaiban a rszben rendezett tervkszts dominlt, mialatt azonban a problmakrt
szles krben nem rtettk. A TWEAK (Chapman, 1987) ezen idszak tervksztsi munkjnak logikai
reprezentcija s egyszerstse volt. Chapman felrsa elgg tiszta volt ahhoz, hogy bizonythat legyen a
tervksztsi problmk klnbz megfogalmazsainak teljessge s kvethetetlensge (NP-nehzsge s eldnthetetlensge). Chapman munkja egy teljes rszben rendezett tervkszt els egyszer s olvashat
lersra vezetett (McAllester s Rosenblitt, 1991). A McAllester s Rosenblitt SNLP-nek (Soderland s Weld,
1991) nevezett algoritmusnak implementcija szles krben elterjedt, s elsknt tette szmos kutat szmra
lehetv a rszben rendezett tervksztk megrtst s kutatst. Az ebben fejezetben korbban bemutatott
RRT algoritmus az SNLP-n alapul.
Weld csoportja fejlesztette ki az UCPOP-ot is (Penberthy s Weld, 1992), az els tervksztt ADL-ben
kifejezett problmkra. Az UCPOP a kielgtetlen-clok-szma heurisztikt alkalmazta. Valamivel gyorsabban
futott, mint az SNLP, de nagyon ritkn volt kpes nhny tucat lpsnl tbbet tartalmaz tervek megtallsra.
Br javtott heurisztikkat is kifejlesztettek az UCPOP mdszerhez (Joslin s Pollack, 1994); (Gerevini s
Schubert, 1996) az 1990-es vekben, a gyorsabb mdszerek megjelensvel a rszben rendezett tervksztk
httrbe szorultak. Nguyen s Kambhampati a mdszer visszatrst javasoltk (Nguyen s Kambhampati,
2001): a tervksztsi grfbl megfelel heurisztikk szrmaztatsval a REPOP tervksztjk jobban
sklzhat, mint a GRAPHPLAN, tovbb ez vetlytrsa lett a leggyorsabb llapottr-tervksztknek is.
A terminolgia kiss zavaros. Sok szerz a nemlineris (nonlinear) jelzt a rszben rendezett rtelemben hasznlja. Ez kiss
klnbzik Sacerdotti eredeti szhasznlattl, aki ezt az sszefslt tervekre hasznlta.
7
362
Tervkszts
Avrim Blum s Merrick Furst felpezsdtette a tervkszts terlett GRAPHPLAN rendszervel (Blum s Furst,
1995; 1997), ami tbb nagysgrenddel gyorsabb volt az akkori rszben rendezett tervksztknl. Ms
grftervez rendszerek, mint az IPP (Koehler s trsai, 1997), a STAN (Fox s Long, 1998) s az SGP (Weld s
trsai, 1998) hamarosan kvettk. Egy kicsivel korbban Ghallab s Laurelle a tervkszt grfhoz nagyon
hasonl adatstruktrt fejlesztettek ki (Ghallab s Laurelle, 1994). Az IXTET rszben rendez tervksztjk az
adatstruktrt a keress irnytsra szolgl heurisztikk kinyersre alkalmazta. Nguyen s trsai a tervkszt
grfokbl szrmaztatott heurisztikk nagyon alapos ttekintst adtk (Nguyen s trsai, 2001). A mi tervkszt
grfokrl szl lersunk rszben ezen, rszben pedig Subbarao Kambhampati jegyzetein alapul. Ahogyan mr a
fejezetben emltettk, tbbfle mdon hasznlhat a tervezsi grf a megolds keressnek irnytsra. A 2002es AIPS tervkszt gyztese, az LPG (Gerevini s Serina, 2002), a WALKSAT ltal sztnzve loklis keressi
technikt hasznlt a tervksztsi grf keressre.
A tervkszts mint kielgthetsg s a SATPLAN algoritmus Kautz s Selman javaslata, akiket a
kielgthetsgi problmkra alkalmazott moh loklis keress meglep sikere inspirlt (Kautz s Selman,
1992) (lsd 7. fejezet). Kautz s trsai szintn kutattk a STRIPS aximk tletlogikai reprezentcijnak
klnbz mdjait, s azt talltk, hogy a legtmrebb alakok nem felttlenl vezettek a leggyorsabb
megoldsokra (Kautz s trsai, 1996). Ernst s trsai szisztematikus elemzst hajtottak vgre (Ernst s trsai,
1997), valamint kifejlesztettek egy automatikus fordtt PDDL problmk tletlogikai megadsnak
generlsra. A Kautz s Selman ltal kifejlesztett BLACKBOX tervkszt (Kautz s Selman, 1998) a GRAPHPLAN
s SATPLAN alaptleteit kombinlja.
Az llapottr-tervksztkkel kapcsolatos rdeklds jjledsnek ttrje Drew McDermott UNPOP
programja (McDermott, 1996), amely elsknt javasolta a trlsi listt figyelmen kvl hagy egyszerstett
problmn alapul tvolsg heurisztikt. Az UNPOP nv a rszben rendezett tervksztket illet tlzott figyelem
egyik reakcija volt; McDermott szerint ms megkzeltsek nem kaptk meg a megrdemelt figyelmet. Bonet
s Geffner heurisztikus keres tervksztje (Heuristic Search Planner HSP) s ennek ksbbi leszrmazottjai
(Bonet s Geffner, 1999) elsknt tettk az llapottr-keresst alkalmazhatv nagymret tervksztsi
feladatokra. A mai napig legsikeresebb llapottr-keres Hoffmann FASTFORWARD vagy FF keresje, az AIPS
2000 tervkszt versenynek gyztese (Hoffmann, 2000). Az FF egyszerstett tervksztsi grf heurisztikt
hasznl egy nagyon gyors, az elrefel s a loklis keresst jszeren tvz algoritmussal.
Napjainkban a tervek binris dntsi diagram (binary decision diagram) alak reprezentcija hdt, ami egy
vges automata tmr lersi mdja, melyet a hardververifikcival foglalkoz kzssg rszletesen
tanulmnyozott (Clarke s Grumberg, 1987; McMillan, 1993). A binris dntsi diagramok jellemzinek mint
egy tervksztsi problma megoldsnak val megfelels tulajdonsgnak bizonytsra szmos technika
elrhet. Cimatti s trsai egy ezen a megkzeltsen alapul tervksztt mutattak be (Cimatti s trsai, 1998).
Ms reprezentcikat szintn felhasznltak; pldul Vossen s trsai az egsz programozs tervksztsre val
felhasznlhatsgt vizsglja (Vossen s trsai, 2001).
A dntbizotsg mg nem dnttt, de a klnbz tervksztsi algoritmusok nhny nagyon rdekes
sszevetse mr elrhet. Helmert a tervksztsi problmk szmos osztlyt vizsglja, s megmutatja, hogy az
NP-nehz problmakrkben a megktsalap megkzeltsek, mint a GRAPHPLAN s a SATPLAN bizonyulnak a
legjobbnak, mg a keressalap megkzeltsek azon problmakrkben hasznosak, ahol visszalpsek nlkl
elrhet egy megfelel megolds (Helmert, 2001). A GRAPHPLAN s SATPLAN algoritmusoknak nehzsget
okoznak a sok objektumot tartalmaz problmk, mert ezek miatt sok cselekvsre van szksgk. Az esetek egy
rszben a problma elkerlhet vagy elodzhat, ha a cselekvsek bizonyos rszt csak szksg esetn
generljuk le dinamikusan, ahelyett hogy mr a keress eltt pldnyostannk mindegyiket. Weld a modern
tervkszt algoritmusok kt kitn ttekintst adja (Weld, 1994; 1999). rdekes ltni az eltelt t v vltozsait
az ttekintsekben: az els a rszben rendezett tervksztsre fkuszl, mg a msodik a GRAPHPLAN s SATPLAN
algoritmusokra. A Readings in Planning (Allen s trsai, 1990) a terlet legjobb korbbi cikkeinek minden
rszletre kiterjed antolgija, belertve nhny ttekintst is. Yang a rszben rendezett tervksztk knyv
mret ttekintst adja (Yang, 1997).
A tervkszts kutatsa a megjelenstl kezdve kzponti krdse a mestersges intelligencia kutatsnak, gy a
tervksztsrl szletett cikkek is szmottev rszt kpezik a folyiratok s konferencik anyagnak.
Specializlt konferencikat is rendeznek, mint az International Conference on AI Planning Systems (AIPS), az
International Workshop on Planning and Scheduling for Space vagy a European Conference on Planning.
7.2. Feladatok
363
Tervkszts
11.1.
rja le a klnbsgeket s hasonlsgokat a problmamegolds s a tervkszts kztt.
11.2.
Adottak a 11.2. bra aximi. Melyek az alkalmazhat konkrt pldnyai a Repl(p, honnan, hova)
cselekvsnek a kvetkez llapotban:
Ott(P1, JFK) Ott(P2, SFO) Repl(P1) Repl(P1)
11.3.
Nzzk meg, hogyan fordthatunk le egy STRIPS smahalmazt a szitucikalkulus kvet llapot aximira
(lsd 10. fejezet).
Vegyk a Repl(p, honnan, hov) smt. rja le a ReplElfelttel(p, honnan, hov, s) prediktum logikai
defincijt, ami igaz, ha a Repl(p, honnan, hov) elfelttelei teljeslnek az s szituciban.
Ezutn rjuk fel a Ott(p, x, s) kvet llapot aximjt, ami a cselekvssmval azonos informcit
tartalmazza, felttelezve, hogy a Repl(p, honnan, hov) az gens szmra rendelkezsre ll egyetlen
cselekvssma.
Most felttelezzk, hogy van egy tovbbi utazsi lehetsg: Teleportls(p, honnan, hov). Ennek egy
tovbbi elfelttele a Torzult(p), extra kvetkezmnye pedig a Torzult(p). Magyarzza meg, hogyan kell
mdostani a szitucikalkulus tudsbzist.
Vgezetl fejlesszen ki egy ltalnos s pontosan specifiklt megoldst egy STRIPS smahalmaz kvet
llapot axima halmazra val lefordtshoz.
11.4.
Egy majom a majom-s-bann feladattal tallkozik egy laboratriumban, ahol elrhetetlen bannfrtk lgnak
a plafonrl. Van egy doboz, ami lehetv teszi a majom szmra a bann elrst, amennyiben felmszik r.
Kiindulskpp a majom az A-ban van, a bannok a B helyen s a doboz a C-n. A majom s a doboz magassga
Alacsony, de ha a majom a dobozra mszik, magassga Magas lesz, megegyezik a bannok magassgval. A
majom szmra elrhet cselekvsek tartalmazzk a Menj egyik helyrl a msikra, a Tol egy trgyat egyik
helyrl a msikra, a Felmszik egy trgyra, illetve Lemszik egy trgyrl, s a Megfog, illetve Elenged egy
trgyat cselekvseket. A megmarkols a trgy megfogst eredmnyezi, ha a majom s a trgy ugyanazon a
helyen s ugyanabban a magassgban vannak.
a. rja fel a kiindul llapotot.
b. rja le a hat cselekvs defincijt STRIPS alakban.
c. Tegyk fel, hogy a majom meg akarja trflni a tudsokat, akik tezni mentek, azltal hogy megragadja a
bannokat, de a dobozt az eredeti helyn hagyja. rja fel ezt mint ltalnos clt (pldul nem felttelezve,
hogy a doboz szksgszeren a C helyen van) a szitucikalkulus nyelvn. Megoldhat ez egy STRIPS-szer
rendszerrel?
d. A tolsi aximja valsznleg helytelen, mert a trgy tl nehz, gy a pozci azonos marad, ha a Tol
opertort alkalmazzuk. Ez elgazsi vagy rtkelsi feladatra ad pldt? Javtsa ki a feladat lerst, hogy
figyelembe vegye a nehz trgyakat.
11.5.
Magyarzza meg, hogy a htrafel keressben a megelz llapotok generlsnak folyamata mirt nem ignyli,
hogy a cselekvs negatv kvetkezmnyeinek megfelel literlokat is szerepeltessk.
11.6.
364
Tervkszts
Magyarzza meg, mirt vezet relaxlt problmra a negatv kvetkezmnyek eldobsa egy STRIPS problma
minden cselekvs smjbl.
11.7.
Vizsglja meg a 3. fejezetben szerepl ktirny keress (bidirectional search) defincijt.
a. A ktirny llapottr-keress hasznlata j tlet lenne tervksztshez?
b. s a rszben rendezett tervek terben trtn ktirny keress?
c. Tervezze meg a rszben rendezett tervkszt azon verzijt, melyben egy cselekvs akkor adhat hozz a
tervhez, ha az elfelttelei elrhetk a tervben mr szerepl cselekvsek kvetkezmnyein keresztl.
Magyarzza meg, hogyan kezeljk a konfliktusokat s a rendezsi megktseket. Szksgszeren azonos ez
az algoritmus az llapottrben trtn elrefel keresssel?
d. Vegynk egy rszben rendezett tervksztt, ami kombinlja a c) rszfeladat mdszert azzal az ltalnos
mdszerrel, ahol a nyitott felttelek elrshez cselekvseket adunk a tervhez. Azonos lesz az gy elll
algoritmus a b) rszfeladattal?
11.8.
Ksztse el a 11.2. brn szerepl problma tervksztsi grfjnak 0., 1. s 2. szintjt.
11.9.
Bizonytsa be az albbi tervkszt grfokra vonatkoz lltsokat:
Az a literl, ami nem jelenik meg a grf utols szintjn, nem rhet el.
Egy soros grfban szerepl literl szintkltsge nem lehet nagyobb, mint az t elr optimlis terv kltsge.
11.10.
sszevetettk az llapottrben elre- s htrafel keres tervksztket a rszben rendezett tervksztkkel gy,
hogy az utbbit egy tervtrkeresnek vettk. Magyarzza meg, hogyan tekinthet az elre- s htrafel trtn
llapottr-keress tervtrkeresnek, s mondja meg, mik a tervfinomt opertorok.
11.11.
A 11.16. bra a kockavilg problmt mutatja, ami Sussman-anomliaknt (Sussman anomaly) ismert. A
problmt azrt tekintettk anomlinak, mert az 1970-es vek nem sszefsls tervkszti nem tudtk
megoldani. rjuk fel a problma defincijt STRIPS alakban, s oldjuk meg, kzzel vagy egy tervkszt
programmal. A nemsszefsl tervkszt egy olyan tervkszt, ami ha kt G1 s G2 rszclt kap, akkor vagy
egy G1 elrsre szolgl tervet fz hozz egy G2 elrsre szolgl tervhez, vagy fordtva. Magyarzza meg,
hogy egy nem sszefsl tervkszt mirt nem tudja megoldani a kockavilg problmt.
11.12.
Vegyk a cip s zokni felvtelnek problmjt, ahogy a 11.3. alfejezetben definiltuk. Alkalmazzuk a
GRAPHPLAN algoritmust erre a problmra, s mutassuk meg, hogyan ll el a megolds. Adjuk hozz a kabt s
a kalap felvtelre szolgl cselekvseket. Adjuk meg azt a rszben rendezett tervet, ami megolds, s mutassuk
meg, hogy ennek 180 klnbz sorrendezse van. Mi a 180 klnbz sorrendezs reprezentcijhoz
szksges klnbz tervkszt grf megoldsok minimlis szma?
11.16. bra - A Sussman-anomlia kockavilg tervksztsi problma
365
Tervkszts
11.17. bra - Shakey vilga. Shakey kpes egy szobn bell mozogni, t tud menni a
szobk kztti ajtkon, fel tud mszni trgyakra, el tudja tolni a mozdthat trgyakat,
valamint a villanyt tudja kapcsolni.
366
Tervkszts
11.13.
Az eredeti STRIPS programot a Shakey robot irnytsra ksztettk. A 11.17. bra a Shakey vilgnak egy
vltozatt mutatja, melyben ngy szoba sorakozik egy folyos mentn, melyek mindegyiknek van egy ajtaja s
van benne egy villanykapcsol.
Shakey vilgnak cselekvsei tartalmazzk az egyik helyrl a msikra val mozgst, mozgathat trgyak (mint
dobozok) eltolst, szilrd testekre (mint dobozokra) val fel- s lemszst, s villanykapcsolk fel-, illetve
lekapcsolst. A robot nmagban soha nem volt elg gyes ahhoz, hogy egy dobozra msszon vagy egy
kapcsolt tkapcsoljon, de a STRIPS tervkszt kpes a robot kpessgein tlmutat terveket tallni s
megadni. Shakey hat cselekvse a kvetkez:
A Megy(x, y), ami felttelezi, hogy Shakey x-ben van, valamint az x s y helyek ugyanazon szobban vannak.
Konvenci alapjn a kt szoba kztti ajt mindkt szobban benne van.
367
Tervkszts
A b doboz eltolsa x pozcibl ugyanazon szoba y pozcijba: Tol(p, x, y). Szksgnk lesz a Doboz
prediktumra s konstansokra a dobozokhoz.
Dobozra felmszs: Felmszik(b); dobozrl lemszs: Lemszik(b). Szksgnk lesz a Rajta prediktumra s
a Padl konstansra.
A villany felkapcsolsa: Felgyjt(s); lekapcsolsa: Leolt(s). A lmpa fel-, illetve lekapcsolshoz Shakey-nek
egy dobozon kell llnia a villanykapcsol mellett.
A 11.17. bra alapjn rja fel Shakey hat cselekvst s a kiindul llapotot STRIPS jellsekkel. Ksztsen
tervet Shakey szmra, hogy a Doboz2 dobozt a Szoba2 szobba mozgassa.
11.14.
Lttuk, hogy a tervksztsi grfok, csak tletlogikai cselekvseket kpesek kezelni. Mi van, hogyha a
tervkszt grfokat a clban vltozkat is tartalmaz problmkra kvnjuk alkalmazni, mint az Ott(P1, x)
Ott(P2, x), ahol x egy vges terlet pozciibl kerl ki? Hogyan tudna egy ilyen problmt tkdolni, hogy
tervkszt grfokkal dolgozhasson? (Segtsg: emlkezzen a rszben rendezett tervkszts Vge cselekvsre.
Ehhez milyen elfeltteleknek kellene tartozni?)
11.15.
Egszen eddig feltteleztk, hogy a cselekvsek csak a megfelel helyzetekben kerlnek vgrehajtsra. Nzzk,
hogy az tletlogikai kvet llapot aximk (mint a 11.1 egyenlet aximja) mit mondanak az olyan
cselekvsekrl, melyek elfelttelei nem teljeslnek.
a. Mutassa meg, hogy az aximk azt jsoljk, hogy semmi sem trtnik, amikor egy cselekvst olyan
llapotban hajtunk vgre, melyben az elfelttelei nem teljeslnek.
b. Vegynk egy p tervet, ami tartalmazza a cl elrshez szksges cselekvseket s illeglis cselekvseket is.
Igaz, hogy ebben az esetben
kiindul llapot kvet llapot aximk p cl
c. Egy szitucikalkulusban elsrend kvet llapot aximk esetn (mint a 10. fejezetben) lehetsges
bizonytani, hogy egy illeglis cselekvseket tartalmaz terv elrje a clt?
11.16.
A repltr problmakrbl adott pldkkal magyarzza meg, hogy a szimblumsztvlaszts hogyan cskkenti
az elfelttel s a cselekvskizrsi aximk mrett. Szrmaztasson egy ltalnos kpletet, mely az
aximahalmazok mrett adja meg az idlpsek szma, a cselekvssmk szma, ezek aritsa, valamint a
trgyak szma fggvnyben.
11.17.
A 11.15. brn szerepl SATPLAN algoritmusban a minden kielgthetsgi algoritmus hvs egy tovbbi gT clt
eredmnyez, ahol a T rtkkszlete 0 Tmax. Tegyk fel, hogy ehelyett a kielgthetsgi algoritmust csak
egyszer hvjuk meg a g0 g1 ... gTmax cllal.
a. Ez mindig ad vissza tervet, amennyiben ltezik egy Tmax hosszsg vagy annl rvidebb terv?
b. Eredmnyez ez a mdszer j hibs megoldsokat?
c. Vizsgljuk meg, hogy hogyan lehetne mdostani egy kielgthetsgi algorimust, pldul a WALKSAT
algoritmust, hogy az (amennyiben ltezik) rvid megoldsokat talljon, amennyiben hasonl diszjunktv clt
kap.
368
12. fejezet - Tervkszts s

cselekvs a val vilgban
Ebben a fejezetben lthatjuk, hogy a kifejezbb reprezentci s az interaktvabb gensarchitektrk hogyan
vezetnek a vals vilgban is hasznlhat tervksztkhz.
Az elz fejezet a tervkszts legalapvetbb fogalmait, reprezentciit s algoritmusait vezette be. A val vilg
feladataihoz, mint a Hubble-rteleszkp megfigyelseinek temezsre, gyrak mkdtetsre vagy
hadmveletek logisztikai kezelsre jval sszetettebb tervksztket hasznlnak. Ezek kiterjesztik az
alaptpusokat mind a reprezentcis nyelv, mind pedig a tervkszts s a krnyezet egyttmkdsnek
szempontjbl. Ez a fejezet bemutatja hogyan. A 12.1. alfejezet az id- s erforrskorlttal rendelkez
tervksztst mutatja be. A 12.2. alfejezet az elre definilt rsztervekhez trtn tervksztst rja le. A 12.3
12.6. alfejezet olyan gensarchitektrkat mutat be, melyeket a bizonytalan krnyezet kezelsre terveztek. A
12.7. alfejezet bemutatja, hogyan tervezznk, amikor a krnyezet ms genseket is tartalmaz.
1. Id, temezs s erforrsok

A STRIPS reprezentci azt rja le, hogy mit csinlnak a cselekvsek, de mivel a reprezentci a
szitucikalkuluson alapul, nem tartalmazza, hogy milyen hossz egy cselekvs, sem azt, hogy mikor kvetkezik
be, kivve azt, hogy egy msik cselekvs eltt vagy utn jn. Nhny feladatkrben azt szeretnnk tudni, hogy a
cselekvsek mikor kezddnek s vgzdnek. A teherszlltsi problmakrben pldul, azt szeretnnk tudni,
hogy egy adott csomagot hordoz replgp mikor rkezik, nem csak azt, hogy megrkezik, amikor a
replsnek vge.
Az alkalmazsok egy ltalnos csaldjnak, az temezsi feladatok (job shop scheduling) csaldjnak a
lnyege az id. Az ilyen feladatok munkk elvgzst ignylik, melyek mindegyike cselekvsek sorozatbl ll,
ahol minden cselekvs adott idtartam s bizonyos erforrsokat ignyelhet. A problma, hogy egy olyan
temezst hatrozzunk meg, ami az erforrskorltok figyelembevtele mellett minimalizlja az sszes
feladat elvgzshez szksges sszidt.
A 12.1. brn egy temezsi feladatra lthatunk pldt. Ez egy nagyon leegyszerstett aut-sszeszerelsi
feladat. Kt munknk van, a C1 s a C2 aut sszeszerelse. Minden munka hrom cselekvsbl ll: a motor
beszerelse, a kerekek felszerelse, valamint az eredmny vgs ellenrzse. Elszr a motort kell berakni
(mivel az els kerekek beszerelse megakadlyozn, hogy hozzfrjnk a motortrhez), a vizsglatot pedig
rtelemszeren utoljra kell vgrehajtani.
12.1. bra - A kt aut sszeszerelst tartalmaz temezsi feladat. A jellsben az

Idtartam(d) jelentse, hogy egy cselekvs d percet vesz ignybe. A Motor(E1, C1, 60)
jelentse az, hogy az E1 egy motor, ami a C1 alvzba illeszthet s 60 perc alatt szerelhet
be.
369
Tervkszts s cselekvs a val

vilgban
A 12.1. brn lthat problma brmely eddig ltott tervksztvel megoldhat. A 12.2. bra (ha a szmokkal
nem trdnk) a rszben rendezett tervkszt megoldst mutatja. Hogy az inkbb egy temezsi, mintsem egy
tervksztsi feladat legyen, minden cselekvshez meg kell hatroznunk, hogy mikor kezddjn s mikor
vgzdjn. Ez azt jelenti, hogy figyelnnk kell minden cselekvs hosszra, csakgy, mint a sorrendjre. Az
Idtartam(d) jells egy cselekvs kapcsn (ahol d csak egy szmmal helyettesthet be) azt jelenti, hogy egy
cselekvs elvgzshez d percre van szksg.
Ha adott a cselekvsek egy rszleges rendezse az idtartamokkal, ahogy a 12.2. bra is mutatja, akkor a
kritikus tvonal mdszer (critical path method CPM) felhasznlhat az egyes cselekvsek lehetsges
kezdsi s befejezsi idpontjainak meghatrozsra. Egy rszben rendezett tervben tallhat tvonal,
cselekvsek egy linerisan rendezett sorozata, ami az Indt-bl indul s a Befejez-ben fejezdik be (pldul a
12.2. bra rszben rendezett tervben kt t tallhat).
A kritikus tvonal (critical path) az az t, amelynek a teljes ideje a leghosszabb; az tvonal kritikus, mert
meghatrozza a teljes terv hosszt. Ms utak rvidtse nem rvidti a terv egszt, de a kritikus tvonalon lv
brmely cselekvs kezdetnek elhalasztsa a teljes tervet lasstja. Az brn a kritikus tvonal vonalt vastag
vonallal jelljk. Hogy a teljes tervet minimlis id alatt hajtsuk vgre, a kritikus tvonal cselekvseit gy kell
vgrehajtani, hogy kztk ne legyen ksleltets. A kritikus tvonalon kvl es cselekvseknek van valamennyi
mozgsterk egy idablak, amelyben vgrehajthatk. Ezt az idablakot a kezdeti idpont lehet legkorbbi
(ES) s a lehet legksbbi (LS) rtkvel definiljuk. Az LS ES mrszmot, a cselekvs mozgsternek
(slack) nevezzk. A 12.2. brn lthatjuk, hogy a teljes terv 85 percet vesz ignybe, a kritikus tvonal minden
cselekvsnek a mozgstere 0 (ez mindig igaz), s a C1 sszeszerelsnek minden cselekvse egy 15 perces
ablakban indthat. A cselekvsek ES s LS idi a problma temtervt (schedule) adjk.
12.2. bra - A 12.1. brn szerepl temezsi problma megoldsa. Az bra tetejn a
rszben rendezett terv megoldsa lthat. Minden cselekvs hozza a tglalap aljn
lthat, a legkorbbi s a legksbbi kezdsi idkkel [ES, LS] a bal fels sarokban. A
kt szm kztt klnbsg a cselekvs mozgstere, a 0 mozgster cselekvsek a
kritikus tvonalon vannak, melyeket vastag vonallal jellnk. Az bra aljn ugyanezen
megolds idrendjt lthatjuk. A szrke tglalapok azt az intervallumot jellik, ami
alatt a cselekvs vgrehajthat, felttelezve, hogy a sorrendezsi megktseket
betartjuk. A szrke tglalapok nem felhasznlt, nem kitlttt terletei a mozgsteret
jellik.
370

vilgban
A kvetkez kifejezsek az ES s LS definciiknt szolglnak, s egyttal a kiszmtsukra szolgl dinamikus

programozsi algoritmust is krvonalazzk:
ES(Indt) = 0
ES(B) = maxA
ES(A) + Idtartam(A)
LS(Befejez) = ES(Befejez)
LS(A) = minA
LS(B) Idtartam(A)
Az tlet az, hogy az ES(Indt) rtknek 0-ra lltsval indtunk. Ezutn, amint elrnk egy olyan B cselekvst,
hogy minden cselekvs, ami kzvetlenl B eltt jn, mr rendelkezik ES rtkekkel, az ES(B) rtket a
kzvetlenl megelz cselekvsek kzl a legkorbbi befejezsi id maximumra lltjuk be, ahol a legkorbbi
befejezsi idt gy definiljuk, mint a cselekvs kezdsi idpontja plusz a cselekvs idtartama. A folyamat
addig folytatdik, amg minden cselekvshez egy ES rtket rendelnk. Az LS rtkeket hasonlkppen
szmtjuk ki a Befejez cselekvstl visszafel haladva. A rszleteket egy ksbbi feladat tartalmazza.
A kritikus tvonal algoritmus komplexitsa csak O(Nb), ahol N a cselekvsek szma s b az egy cselekvsbe be, illetve kimen maximlis elgazsok szma. (Ennek megrtshez vegyk szre, hogy az LS s ES
szmtsokat minden cselekvsre csak egyszer hajtjuk vgre, s minden szmts legfeljebb b msik cselekvsen
megy vgig.) Ezrt, ha adott a cselekvsek egy rszben rendezse, a minimlis idtartam temezs megtallsa
elg knnyedn elvgezhet.
1.1. temezs erforrskorltokkal

A vals temezsi problmkat az erforrsokra (resources) vonatkoz korltozsok jelenlte megbonyoltja.
Pldul egy motornak az autba szerelshez egy motoremelre van szksg. Ha csak egyetlen emelnk van,
akkor nem tudjuk egyszerre beszerelni az E1 motort, a C1 s az E2 motort a C2 autba, gy a 12.2. brn
bemutatott temezs vgrehajthatatlan. A motoremel plda egy jrahasznosthat erforrsra (reusable
371

vilgban
resource). Az erforrs foglalt, amg a cselekvs tart, de jra hasznlhatv vlik annak befejezse utn.
Vegyk szre, hogy az jrahasznosthat erforrsokat nem tudjuk a hagyomnyos elfelttel s kvetkezmny
alak cselekvslersokkal kezelni, mert a rendelkezsre ll erforrs-mennyisg nem vltozik, miutn egy
cselekvst lezrtunk.1 Ezrt kiterjesztjk a lersunkat, hogy egy ERFORRS: R(k)-t is tartalmazzon, amelynek
jelentse, hogy k egysg R tpus erforrsra van szksg a cselekvshez. Az erforrs-szksglet mind
elfelttel (a cselekvs nem hajthat vgre, ha az erforrs nem rhet el), mind pedig tmeneti kvetkezmny,
abban az rtelemben, hogy az R erforrs rendelkezsre llsa k-val cskken a cselekvs idtartama alatt. A
12.3. bra mutatja, hogyan lehet a motorbeszerels problmjt kiterjeszteni, hogy az hrom erforrst is
tartalmazzon: egy motoremelt a motorok beszerelshez, egy kerkllomst a kerekek felszerelshez s kt
vizsglbiztost. A 12.4. bra a legrvidebb szerelsi idej megoldst mutatja, ez 115 percet ignyel. Ez
hosszabb, mint az erforrs-megktsek nlkli 85 perces temezs. Vegyk szre, hogy nincs olyan
idpillanat, amikor mindkt vizsglbiztosra szksg van, ezrt az egyik vizsglbiztost azonnal egy
termelkenyebb posztra helyezhetjk.
Az erforrsok numerikus mennyisgekknt trtn lersa mint a Vizsglbiztosok(2), a megnevezett entitsok
hasznlata helyett, mint a Vizsglbiztos(I1) s a Vizsglbiztos(I2), j plda a nagyon ltalnosan hasznlt
aggregcis (aggregation) technikra. Az aggregci kzponti tlete, hogy egyedi objektumokat
csoportostsunk mennyisgekk, amikor maguk az objektumok nem megklnbztethetk a cl szempontjbl.
Az sszeszerelsi problmnkban nem szmt, hogy melyik vizsglbiztos vizsglja az autt, ezrt nincs szksg
klnbsgttelre. (Ugyanez az tlet mkdik a 3.9. feladat misszionriusok s kanniblok problmjra.) Az
aggregci a komplexits cskkentshez elengedhetetlen. Vizsgljuk meg, mi trtnik, ha egy temezs 10
konkurrens Vizsglat cselekvst tartalmaz, de csak 9 vizsglbiztos ll rendelkezsre. Ha a vizsglbiztosokat
mint mennyisgeket reprezentljuk, a bukst az algoritmus azonnal detektlja, s visszalp, hogy egy msik
temezssel prblkozzon. Ha a vizsglbiztosokat nll szemlyekknt reprezentljuk, akkor az algoritmus
feleslegesen mind a 10! vizsglbiztos-kioszts kiprblshoz visszalp.
12.3. bra - Kt aut sszeszerelsnek temezsi feladata erforrsokkal. Egy

sszeszerel lloms, egy kerkszerel-lloms s kt vizsglbiztos az sszes elrhet
erforrs. Az ERFORRS:r jells jelentse, hogy az r erforrst egy cselekvs
vgrehajtsa alatt hasznljuk, de a cselekvs befejezse utn jra szabad.
12.4. bra - A 12.3. bra erforrsokat is tartalmaz temezsi feladatnak megoldsa.

Az bra bal szle az erforrsokat sorolja fel, a cselekvsek az ltaluk hasznlt
erforrsokkal egy sorban jelennek meg. Attl fggen, hogy melyik sszeszerels
Ezzel szemben a fogyeszkz-erforrsok (consumable resources), mint az aut-sszeszerelshez hasznlt csavarok, az eredeti
keretrendszeren bell kezelhetk; lsd 12.2. feladat.
1
372

vilgban
hasznlja a motorszerel-llomst elszr, kt lehetsges temezs ltezik. Mi az

optimlis megoldst brzoltuk, ami 115 percet vesz ignybe.
Az elnyk ellenre, az erforrs-megktsek nagyon megbonyoltjk az temezsi feladatokat azltal, hogy a

cselekvsek kz tovbbi klcsnhatsokat vezetnek be. Habr a megktsek nlkli temezs a kritikus
tvonal mdszer felhasznlsval knny, a legkorbbi befejezsi idej erforrs-megktseket tartalmaz
temezs megtallsa NP-nehz. Ez a komplexits gyakran mind a gyakorlatban, mind az elmletben lthat.
Az 1963-ban kzztett nagy kihvst jelent feladat egy optimlis temezs megtallsa egy 10 gpet, 10
munkt s 100 cselekvst tartalmaz problmhoz 23 vig megoldatlan maradt (Lawler s trsai, 1993). Sok
megkzeltst kiprbltak, kztk az elgazsos megktst, a szimullt lehtst, a tabu keresst, a
knyszerkielgtst s szmos ms, a II. rszben szerepl technikt. A legegyszerbb, de npszer heurisztika a
minimlis tartalk (minimum slack) algoritmus. Ez a cselekvseket moh jelleggel temezi. Minden
iterciban megnzi azokat a cselekvseket, amelyeknek az sszes elzmnyt mr temeztk, s azt temezi,
amelyiknek a legkevesebb tartalk ideje van a legkorbbi lehetsges kezdshez. Ezutn frissti az ES s LS
idrtkeket minden egyes rintett cselekvsre, s ezt ismtli.
A heurisztika ugyanazon az tleten alapul, mint a legjobban korltozott vltoz heurisztika a
knyszerkielgtsnl. Ez a gyakorlatban gyakran jl mkdik, de a mi sszeszerelsi problmnkra egy 130
perces megoldst ad, nem pedig a 12.4. brn bemutatott 115 perceset.
Az ebben a fejezetben bemutatott megkzelts a tervezznk elszr, temezznk ksbb megkzelts: azaz
a teljes problmt egy tervksztsi fzisra s egy temezsi fzisra bontjuk. A tervezsi fzisban a cselekvseket
rszben rendezzk, hogy elrjk a problma cljait, az temezsi fzisban pedig az idinformcikat illesztjk a
tervhez, ezzel biztostva, hogy a terv kielgtse az erforrs- s a hatridkorltokat. Ez a megkzelts nagyon
gyakori a vals idej gyrtsi s logisztikai problmkban, ahol a tervksztsi fzist leggyakrabban emberi
szakrtk vgzik. Ellenben, amikor sok erforrs-megkts van, addhat, hogy nhny rvnyes terv sokkal
jobb temezshez vezet, mint msok. Ebben az esetben, a tervksztsi s temezsi fzist clszer integrlni
gy, hogy a rszben rendezett tervkszts sorn figyelembe vesszk a cselekvsek idtartamait s tfedseit. A
11. fejezetben bemutatott szmos tervkszt algoritmus kiterjeszthet gy, hogy ezt az informcit is kezelje.
Pldul a rszben rendezett tervksztk az okozati kapcsolatok konfliktusainak detektlshoz hasonlan az
erforrskorlt megsrtseit is detektlni tudjk. A heurisztikk mdosthatk, hogy a cselekvsek teljes
kltsgn tl, a tervek teljes vgrehajtsi idejt is becsljk. Ez napjainkban a kutats egy aktv terlete.
2. Hierarchikus feladathl tervkszts

Az egyik legelterjedtebb mdszer a komplexits kezelsre a hierarchikus dekompozci (hierarchical
decomposition). Az sszetett szoftvereket szubrutinok vagy objektum osztlyok hierarchijbl ptik fel, a
hadseregek klnbz egysgek hierarchii, a kormnyok s cgek igazgatsgokbl, osztlyokbl s
alosztlyokbl llnak. A hierarchikus struktra f elnye, hogy a hierarchia minden szintjn egy szmtsi
feladat, egy hadmvelet vagy egy adminisztratv feladat az eggyel alatta lv szint nhny cselekvsre pl,
gy e cselekvsek megfelel elrendezse a magasabb szinten lv feladat megoldshoz kis szmtsi kltsggel
jr. Msrszrl a nem hierarchikus mdszerek a feladatot nagyszm, fggetlen cselekvsre bontjk fel, ami
nagy lptk feladatok esetn egyltaln nem praktikus. A legjobb esetben amikor a magas szint
megoldsokhoz mindig kielgt alacsony szint megvalsts tartozik a hierarchikus megoldsok az
exponencilis idej tervkszt algoritmusokkal szemben lineris idre vezetnek.
Ez az alfejezet a hierarchikus feladathlkon vagy HFH-kon (hierarchical task networks HTN) alapul
tervksztsi mdszert mutatja be. A megkzeltsnk tvzi a rszben rendezett tervkszts (11.3. alfejezet)
alaptleteit, illetve a HFH-tervkszts terlett. A HFH-tervksztsben a kiindul problmt, amely a
feladatot rja le, a vgrehajtand feladat egy nagyon magas szint lersnak tekintjk, pldul: ptsnk egy
hzat. A terveket cselekvsdekompozcikkal (action decompositions) finomtjuk. Minden
373

vilgban
cselekvsdekompozci a magas szint cselekvst alacsonyabb szint cselekvsek rszben rendezett halmazra
bontja. A cselekvsdekompozci ezrt a cselekvsek megvalstsra vonatkoz ismereteket testesti meg.
Pldul egy hz felptse az engedlyek megszerzsre, a kivitelez megbzsra, az ptkezs elvgzsre s a
kivitelez kifizetsre reduklhat. (A 12.5. bra egy ilyen dekompozcira mutat pldt.) A folyamat addig
folytatdik, amg csak az egyszer cselekvsek (primitive actions) maradnak a tervben. Az egyszer
cselekvsek tipikusan azok a cselekvsek, amelyeket az gens automatikusan vgre tud hajtani. Egy ltalnos
kivitelezre a kertpts egy egyszer cselekvs lehet, mert egyszeren csak egy kertpt bevonst jelenti.
Egy kertpt szmra azonban az olyan cselekvsek tekinthetk egyszernek, mint az ltessen rododendront
ide.
A tiszta HFH-tervksztsben a terveket csak egymst kvet cselekvsdekompozcikkal lltjuk el. A HFH
ezrt a tervksztst a cselekvslersok konkretizlsnak tekinti, szemben az res cselekvsbl kiindul
cselekvslers elksztsnek folyamatval (ami az llapottr-keressre s a rszben rendezett tervksztsre is
igaz). Vgezetl kiderl, hogy minden STRIPS cselekvslers egy cselekvsdekompozcira rhat t (lsd
12.6. feladat), s a rszben rendezett tervkszts a tiszta HFH-tervkszts egy specilis esetnek tekinthet.
Bizonyos feladatokra azonban klnsen szokatlan konjunktv clokra a tiszta HFH-nzpont elgg
termszetellenes, gy egy hibrid megkzeltst rszestnk elnyben, ahol a cselekvsdekompozcikat mint a
rszben rendezett tervkszts tervfinomtsait hasznljuk fel, a nyitott elfelttelek teljestse s az tkzs
feloldsra szolgl rendezsi megktsek hozzadsa mellett. (Annak, hogy a HFH-tervksztst a rszben
rendezett tervkszts kiterjesztsnek tekintjk, tovbbi elnye, hogy egy teljesen j jellsrendszer bevezetse
helyett ugyanaz hasznlhat.) Kezdsknt a cselekvsek dekomponlst mutatjuk be rszletesebben, majd
elmagyarzzuk, hogy a rszben rendezett tervksztst hogyan kell mdostani a dekompozcik kezelshez.
Vgezetl a teljessg, a komplexits s a hasznlhatsg krdseit trgyaljuk.
2.1. A cselekvsdekompozcik reprezentcija

A cselekvsdekompozcis mdszerek ltalnos lersait egy tervknyvtrban (plan libary) troljuk, ahonnan
kinyerhetk s a kszl terv ignyeinek megfelelen felhasznlhatk. Minden mdszer egy Dekomponl(a, d)
formj kifejezs, amelynek jelentse, hogy egy a cselekvs dekomponlhat a d tervbe, mely egy a 11.3.
alfejezetben lertaknak megfelel rszben rendezett tervknt van megadva.
A hzpts egy szp, konkrt plda, ezrt ezt hasznljuk fel a cselekvsdekompozci bemutatsra. A 12.5.
bra a Hzatpt cselekvs egy lehetsges dekompozcijt mutatja ngy alacsonyabb szint cselekvsre. A
12.6. bra nhny cselekvs lerst tartalmazza erre a feladatkrre, valamint a hzpts dekompozcijt,
ahogyan az a tervknyvtrban megjelenne. A knyvtrban ms lehetsges dekompozcik is szerepelhetnek.
A dekompozci Indt cselekvse szolgltatja a terv cselekvseinek sszes olyan elfelttelt, melyet ms
cselekvs nem llt el. Ezeket kls elfeltteleknek (external preconditions) nevezzk. Pldnkban a
dekompozci kls elfelttelei a Telek s a Pnz. Hasonlkpp a Befejez elfelttelei a kls
kvetkezmnyek (external effects). Ezek a terv cselekvseinek sszes olyan kvetkezmnyt jelentik,
melyeket ms cselekvsek nem neglnak. Pldnkban a Hzatpt kls kvetkezmnyei a Hz s a Pnz.
Nhny HFH-tervkszt szintn klnbsget tesz az elsdleges kvetkezmnyek (primary effects), mint a
Hz, s a msodlagos kvetkezmnyek (secondary effects), mint a Pnz kztt. Mivel mindkt tpus
kvetkezmny felhasznlsa tkzsekhez vezethet ms cselekvsekkel, csak az elsdleges kvetkezmnyeket
hasznlhatjuk a clok elrsre, ami nagymrtkben cskkenti a keressi teret.2
12.5. bra - A Hzatpt cselekvs egy lehetsges dekompozcija
Ez nhny nem vrt terv ellltst is megakadlyozhatja. Pldul egy csdeljrs eltt ll szemly minden ing vagyont eltntetheti (a
Pnz elrsvel) egy hz megvsrlsval vagy megptsvel. Ez a terv hasznos, mert az aktulis trvny kizrja az elsdleges lakhely
hitelezk ltali lefoglalst (legalbbis az USA-ban a szerk.).
2
374

vilgban
A dekompozcinak a cselekvs egy korrekt megvalstsnak kell lennie. A d terv egy a cselekvst korrekten
valst meg, ha d egy teljes s konzisztens rszben rendezett terv arra a problmra, ahol a elfeltteleibl a
kvetkezmnyeit kell elrnnk. Ha a dekompozci egy helyesen mkd rszben rendezett tervkszt
futsnak eredmnye, akkor nyilvnvalan korrekt.
Brmely magas szint cselekvshez a tervknyvtr szmos dekompozcit tartalmazhat, pldul a Hzatptnek lehet egy msik dekompozcija, amely a folyamatot gy rja le, hogy a hzat az gens sajt kezleg pti
kvekbl s malterbl. Minden dekompozcinak egy korrekt tervnek kell lennie, de a magas szint
cselekvslersban szereplkn tl tovbbi elfeltteleket s kvetkezmnyeket is tartalmazhat. Pldul a
Hzatpt 12.5. brn lthat dekompozcija a Telek mellett a Pnz-t is megkveteli, s kvetkezmnye a
Pnz. Msrszrl a sajt kez pts nem ignyel pnzt, de szksges hozz egy felhasznlsra vr K s
Malter kszlet, valamint eredmnye lehet egy FjsHt.
Mivel egy magas szint cselekvsnek, mint amilyen a Hzatpt, szmos lehetsges dekompozcija lehet,
elkerlhetetlen, hogy a STRIPS cselekvslersa elrejtse ezen dekompozcik nhny elfelttelt vagy
kvetkezmnyt. A magas szint cselekvs elfeltteleit a dekompozciiban szerepl kls elfelttelek
metszete, mg a kvetkezmnyit a dekompozcik kls kvetkezmnyeinek metszete adja. Mskppen, a magas
szint elfelttelek s kvetkezmnyek garantltan rszhalmazai minden egyszer implementci vals
elfeltteleinek s kvetkezmnyeinek.
12.6. bra - A hzptsi problma cselekvseinek lersa s a Hzatpt cselekvs

rszletes dekompozcija. A lersok a pnzzel kapcsolatban egy egyszerstett, az
ptkkel kapcsolatban egy optimista nzetet alkalmaznak.
375

vilgban
Az informci elrejtsnek kt msik formjt is meg kell emltennk. Elszr, a magas szint lers teljes
mrtkben figyelmen kvl hagyja a dekompozcik sszes bels kvetkezmnyt (internal effects). Pldul a
Hzatpt ltalunk javasolt dekompozcijnak ideiglenes bels kvetkezmnye az Engedly s a Szerzds.3
Msodszor, a magas szint lers nem specifiklja a cselekvsen belli idintervallumot, ami alatt a magas
szint elfeltteleknek s kvetkezmnyeknek teljeslnik kell. Pldul a Telek elfelttelnek csak addig kell
teljeslnie (a kzelt modellnkben), amg az EngedlytSzerez nem hajtdik vgre, s a Hz csak a
KiviteleztKifizet vgrehajtsa utn igaz.
Az informci elrejtsnek ez a mdja szksgszer, ha a hierachikus tervezs clja a komplexits cskkentse.
Szksges, hogy a magas szint cselekvsekrl anlkl dnthessnk, hogy a szmtalan implementcis rszlet
miatt aggdnnk. Ennek azonban ra van. Konfliktusok lphetnek fel, pldul egy magas szint cselekvs bels
felttelei, valamint egy msik magas szint cselekvs bels cselekvsei kztt, mikzben a magas szint
lersok alapjn nincs md ezek detektlsra. Ennek a problmnak komoly hatsai vannak a HFH-tervkszt
algoritmusokra. Dihjban, mg a tervkszt algoritmus az atomi cselekvseket, mint pontszer esemnyeket
kezelheti, a magas szint cselekvseknek idbeli kiterjedse van, ami alatt minden mehet tovbb.
2.2. A tervkszt mdostsa a dekompozcik kezelshez

Most megmutatjuk, hogyan mdosthat a rszben rendezett tervkszt, hogy egy HFH-tervksztt is
tartalmazzon. Ehhez a rszben rendezett tervkszt llapottmenet-fggvnyt (lsd 3.1. szakasz - Plda a
rszben rendezett tervksztsre rszben) mdostsuk gy, hogy lehetv tegye a T aktulis rszleges terven a
dekompozcis mdszerek alkalmazst. Az j kvetkez terveket gy alaktjuk ki, hogy elszr kivlasztunk
nhny nem-atomi a cselekvst a T-bl, majd a tervknyvtr minden Dekomponl(a, d) metdusra, amelyben
a behelyettestssel az a s a egyenlv vlik, az a-t behelyettestjk a d = SUBST (, d)-vel.
A 12.7. brn egy plda lthat. Az bra tetejn egy hz megszerzsre vezet T terv tallhat. Az a =
Hzatpt magas szint cselekvst vlasztottuk a dekompozcira. A 12.5. brrl a d dekompozcit
vlasztottuk, s a Hzatpt cselekvst ezzel helyettestettk. A dekompozcis lps ltal ltrehozott Pnz
nyitott felttel teljestsre a KlcsntVeszFel jrulkos lpst vezettk be. Egy cselekvs helyettestse annak
dekompozcijval egy kicsit hasonlt a szervtltetses mttekhez. Az j rsztervet ki kell bontanunk a
csomagolsbl (az Indt s Befejez lpsek kzl), be kell illesztennk s mindent megfelelen le kell zrnunk.
Ezt tbbflekppen is megtehetjk. Hogy pontosabbak legynk, minden lehetsges d dekompozcihoz az
albbiakat kell megtennnk:
1. Elszr is az a cselekvst el kell tvoltani a T tervbl. Ezutn a d minden s lpsre ki kell vlasztanunk
egy cselekvst, amely kitlti az s szerept, s hozz kell adnunk a tervhez. Ez lehet az s egy j pldnyostsa
vagy egy meglv s lps a T-bl, ami s-sel azonos. A Borkszts cselekvsdekompozcija pldul
megkvetelheti a TelketVesz cselekvst, de vrhatan hasznlhatjuk ugyanazt a TelketVesz cselekvst, mely
mr szerepel a tervben. Ezt rszfeladat-megosztsnak (subtask sharing) nevezzk.
A 12.7. brn nincsenek megosztsi lehetsgek, ezrt j cselekvspldnyokat hoztunk ltre. Ha egy cselekvst
kivlasztottunk, d minden bels elfelttelt tmsoljuk. Pldul az EngedlytSzerez cselekvs, az ptkezs el
rendelt, s ltezik egy okozati kapcsolat ezen lpsek kztt, mely szerint az Engedly elfelttele az ptkezsnek. Ez lezrja az a helyettestst a d pldnyostsval.
12.7. bra - Egy magas szint cselekvs dekompozcija egy ltez tervben. A Hzatpt
cselekvst a 12.5. bra dekompozcijval helyettestjk. A Telek kls elfelttelt a mr
ltez TelketVesz-bl kiindul okozati kapcsolat biztostja. A Pnz kls elfelttel
nyitott marad a dekompozcis lps utn, ezrt a KlcsntVeszFel cselekvst szrjuk
be.
Az ptkezs neglja az Engedly-t, egybknt ugyanazon engedly tbb hz megptshez is hasznlhat lenne. Sajnos az ptkezs nem
zrja le a Szerzds-t, mert elbb a KiviteleztKifizet-et kell vgrehajtanunk.
3
376

vilgban
2. A kvetkez lps, hogy az eredeti tervben szerepl a sorrendezsi megktseit megfelelen tvezessk a d
lpseihez. Elszr vegyk T B a alak sorrendezsi megktseit. Hogyan kellene B-t rendezni a d
lpseinek megfelelen? A legkzenfekvbb megolds, hogy B az sszes d-ben szerepl lps eltt jjjn,
amit gy rhetnk el, hogy d minden Indt s alak megktst a B s megktssel helyettestjk.
Msrszrl ez a megkzelts tlzottan szigor lehet! Pldul a TelketVesz a Hzatpt eltt kell
kvetkezzen, de nincsen szksg arra, hogy a TelketVesz a KiviteleztVeszFel eltt jjjn a kiterjesztett
tervben. Egy tlzottan szigor rendezs fellltsa lehetetlenn teheti nhny megolds megtallst. Ezrt
minden rendezsi megktsre a legjobb megolds, hogy rgztsk a megkts okt. Ha ezutn egy magas
szint cselekvst kibontunk, az j rendezsi megktsek a lehet leglazbbra vehetk az eredeti megkts
okval sszhangban. Ugyanezek a megfontolsok alkalmazhatk, amikor az a C alak megktseket
helyettestjk.
3. Az utols lps, hogy az okozati kapcsolatokat tvezessk. Ha a
az eredeti terv egy okozati
kapcsolata volt, helyettestsk azt egy okozati kapcsolathalmazzal, amely B-bl d sszes olyan lpshez
vezet, amelynek elfelttele a d dekompozci Indt lpse ltal ellltott p (pldul d sszes lpse,
melyekre p egy kls elfelttel). A pldban a
okozati kapcsolatot a
kapcsolattal helyettestjk. (A dekompozciban szerepl KiviteleztKifizet, Pnz

elfelttele nyitott felttell vlik, mert az eredeti tervben nincs olyan cselekvs, ami a Pnz-t biztostja a
Hzatpt-hez.) Hasonlkppen a terv sszes
okozati kapcsolatt helyettestsk d brmely, a d
dekompozci Vge lpshez p-t szolgltat lpsbl C-be mutat okozati kapcsolathalmazzal (pldul d pt kls kvetkezmnyknt tartalmaz lpsbl). Pldnkban a
kapcsolatot a
kapcsolattal helyettestjk.
Ez lezrja a rszben rendezett tervksztknl alkalmazott, a dekompozcik elksztshez szksges
kiterjesztseket.4
A rszben rendezett tervkszt algoritmushoz tovbbi mdostsok szksgesek, mert a magas szint
cselekvsek elrejtik az informcit a vgs elemi megvalstsukrl. Nevezetesen az eredeti rszben rendezett
tervkszt algoritmus hibval lp vissza, ha az aktulis terv feloldhatatlan tkzst tartalmaz, vagyis ha egy
cselekvs tkzik egy okozati kapcsolattal, de nem helyezhet sem el, sem pedig mg. (Erre a 11.9. bra
mutat pldt.) Msrszrl, a magas szint cselekvsek esetn a feloldhatatlan tkzsek nha feloldhatk az
tkz cselekvsek dekompozcijval s lpseik sszerendezsvel. Erre a 12.8. bra mutat be egy pldt. gy
elfordulhat olyan eset, ahol dekompozcival egy teljes s konzisztens alapterv nyerhet, mg akkor is, hogyha
nem ltezik teljes s konzisztensen magas szint terv. Ez a lehetsg azt jelenti, hogy egy teljes HFHtervksztnek vgig kell tekintenie az eredeti rszben rendezett tervkszthz tallhat szmos metszsi
lehetsget. Egybknt hasznlhatjuk brmely metszsi eljrst, remlve, hogy nem hagyunk figyelmen kvl
lehetsges megoldst.
Vannak tovbbi apr mdostsok a magas szint cselekvsek konfliktusfeloldsnak kezelsre. Az rdekld olvas ezeknek a fejezet
vgn hivatkozott irodalmakban nzhet utna.
4
377

vilgban
12.8. bra - Az O. Henrik trtnetbl kiragadott Mgusok ajndka problma egy

inkonzisztens absztrakt tervet mutat, ami azonban dekomponlhat egy konzisztens
megoldsra. Az (a) bra a problmt mutatja be: egy szegny hzasprnak csak kt
rtkes tulajdona van. A frfinek egy aranyrja, a nnek pedig a gynyr hossz
haja. Mindketten azt tervezik, hogy ajndkot vsrolnak a msiknak, hogy az boldog
legyen. A frfi gy dnt, hogy az rjt egy ezstfsre cserli be, mg a n eladja a
hajt, hogy aranylncot vegyen az rhoz. (Felttelezzk, hogy a Fst ad cselekvs
elfelttele a Haj, mivel ha a felesgnek nincs hossz haja, a cselekvs nem ri el a
kvnt hatst, hogy boldogg tegye; s hasonlkppen a Lncot ad cselekvsre.) A (b)
brn szerepl rszleges terv inkonzisztens, mert a Fst ad s Lncot ad absztrakt
lpsek nem sorrendezhetk konfliktus nlkl. (c) Dekomponljuk a Fst ad lpst
egy beilleszt terv metdussal. A dekompozci els lpsben a frj megszerzi a fst,
s odaadja felesgnek, mikzben az rt egy ksbbi idpontban adja oda fizetsgl. A
msodik lpsben az rt tadja, s a ktelezettsget teljesti. Egy hasonl mdszer
dekomponlja a Lncot ad lpst. Amg mindkt odaad lpst a szlltsi lps el
sorrendezzk, ez a dekompozci megoldja a feladatot. (Vegyk szre, hogy ez azon
mlik, hogy a lnc hasznlata az rhoz vagy a fs hasznlata a hajhoz boldogsgot
okoz mg akkor is, ha a tulajdonjogot mr elvesztettk.)
2.3. Elemzs
Kezdjk a rossz hrrel: a tiszta HFH-tervkszts (ahol az egyetlen megengedett tervfinomts a dekompozci),
a vges llapottr ellenre is, eldnthetetlen! Ez nagyon elszomortnak tnhet, mivel a HFH-tervkszts
lnyege, hogy nveljk a hatkonysgot. Ez a nehzsg azrt lp fel, mert a cselekvsdekompozcik
rekurzvak (recursive) (pldul a stls implementlhat egy lps megttelvel s utna egy stlssal), gy a
HFH-tervek tetszlegesen hosszra nylhatnak. Nevezetesen a legrvidebb HFH-megolds is tetszlegesen
hossz lehet, gy nincs arra lehetsg, hogy a keresst egy megadott id utn lelltsuk. Ennek ellenre azonban
legalbb hrom okunk van a bizakodsra:
1. Kizrhatjuk a rekurzit, amit csak nagyon kevs tervksztsi feladat ignyel meg. Ebben az esetben az
sszes HFH-terv vges vagy megszmllhat hosszsg.
378

vilgban
2. Korltozhatjuk azon megoldsok hosszt, amelyekre kvncsiak vagyunk. Mivel az llapottr vges, az olyan
terv, amelynek tbb lpse van, mint az llapottr llapotainak szma, mindenkppen tartalmaz ciklust, ami
ugyanabba az llapotba tbbszr lp be. Az ilyen HFH-megoldsok kizrsval nagyon picit vesztnk, de
uraljuk a keresst.
3. Ltrehozhatunk egy hibrid megkzeltst, ami a rszben rendezett s a HFH-tervksztket kombinlja. A
rszben rendezett tervkszts nmagban elegend, hogy eldntsk, ltezik-e terv, gy a hibrid feladat is
nyilvnvalan eldnthet.
A harmadik megoldssal egy kicsit vatosan kell bnnunk. A rszben rendezett tervkszt klnbz mdokon
tud elemi cselekvseket sszehuzalozni, gy olyan megoldsokkal tallhatjuk magunkat szembe, amelyek
nagyon nehezen rhetk, s amelyeknek nincs meg a HFH-tervek szp hierarchikus rendezse. Egy megfelel
kompromisszum, hogy a hibrid keresst gy szablyozzuk, hogy a cselekvsdekompozcikat elnyben
rszestjk az j cselekvsek hozzadsa eltt, de nem olyan mrtkben, hogy tetszlegesen hossz HFH-tervek
jjjenek ltre, mieltt egy elemi cselekvst hozzadnnk. A megvalsts egyik lehetsges mdja egy
kltsgfggvny alkalmazsa, amely engedmnyt ad a dekompozci ltal bevezetett cselekvsekre. Minl
nagyobb az engedmny, a keress annl inkbb a tiszta HFH-tervksztsre hasonlt, s a megolds annl inkbb
hierarchikus. A hierarchikus tervek rendszerint sokkal knnyebben vgrehajthatk a vals helyzetekben, s
knnyebben javthatk, ha valami elromlik.
A HFH-tervek egy msik fontos tulajdonsga a rszfeladat-megoszts lehetsge. Emlkezznk vissza, hogy a
rszfeladat-megoszts azt jelenti, hogy ugyanazt a cselekvst hasznljuk fel a tervdekompozciban szerepl kt
klnbz lpshez. Ha megtiltjuk az alfeladat megosztst, akkor a d dekompozci minden pldnyostsa
csak egyetlen mdon hajthat vgre, nem pedig sokflekpp, gy jelentsen szktjk a keressi teret.
Rendszerint ez a szkts idt sprol, s a legrosszabb esetben is az optimlisnl csak kicsivel hosszadalmasabb
megoldsra vezet. Nhny esetben azonban tbb problmt is okozhat. Vegyk pldul az lvezzk a
mzesheteket, s neveljnk fel egy csaldot clt. A tervknyvtr a hzasodj s menj Hawaiira tervvel llhat
el az els rszclra s a hzasodj s legyenek gyermekeid tervvel a msodikra. A rszfeladat megoszts
nlkl a terv kt klnll hzasods cselekvst tartalmaz, ami nagymrtkben kerlend.
Egy rdekes plda a rszfeladat-megoszts kltsgeire s elnyeire a fordtk optimalizlsnl fordul el.
Vegyk a tan(x) sin(x) kifejezs fordtsnak problmjt. A legtbb fordt ezt kt kln szubrutin trivilis
sszeolvasztsval ri el: a tan lpsek a sin lpsek eltt kvetkeznek. Vegyk azonban a sin s tan albbi
Taylor soros kzeltseit:
Egy rszfeladat-megosztst tartalmaz HFH-tervkszt sokkal hatkonyabb megoldsokat kszthet, mert a sin
kiszmtsnak szmos lpsre vlaszthatja a tan meglv lpseit. A legtbb fordt nem alkalmazza ezt a
fajta procedrk kztti megosztst, mert az sszes lehetsges megosztott terv figyelembevtele tl sok idt
venne ignybe. Ehelyett a legtbb fordt minden rsztervet fggetlenl kszt el, majd esetleg mdostja az
eredmnyt egy optimalizl hasznlatval.
A cselekvsdekompozci ltal bevezetett jrulkos bonyoltsok tudatban mirt hisszk mgis, hogy a HFHtervkszts hatkony lehet? A komplexits vals forrsai a gyakorlatban nehezen analizlhatk, ezrt vegynk
egy idealizlt esetet. Tegyk fel pldul, hogy egy n cselekvsbl ll tervet akarunk ltrehozni. Egy
nemhierarchikus elrefel halad llapottr-tervez kltsge, minden llapotban b megengedett cselekvssel,
O(bn). A HFH-tervkszt esetn felttelezznk egy nagyon ltalnos dekompozcis formt: minden nem elemi
cselekvsnek, d lehetsges dekompozcija van, mindegyik a kvetkez alacsonyabb szinten k cselekvsbl ll.
Tudni szeretnnk, hogy ebben a struktrban hny klnbz dekompozcis fa ltezik. Ha a kiindulsi szinten
n cselekvs van, akkor a gykr alatti szintek szma logkn, gy a bels dekompozcis csompontok szma 1 + k
+ k2 + klog k n1 = (n 1)/(k 1). Minden bels csompontnak d lehetsges dekompozcija van, gy sszesen
d(n1)/(k1) lehetsges dekompozcis fa alkothat. Ezt a kpletet megvizsglva lthatjuk, hogy d alacsonyan tartsa
nagy k mellett risi megtakartsokat eredmnyezhet. Ha b s d sszemrhet, akkor gyakorlatilag a
nemhierarchikus kltsg k-adik gykt vesszk. Msrszrl azonban egy kisszm, de hossz dekompozcit
tartalmaz tervknyvtr megalkotsa, br lehetv teszi brmely problma megoldst, nem mindig lehetsges.
Mskpp mondva, a hossz makrk, amelyek problmk szles krn alkalmazhatk, kiemelten rtkesek.
379

vilgban
Egy msik s taln jobb ok arra, hogy a HFH-tervkszt hatkonysgban higgynk, az, hogy a gyakorlatban
mkdik. A nagymret alkalmazsokhoz hasznlt tervksztk majdnem mindegyike HFH-tervkszt, mert a
HFH-tervkszts lehetsget ad az emberi szakrt szmra, hogy a komplex feladatok vgrehajtshoz
szksges elengedhetetlen tudst tadhassk, hogy a nagy tervek kicsi szmtsi rfordtssal elkszthetk
legyenek. Pldul a HFH-tervksztst az temezssel tvz O-PLAN-t (Bell s Tate, 1985) arra hasznltk,
hogy a Hitachi szmra ksztsen gyrtsi terveket. Egy tipikus gyrtsi sor problma 350 klnbz termket,
35 sszeszerel gpet s tbb mint 2000 klnbz mveletet tartalmaz. A tervkszt egy 30 napos temezst
kszt, naponta hrom 8 rs mszakkal s tbb milli lpssel.
A HFH-tervkszts kulcsa gy egy tervknyvtr megalkotsa, amely a komplex magas szint cselekvsek
megvalstshoz tartalmazza az ismert mdszereket. A knyvtr megalkotsnak egyik mdja, hogy a
problmamegoldsok tapasztalataibl tanuljunk mdszereket. Egy terv elksztsnek gytrelmes tapasztalatai
utn az gens elmentheti a tervet a knyvtrba mint egy a feladat (task) ltal definilt magas szint cselekvs
megvalstsi mdjt. Ily mdon az gens egyre kifinomultabb vlik, ahogy a rgi mdszerekre alapozva j
mdszerek plnek. Ennek a tanulsi folyamatnak egyik fontos szempontja, hogy az elksztett mdszereket
ltalnostani tudja, a tervbl csak a kulcslpseket megtartva, azaz a problma pldnyainak specifikus
rszleteit elhagyva (pldul az pt nevnek s cmnek elhagysa a tervekrl). Az ilyen ltalnostsra
alkalmas mdszereket a 19. fejezetben mutatjuk be. Szmunkra elkpzelhetetlen, hogy hasonl mechanizmusok
nlkl az emberek olyan kompetensek lehetnek, mint amilyenek.
3. Tervkszts s cselekvs nemdeterminisztikus

problmakrkben
Eddig csak klasszikus tervksztsi (classical planning) krnyezeteket vettnk figyelembe, amelyek teljesen
megfigyelhetk, statikusak s determinisztikusak. Mindezeken tl feltteleztk, hogy a cselekvslersok
megfelelk s teljesek. Ilyen krlmnyek kztt egy gens elszr tervez, majd becsukott szemmel
vgrehajtja a tervet. Egy bizonytalan krnyezetben msrszrl az gensnek az rzkeit is fel kell hasznlnia,
hogy kvesse a trtnseket a terv vgrehajtsa alatt, valamint szksg esetn mdostsa vagy helyettestse a
tervet, amennyiben valami vratlan dolog trtnik.
Az gensnek meg kell kzdenie mind a nem teljes, hinyos (incomplete), mind pedig a nem megfelel, hibs
(incorrect) informcikkal. A nem teljessg abbl kvetkezik, hogy a vilg vagy csak rszben megfigyelhet,
vagy nemdeterminisztikus, vagy mindkett. Pldul az irodaszerszekrny ajtaja vagy be van zrva, vagy nincs.
Az egyik kulcsom vagy kinyitja az ajtt, vagy nem, mr amennyiben be van zrva. Radsul ismereteim e
hinyossgainak vagy tudatban vagyok, vagy nem. Ebbl kifolylag a vilgrl alkotott modellem gyenge, de
helyes. Msrszrl a nem helyessg azrt lp fel, mert a vilg nem szksgszeren felel meg a rla alkotott
modellemnek. Pldul n hihetem, hogy a kulcsom kinyitja az irodaszerszekrnyt, de ebben tvedhetek is, ha a
zrakat kicserltk. A helytelen informci kezelsi kpessgnek hinyban az gens olyan buta lehet, mint
egy ganajtr bogr (2.3. szakasz - Mindentuds, tanuls s autonmia rszben), ami mg az utn is
megprblja a ganajgolyt bedugni a fszkbe, hogy a golyt eltvoltottk a fogsbl.
A teljes s korrekt ismeretek megszerzsnek lehetsge attl fgg, hogy mennyi nemdeterminisztikussg van a
vilgban. Korltos nemdeterminisztikussg (bounded indeterminacy) esetn a cselekvseknek
megjsolhatatlan kvetkezmnyei lehetnek, de a lehetsges kvetkezmnyeket felsorolhatjuk a cselekvsler
aximkban. Pldul amikor feldobunk egy pnzt, jogosan felttelezhetjk, hogy a kimenetele vagy fej, vagy
rs lesz. Egy gens kezelheti a korltos nemdeterminisztikussgot gy, hogy a terveket az sszes lehetsges
krlmnyre felkszti. Nem korltos nemdeterminisztikussg (unbounded indeterminacy) esetn azonban
az elfelttelek vagy hatsok halmaza vagy nem ismert, vagy tl nagy ahhoz, hogy kimerten felsoroljuk. Ez az
eset ll fenn a nagyon sszetett vagy dinamikus problmakrkben, mint amilyenek pldul az autvezets, a
gazdasgos tervezs vagy a hadmveletek. Egy gens csak gy kezelheti a nem korltos
nemdeterminisztikussgot, ha felksztjk arra, hogy tdolgozza a terveit s/vagy a tudsbzist. A nem korltos
nemdeterminisztikussg kzeli rokonsgban van a 10. fejezetben trgyalt kvalifikcis problmval
(qualification problem) (az sszes elfelttel felsorolsnak lehetetlensgvel, amire egy valdivilg-beli
cselekvsnek szksge van, hogy a szndkolt hatst elrje).
A nemdeterminisztikussg kezelsre ngy tervkszt mdszer ltezik. Az els kett a korltos
nemdeterminisztikussg, a msodik kett pedig a nem korltos nemdeterminisztikussg esetn hasznlhat:
rzkelmentes tervkszts (sensorless planning): ez a ms nven alkalmazkod tervksztsnek
(conformant planning) nevezett mdszer norml, szekvencilis terveket kszt, melyeket rzkels nlkl
380

vilgban
kell vgrehajtani. Az rzkelsmentes tervkszt algoritmusnak biztostania kell, hogy a terv a clt minden
lehetsges krlmny kztt elrje fggetlenl a vals indul llapottl s a cselekvsek aktulis
kimeneteleitl. Az rzkelsmentes tervkszts a knyszertsen (coercion) alapul, alapgondolata, hogy a
vilg erszakkal egy megadott llapotba vihet mg akkor is, ha az gensnek csak rszleges informcii
vannak az aktulis llapotrl. A knyszerts nem mindig lehetsges, gy az rzkelsmentes tervkszts
gyakran alkalmazhatatlan. Az rzkelmentes feladatmegoldst, amely magban foglalja a hiedelem
llapottrben trtn keresst, a 3. fejezetben mutattuk be.
Feltteles tervkszts (conditional planning): a ms nven eshetsgi tervkszts (contingency
planning) mdszere a korltos nemdeterminizmust kezeli gy, hogy egy feltteles tervet kszt, amely a
klnbz eshetsgekhez klnbz gakat tartalmaz. Csakgy, mint a klasszikus tervksztsben, az gens
elszr tervez, majd vgrehajtja az elksztett tervet. Az gens rzkel cselekvseket pt a tervbe, hogy
ellenrizze a megfelel feltteleket, gy meghatrozhatja, hogy a terv mely rszt hajtsa vgre. A lgi
szlltsi feladatkrben pldul olyan terveink lehetnek, amelyek a kvetkezket mondjk: ellenrizd, hogy
az SFO repltr hasznlhat-e. Ha igen, replj oda; egybknt replj Oaklandba. A feltteles
tervksztssel a 12.4. alfejezet foglalkozik.
Vgrehajts monitorozs s jratervezs (execution monitoring and replanning): ebben a
megkzeltsben az gens brmely ezt megelz tervkszt technikt felhasznlhat (klasszikus,
rzkelmentes vagy feltteles), de hasznl egy vgrehajts monitorozst (execution monitoring), amely
eldnti, hogy a terv hasznlhat-e az aktulis llapotban, vagy jra kell gondolni. jratervezs (replanning)
akkor trtnik, amikor valami hiba lp fel. Ily mdon az gens a nem korltos nemdeterminisztikussgot is
kezelni kpes. Pldul ha az jratervez gens nem ltta elre az SFO lezrsnak lehetsgt, szreveheti ezt
a szitucit, amikor fellp, s a tervkszt ltal j tvonalat tallhat a clhoz. Az jratervez genseket a
12.5. alfejezetben trgyaljuk.
Folytonos tervkszts (continuous planning): minden eddig ltott tervkszt arra kszlt, hogy elrje a
clt, s meglljon. A folytonos tervkszt egy leten keresztli mkdsre van tervezve. Kezelni kpes a
krnyezetben fellp nem vrt krlmnyeket mg akkor is, ha azok az genst egy tervkszts kzepn rik.
A cljraformls (goal formulation) ltal kpes kezelni a clok elhagyst, illetve j clok keletkezst is.
A folytonos tervksztst a 12.6. alfejezetben trgyaljuk.
Vegynk egy pldt, hogy megvilgtsuk a klnbz gensek kztti klnbsgeket. A problma a kvetkez:
a kiindul llapotban adott egy szk, egy asztal s nhny doboz festk. A szne semminek sem ismert, s olyan
llapotot kell elrni, ahol az asztal s a szk szne azonos.
A klasszikus tervkszt gens nem tudja kezelni ezt a problmt, mert a kiindul llapot nem teljesen
specifiklt, azaz nem tudjuk, hogy milyen sznek a btorok.
Az rzkelmentes tervkszt gensnek egy olyan tervet kell tallni, ami rzkels nlkl mkdik a terv
vgrehajtsa sorn. A megolds, hogy brmelyik festkesdobozt nyitjuk ki, a festket mind az asztalra, mind a
szkre alkalmazzuk. gy knyszertjk (coercing) ket, hogy azonos sznek legyenek (mg akkor is, ha az
gens nem tudja, hogy ez milyen szn). A knyszerts akkor helynval, ha az elzetes informcik gyjtse
drga vagy lehetetlen. Pldul az orvosok gyakran egy szles spektrum antibiotikumot hasznlnak ahelyett,
hogy egy feltteles tervet ksztennek, ami egy vrvizsglatot hajt vgre, megvrja az eredmnyeket, s utna
egy specifikus antibiotikumot alkalmaz. Ezt az indokolja, hogy a vrteszt rendszerint nagy kltsggel s
ksedelemmel jr.
A feltteles tervkszt gens jobb tervet kszthet: elszr megvizsglja az asztal s a szk sznt, majd ha
ezek mr eleve azonosak, a terv ksz. Ha nem, megnzi a festkesdobozok cmkit, ha ezek kzt tall olyan
sznt, mint amilyen a szne brmelyik btordarabnak, akkor ezt a festket alkalmazza a msikon. Egybknt
befesti mindkt darabot brmelyik sznnel.
Az jratervez gens a feltteles tervksztvel azonos tervet kszthet vagy elsre egy jval kevesebb gat
tartalmazt, majd amennyiben szksges, a vgrehajtsi idben tlti fel a tbbit. A cselekvslersok nem
megfelelsgt szintn kezelni tudja. Pldul tegyk fel, hogy a Fest(trgy, szn) cselekvsnek a Szn(trgy,
szn) determinisztikus hatst tulajdontjuk. Egy feltteles tervkszt felttelezi, hogy a kvetkezmny teljesl,
ha a cselekvst vgrehajtottuk, de az jratervez gens ellenrizheti a hatst s ha az nem igaz (taln mivel az
gens figyelmetlen volt s kihagyott egy rszt), jra tervezhet s jra festhet egy rszt. Ehhez a pldhoz az 5.
szakasz - Vgrehajts monitorozsa s jratervezse rszben visszatrnk.
381

vilgban
A folytonos tervkszt gens a nem vrt esemnyek kezelsn tl jra is tervezhet, ha mondjuk a legyen ebd
az asztalon j clt illesztjk be, azaz a festsi tervet el kell halasztani.
A valdi vilgban az gensek a klnbz megkzeltsek kombinciit hasznljk. Az autgyrtk ptkereket
s tartalk lgzskokat rulnak, amelyek fizikai megtestesti a feltteles tervgaknak, melyeket a defektek vagy
az tkzsek kezelsre ksztettek. Msrszrl a legtbb autvezet soha nem veszi figyelembe ezeket a
lehetsgeket, gy a defektekre vagy az tkzsekre mint jratervez gensek reaglnak. ltalnossgban az
gensek csak azokra az eshetsgekre ksztenek feltteles tervet, amelyeknek fontos hatsai vannak, s nem
elhanyagolhat esllyel okoznak hibt. gy egy autvezetnek, aki a Szaharn keresztl kvn utazni, igencsak
figyelembe kell vennie a lerobbans lehetsgt, mg egy ruhzba vezet t jval kevesebb megelz tervezst
ignyel.
Az ebben a fejezetben bemutatott gensek a nemdeterminisztikussg kezelsre kszltek, de nem alkalmasak
arra, hogy mrlegeljenek a sikeressg valsznsge s a terv elksztsnek kltsge tekintetben. A 16. fejezet
tovbbi eszkzket biztost az ilyen problmk kezelsre.
4. Feltteles tervkszts
Feltteles tervkszts a bizonytalansg kezelsnek egy mdja. Mdszere, hogy a terv elre meghatrozott
pontjain ellenrzi, hogy valjban mi is trtnik a krnyezetben. A feltteles tervkszts bemutatsa a teljesen
megfigyelhet krnyezetek esetn a legegyszerbb, gy ezzel az esettel kezdnk. A rszlegesen megfigyelhet
eset jval nehezebb, de egyben jval rdekesebb is.
4.1. Feltteles tervkszts teljesen megfigyelhet

krnyezetekben
A teljes megfigyelhetsg jelentse, hogy az gens mindig ismeri az aktulis llapotot. Nemdeterminisztikus
krnyezet esetn azonban, az gens nem kpes megjsolni a cselekvseinek kimenetelt. A feltteles tervkszt
gens a nemdeterminisztikussgot gy kezeli, hogy a tervekbe feltteles lpseket pt be (tervksztsi idben),
amelyek ellenrzik a krnyezet llapott (futsi idben), hogy a tovbbiakrl dnthessen. A krds teht,
hogyan kszthetk el az ilyen feltteles tervek.
Pldaknt a porszvvilg (vacuum word) problmakrt hasznljuk, amelynek llapottert a determinisztikus
esetre a 2. szakasz - Pldaproblmk rszben fektettk le. Emlkezznk vissza, hogy a Balra, a Jobbra s a Szv
a rendelkezsre ll cselekvsek. Szksgnk lesz nhny propozcira, hogy definiljuk az llapotokat: legyen
az OttBal (OttJobb) igaz, ha az gens a bal (jobb) llapotban van, s legyen a TisztaBal (TisztaJobb) igaz, ha a
bal (jobb) llapot tiszta.5 Az els feladatunk a STRIPS nyelv kiterjesztse, hogy megengedje a
nemdeterminisztikussgot. Ennek rdekben megengedjk a cselekvsekben a diszjunktv kvetkezmnyeket
(disjunctive effects), ami azt jelenti, hogy egy cselekvst brmikor vgrehajtva annak kett vagy tbb
klnbz kimenetele is lehet. Tegyk fel pldul, hogy a Balra lps nha sikertelen. Ekkor a
Cselekvs(Balra, Elfelttel:OttJobb, Kvetkezmny:OttBal OttJobb)
norml cselekvslerst mdostanunk kell, hogy diszjunktv kvetkezmnyt is tartalmazzon:

Cselekvs(Balra, Elfelttel:OttJobb, Kvetkezmny:OttBal OttJobb) (12.1)
Szintn hasznosnak talljuk a feltteles kvetkezmnyeket (conditional effects), amikor is egy cselekmny
kvetkezmnye fgg attl az llapottl, amelyben vgrehajtjuk. A feltteles kvetkezmnyek a cselekvs
KVETKEZMNY rszben jelennek meg a when <felttel>: <kvetkezmny> szintaxissal. Pldul a Szv
cselekvs modellezsre a
Cselekvs(Szv, Elfelttel:, Kvetkezmny:(when OttBal: TisztaBal)
(when OttJobb: TisztaJobb))]
Nyilvnvalan az OttJobb akkor s csak akkor igaz, ha a OttBal igaz, s fordtva. A kt llts hasznlatnak oka fknt az olvashatsg
javtsa.
5
382

vilgban
kifejezst rnnk fel. A feltteles kvetkezmnyek nem vezetik be a nemdeterminisztikussgot, de segtsget
nyjtanak annak modellezsben. Tegyk fel pldul, hogy egy krmnfont porszvnk van, ami nha, ha
mozog, piszkot szr a clngyzetre, de csak akkor, ha az tiszta. Ez a
Cselekvs(Balra, Elfelttel:OttJobb, Kvetkezmny:OttBal
(OttBal (when TisztaBal: TisztaBal))
lerssal modellezhet, ami mind diszjunktv, mind pedig feltteles. 6 Hogy feltteles terveket kszthessnk,
feltteles lpsekre (conditional steps) van szksgnk. Ezeket az if <teszt> then terv_A else terv_B
szintaxis hasznlatval rjuk le, ahol a <teszt> egy ktrtk fggvnye az llapotvltozknak. Az if OttBal
TisztaBal then Jobbra else Szv pldul a porszvvilg egy feltteles lpse lehet. Egy ilyen lps vgrehajtsa
a kzenfekv mdon trtnik. A feltteles lpsek egymsba gyazsaival a tervek fk lesznek.
A feltteles tervektl elvrjuk, hogy mkdjenek, fggetlenl attl, hogy valjban a cselekvs mely kimenetele
kvetkezik be. Ezzel a problmval egy msik kntsbe bjtatva mr tallkoztunk korbban. A ktszemlyes
jtkokban (lsd 6. fejezet) olyan lpseket szeretnnk, amelyek az ellenfl lpseitl fggetlenl gyzelemhez
vezetnek. A nemdeterminisztikus tervksztsi problmkat ezrt gyakran termszet elleni jtkoknak (games
against nature) nevezik.
Vegyk a porszvvilg egy specilis pldjt. A kiindul llapotban a robot a tiszta vilg jobb oldali ngyzetn
van. Mivel a krnyezet teljesen megfigyelhet, az gens ismeri a teljes OttJobb TisztaBal TisztaJobb
llapotlerst. A clllapotban a robot a tiszta vilg bal oldali ngyzetn van. Ez a feladat elg trivilis lenne, ha
nem a dupla-Murphy porszvval lenne dolgunk, amely nha piszkot hagy maga utn, amikor egy tiszta
clngyzetre lp, s nha bepiszkolja a tiszta ngyzetet, ha a Szvs cselekvs vgrehajtdik.
Ennek a krnyezetnek a jtkfjt a 12.9. brn mutatjuk be. A cselekvseket a robot a fa llapot
csompontjaiban hajtja vgre, majd a krrel jellt valsznsgi csompontokban a termszet dnt a
cselekvs kimenetelrl. A megolds egy rszfa, mely (1) minden levelben egy cl csompontot tartalmaz, (2)
minden llapot csomponthoz egy cselekvst specifikl, s (3) minden valsznsgi csompontban
tartalmazza az sszes kimenetelhez tartoz gat. Az brn a megoldst vastag vonallal jelltk, ami a [Balra, if
OttBal TisztaBal TisztaJobb then [] else Szv] tervnek felel meg. (Mivel llapottr-tervksztt hasznlunk,
a feltteles lpsekben hasznlt tesztek egyelre teljes llapot lersok.)
12.9. bra - A dupla-Murphy porszvvilg keressi fjnak els kt szintje. Az

llapotcsompontokban s a VAGY csompontokban cselekvseket kell vlasztani. A
valsznsgi csompontok, amelyeket krkkel jelltnk S csompontok, ahol, ahogy
azt a kimen gakon szerepl v is jelli, minden kimenetelt kezelni kell. A megoldst
vastag vonallal jelltk.
A when TisztaBal: TisztaBal feltteles kvetkezmny egy kicsit furcsnak tnhet. Emlkezznk vissza azonban, hogy itt a TisztaBal a
cselekvs eltti, mg a TisztaBal a cselekvs vgrehajtsa utni helyzetre vonatkozik.
6
383

vilgban
A jtkok pontos megoldshoz a minimax algoritmust hasznljuk (lsd 6.3. bra). Ehhez a feltteles
tervksztsben tipikusan kt mdosts tartozik. Elszr is, a MAX s a MIN csompontok VAGY s S
csompontokk vlhatnak. Nyilvnvalan a tervnek minden elrt llapotban vlasztania kell valamilyen
cselekvst, de kezelnie kell ezen cselekvs minden kimenetelt. Msodszor, az algoritmusnak nemcsak egy
lpst kell megadnia, hanem egy feltteles tervet kell ksztenie. Egy VAGY csompontban a terv egyszeren a
vlasztott cselekvs, amelyet brmi kvethet. Egy S csompontban a terv if-then-else lpsek egymsba
gyazott sorozata, melyek minden lehetsges kimenetelhez egy rsztervet adnak meg. Ezen lpsekben a felttel
vizsglatokban teljes llapotlersok szerepelnek.7
12.10. bra - Egy algoritmus a nemdeterminisztikus krnyezetek ltal generlt S-VAGY

grfok keressre. Felttelezzk, hogy az LLAPOTTMENET fggvny a cselekvsek egy
listjt adja vissza, melyek mindegyike egy lehetsges kimenetel halmazhoz tartozik. A
cl egy feltteles terv megtallsa, ami brmilyen krlmnyek kztt elr egy
clllapotot.
Az ilyen terveket case szerkezettel is lerhatnnk.
384

vilgban
Formlisan az eddig definilt keressi tr egy s-vagy grf. Az S-VAGY grfok korbban a 7. fejezetben az
tletlogikai Horn-klz kvetkeztetsben jelentek meg. Itt az gak logikai kvetkeztet lpsek helyett
cselekvsek, de az algoritmus azonos. A 12.10. bra az S-VAGY grfok keressre egy rekurzv, mlysgi
keres algoritmust ad meg.
A bemutatott algoritmusban kulcsfontossg a nemdeterminisztikus tervksztsi problmkban gyakran
felmerl ciklusok kezelsnek mdja (pldul ha egy cselekvsnek nha nincs kvetkezmnye vagy egy
helytelen kvetkezmny kijavthat). Ha az aktulis llapot azonos a gykrtl idig vezet tvonal egy
llapotval, akkor hibval tr vissza. Ez nem jelenti, hogy nincs megolds az aktulis llapotbl, egyszeren
annyit jelent, hogy van egy nemciklikus megolds, ami elrhet az aktulis llapot korbbi elfordulsbl, gy
az llapot jabb bekvetkezse kihagyhat. Ezzel az ellenrzssel biztostjuk, hogy az algoritmus minden vges
llapottr esetn lelljon, mivel minden tvonal clt r, zskutcba jut, vagy egy llapot ismtlse. Vegyk
szre, hogy az algoritmus nem ellenrzi, hogy az aktulis llapot egy msik tvonalon szerepl llapot
ismtlse-e. A 12.15. feladat ezt a krdst jrja krl.
12.11. bra - A tripla-Murphy porszvvilg keressi grfjnak els szintje, ahol a

ciklusokat explicit megjelltk. A problma sszes megoldsa ciklikus terv.
Az S-VAGY-GRF-KERESS ltal visszaadott tervek feltteles lpseket tartalmaznak, melyek a teljes

llapotlerst megvizsgljk, hogy egy grl dntsenek. A legtbb esetben ennl jval kevsb kimert
ellenrzsekkel is megszhatjuk. Pldul a 12.9. brn lthat megolds a [Balra, if TisztaBal then [] else Szv]
megadssal egyszeren lerhat. Ennek oka, hogy a TisztaBal teszt elegend, hogy az S csompont llapotait
kt egyelem halmazba sorolja gy, hogy a tesztek utn az gens pontosan ismerje az llapott. Valjban az
egyvltozs if-then-else tesztek sorozata mindig elegend, hogy llapotok egy halmazt egyelem halmazokra
385

vilgban
ossza, feltve, hogy az llapot teljesen megfigyelhet. Ezrt az ltalnossg teljes megrzse mellett a teszteket
egyvltozs tesztekre szkthetjk.
Az utols nehzsg, ami gyakran felmerl a nemdeterminisztikus feladatkrkben, a kvetkez: a dolgok nem
mindig mkdnek elsre, gy jra kell prblkozni. Vegyk pldul a tripla-Murphy porszv pldjt, mely
(a korbban bemutatott szoksok mellett) nha nem mozdul az utasts ellenre. Pldul csakgy, mint a (12.1)
egyenletben, a Balra cselekvs tartalmazhatja a OttBal OttJobb diszjunktv hatst. Ekkor a [Balra, if
TisztaBal then [] else Szv] terv mr nem garantlt, hogy mkdik. A 12.11. bra a keressi grf egy rszlett
mutatja. Tisztn lthat, hogy a tovbbiakban nincsenek ciklusmentes megoldsok, s az S-VAGY-GRFKERESS hibval trne vissza. Ltezik azonban egy ciklikus megolds (cyclic solution), ami addig prblgatja
a Balra lpst, mgnem egyszer mkdik. Ez a megolds knnyebben kifejezhet, ha a terv egy rszt egy
cmkvel (label) jelljk meg, s a terv ismtelgetse helyett erre a cmkre hivatkozunk. gy a ciklikus
megoldsunk
[L1 : Balra, if OttJobb then L1 else if TisztaBal then [] else Szv]
alak. (A while OttJobb do Balra kifejezs egy jobb szintaxis a terv ciklikus rszre.) Az S-VAGY-GRFKERESS-ben szksges mdostsokat a 12.16. feladat dolgozza fel. A megvalsts kulcsa, hogy az
llapottrben egy L llapotba visszalp hurok a tervben egy arra a pontra visszamutat hurkot jelent, ahol az L
llapotba vezet rsztervet vgrehajtjuk.
gy mr kpesek vagyunk feltteleket s ciklusokat tartalmaz programokhoz hasonlatos sszetett tervek
ltrehozsra. Sajnos ezek a ciklusok vgtelen ciklusok lehetnek. Pldul a tripla-Murphy vilg cselekvs
reprezentcijban a semmi jelentse, hogy a Balra szksgszeren sikeres. A ciklikus tervek ezrt kevsb
elnysek, mint a ciklus nlkliek, de megoldsnak tekinthetk, amennyiben minden levl egy clllapot, s a
terv minden pontjbl elrhet egy levl.
4.2. Feltteles tervkszts rszlegesen megfigyelhet

krnyezetekben
Az elz alfejezet teljesen megfigyelhet krnyezetekkel foglalkozott, amelyek elnye, hogy a feltteles
ellenrzsek brmit krdezhetnek, s biztosak lehetnek a vlaszt kapnak. A valdi vilgban a rszleges
megfigyelhetsg jval gyakoribb. Egy rszlegesen megfigyelhet tervksztsi feladat kiindul llapotban az
gens csak bizonyos dolgokat tud az aktulis llapotrl. Ennek a helyzetnek a legegyszerbb modellezse, ha a
kiindul llapotrl annyit mondunk, hogy egy llapothalmazba tartozik. Az llapothalmaz az gens kiindul
hiedelmi llapott (belief state) rja le.8
Tegyk fel, hogy a porszvvilg gens tudja, hogy a jobb oldali ngyzeten van, s az tiszta, de nem tudja
rzkelni a piszok jelenltt vagy hinyt a tbbi ngyzeten. Ekkor, legjobb ismeretei szerint kt llapotban
lehet: a bal oldali ngyzet vagy piszkos, vagy tiszta. Ezt a hiedelmi llapotot a 12.12. brn A-val jelltk. Az
bra a vltakoz dupla-Murphy porszvvilg S-VAGY grfjnak egy rszt mutatja be, melyben a tiszta
ngyzetet elhagy gens piszkot hagyhat maga utn.9 Ha a vilg teljesen megfigyelhet volna, az gens egy
Mozogj balra s jobbra, s szvd fel a piszkot, amennyiben tallsz, amg mindkt kocka tiszta nem lesz, s a bal
oldali kockn vagyok formj ciklikus megoldst kszthetne (lsd 12.16. feladat). Sajnos csak loklis
szemtrzkelssel ez a terv vgrehajthatatlan, hiszen a mindkt kocka tiszta teszt igazsgrtke nem
hatrozhat meg.
Figyeljk meg az S-VAGY grf felptst. Az A hiedelmi llapotbl a Balra mozgs kimenetelt mutatjuk. (A
tbbi cselekvsnek nincs rtelme.) Mivel az gens piszkot hagyhat maga utn, a kt kiindul vilgbl ngy
lehetsges vilg addhat, ahogy az a B s C llapotokban lthat. A rendelkezsre ll rzkel informcik
alapjn a vilg kt klnll hiedelmi llapotra oszthat.10 A B-ben, az gens tudsa a TisztaBal, mg C-ben a
TisztaBal. A piszok feltakartsa C-ben az genst a B-be mozgatja. A B-bl a jobbra mozgs vagy hagy piszkot
maga utn, vagy nem, gy az gensnek azon tudsa alapjn, hogy TisztaJobb igaz (vissza az A-ra) vagy hamis (D
hiedelmi llapot), ismt ngy lehetsges vilg addik.
Ezeket a fogalmakat a 3.6. alfejezetben vezettk be, gy az olvas ezt tismtelheti a tovbblps eltt.
A kisgyermekes szlk jl ismerhetik ezt a jelensget. Tisztelet a kivtelnek.
10
Vegyk szre, hogy ezek nem aszerint kerlnek osztlyzsra, hogy az gens piszkot hagy-e maga utn, amikor mozdul. A hiedelmi
llapottrbeli elgazsokat a klnbz tudslehetsgek, s nem a klnbz fizikai kimenetelek okozzk.
8
9
386

vilgban
sszegezve a nemdeterminisztikus, rszben megfigyelhet krnyezetek a hiedelmi llapotok egy S-VAGY
grfjt eredmnyezik. Ebbl addan feltteles tervek tallhatk pontosan ugyanazon algoritmusokkal, mint a
teljesen megfigyelhet esetben, nevezetesen az S-VAGY-GRF-KERESS-sel. Ez abbl is knnyen megrhet,
ha beltjuk, hogy az gens hiedelmi llapota mindig teljesen megfigyelhet, azaz mindig tudja, hogy mit tud. A
hagyomnyos teljesen megfigyelhet problmamegolds csak egy specilis eset, melyben minden hiedelmi
llapot egy egyelem halmaz, pontosan egy fizikai llapottal.
12.12. bra - A vltakoz dupla-Murphy porszvvilg S-VAGY grfjnak egy rszt

mutatja be, melyben a tiszta ngyzetet elhagy gens piszkot hagyhat maga utn. Az
gens nem tudja rzkelni a ms ngyzetben lev piszkot.
Ezzel kszen vagyunk? Nem egszen! Mg meg kell hatroznunk, hogy hogyan reprezentljuk a hiedelmi
llapotokat, hogyan mkdik az rzkels, s hogy ebben az j helyzetben hogyan rjuk le a cselekvseket.
A hiedelmi llapotok esetn alapveten hrom vlasztsunk van:
1. Teljes llapotlersok halmazai. Pldul a 12.12. bra kiindul hiedelmi llapota az
{(OttJobb TisztaJobb TisztaBal), (OttJobb TisztaJobb TisztaBal)}
Ezzel a lerssal knny dolgozni, de nagyon kltsges: ha n ktrtk tletllts definil egy llapotot, akkor a
hiedelmi llapot O(2n) fizikai llapotlerst tartalmazhat, melyek mindegyike O(n) mret. Ha az gens az
tletlltsoknak csak egy tredkt ismeri, exponencilisan nagy hiedelmi llapotok addnak minl
kevesebbet tud, annl tbb lehetsges llapotban lehet.
2. Logikai mondatok, melyek pontosan lerjk a hiedelmi llapotban lehetsges vilgok halmazt. Pldul a
kiindul llapot az
OttJobb TisztaJobb
387

vilgban
formban adhat meg. Nyilvnval, hogy brmely hiedelmi llapot pontosan befoglalhat egyetlen logikai
mondatba. Ha akarjuk, az sszes konjuktv llapotlers diszjunkcijt vehetjk, de a pldnk mutatja, hogy
ennl tmrebb mondatok ltezhetnek.
Az ltalnos logikai mondatok egyik htultje, hogy mivel sok ekvivalens, de klnbz logikai mondat
rhatja le ugyanazt a hiedelmi llapotot, az ismtld llapotok ellenrzse ltalnos ttelbizonyt kpessgeket
vr el a grfkeres algoritmustl. Ezrt a mondatok egy kanonikus reprezentcijt szeretnnk, amelyben
minden hiedelmi llapot pontosan ugyanannak a mondatnak felel meg. 11 Egy ilyen reprezentci, azaz
tletlltsok nevei alapjn rendezett literlok konjukcijt hasznlja, melynek egy pldja a OttJobb
TisztaJobb. Ez a 11. fejezet nylt vilg felttelezsben (open-world assumption) egy egyszer llapotlers.
Nem minden logikai mondat rhat fel ilyen alakban (pldul nincs md az OttBal TisztaJobb felrsra), de
szmos problma kezelhet.
3. Tuds tletlltsok (knowledge propositions), amelyek az gens ismereteit rjk le. (Ugyanezt lsd a 7.7.
alfejezetben.) A kiindul llapotunk:
K(OttJobb) K(TisztaJobb)
ahol K jelentse tudja s K(P) jelentse, hogy az gens tudja, hogy P igaz.12 A tuds tletlltsokkal zrt
vilg felttelezst hasznlunk, azaz ha egy llts nem jelenik meg a listban, akkor hamisnak felttelezzk.
Pldul a K(TisztaBal) s a K(TisztaBal) implicit szerepelnek a fenti mondatban, gy az rgzti a tnyt, hogy
az gens rzketlen a TisztaBal igazsgrtkre.
Kimutathat, hogy a msodik s harmadik lehetsgek durvn azonosak, de mi a harmadik tuds, az tletllts
lehetsget hasznljuk, mert ez az rzkels egy ersebb lerst adja, s mert mr tudjuk, hogy hogyan rhatunk
a zrt vilg felttelezs (closed-world assumption) mellett STRIPS kifejezseket.
Fontos
Mindkt esetben, minden tletszimblum hromflekppen jelenhet meg: lehet pozitv, neglt vagy
ismeretlen. Ezrt gy pontosan 3n lehetsges hiedelmi llapot adhat meg. A hiedelmi llapotok
halmaza gy a hatvnyhalmaza (az sszes rszhalmaz halmaza) a fizikai llapotoknak. sszesen 2n
fizikai llapot van, ezrt 2^2n hiedelmi llapot, ami sokkal tbb, mint 3n, gy a 2. s 3. vlaszts elgg
korltozottan alkalmas a hiedelmi llapotok lersra. Ez jelenleg hasznlhatatlannak tnik, hiszen
brmely sma, ami kpes minden lehetsges hiedelmi llapot reprezentlsra, O(log2(2^2n)) = O(2n)
bitet ignyel, hogy legrosszabb esetben mindegyiket lerhassa. A mi egyszer smnk csak O(n) bitet
ignyel a hiedelmi llapotok lershoz, mert a kifejezkpessget a tmrsgre cserltk.
Nevezetesen, ha egy cselekvs megjelenik, amelynek az elfelttelei ismeretlenek, akkor az
eredmnyknt kapott hiedelmi llapot nem lesz pontosan reprezentlhat, s a cselekvs kimenetele
ismeretlen lesz.
Most arrl kell dntennk, hogy az rzkels hogyan mkdik. Itt kt vlasztsunk van. Hasznlhatunk
automatikus rzkelst (automatic sensing), ami annyit tesz, hogy az gens minden idlpsben az sszes
elrhet rzetet megkapja. A 12.12. brn lthat plda a helyzet s a helyi tisztasg meghatrozsra
automatikus rzkelst felttelez. Hasznlhatunk ellenben aktv rzkelst (active sensing), ami annyit jelent,
hogy az rzkelt informcik csak megadott rzkelsi cselekvsek (sensory actions), (mint
TisztasgEllenrzs s PozciEllenrzs) vgrehajtsval nyerhetk. Az rzkelsi tpusokat sorban trgyalni
fogjuk.
Most hasznljunk tuds lltsokat a cselekvsek lershoz. Tegyk fel, hogy az automatikus helyi
tisztasgrzkelssel felruhzott vltakoz-dupla-Murphy vilg problmban az gens Balra lp. Az erre a
vilgra vonatkoz szablyoknak megfelelen az gens hagy, vagy taln nem hagy piszkot maga utn, ha a
ngyzet tiszta volt. Mint fizikai kvetkezmny, ez diszjunktv lenne, de mint tuds kvetkezmny ez egyszeren
trli az gens TisztaJobb tudst. Emellett az gens a helyi piszokrzkels miatt gy vagy gy tudni fogja, hogy
vajon a TisztaBal igaz-e, s tudni fogja, hogy a pozcija OttBal:
Cselekvs(Balra, Elfelttel:OttJobb,
Az ltalnos tletlogikai mondatok legjobb kanonikus reprezentcija a binris dntsi diagram (binary decision diagram) vagy BDD
(Bryant, 1992).
12
Ez a jells ugyanaz, mint amit a 7. fejezetben az ramkralap genseknl hasznltunk. Nhny szerz ezt a tudja, hogy P igaz-e
rtelemben hasznlja. A kt rtelmezs kztti fordts kzenfekv.
11
388

vilgban
Kvetkezmny:K(OttBal) K(OttJobb)
when TisztaJobb: K(TisztaJobb)
when TisztaBal: K(TisztaBal)
when TisztaBal: K(TisztaBal) (12.2)
Vegyk szre, hogy az elfelttelek s a when felttelek egyszer lltsok s nem tuds lltsok. Ez gy van,
ahogy lennie kell, hiszen a cselekvsek kimenetele fgg az aktulis vilgtl, de hogyan ellenrizhetnnk ezen
felttelek igazsgrtkt csupn a hiedelmi llapot alapjn? Ha az gens az aktulis hiedelmi llapotban tudja
mondjuk a K(OttJobb) lltst, akkor az lltsnak igaznak kell lennie az aktulis fizikai llapotban, gy egyben a
cselekvs is alkalmazhat. Ha az gens nem ismeri az lltst (pldul TisztaBal az if felttelt), akkor a hiedelmi
llapotnak tartalmaznia kell olyan vilgokat, melyekben a TisztaBal igaz, s olyan vilgokat, amelyekben a
TisztaBal hamis. Pontosan ez az, ami miatt egy cselekvs tbbszrs hiedelmi llapotokat eredmnyez. gy, ha a
kiindul llapot a (K(OttJobb) K(TisztaJobb)), akkor a Balra lps utn a (K(OttBal) K(TisztaBal)) s a
(K(OttBal) K(TisztaBal)) a kt lehetsges hiedelmi llapot. Mindkt esetben ismert a TisztaBal rtke, gy a
TisztaBal teszt felhasznlhat a tervben.
Aktv rzkels (mint az automatikus rzkels ellentettje) esetn, az gens csak krsre kap j megfigyelseket.
gy a Balra lps utn az gens nem tudja, hogy a bal oldali ngyzet piszkos-e, ezrt a (12.2) cselekvsler
egyenletben az utols kt feltteles kvetkezmny mr nem jelenik meg. Az gens a TisztasgEllenrzs
cselekvssel dertheti ki, hogy a ngyzet piszkos-e:
Cselekvs(TisztasgEllenrzs, Kvetkezmny: when OttBal TisztaBal: K(TisztaBal)
when OttBal TisztaBal: K(TisztaBal)
when OttBal TisztaJobb: K(TisztaJobb)
when OttBal TisztaJobb: K(TisztaJobb) (12.3)
Knny megmutatni, hogy aktv rzkels esetn a Balra lpssel kvetett TisztasgEllenrzs cselekvs
ugyanazt a kt hiedelmi llapotot eredmnyezi, amit az automatikus rzkels esetn a Balra adott. Aktv
rzkels esetn a fizikai cselekvsek egy hiedelmi llapotot mindig egyetlen kvet hiedelmi llapotra
kpeznek le. A tbbszrs hiedelmi llapotok csak az rzkel cselekvsek ltal jhetnek ltre, melyek
specifikus tudst adnak, s ezrt lehetv teszik a felttelvizsglatok hasznlatt a tervekben.
Az eddigiekben az llapottr S-VAGY keressn alapul feltteles tervksztsre mutattunk be egy ltalnos
megkzeltst. Ez a megkzelts nhny tesztproblmn elg hatkonynak bizonyult, de ms feladatokra
alkalmatlan. Bizonythat, hogy a feltteles tervkszts nagyobb algoritmikus komplexits, mint a
hagyomnyos. Emlkezznk vissza, hogy az NP osztly defincija alapjn egy megoldsrl ellenrizhet, hogy
polinomilis idej-e. Ez a hagyomnyos tervekre (legalbbis a polinomilis mretekre) igaz, gy a
hagyomnyos tervkszts az NP osztlyba tartozik. A feltteles tervkszts esetn egy jelltre ellenrizni kell,
hogy az sszes lehetsges llapotra a tervben ltezik-e valamilyen, a clt kielgt tvonal. Az
sszes/valamilyen sszellts nem ellenrizhet polinomilis idben, gy a feltteles tervkszts nehezebb,
mint NP. Ez csak gy kerlhet el, hogy a tervksztsi fzisban figyelmen kvl hagyunk nhny lehetsges
eshetsget, s ezeket csak akkor kezeljk, ha valjban fellpnek. A kvetkez alfejezetben ezt a megkzeltst
elemezzk.
5. Vgrehajts monitorozsa s jratervezse

A vgrehajts-monitoroz (execution monitoring) gens rzkelivel ellenrzi, hogy minden a terv szerint
megy-e. Murphy trvnye alapjn az egereknek, embereknek s a feltteles tervkszt genseknek mg a
legjobban elksztett tervei is gyakran sikertelenek. A problma a nem korltos nemdeterminisztikussg, azaz
nhny vratlan krlmny mindig felmerl, melyre az gens cselekvs lersai helytelenek. A vals
krnyezetekben ezrt a vgrehajts-monitorozs elengedhetetlen. Ktfle vgrehajts-monitorozst vesznk
szmba: az egyszer, de gyenge cselekvsmonitorozst (action monitoring), ahol az gens a krnyezet
vizsglatval ellenrzi, hogy a kvetkez cselekvs mkdni fog, s az sszetettebb, de hatkonyabb
tervmonitorozst (plan monitoring), melyben az gens a terv teljes htralev rszt ellenrzi.
389

vilgban
Az jratervez (replanning) gens tudja, hogy vratlan esemnyek esetn mit kell tennie: jra meghvja a
tervksztt, hogy a cl elrshez egy j tervet biztostson. Annak elkerlsre, hogy tl sok idt tltsnk
tervksztssel, ez rendszerint a rgi terv javtsval trtnik, azaz utat keresnk a fennll nem vrt llapotbl
vissza, a meglv tervhez.
Pldaknt trjnk vissza a 12.9. bra dupla-Murphy porszvvilghoz. Ebben a vilgban egy tiszta cellra lps
nha bepiszkolja azt. De mi trtnik, ha az gens ezt nem tudja vagy nem foglalkozik vele? Akkor egy nagyon
egyszer megoldssal ll el: [Balra]. Ha a terv vgrehajtsnl rkezskor nem trtnik piszkts, akkor az
gens a cl elrst detektlja. Ellenkez esetben azonban, mivel az implicit Befejez lps TisztaBal elfelttele
nem teljesl, az gens j tervet kszt: [Szv]. Ennek a tervnek a vgrehajtsa mindig sikeres.
A vgrehajts-monitorozs s jratervezs egyttesen egy ltalnos stratgia, ami mind a teljesen, mind pedig a
rszben megfigyelhet krnyezetekre alkalmazhat a tervksztsi reprezentcik szles krn, belertve az
llapottr-, a rszben rendezett s a feltteles terveket. A 12.13. bra az llapottr-tervksztsre mutat be egy
egyszer megkzeltst. A tervkszt gens egy cllal indt, s kiindul tervet kszt ennek elrshez.
Ellenttben ms tervkszt gensekkel, az jratervez gens kveti mind a htralev, mg vgrehajtatlan terv
rszletet, valamint a teljes eredeti tervet teljes_terv-et. Cselekvsmonitorozst (action monitoring) hasznl: a
terv kvetkez cselekvsnek vgrehajtsa eltt az gens megvizsglja az rzkelit, hogy megbizonyosodjon
arrl, hogy a terv elfelttelei nem vltak-e vratlanul kielgtetlenn. Ha igen, akkor az gens egy
cselekvssorozat jratervezsvel megprbl a teljes_terv egy pontjra visszajutni.
12.13. bra - Egy cselekvsmonitoroz s -jratervez gens. Ez szubrutinknt a

TERVKSZT teljes llapottr tervkszt algoritmust hasznlja. Ha a kvetkez cselekvs
elfelttelei nem teljeslnek, az gens a teljes_terv lehetsges p pontjain iterl olyat
keresve, amelyhez a TERVKSZT tvonalat tud tervezni. Ezt az tvonalat hvjuk
javtsnak. Ha a TERVKSZT sikeres a javtsban, az j terv ksztshez sszefzi a
javtst s a terv p utni rszt. Az gens ezutn a terv els lpst adja vissza.
A 12.14. bra a folyamat sematikus illusztrcija. Az jratervez szreveszi, hogy a terv els cselekvsnek
elfeltteleit az aktulis llapot nem elgti ki. Ezutn meghvja a tervksztt, hogy ksztsen egy j javts-nak
nevezett rsztervet, amely az aktulis llapotbl a teljes_terv valamely s llapotba vezet vissza. Ebben a
pldban az s trtnetesen egylpsnyi visszalpst jelent az aktulis htralv terv-bl. (Ez az oka, hogy a
htralv terv helyett a teljes tervet figyeljk.) ltalnossgban s-et a jelen llapothoz a lehet legkzelebbre
vlasztjuk. Az j terv a javts s a teljes_terv s-tl htralev rsze amit folytats-nak neveznk
sszefzsbl addik, mellyel az gens kszen ll a vgrehajts folytatsra.
Trjnk vissza az asztal s a szk azonos sznre festsnek problmjhoz, ez alkalommal jratervezssel.
Felttelezzk a teljesen megfigyelhet krnyezetet. A kiindul llapotban a szk kk, az asztal zld, valamint 1
doboz kk s 1 doboz zld festk ll rendelkezsnkre. Ez a kvetkez problma defincihoz vezet:
390

vilgban
12.14. bra - A vgrehajts eltt a tervkszt egy teljes_terv-nek nevezett tervet kszt,
mely S-bl G-be vezet. Az gens az E-vel jellt pontig vgrehajtja a tervet. A terv
htralev rsznek vgrehajtsa eltt a szoksos mdon ellenrzi az elfeltteleket, s
azt tallja, hogy valjban az O llapotban van, s nem az E-ben. Ezutn meghvja a
tervkszt algoritmust, hogy ksztsen egy javts-t, mely egy terv az O-bl az eredeti
teljes_terv egy P pontjhoz. Az j terv ezutn a javts s a folytats (az eredeti teljes_terv
maradk rsze) sszefzsbl addik.
Kiinduls(Szne(Szk,
Szne(Asztal, Zld)
Kk)
SzntTartalmaz(BC,
FestkDoboz (BC)
Kk)
SzntTartalmaz(RC,
FestkDoboz (RC)
Piros)
Cl(Szne(Szk, x)
x))
Szne(Asztal,
Cselekvs(Fest(trgy, szn),
Elfelttel:VanFestk(szn)
Kvetkezmny:Szne(trgy, szn))
Cselekvs(Nyit(doboz),
Elfelttel:FestkDoboz(doboz)
Szne(doboz, szn)
Kvetkezmny:Szne(szn))
Az gens TERVKSZT-jnek a kvetkez tervvel kellene elllnia:

[Indt; Nyit(BC); Fest(Asztal, Kk); Befejez]
Az gens most kszen ll a terv vgrehajtsra. Tegyk fel, hogy minden jl megy, s az gens kinyitja a kk
festket s az asztalra keni. Az elz alfejezet gensei a terv lpsnek befejezse utn gyzelmet kiltannak.
A vgrehajts-monitoroz gensnek ellenben elszr ellenriznie kell a Befejez lps elfelttelt, ami azt
391

vilgban
mondja, hogy a kt btornak azonos sznnek kell lennie. Tegyk fel, hogy az gens azt rzkeli, hogy a
btorok nem azonos sznek, mivel a fests hinyossga miatt az asztalon egy zld folt maradt. Az gensnek
ezutn keresnie kell egy clpontot a teljes_terv-ben, amelyet megclozhat, s egy javt cselekvssorozatot kell
kidolgoznia, hogy ide jusson. Az gens szreveszi, hogy az aktulis llapot azonos a Fest cselekvs
elfeltteleivel, gy a javt egy res sorozat, s a terv azonos az pp vgrehajtott [Fest, Befejez] sorozattal.
Ezzel az j tervvel a monitorozs vgrehajtsa folytatdik, s a Fest cselekvs jra vgrehajtsra kerl. Ez a
viselkeds addig ismtldik, amg az asztalt teljesen lefestettnek nem rzkeljk. Vegyk szre, hogy a ciklus a
tervvgrehajtsjratervezs folyamat sorn alakult ki, nem pedig egy explicit ciklus az eredeti tervben.
A cselekvsmonitorozs a vgrehajts-monitorozs nagyon egyszer mdszere, de nha kevsb intelligens
viselkedshez vezethet. Pldul tegyk fel, hogy az gens olyan tervet kszt, amelyben az asztalt s a szket is
pirosra festi. Ekkor kinyitja a piros festket, s azt tallja, hogy nincs elegend festk a szkhez. A
cselekvsmonitorozs nem rzkeln ezt a sikertelensget, csak miutn a szket befestettk, amikor is a
VanFestk(Piros) hamiss vlik. Amire valjban szksgnk van, az az, hogy akkor rzkeljk a hibt, amikor
olyan llapotba jutunk, ahonnan a terv htralev rsze mr nem mkdik. A tervmonitorozs (plan
monitoring) ezt gy ri el, hogy a teljes htralev tervben szerepl elfelttelek sikeressgt ellenrzi, azaz a
terv minden lpsnek elfeltteleit, kivve azokat, amelyeket a htralv terv egy msik lpsvel r el. A
tervmonitorozs a hibs terv vgrehajtst a lehet leghamarabb megszaktja, azaz nem vrja meg, mg a hiba
valjban fellp.13 Nhny esetben ez az genst a teljes bukstl mentheti meg, amikor a hibs terv egy olyan
zskutcba vezetne, melybl a cl mr elrhetetlen.
Elg kzenfekv a tervkszt algoritmus mdostsa, hogy az a terv minden pontjn tartalmazza a htralev
terv sikerhez szksges elfeltteleket. Ha a tervmonitorozst kiterjesztjk, hogy az aktulis pont helyett az
sszes jvbeni pontra ellenrizze, hogy az aktulis llapot kielgti-e a terv elfeltteleit, akkor a
tervmonitorozs kihasznlhatja a szerencss rbukkanst (serendipity), azaz a vletlenszer sikert. Ha valaki
arra jrtban pirosra festi az asztalt ugyanabban az idben, amikor az gens a szket festi pirosra, akkor a vgs
terv elfelttelei teljeslnek (a cl teljesl), s az gens korbban megpihenhet.
Eddig a monitorozst s jratervezst a teljesen megfigyelhet krnyezetek esetre mutattuk be. A rszlegesen
megfigyelhet krnyezetek esetn jval komplikltabb problmk lphetnek fel. Elszr is olyan hibk
lphetnek fel, amelyet az gens nem tud rzkelni. Msodszor az elfelttelek ellenrzse rzkel
cselekvsek vgrehajtst teheti szksgess, amelyet tervezni kell vagy a tervksztsi idben, ami a feltteles
tervksztshez vezet vissza, vagy a vgrehajtsi idben. A legrosszabb esetben az rzkelsi cselekvsek
vgrehajtsa sszetett tervet ignyel, melyhez monitorozs, gy tovbbi rzkelsi cselekvsek szksgesek. s
ez gy megy tovbb. Ha az gens ragaszkodik minden elfelttel ellenrzshez, akkor elkpzelhet, hogy
sohasem jut hozz, hogy valjban tegyen is valamit. Az gensnek csak a fontos vltozk ellenrzst kellene
szem eltt tartani, melyek j esllyel okoznak hibt, s nem tl drga a megfigyelsk. Ez lehetsget ad az
gensnek, hogy megfelelkppen reagljon a fontos fenyegetsekre, de ne vesztegessen idt annak
ellenrizgetsre, hogy sszeomlik-e az g.
Miutn bemutattuk a monitorozs s jratervezs mdszert, meg kell krdeznnk: Mkdik? Ez meglepen
becsaps krds. Ha a krdst gy rtelmezzk, hogy Garantlni tudjuk-e, hogy az gens mindig, mg nem
korltos nemdeterminisztikussg esetn is clt r?, akkor a vlasz nem, hiszen az gens figyelmetlensgbl
zskutcba juthat, csakgy, mint a 4.5. alfejezetben bemutatott online keress. Pldul lehet, hogy a
porszvgens nem tudja, hogy az elemei kifogyhatnak. Zrjuk ki a zskutckat, azaz ttelezzk fel, hogy az
gens olyan tervet tud ltrehozni, amelyben a clt a krnyezet brmely llapotbl elri. Ha felttelezzk, hogy
a krnyezet valban nemdeterminisztikus, abban az rtelemben, hogy egy ilyen tervnek egy adott vgrehajtsa
esetn mindig van valamekkora eslye a sikerre, akkor az gens szksgszeren clt r. Az jratervez gens
kpessgei ezrt megfelelnek a feltteles tervkszt gens kpessgeinek. Valjban mdosthatjuk a feltteles
tervksztt, hogy csak rszleges megoldst ksztsen, amely if <teszt> then terv_A else jratervez formj
lpseket tartalmaz. Az emltett korltozsokkal egy ilyen terv megfelel megoldsa lehet az eredeti
problmnak, s elksztse szintn sokkal olcsbb lehet, mint a teljes feltteles tervnek.
Hiba akkor lp fel, ha az gens ismtelt ksrletei is sikertelenek a cl elrsben, azaz valamilyen, szmra
ismeretlen elfelttel vagy kvetkezmny blokkolja. Pldul ha az gens rossz kulcskrtyt kap a
A tervmonitorozs okosabb teszi az gensnket egy ganajtr bogrnl (lsd 2.3. szakasz - Mindentuds, tanuls s autonmia rszben).
Az gensnk szrevenn, hogy a ganaj mr nincs a lbainl, jratervezne, hogy szerezzen egy msikat, s azzal zrn le a lyukat.
13
392

vilgban
hotelszobjhoz, akkor nincs az a beillesztsi s eltvoltsi prblkozs, ami kinyitn az ajtt. 14 Egy megolds,
hogy ugyanazon terv ismtelgetse helyett vletlenszeren vlasztunk egy lehetsges javtterv halmazbl.
Ebben az esetben egy j kulcskrtya krse a recepcirl hasznos alternatv javt terv. Mivel nem biztos, hogy
az gens kpes a valban nemdeterminisztikus esetet s a hibavalsg esett megklnbztetni, egy kis
vltozatossg a javtsban ltalnossgban is j tlet.
A helytelen cselekvs problmjra egy msik megolds a tanuls. Nhny prblkozs utn a tanul gensnek
kpesnek kell lennie a cselekvslers mdostsra, hogy az ignyelje, hogy a kulcs nyissa az ajtt. Ezen a
ponton az jratervez automatikusan egy j tervvel ll el, mint egy j kulcs megszerzse. A 21. fejezet ezt a
fajta tanulst mutatja be.
Az jratervez gensnek mg ezekkel a lehetsges javtsokkal is vannak tovbbi htrnyai. Nem hatkony a
vals idej krnyezetekben, s nincs korlt az jratervezsi idre, ezltal nincs korlt a cselekvsrl val dnts
idejre sem. Szintn kptelen sajt clokat kialaktani vagy a meglv clokhoz j clokat fogadni, azaz nem
lehet hossz let egy sszetett krnyezetben. Ezeket a htrnyokat kezeljk a kvetkez fejezetben.
6. Folytonos tervkszts
Ebben az alfejezetben olyan genst terveznk, amely meghatrozatlanul sokig kitart egy krnyezetben. gy ez
nem egy problmamegold, ami egyetlen clt szeretne elrni s ezt tervezi, s addig cselekszik, amg a clt el
nem ri, hanem folyamatosan vltoz clok, tervksztsi s cselekvsi fzisok sorozatt li meg. Ahelyett hogy
a tervksztt s a cselekvsmonitorozt mint klnll, de egymsnak eredmnyeket szolgltat folyamatokat
tekintetnnk, a folytonos tervkszt gensben (continuous planning agent) ezeket egyetlen folyamatknt
kpzeljk el.
Az gensre mindig gy gondolunk, mint ami rsze egy terv vgrehajtsnak, az lete nagy tervnek. Cselekvsei
tartalmazzk a vgrehajtsra kszen ll terv lpseinek vgrehajtst, a nyitott elfelttelek kielgtsre vagy a
konfliktusok feloldsra szolgl tervfinomtst, a vgrehajts sorn nyert j informcik fnyben a terv
mdostst. Nyilvnval, hogy amikor elszr j clt forml, az gensnek nincsenek vgrehajtsra ksz
cselekvsei, ezrt egy kis idt a rszleges terv elksztsvel tlt. Nagyon is lehetsges azonban, hogy az gens a
terv teljes befejezse eltt elkezdi a vgrehajtst, klnsen ha fggetlen rszclokat kell elrni. A folytonos
tervkszt gens folyamatosan monitorozza a vilgot, az j megfigyelsek alapjn mdostja ennek modelljt,
mg akkor is, ha elkpzelsei mg mindig vltoznak.
Elszr egy pldn haladunk vgig, majd bemutatjuk az gens programjt, amelyet FOLYTONOS-RRT-GENS-nek
neveznk, mivel a tervezett cselekvsek reprezentlsra rszben rendezett terveket hasznl. Hogy a lerst
egyszerstsk, teljesen megfigyelhet krnyezetet feltteleznk. Ugyanezen technikk kiterjeszthetk a rszben
megfigyelhet esetre is.
A pldnk a kockavilg problmakrbl szrmazik (lsd 11.1. alfejezet). A kiindul llapot a 12.15. (a) brn
lthat. A Mozgat(x, y) cselekvsre van szksgnk, ami az x kockt az y kockra mozgatja, amennyiben
mindketten szabadok. A cselekvs smja:
Cselekvs(Mozgat(x, y),
Elfelttel:Tiszta(x) Tiszta(y) Rajta(x, z)
Kvetkezmny:Rajta(x, y) Tiszta(z) Rajta(x, z) Tiszta(y)
Az gensnek elszr egy clt kell megfogalmaznia. Itt nem trgyaljuk a clkialaktst, helyette felttelezzk,
hogy az gensnek valahogy megmondtk (vagy sajt maga eldnttte), hogy a Rajta(C, D) Rajta(D, B) clt
kell elrnie. Az gens ehhez a clhoz kezdi a tervezst. Ellenttben minden msik gensnkkel, amelyek
lekapcsoljk rzkeliket, amg a tervkszt egy teljes megoldst nem ad a problmra, a folytonos tervkszt
gens inkrementlisan pt egy tervet, ahol a terv minden bvtse egy korltos idtartamot vehet ignybe.
Minden bvts utn az gens egy NoOp cselekvst ad vissza, s ellenrzi az rzkelseit. Felttelezzk, hogy az
rzkelt adatok nem vltoznak, s az gens gyorsan megalkotja a 12.16. brn lthat tervet. Vegyk szre,
hogy br mindkt cselekvs elfeltteleit teljesti az Indt llapot, van egy kvetsi megkts, ami a Mozgat(D,
A tervjavts hatstalan ismtlse pontosan megfelel a szcskel darzs viselkedsnek (lsd 2.3. szakasz - Mindentuds, tanuls s
autonmia rszben).
14
393

vilgban
B) cselekvst a Mozgat(C, D) el helyezi. Erre azrt van szksg, hogy a Tiszta(D) igaz maradjon, amg a
Mozgat(D, B) befejezdik. A folytonos tervksztsi folyamat alatt az Indt mindig az aktulis llapot cmkje.
Az gens minden cselekvs utn mdostja az llapotot.
A terv kszen ll a vgrehajtsra, de mg mieltt az gens cselekedhetne, a krnyezet kzbeszl. Egy kls
gens (taln az gens tantja vlt trelmetlenn) a (d) kockt a (b)-re helyezi, a vilg most a 12.15. bra (b)
llapotnak felel meg. Az gens ezt rzkeli, szreveszi, hogy a Tiszta(B) s a Rajta(D, G) mr nem igaz az
aktulis llapotban, s ennek megfelelen mdostja az aktulis llapot modelljt. Az okozati kapcsolatok,
amelyek a Mozgat(D, B) cselekvs Tiszta(B) s Rajta(D, G) elfeltteleit adtk, mr nem helyesek, el kell
tvoltani ket a tervbl. Az j tervet a 12.17. bra mutatja. Minden pillanatban az Indt az aktulis llapotot
reprezentlja, gy ez az Indt klnbzik az elz bra hasonl llapottl. Vegyk szre, hogy a terv most nem
teljes: a Mozgat(D, B) elfelttelei kzl kett nyitott, s a Rajta(D, y) most nem pldnyostott, mert mr nincs
okunk felttelezni, hogy a lps a G-rl indul.
Az gens most kihasznlhatja a segt kzbeavatkozst, szrevve, hogy a
okozati kapcsolat helyettesthet az Indt-bl a Befejez llapotba mutat direkt kapcsolattal. Ezt a folyamatot az
okozati kapcsolat kiterjesztsnek (extension) nevezzk, s akkor alkalmazzuk, amikor egy felttel egy
ksbbi helyett egy korbbi lpssel biztosthat, j tkzs okozsa nlkl.
12.15. bra - Az llapotok sora, amint a folytonos tervkszt gens megprblja a (d)nek megfelel Rajta(C, D) Rajta(D, B) clllapotot elrni. A kiindul llapot az (a). A
(b) llapotnl egy msik gens kzbelpett s (d)-t (b)-re helyezte. A (c) llapotban az
gens a Mozgat(C, D) cselekvst hajtotta vgre, ami sikertelen volt, (c)-t az (a)-ra ejtette.
jraprblja a Mozgat(C, D) cselekvst, amivel elri a (d) clllapotot.
12.16. bra - A folytonos tervkszt gens ltal ksztett kiindul terv. A terv egyelre
nem klnbzik egy tlagos rszben rendezett tervkszt ltal ksztettl.
12.17. bra - Miutn valaki ms elmozdtotta a D kockt a B-re, a Tiszta(B) s a Rajta(D,

G) biztostsra szolgl kapcsolatokat eldobjuk, ami ezt a tervet eredmnyezi
Miutn a rgi Mozgat(D, B) s Befejez kztti okozati kapcsolatot eltvoltottuk, a Mozgat(D, B) tovbbiakban
nem forrsa egyetlen okozati kapcsolatnak sem. Ez most egy redundns lps (redundant step). Minden
redundns lpst s brmely ezt biztost kapcsolatot kitrlnk a tervbl. Ez a 12.18. brn lthat tervet
eredmnyezi.
394

vilgban
Most a Mozgat(C, D) lps kszen ll a vgrehajtsra, hiszen az Indt lps kielgti minden elfelttelt, nincs
szksg ms megelz lpsre, s nem tkzik a terv egyetlen msik kapcsolatval sem. A lpst eltvoltjuk a
tervbl, s vgrehajtjuk. Sajnos az gens gyetlen, s a C-t az A-ra ejti a B helyett, ami a 12.15. bra (c) llapott
eredmnyezi. Az j tervllapotot a 12.19. bra mutatja. Vegyk szre, hogy br most nincsenek cselekvsek a
tervben, a Befejez lpsnek mg mindig van egy nyitott felttele.
Az gens gy dnt, hogy a nyitott felttelhez kszt tervet. jra a Mozgat(C, D) elgti ki a clfelttelt. Ennek
elfeltteleit az Indt lpsbl indul j okozati kapcsolatok teljestik. Az j tervet a 12.20. bra mutatja.
12.18. bra - A Mozgat(C, D) ltal ltrehozott kapcsolatot helyettestettk az Indt

kapcsolatval, a most mr redundns Mozgat(D, B) lpst pedig elhagytuk
12.19. bra - A Mozgat(C, D) vgrehajtsa s a tervbl val eltvoltsa utn az Indt

lps kvetkezmnyei azt a tnyt tkrzik, hogy a C a vrt D helyett az A kockra
kerlt. A Rajta(C, D) cl elfelttel mg minding nyitott.
12.20. bra - A nyitott elfelttelt a Mozgat(C, D) ismtelt hozzadsval oldjuk fel.

Vegyk szre az elfelttelekhez szksges j kapcsolatokat.
A Mozgat(C, D) jra kszen ll a vgrehajtsra. Ez alkalommal mkdik, ami a clllapotot eredmnyezi,

melyet a 12.15. bra (d) rsze mutat. Miutn egy lpst elhagyunk a tervbl, a Rajta(C, D) clfelttel jra
nyitott vlik. Mivel az Indt lpst frisstettk, hogy tkrzze az j llapotot, a clfelttel azonnal kielgthet
egy kapcsolattal az Indt lpsbl. Ez az esemnyek normlis folysa, ha egy cselekvs sikeres. A vgleges
tervllapotot a 12.21. bra mutatja. Mivel az Indt lps az sszes clfelttelt kielgti, s nincsenek htralev
cselekvsek, az gens szabadon eltvolthatja a Befejez llapot cljait, s j clokat fogalmazhat meg.
12.21. bra - A Mozgat(C, D) vgrehajtsa s tervbl eltvoltsa utn a Rajta(C, D)

megmaradt nyitott felttelt az Indt lpsbl indul okozati kapcsolat hozzadsval
oldjuk fel. A terv most teljes.
Ebbl a pldbl lthat, hogy a folytonos tervkszts nagyban hasonlt a rszben rendezett tervksztshez.
Minden iterciban az algoritmus tall valami tervsrlsnek (plan flaw) nevezett javtanivalt a tervben, s
megjavtja. A rszben rendezett tervkszt algoritmus egy srlseltvolt algoritmusnak tekinthet, ahol a
395

vilgban
ktfle srls a nylt elfelttel s az okozati tkzs lehet. A folytonos tervkszt gens msrszrl srlsek
egy jval szlesebb krt kezeli:
Hinyz cl: az gens eldntheti, j clt vagy clokat ad a Befejez llapothoz. (Folytonos tervksztsben
rtelmesebb lenne a Befejez llapot nevt rkkvalsg-ra s az Indt-t Aktulis-ra vltoztatni, de
ragaszkodunk a hagyomnyokhoz.)
Nylt elfelttel: egy okozati kapcsolatot ad a nylt elfelttelhez, egy meglv vagy egy j cselekvst
vlasztva (mint a rszben rendezett tervksztben).
Okozati tkzsek: adott az
ok-okozati kapcsolat s a p kvetkezmny C cselekvs. Vlasszunk
az tkzs feloldshoz egy rendezsi megktst vagy egy vltozmegktst (mint a rszben rendezett
tervksztsben).
Nem tmogatott kapcsolat: ha van egy
ok-okozati kapcsolat, ahol a p nem igaz az Indt
llapotban, akkor tvoltsuk el a kapcsolatot. (Ez megv minket attl, hogy vgrehajtsunk egy olyan
cselekvst, melynek elfelttelei hamisak.)
Redundns cselekvsek: ha egy A cselekvs nem eredmnyez ok-okozati kapcsolatokat, akkor tvoltsuk el a
kapcsolataival egytt. (Ez lehetv teszi szmunkra, hogy kihasznljuk a szerencss helyzeteket.)
Vgrehajtatlan cselekvs: ha egy (a Befejez-tl eltr) A cselekvsnek, melynek az elfeltteleit az Indt
kielgti, nincs (az Indt-tl eltr) cselekvs el sorolva, s nem tkzik okozati kapcsolatokkal, akkor
tvoltsuk el A-t s ok-okozati kapcsolatait, majd adjuk vissza mint a vgrehajtand cselekvst.
Szksgtelen trtnelmi cl: ha nincsenek nylt elfelttelek s nincsenek a tervben cselekvsek (azaz minden
ok-okozati kapcsolat kzvetlen az Indt-bl a Befejez llapotba mutat), akkor elrtk az aktulis clhalmazt.
Tvoltsuk el a clokat s az ezekbe mutat kapcsolatokat, hogy j clokat tegynk lehetv.
A 12.22. bra a Folytonos-RRT-gens-t mutatja be. Ennek ciklusa az rzkels, eltvolts a folyamatbl,
cselekvs. Tudsbzisban egy lland tervet tart, s minden lpsben eltvolt egy folyamatot ebbl a tervbl.
Ezutn cselekszik (br gyakran ez a cselekvs a NoOp) s ismtli a ciklust. Ez az gens az 5. szakasz Vgrehajts monitorozsa s jratervezse rszben trgyalt jratervez genshez felsorolt problmk nagy
rszt kpes kezelni. Nevezetesen vals idben cselekszik, kezeli a kedvez helyzeteket, sajt clokat fogalmaz
meg, s kezeli a vratlan esemnyeket, melyek a jvbeli terveket rintik.
12.22. bra - A FOLYTONOS-RRT-GENS, egy folytonos, rszben rendezett tervkszt gens.

Egy rzkels utn az gens eltvolt egy lpssorozatot a folytonosan javtott tervbl,
s visszaad egy cselekvst. Gyakran szmos cselekvssor-eltvolt tervksztsi lpsre
van szksg, mialatt csak a NoOp-ot adja vissza, mieltt kszen llna egy vals cselekvs
vgrehajtsra.
7. Multigens tervkszts
Eddig egygenses krnyezetekkel (single-agent enviroments) foglalkoztunk, amelyben az gensnk egyedl
van. Amikor ms gensek is jelen vannak a krnyezetben, az gensnk egyszeren hozzveheti ket a
krnyezetrl alkotott modelljhez, az alapvet algoritmusainak mdostsa nlkl. Sok esetben azonban ez
gyenge teljestmnyhez vezetne, mert tbbi genssel val foglalkozs nem azonos a krnyezet kezelsvel.
396

vilgban
Nevezetesen, a termszet (felttelezheten) kzmbs az gens szndkait illeten, mg ms gensek nem. 15 Ez
az alfejezet ezen krdsek kezelsre a multigens tervksztst mutatja be.
A 2. fejezetben lthattuk, hogy a multigens krnyezetek lehetnek egyttmkdk (cooperative) vagy
versengk (competitive). Egy nagyon egyszer kooperatv pldval kezdnk: egy pros teniszcsapat
tervksztsvel. Olyan tervek alkothatk, amelyek a csapat mindkt jtkosnak a cselekvseit meghatrozzk.
Az ilyen tervek hatkony elksztshez hasznlhat technikkat mutatjuk be. A hatkony tervkszts hasznos,
de nem garantlja a sikert. Az genseknek egyet kell rtenik a felhasznlt tervben! Ez valamilyen koordincit
(coordination) felttelez, amit valsznleg kommunikcival (communication) rhetnk el.
7.1. Kooperci: kzs clok s tervek

A pros teniszt jtsz genscsapatoknak kzs cljuk van, a meccs megnyerse, ami klnbz rszclokat
eredmnyez. Tegyk fel, hogy a jtk egy pontjn a kzs cljuk az tttt labda visszaadsa gy, hogy
legalbb egyikjk a hlt vdi. Ezt a gondolatot egy multigens tervksztsi (multiagent planning)
problmval rhatjuk le, amint azt a 12.23. bra is mutatja.
12.23. bra - A pros tenisz problma. Kt gens egytt jtszik, s ngy pozci
egyikben lehetnek: [Bal, Alapvonal], [Jobb, Alapvonal], [Bal, Hl] s [Jobb, Hl]. A
labda visszaadhat, ha pontosan egy jtkos van a megfelel helyen.
Ez a jellsrendszer kt jdonsgot vezet be. Elszr az gens(A, B) deklarlja, hogy kt gensnk van, A s B,
akik a tervben szerepelnek. (Ebben a problmban a szemben ll jtkosokat nem gensnek vesszk.)
Msodszor minden cselekvs az genst explicit mdon, mint egy paramtert emlti, mert pontosan kvetnnk
kell, melyik gens mit csinl.
A multigens tervksztsi problma megoldsa egy egyttes terv (joint plan), amely minden genshez
tartalmaz cselekvseket. Az egyttes terv egy megolds, ha a clt elrjk azltal, hogy mindegyik gens
vgrehajtja a szmra kijellt cselekvseket. A kvetkez terv a tenisz problma egy megoldsa :
Terv1:
A: [Megy(A, [Jobb, Alapvonal]), t(A, Labda)]
B: [NoOp(B), NoOp(B)]
Ha mindkt gens ugyanazzal a tudsbzissal rendelkezne, s ez lenne az egyetlen megolds, akkor minden
rendben lenne; minden gens meghatrozn a megoldst, s egyttesen vgrehajtank. Az gensek szmra
sajnlatos (s hamarosan ltni fogjuk, hogy ez mirt sajnlatos), hogy van egy msik terv is, ami az elshz
hasonlan kielgti a clt:
Terv 2:
15
Nem biztos, hogy az Egyeslt Kirlysg laki, ahol egy pikniknek mr pusztn a tervezse is est garantl, egyetrtenek ezzel.
397

vilgban
A: [Megy(A, [Bal, Hl]), NoOp(A)]
B: [Megy(B, [Jobb, Alapvonal]), t(B, Labda)]
Ha az A a 2. tervet vlasztja, s B az 1-et, akkor senki sem fogja visszaadni a labdt. Fordtva, ha A az 1-et s B
a 2-t vlasztja, akkor vrhatan sszetkznek egymssal, senki nem adja vissza a labdt, s a hl is
fedezetlenl marad. Ezrt a helyes egyttes terv ltezse nem jelenti, hogy a clt el is rjk. Az genseknek
szksgk van egy koordincis (coordination) mechanizmusra, hogy ugyanazt az egyttes tervet rjk el, st
mi tbb, az gensek kzs tudssal is kell rendelkezzenek (lsd 10. fejezet) arrl, hogy melyik egyttes tervet
hajtjk vgre.
7.2. Tbbtest tervezs

Ez az alfejezet a megfelel egyttes tervek megalkotsra fkuszl, elodzva egyelre a koordincis
krdskrt. Ezt tbbtest tervksztsnek (multibody plannining) nevezzk, s tulajdonkppen az a
tervksztsi problma, mellyel egy egyedlll centralizlt gens ll szemben, mely cselekvseket diktlhat
minden fizikai entitsnak. Egy valban multigens esetben ez lehetv teszi minden gens szmra, hogy
feldertse melyek a lehetsges egyttes tervek, melyek egyttes vgrehajtsa sikeres lenne.
Megkzeltsnkben a tbbtest tervksztst a 11.3. alfejezetben bemutatott rszben rendezett tervksztsre
alapozzuk. Az egyszersg kedvrt teljes megfigyelhetsget feltteleznk. Van mg egy krds, ami nem
merl fel az egyedlll gens esetn: a krnyezet a tovbbiakban nem igazn statikus (static), mert a tbbi
gens cselekedhet, amg egy bizonyos gens gondolkozik. Ezrt foglalkoznunk kell a szinkronizcival
(synchronization). Az egyszersg kedvrt felttelezzk, hogy minden cselekvs vgrehajtsi ideje azonos,
illetve hogy az sszetett terv minden pontjn a cselekvsek vgrehajtsa szimultn trtnik.
Brmely idpontban minden gens pontosan egy cselekvst hajt vgre (belertve a NoOp(res) opertort is).
Ezen konkurens cselekvsek halmazt egyttes cselekvsnek (joint action) nevezzk. A tenisz problmban
(7.1. szakasz - Kooperci: kzs clok s tervek rszben) pldul a NoOp(A), t(B, Labda) az A s B
genseknek egy egyttes cselekvse. Egy egyttes terv egyttes cselekvsek rszben rendezett grfja. Pldul a
tenisz problma msodik terve az egyttes cselekvsek kvetkez sorozatval rhat le:
Megy(A, [Bal, Hl]), Megy(B, [Jobb, Alapvonal])
NoOp(A), t(B, Labda)
Vgrehajthatnnk a tervksztst a hagyomnyos rszben rendezett tervkszt algoritmussal, azt az sszes

lehetsges egyttes cselekvs halmazra futtatva. Az egyetlen problma a halmaz mrete: 10 cselekvssel s 5
genssel 105 egyttes cselekvst kapunk. Elg unalmas lenne az sszes cselekvs elfelttelt s
kvetkezmnyt helyesen definilni, s nem lenne hatkony egy ilyen nagy halmazzal tervezni.
Egy msik lehetsg az egyttes cselekvsek implicit definilsa gy, hogy minden egyes cselekvshez lerjuk,
hogy milyen klcsnhatsban ll a tbbi lehetsges cselekvssel. Ez egyszerbb lenne, hiszen a legtbb
cselekvs fggetlen a legtbb msiktl, ezrt csak azon nhny cselekvst kellene listznunk, amelyek valjban
klcsnhatsban vannak. Ezt a hagyomnyos STRIPS vagy ADL cselekvslersok egy j tulajdonsggal val
kiterjesztsvel tehetjk meg: ez a konkurens cselekvsek listja (concurrent action list). Ez nagyon hasonlt
a cselekvs lersban szerepl elfelttelhez, kivve, hogy az llapotvltozk lersa helyett ez cselekvseket r
le, amelyeket egyszerre kell, vagy ppen nem szabad egyszerre vgrehajtani. Pldul a Tallat cselekvs a
kvetkezkppen rhat le:
Cselekvs(t(A, Labda),
Konkurens:t(B, Labda)
Elfelttel:Megkzelt(Labda, [x, y]) Ott(A, [x, y])
Kvetkezmny:Visszaadott(Labda))
Itt egy tilt egyidejsgi megktsnk van, azaz az t cselekvs vgrehajtsa alatt egy msik gens nem hajthat
vgre egy msik t cselekvst. Hasonlkppen megkvetelhetnk egyidej cselekvst. Pldul amikor kt
gensre van szksg egy dtkkel teli httska teniszplyhoz cipelshez. Ezen cselekvs lersa azt fejezi
ki, hogy az A gens nem hajthatja vgre a Cipel cselekvst, hacsak nincs egy msik B gens, aki egyidejleg egy
Cipel cselekvst hajt vgre ugyanazon httskval:
398

vilgban
Cselekvs(Cipel(A, httska, itt, ott),
Konkurens:Cipel(B, httska, itt, ott)
Elfelttel:Ott(A, itt) Ott(Httska, itt) Httska(httska)
Kvetkezmny:Ott(A, ott) Ott(httska, ott)
Ott(A, itt) Ott(httska, itt))
Ezen reprezentci segtsgvel a rszben rendezett tervkszthz nagyon kzeli tervkszt hozhat ltre.
Mindssze hrom klnbsg van:
1. Az A B temporlis rendezsi relcit kiegsztend megengedjk az A = B-t s az
egyidejsget, illetve megelzsget vagy egyidejsget jelent.
-t, ami
2. Amikor egy j cselekvs egyidej cselekvseket ignyel, pldnyostani kell ezen cselekvseket a terv j
vagy ltez cselekvseinek felhasznlsval.
3. A tiltottan egyidej cselekvsek a megktsek jabb forrsai. Minden megktst fel kell oldani az tkz
cselekvsek egyms el vagy mg rendelsvel.
Ez a reprezentci a tbbtrzs problmakrkhz alkalmazott, rszben rendezett tervksztvel ekvivalens.
Kiterjeszthetnnk ezt a megkzeltst az utols kt fejezet finomtsaival HFH-ek rszleges megfigyelhetsg,
felttelek, vgrehajts-monitorozs s jratervezs , de ez tlmutat a knyv clkitzsein.
7.3. Koordinl mechanizmusok

A legegyszerbb mdszer, amivel gensek egy csoportja biztosthatja az egyetrtst egy egyttes tervben, hogy
egy konvencit (convention) fogadnak el az egyttes cselekvs megkezdse eltt. A konvenci az egyttes
tervek kztti vlasztsra vonatkoz brmely olyan megkts, amely tlmutat az alapmegktsen, amely szerint
egy egyttes tervnek mkdni kell, ha minden gens alkalmazza. Pldul a maradj a sajt trfeleden
konvenci a pros partnereket a msodik terv kivlasztsra sarkallja, mg az egy jtkos mindig a hlnl
marad konvenci az egyes tervhez vezetn ket. Nhny konvenci, mint az t megfelel oldaln val vezets,
olyan szles krben elterjedt, hogy ezeket mr trsadalmi trvnyszersgekknt (social laws) kezeljk. Az
emberi nyelvek szintn konvenciknak tekinthetk.
Az elz alfejezet konvencii alkalmazsi terlet specifikusak s a cselekvslersok megktseivel
implementlhatk, amelyekkel kizrjuk a konvencik megszegseit. Egy ltalnosabb megkzelts, hogy
problmakr-fggetlen konvencikat hasznljunk. Pldul ha mindegyik gens ugyanazon tbbtest tervkszt
algoritmust futtatja ugyanazon bemenetekkel, kveti azt a konvencit, miszerint az elsknt megtallt,
hasznlhat sszetett tervet hajtsa vgre, mikzben biztos benne, hogy a tbbi gens ugyanezzel a vlasztssal
l. Egy sokkal robusztusabb, de jval kltsgesebb stratgia lenne az sszes sszetett terv elksztse, majd az
ebbl val vlaszts (mondjuk annak kivlasztsa, amelynek lert reprezentcija bc-sorrendben az els).
Konvencik szintn addhatnak a folyamatok evolcis fejldsvel. Pldul a kzssgben l rovarok nagyon
kidolgozott sszetett terveket hajtanak vgre, melyeket a kolnia egyedeinek kzs genetikus sszelltsa
biztost. Az azonossgot szintn nyomatkostja a tny, hogy a konvenciktl val eltrs cskkenti az
evolcis alkalmassgot, gy brmely alkalmazhat sszetett terv stabil egyenslyi helyzetet eredmnyezhet.
Hasonl megfontolsok alkalmazhatk az emberi nyelv fejldsre, ahol nem az a fontos, hogy egyes
szemlyek milyen nyelvet beszlnek, hanem az a tny, hogy minden szemly ugyanazt a nyelvet beszli.
Egy utols plda a madarak gylekezsi viselkedse. Megfelel szimulcit nyerhetnk, ha minden egyes madr
gens (melyet nha madaroidnak vagy roidnak (boid) neveznk) a kvetkez hrom szablyt kveti valamilyen
kombinci alapjn:
1. Klnvls: tvolodjunk el a szomszdoktl, amikor tl kzel kerlnk;
2. Kohzi: kerljnk tlagos tvolsgra a szomszdainktl;
3. Irnyultsg: kerljnk a szomszdokhoz kpest tlagos orientciba (haladsi irnyba).
399

vilgban
Ha minden madr azonos szablyrendszert hajt vgre, a csapat replse egy kialakul viselkedst (emergent
behavior) mutat, hasonlan egy nagyjbl azonos srsg pszeudomerev test viselkedshez, amely nem
bomlik fel az id sorn. Mint a bogaraknl, itt sincs szksg arra, hogy minden gens ismerje a teljes sszetett
tervet, ami a tbbi gens cselekvst modellezi.
A konvencik ahelyett, hogy minden egyes j problmhoz kifejlesztennk ket, tipikusan egyedi multigens
tervkszt problmk egy egsz csoportjhoz kszlnek. Ez rugalmatlansghoz s hibhoz vezethet, amit nha
lthatunk, ha a pros tenisz jtszmban a labda nagyjbl azonos tvolsgra van a kt partner kztt. Egy
alkalmazhat konvenci hinyban az gensek kommuniklhatnak (communication), hogy egy kzs tudst
rjenek el az alkalmazhat sszetett tervbl. Pldul a teniszpros egy jtkosa felkilthat Enym! vagy
Tid!, hogy jelezze a preferlt tervet. A kommunikcis mechanizmusokat nagyobb mlysgben a 22.
fejezetben trgyaljuk, ahol megfigyelhetjk, hogy a kommunikci nem szksgszeren szbeli
informcicsert jelent. Pldul egy jtkos gy is kzlheti az ltala elnyben rszestett sszetett tervt a
msikkal, hogy vgrehajtja annak kezd rszlett. A teniszjtszma problmnkban, ha az A gens elindul a
hlhoz, akkor a B gens rknyszerl, hogy visszamenjen az alapvonalhoz megtni a labdt, mivel a msodik
terv az egyetlen sszetett terv, ami A hlhoz mozgsval kezddik. Ez az irnytsi megkzelts, amelyet
gyakran a terv felismersnek (plan recognition) neveznk, akkor mkdik, ha egyetlen cselekvs (vagy
cselekvsek rvid sorozata) elegend, hogy egyrtelmen azonostsuk az sszetett tervet.
Azt a terhet, amely biztostja, hogy az gensek egy sikeres sszetett tervhez jussanak, vagy az gensek
ksztire, vagy magukra az gensekre helyezhetjk. Az els esetben mieltt az gensek tervezni kezdennek, az
gens ksztjnek bizonytania kell, hogy az gensek szablyai s stratgii sikeresek lesznek. Az gensek
nmagukban lehetnek reaktvak, amennyiben ez mkdik az ket krlvev krnyezetben, valamint ha nem
kell, hogy pontos modelljk legyen a tbbi gensrl. Az utbbi esetben az gensek megfontoltak: bizonytaniuk
vagy demonstrlniuk kell, hogy a tervk hatkony lesz, figyelembe vve a tbbi gens megfontolsait. Pldul
egy A s B logikai genst tartalmaz krnyezetben mindketten rendelkezhetnek a kvetkez defincival:
p, s Megfelel(p, s) KzsTuds({A, B}, Elri(p, s, Cl))
Ez azt mondja, hogy brmely s szituciban, a p terv egy alkalmazhat sszetett terv, ha az gensek kzsen
tudjk, hogy a p elri a clt. Tovbbi aximkra van szksgnk, hogy biztostsuk egy adott sszetett terv
vgrehajtsra vonatkoz kzs szndk (joint intention) egyttes ismerett. Az gensek csak ebben az
esetben kezdhetnek cselekedni.
7.4. Versengs
A tbbgenses krnyezeteknek nem mindegyike ll egyttmkd gensekbl. Az egymsnak ellentmond
mkds gensek versenyben (competition) vannak egymssal. Erre egy pldt jelentenek a kt jtkost
ignyl, de zrus sszeg jtkok, mint amilyen a sakk. A 6. fejezetben lthattuk, hogy a sakkoz gensnek
figyelembe kell vennie az ellenfl kvetkez nhny lehetsges lpst is. Azaz egy verseng krnyezetben lev
gensnek (a) fel kell ismernie, hogy vannak ms gensek, (b) meg kell hatroznia a tbbi gens lehetsges
terveit, (c) meg kell hatroznia, hogy a tbbi gens hogyan tervezi a sajt terveivel val klcsnhatst, s (d) el
kell dntenie, hogy ezek fnyben mi a legjobb cselekvs. A versengs, hasonlan az egyttmkdshez, a tbbi
gens tervnek modelljt ignyli. Msrszrl, egy verseng krnyezetben nincs elhatrozs egy sszetett terv
mellett.
A 12.4. alfejezet felvzolta a jtkok s a feltteles tervksztsi problmk kztti analgit. A 12.10. brn
szerepl feltteles tervkszt algoritmus olyan tervet kszt, amely a krnyezetrl a legrosszabb esetet
felttelezve is mkdik, gy olyan versenyhelyzetekben is alkalmazhat, ahol az genst csak a siker vagy a
buks rdekli. Amikor az gens s ellenfelei a terv kltsgeivel is foglalkoznak, akkor a minimax megolds a
helynval. Eddig nagyon kevs munkt fordtottak a minimax mdszer olyan mdszerekkel val
kombinlsra, mint a rszben rendezett tervkszts vagy a HFH-tervkszts, ami tlmutat a 6. fejezetben
hasznlt llapottr-keressi modellen. A versengs krdsre a jtkelmlettel foglalkoz 17.6. alfejezetben mg
visszatrnk.
8. sszefoglals
400

vilgban
Ez a fejezet a valdi vilgban alkalmazott tervkszts s cselekvs nehzsgeivel foglalkozott. sszefoglaljuk a
f megllaptsokat.
A legtbb cselekvs erforrsokat (resources) hasznl, pldul pnzt, benzint vagy nyersanyagokat. Ezen
erforrsokat kszletekre vonatkoz mrszmokknt clszer kezelni, mintsem hogy megprbljunk
kvetkeztetni mondjuk a vilg minden egyes pnzrmjrl s paprpnzrl. A cselekvsek generlhatnak s
elfogyaszthatnak erforrsokat, s rendszerint olcs s hatkony, ha a tovbbi finomtsok vgrehajtsa eltt a
rszleges terveket ellenrizzk, hogy az erforrsokra vonatoz korltozsokat kielgtik-e.
Az id az egyik legfontosabb erforrs. Ez specilis temez algoritmusokkal kezelhet, vagy az temezst
integrlhatjuk a tervksztsbe.
A hierarchikus feladat hl (hierarchical task network) (HFH) tervkszts lehetv teszi az gens
szmra, hogy dekompozcis szablyok formjban tancsokat fogadjon el a feladatkr tervezjtl. Ez
lehetv teszi, hogy nagyon nagy terveket ksztsnk, amelyekre szmos valdivilg-beli alkalmazshoz
szksg van.
A hagyomnyos tervkszt algoritmusok teljes s helyes informcit s determinisztikus, teljesen
megfigyelhet krnyezetet feltteleznek. A legtbb problmakrre nem igaz ez a felttelezs.
A hinyos informci kezelhet azltal, hogy rzkel cselekvseket terveznk, amelyekkel megszerezzk a
szksges informcit. A feltteles tervek (conditional plans) lehetv teszik az gens szmra, hogy a
vgrehajts sorn rzkelje a krnyezett, hogy eldnthesse, mely gt kveti a tervnek. Nhny esetben
rzkelmentes (sensorless) vagy alkalmazkod tervkszts (conformant planning) hasznlhat az
rzkelst nem ignyl terv elksztshez. Mind az rzkelmentes, mind pedig a feltteles tervek
elllthatk a hiedelmi llapotok (belief states) terben trtn keresssel.
A helytelen informcik kielgtetlen elfeltteleket eredmnyeznek a cselekvsek s a tervek szmra. A
vgrehajts-monitorozs (execution monitoring) a terv sikeres befejezse rdekben rzkeli az
elfelttelek megszegseit.
Az jratervez gens (replanning agent) vgrehajts-monitorozst hasznl s szksg esetn javtsokat
szr be.
A folytonos tervkszt (continuous planning) gens elrehaladsa sorn j clokat alkot s vals idben
reagl.
Multigens (multiagent) tervezsre van szksg, amikor a krnyezetben ms gensek is tallhatk,
melyekkel egyttmkdni vagy versengeni kell, vagy amelyeket koordinlni kell. A tbbtest (multibody)
tervkszts az egyttes cselekvslersok hatkony dekompozcijt felhasznlva egyttes terveket alkot, de
ki kell egszteni valamilyen koordincival, amennyiben kt egyttmkd gensnek egyet kell rteni
abban, hogy melyik egyttes tervet hajtsk vgre.

A folytonos idvel val tervksztst elsknt DEVISER vetette fel (Vere, 1983). Az idnek a tervekben val
szisztematikus reprezentcijval Dean s trsai dolgoztak a FORBIN rendszerben (Dean s trsai, 1990). A
NONLIN+ (Tate s Whiter, 1984) s a SIPE (Wilkins, 1988; 1990) kezelni tudta a korltos erforrsok klnbz
tervlpsekhez val hozzrendelst. Az O-PLAN (Bell s Tate, 1985) HFH-tervkszt az id- s erforrskorltozsok egysges s ltalnos reprezentcijt tartalmazta. A szvegben emltett Hitachi-alkalmazs
kiegsztsekppen, az O-PLAN mdszert a Price Waterhouse-ban a szoftverbeszerzsi tervksztshez
alkalmaztk, mg a Jaguar Autgyrban a hts tengely sszeszerelsi tervnek ksztsnl. Szmos hibrid
tervkszt s temez rendszert alkalmaztak: az ISIS (FOX s trsai, 1982; Fox, 1990) egy temezsi
feladatban alkalmaztk a Westinghouse-nl, a GARI (Descotte s Latombe, 1985) mechanikus alkatrszek
gpestst s ksztst tervezte, a FORBIN-t gyr vezrlsre hasznltk, vgezetl a NONLIN+ hajzsi
logisztikai tervksztshez alkalmaztk.
Az 1980-as vekben megindult elmleti munka tetzse utn, napjainkban ismt a temporlis tervkszts kerl
eltrbe, amikor az j algoritmusok s a megnvekedett feldolgozsi teljestmny lehetv tette a gyakorlati
felhasznlst. A kt tervkszt a SAPA (Do s Kambhampati, 2001) s a T4 (Haslum s Geffner, 2001) elrefel
trtn llapottr keresst alkalmaztak, amit az idtartammal s erforrsokkal rendelkez cselekvsek
401

vilgban
kezelshez egy kifinomult heurisztikval egsztettek ki. Egy msik lehetsg a nagyon kltsges
cselekvsler nyelvek hasznlata, melyeket kzzel rt s alkalmazsi terlet specifikus heurisztikkkal
irnythatunk, amint az az ASPEN (Fukunaga s trsai, 1997), a HSTS (Jonsson s trsai, 2000) s az IxTeT
(Ghallab s Laruelle, 1994) esetn is trtnik.
Az temezs az rkutatsban nagyon hossz mltra tekint vissza. A T-SCHED (Drabble, 1990) rendszert az
UOSATII mhold kldetsvezrl parancssorozatainak temezsre hasznltk. Az O-PLAN-en alapul
OPTIMUM-AIV (Aarup s trsai, 1994) s a PLAN-ERS1 (Fuchs s trsai, 1990) az rreplgp-sszeszerelsben
a megfigyelsi tervksztsben hasznltk fel az Eurpai rkutatsi gynksgnl (ESA).
A SPIKE rendszert (Johnston s Adorf, 1992) a NASA-nl a Hubble-rteleszkp megfigyels-tervezshez
hasznltk, mg az rsikl fldi feldolgozstemez rendszer (Deale s trsai, 1994) emberi erforrs temezst
vgez egszen 16 000 munks-mszak rtkig. A Remote gens (Muscettola s trsai, 1998) lett az els nll
tervkszt s temez, mely rsiklt vezrelt, mialatt a Deep Space One rszonda fedlzetn replt 1999-ben.
Az emberi erforrs temezs irodalmt Vaessens s trsai (Vaessens s trsai, 1996) foglaltk ssze, az
elmleti eredmnyeket Martin s Shmoys (Martin s Shmoys, 1996) jelentette meg.
A STRIPS programban tallhat a macrops elemi lpsek sorozatbl ll makropertorok (macro
operators) tanulsra szolgl eszkztr, az els hierarchikus mechanizmusnak tekinthet (Fikes s trsai,
1972). A hierarchit szintn alkalmaztk a LAWALY rendszerben (Siklossy s Dreussi, 1973). Az ABSTRIPS
rendszer (Sacerdoti, 1974) az absztrakcis hierarchia (abstraction hierarchy) tlett vezette be, ahol a
magasabb szint tervezs megengedte a cselekvsek alacsonyabb szint elfeltteleinek figyelmen kvl
hagyst, hogy egy mkd terv ltalnos struktrjt szrmaztathassa. Austin Tate PhD-tzise (Tate, 1975b) s
Earl Sacerdoti (Sacerdoti, 1977) munkja a HTM tervkszts modern formjnak alaptleteit vezette be.
Szmos gyakorlati tervkszt, belertve az O-PLAN s a SIPE tervksztket, HFH-tervkszt. Yang (Yang,
1990) a HFH-tervksztst hatkonny tev cselekvsek jellemzit trgyalja. Erol, Hendler s Nau (Erol s
trsai, 1994, 1996) egy teljes hierarchikus dekompozcit alkalmaz tervksztt mutat be, valamint szmos
komplexitsbeli eredmnyt a tiszta HFH-tervksztkhz. Ms szerzk (Ambros-Ingerson s Steel, 1988);
Young s trsai (Young s trsai, 1994); Barrett s Weld (Barett s Weld, 1994); Kambhampati s trsai
(Kambhampati s trsai, 1998) az ebben a fejezetben bemutatott hibrid megkzeltst javasoltk, melyben a
dekompozcik mindssze a rszben rendezett tervksztshez hasznlhat finomtsok egy msik formjt
jelentik.
A STRIPS-ben szerepl makropertorokkal kezdden a hierarchikus tervkszts egyik clja a korbbi,
ltalnostott tervek formjban rendelkezsre ll tervksztsi tapasztalat jrahasznostsa. A
magyarzatalap tanuls (explanation-based learning) technikjt, amit rszleteiben a 19. fejezet mutat be,
szmos rendszerben, mint a SOAR Laird s trsai (Laird s trsai, 1986) s PRODIGY (Carbonell s trsai, 1989)
alkalmaztk a korbban elksztett tervek ltalnostsra. Egy msik megkzelts, hogy a korbban kiszmtott
terveket eredeti formjukban troljuk el, majd az j hasonl feladatokban az eredeti feladat analgijra
jrahasznostjuk ket. Ezt a megkzeltst esetalap tervksztsnek (case-based planning) (Carbonell, 1983;
Alterman, 1988; Hammond, 1989) nevezzk. Kambhampati (Kambhampati, 1994) rvelse szerint az esetalap
tervksztst a finomt tervksztshez hasonlan kellene vizsglni. Emellett lefekteti az esetalap rszben
rendezett tervkszts formlis alapjait.
A vals krnyezetek kiszmthatatlansgt s rszleges megfigyelhetsgt elsknt tervksztsi technikkat
hasznl robotikai projektekben belertve a Shakey (Fikes s trsai, 1972) s a FREDDY (Michie, 1974)
projekteket ismertk fel. A problmakr tbb figyelmet kapott McDermott nagy hats Tervezs s cselekvs
(Planning and Acting) c. cikknek megjelenst kveten (McDermott, 1978a).
A korai, feltteleket s ciklusokat nem tartalmaz tervksztk nem tkrztk pontosan a feltteles tervkszts
megkzeltsmdjt, de ennek ellenre nha knyszerten reagltak a krnyezet bizonytalansgra. Sacerdoti
NOAH rendszere knyszertst hasznlt a kulcsok s dobozok (keys and boxes) problma megoldsban, egy
olyan tervksztsi kihvsban, ahol a tervkszt keveset tud a kiindul llapotrl. Mason (Mason, 1993)
kijelentette, hogy a robotikai tervkszts nlklzni tudja s nlklznie is kell az rzkelst, s bemutatott egy
rzkelmentes tervet, ami a kiindulsi pozcitl fggetlenl kpes egy eszkzt csuklmozdulatok sorozatval
az asztal egy megadott pozcijba mozgatni. Ezt az tletet a robotika kontextusban trgyaljuk (lsd 25.17.
bra).
Goldman s Boddy (Goldman s Boddy, 1996) bevezettk az alkalmazkod tervkszts (conformant
planning) fogalmt, az rzkelmentes tervksztkre, melyek a bizonytalansgot a krnyezet ismert
llapotokba val knyszertsvel kezelik, megjegyezve, hogy az rzkelmentes tervek gyakran hatkonyak
402

vilgban
mg akkor is, ha az gens rendelkezik rzkelkkel. Az els megfelelen hatkony alkalmazkod tervkszt
Smith s Weld (Smith s Weld, 1998) Conformant Graphplan (CGP) rendszere volt. Ferraris s Giunchiglia
(Ferraris s Giunchiglia, 2000), valamint Rintanen (Rintanen, 1999) fggetlenl fejlesztettek ki SATPLAN-alap
alkalmazkod tervksztket. Bonet s Geffner (Bonet s Geffner, 2000) a hiedelmi llapotok tern vgzett
heurisztikus keressalap alkalmazkod tervksztt mutat be, olyan tletekre alapozva, melyeket elszr 1960ban fejlesztettek ki a rszlegesen megfigyelhet Markov dntsi folyamatokhoz (Partially Observable Markov
Decision Process POMDP) (lsd 17. fejezet). Jelenleg a leggyorsabb hiedelmi llapot alkalmazkod
tervksztk, mint pldul a HSCP (Bertoli s trsai, 2001a) binris dntsi diagramokat (BDD) (Bryant, 1992)
hasznlnak a hiedelmi llapotok lersra, valamint t nagysgrenddel gyorsabbak, mint a CGP.
A WARPLAN-C (Warren, 1976), ami a WARPLAN egy vltozata, volt az els feltteles cselekvseket hasznl
tervksztk egyike. Olawski s Gini (Olawski s Gini, 1990) a feltteles tervkszts f problmit vetette fel.
A fejezetben bemutatott feltteles tervksztsi megkzelts a Jimenez s Torras (Jimenez s Torras, 2000),
valamint Hansen s Zilberstein (Hansen s Zilberstein, 2001) ltal kifejlesztett ciklikus S-VAGY grfok
hatkony keressi algoritmusn alapul. Bertoli s trsai (Bertoli s trsai, 2001b) egy BDD-alap megkzeltst
mutatnak be, ami ciklikus feltteles terveket kszt. A C-BURIDAN rendszer (Draper s trsai, 1994) egy
folytonos tervksztst vgez valsznsgi kimenetel cselekvsekre, melynek problmja a POMDP vezrlse
sorn is felmerlt (lsd 17. fejezet). Szoros kapcsolat van a feltteles tervkszts s az automatizlt
programkszts kztt. A 9. fejezet szmos ilyen hivatkozst tartalmaz. A kt terletet egymstl fggetlenl
trtk fel, aminek oka az az risi kltsgklnbsg, ami egy gpi utasts vgrehajtsa, valamint robot- vagy
manipultorcselekvsek vgrehajtsa kztt fennll. Linden (Linden, 1991) a kt terlet kztti tudsmegosztst
szorgalmazza.
Trtnelmi tvlatbl mr lthat, hogy hogyan vezetett a kt f klasszikus tervkszt algoritmus kibvtett
verzikhoz a bizonytalan krnyezetek kezelse cljbl. A keressalap technikk a hiedelmi llapottr
keressre vezettek (Bonet s Geffner, 2000). A SATPLAN algoritmus a sztochasztikus SATPLAN (Majercik s
Littman, 1999) algoritmusra, valamint a kvantorokat alkalmaz logikai tervezsre vezetett (Rintanen, 1999). A
rszben rendezett tervksztsbl az UWL (Etzioni s trsai, 1992), a CNLP (Peot s Smith, 1992) s a
CASSANDRA (Pryor s Collins, 1996) szrmazik. A GRAPHPLAN, az rzkelses GRAPHPLAN (sensory GRAPHPLANSGP) (Weld s trsai, 1998) algoritmusra vezetett, de a teljesen valsznsgi GRAPHPLAN algoritmus mg
kifejlesztsre vr.
A vgrehajts monitorozs els f megjelense a PLANEX (Fikes s trsai, 1972), ami egy STRIPS tervksztvel
mkdtt a Shakey robot irnytsn. A PLANEX hromszg tblkat hasznlt ami egy szksgszeren
hatkony trolsi mechanizmus a terv elfeltteleinek trolsra a terv minden pontjn , hogy teljes
jratervezs nlkl helyrellhasson egy rszleges vgrehajtsi hiba utn. A vgrehajts Shakey-modelljt a 25.
fejezetben trgyaljuk tovbb. A NASL tervkszt (McDermott, 1978a) a tervksztsi problmt egyszeren,
mint egy komplex cselekvs vgrehajtsnak specifikcijt tekintette, gy a tervezs s vgrehajts teljesen
egysgess vlt. Az sszetett cselekvsek levezetsre ttelbizonytst hasznl.
A SIPE (System for Interactive Planning and Execution Monitoring) (Wilkins, 1988, 1990) volt az els
tervkszt, ami az jratervezs problmjt szisztematikusan kezelte. Klnbz problmakrk demonstrcis
feladataiban is felhasznltk, pldul az rsiklhordoz fedlzeti terv ksztsre vagy emberi erforrs
temezsre egy ausztrl srgyrban. Egy msik vizsglat a SIPE rendszert tbbemeletes pletek tervezsben
alkalmazta, ami az egyik legbonyolultabb problmakr, amit tervkszt valaha kezelt.
Az IPEM (Intergrated Planning, Execution, and Monitoring) (Ambros-Ingerson s Steel, 1988) volt az els
rendszer, ami integrlta a rszben rendezett tervksztst s a vgrehajtst, hogy folytonos tervkszt gensre
jusson. Az ltalunk trgyalt folytonos, rszben rendezett tervkszt gens ( CONTINUOUS-POP-AGENT) az IPEM a
PUCCINI (Golden, 1998) s a CYPRESS (Wilkins s trsai, 1995) tervksztk tleteit kombinlja.
Az 1980-as vek kzepn nhnyan gy gondoltk, hogy a rszben rendezett tervkszts s a kapcsold
technikk soha nem futhatnak elgg gyorsan, hogy egy valdivilg-beli gens szmra hasznlhat viselkedst
biztostsanak (Agre s Chapman, 1987). Ezek helyett a reaktv tervkszt (reactive planning) rendszereket
vezettk be. Ezek alapesetben reflexszer gensek, esetenknt bels llapottal, melyek szmos klnbz
felttel-cselekvs szablybrzols segtsgvel implementlhatk. Brooks (Brooks, 1986) bennfoglalsi
architektrja (lsd. 7. s 25. fejezet) rtegzett vges llapot llapotgpeket hasznlt, lbbal s kerkkel elltott
robotok mozgsnak s akadlyok elkerlsnek a szablyozsra. Pengi (Agre s Chapman, 1987) egy (teljesen
megfigyelhet) videojtkot tudott jtszani, az aktulis clok ltott reprezentcija, az gens bels llapota,
valamint ktrtk ramkrk kombinlsval.
403

vilgban
Az univerzlis tervek (Schoppers, 1987) a reaktv tervkszts kerestbla mdszereknt kerlt kifejlesztsre,
de mint kiderlt, ez a Markov dntsi folyamatokban hasznlt eljrsmd (policy) tletnek jrafelfedezse
volt. Egy univerzlis terv (vagy egy eljrsmd) brmely llapotban az adott llapotban vgrehajtand
cselekvsre mutat lekpezst tartalmazza. Ginsberg (Ginsberg, 1989) lelkes tmadst indtott az univerzlis
tervek ellen, ami kezelhetetlensgi eredmnyeket is tartalmazott a reaktv tervksztsi problma nhny
alakjra. Erre Schoppers 1989-ben egy hasonlan lelkes vlaszt adott (Schoppers, 1989).
Mint a legtbb esetben a hibrid megkzelts feloldja az ellentmonst. Jl tervezett hierarchik hasznlatval a
HFH tervksztk, mint a PRS (Georgeff s Lansky, 1987) s a RAP (Firby, 1996), valamint a folytonos
tervkszt gensek hasznlhat vlaszidket s sszetett hossz tv terveket rhetnek el szmos
problmakrben.
A multigens tervkszts napjainkban vlt npszerv, br hossz trtnelme van. Konolige (Konolige, 1982) a
multigens tervkszts elsrend logikai lerst adta meg, mg Pednault (Pednault, 1986) egy STRIPS-alak
lerst ksztett. A klcsns szndk tlete, ami elengedhetetlen, ha az gensek egyttes tervet hajtanak vgre,
a kommunikcis viselkeds kutatsbl ered (Cohen s Levesque, 1990; Cohen s trsai, 1990). Az ltalunk
bemutatott tbbtest rszben rendezett tervkszts Boutilier s Brafman (Boutilier s Brafman, 2001) munkjn
alapul.
Az itt szerepl, a multigens tervksztsben az egyttmkdst clz munka bemutatsa ppcsak a jghegy
cscsa. Durfee s Lesser (Durfee s Lesser, 1989) azt trgyalja, hogy a feladatok hogyan oszthatk meg az
gensek kztt egyezkeds tjn. Kraus s trsai (Kraus s trsai, 1991) egy Diplomacyt egy egyezkedst,
egyttmkdst, felbomlst s gyeskedst ignyl tblajtkot jtsz rendszert mutatnak be. Stone (Stone,
2000) bemutatja, hogy az gensek hogyan tudnak csapattagknt egyttmkdni a robotfoci verseng,
dinamikus, rszben megfigyelhet krnyezetben. A (Weiss, 1999) a multigens rendszerek egy
knyvhosszsg ttekintse. Az 7.3. szakasz - Koordinl mechanizmusok rsz moid modellje Reynoldsnak
ksznhet (Reynolds, 1987), aki ennek a Batman visszatr (Batman returns) c. film denevrseregeire s
pingvincsapatra val alkalmazsval Oscar-djat is nyert.
8.2. Feladatok
12.1.
Vizsgljuk meg figyelmesen a 12.1. alfejezetben az id s az erforrsok reprezentcijt.
a. Mirt jobb, ha egy cselekvs kvetkezmnye az Idtartam(d), mint ha a cselekvsnek egy IDTARTAM:d
alak kln mezje lenne? (Segtsg: vegyk figyelembe a feltteles kvetkezmnyeket s a diszjunktv
kvetkezmnyeket.)
b. Az ERFORRS: m mirt egy kln mez a cselekvsben, nem pedig egy kvetkezmny?
12.2.
Egy fogyeszkz (consumable resource) egy olyan erforrs, ami (rszlegesen) felhasznlsra kerl a
cselekvsben. Pldul a motor beszerelse az autba csavarokat ignyel. Miutn a csavarokat felhasznltuk, mr
nem hasznlhatk tovbbi rgztsekhez.
a. Magyarzza meg, hogyan mdostsuk a 12.3. bra reprezentcijt gy, hogy 100 kiindul csavarunk legyen
az E1 motor 40 csavart, az E2 pedig 50 csavart ignyel. A + s szimblumok felhasznlhatk az
erforrsokat ler kvetkezmnyliterlokban.
b. Mutassa meg, hogy a rszben rendezett tervksztsben alkalmazott okozati kapcsolatok s cselekvsek
kztti tkzs (conflict) defincijt hogyan kell mdostani, hogy a fogyeszkzket kezelje.
c. Nhny cselekvs, pldul a gyr elltsa csavarokkal vagy egy aut feltankolsa, nvelheti az erforrsok
kszlett. Egy erforrs monoton nem nvekv, ha egyetlen cselekvs sem nveli. Magyarzza meg, hogyan
hasznlhat ez a tulajdonsg a keressi tr megmetszshez.
12.3.
Adjon dekompozcit a 12.7. bra KiviteleztVeszFel s EngedlytSzerez lpseire, s mutassa meg, hogy a
dekomponlt rsztervek hogyan llnak ssze egy teljes tervv.
404

vilgban
12.4.
Adjon pldt a hzptsi problmakrben kt olyan absztrakt rsztervre, ami nem egyesthet egy teljes tervv
lpsek megosztsa nlkl. (Segtsg: azok a pontok, ahol egy hz fizikai rszei csatlakoznak, egyttal a
rsztervek vrhat csatlakozsi klcsnhatsi pontjai is.)
12.5.
Sokan mondjk, hogy a HFH-tervkszts elnye, hogy tegynk egy krutat Los Angelesbl New Yorkba, s
vissza tpus problmkat is meg tud oldani, amelyeket nehz nem HFH-jellsekkel kifejezni, hiszen a
kiindul s a clllapotok azonosak lennnek (Ott(LA)). Tud mondani megfelel reprezentcit, illetve meg
tudja-e oldani ezt a problmt HFH-k nlkl?
12.6.
Mutassa meg, hogy az eredeti STRIPS cselekvslers hogyan rhat t HFH-dekompozciv. Hasznlja az
Elri(p) cselekvst a p felttel elrshez szksges cselekvs jellsre.
12.7.
A hagyomnyos programozsi nyelvekben szmos mvelet modellezhet olyan cselekvssel, amely
megvltoztatja a vilg llapott. Pldul egy rtkadsi opertor egy memriaterlet tartalmt msolja, mg egy
nyomtats opertor megvltoztatja a kimenet llapott. Egy, ezekbl a mveletekbl ll programot tervnek
tekinthetnk, melynek cljt a program specifikcija definilja. A felkszt algoritmusok ezrt felhasznlhatk
egy adott specifikcij program elksztshez.
a. rjon egy opertorsmt az rtkadsi opertorhoz (egy vltoz rtknek tadsa egy msik vltoznak).
Vegye figyelembe, hogy az eredeti rtk fellrdik!
b. Mutassa meg, hogy az objektumok ltrehozsa hogyan hasznlhat a felkszt ltal kt vltoz rtknek
egy tmeneti vltoz felhasznlsval trtn felcserlsre.
12.8.
Tekintsk a kvetkez indoklst: egy bizonytalan kiindul llapotot megenged keretrendszerbe a diszjunktv
kvetkezmnyek (disconjuctive effects) csak jellsi knnyebbsget jelentenek, s nem a kifejezkpessg
nvelsre szolglnak. Egy P Q diszjunktv kvetkezmnyt tartalmaz a cselekvssmt mindig
helyettesthetnk a when R: P when R: Q feltteles kvetkezmnyekkel, ami cserben kt hagyomnyos
cselekvsre reduklhat. Az R kifejezs egy a kiindul llapotban ismeretlen vletlen lltst takar, melyhez
nem tartozik rzkel cselekvs. Helyes ez az indokls? Vegynk kln kt esetet, egyet, melyben csak egy a
cselekvssma szerepel a tervben, s egy msikat, melyben tbb mint egy pldny van.
12.9.
Mirt nem tudja a feltteles tervkszts kezelni a nem korltos nemdeterminisztikussgot?
12.10.
A kockavilgban kt STRIPS cselekvst kellett bevezetnnk, hogy az res prediktumot helyesen megtartsuk, a
Mozgat s az AsztalraTesz cselekvseket. Mutassuk meg, hogy a feltteles kvetkezmnyek hogyan
hasznlhatk mindkt eset egyetlen cselekvssel trtn lersra.
12.11.
A feltteles kvetkezmnyeket a porszvvilg Szv cselekvsre mutattuk be, ahol az, hogy melyik kocka lesz
tiszta, attl fgg, hogy mely kockn ll a robot. Tud mondani olyan tletlogikai vltozkat, melyek a
porszvvilg llapotait definiljk gy, hogy a Szv cselekvsnek felttel nlkli lersa legyen? Adja meg a
Szv, a Balra s a Jobbra cselekvsek lerst az lltsaik felhasznlsval, s mutassa meg, hogy ezek
kielgtk a vilg sszes lehetsges llapotnak lershoz.
12.12.
405

vilgban
Adja meg a Szv cselekvs teljes lerst a dupla-Murphy porszv problmra, ami nha piszkot hagy maga
utn, amikor egy tiszta clterletre mozog, s nha piszkot rak le, ha a Szv cselekvst egy tiszta ngyzeten
hajtjuk vgre.
12.13.
Keressen egy megfelelen piszkos sznyeget, amely akadlymentes s porszvzza ki. Rajzolja le a porszv
ltal vlasztott tvonalat, amilyen pontosan csak tudja. Indokolja a vlaszt hivatkozva a fejezetben trgyalt
tervksztsi mdszerekre.
12.14.
A kvetkez idzetek samponos flakonok htuljrl szrmaznak. Azonostsa mindegyiket, mint egy felttel
nlkli, feltteles vagy vgrehajts monitoroz tervet. (a) Moss. blts. Ismtelje. (b) Tegye a sampont a
fejre, s hagyja ott nhny percig. bltsen s ismtelje, ha szksges. (c) Amennyiben az irritci nem
sznik, forduljon orvoshoz.
12.15.
A 12.10. brn szerepl S-VAGY-GRF-KERESS algoritmus csak a gykr s az aktulis llapot kztti
tvonalat ellenrzi le ismtld llapotokra. Mindehhez tegyk fel, hogy az algoritmus eltrolt minden
megltogatott llapotot, s sszeveti ezzel a listval (lsd pldul 3.19. bra GRF-KERESS). Hatrozza meg,
hogy milyen informcit kellene trolni, s azt, hogy az algoritmus hogyan hasznlja ezt fel, amikor ismtld
llapotot tall. (Segtsg: szksge lesz arra, hogy klnbsget tegyen azon llapotok, melyekhez egy sikeres
rszterv kszlt korbban, s azon llapotok kztt, melyekre nem tallt rsztervet.) Magyarzza meg, hogyan
hasznlhatunk cmkket (labels), hogy elkerljk a rsztervek dupliklst.
12.16.
Mutassa meg preczen, hogy hogyan mdostjuk az S-VAGY-GRF-KERESS algoritmust, hogy ciklikus tervet
generljon, amennyiben ciklusmentes terv nem ltezik. Ehhez hrom problmval kell megkzdenie: a terv
lpseinek cmkzse, hogy egy ciklikus terv vissza tudjon mutatni a terv egy korbbi pontjra, a VAGYKERESS mdostsval, hogy egy ciklikus terv megtallsa utn ciklusmentes tervet keressen, s a terv
lersnak olyan bvtsvel, mely jelzi, hogy a terv ciklikus. Mutassa meg, hogyan mkdik az algoritmus (a) a
tripla-Murphy porszvvilgban, (b) a vltakoz dupla-Murphy porszvvilgban. Hasznlhat szmtgpes
implementcit az eredmnyek ellenrzshez. A (b) eset terve felrhat egy hagyomnyos ciklusszintaxis
hasznlatval?
12.17.
Specifiklja teljesen a hiedelem llapot mdost folyamatot rszben megfigyelhet krnyezetekre. Azaz a
mdszert, ami az j hiedelmi llapot lerst szmtja (mint ismeret lltsok listjt) az aktulis hiedelmi llapot
lersbl s a feltteles kvetkezmnyeket tartalmaz cselekvslersokbl.
12.18.
rjon a (12.2.) egyenlettel analg cselekvslersokat a Jobbra s a Szv cselekvsekre. Adja meg a lerst a
PozciEllenrzs cselekvsnek, a (12.3.) egyenletnek megfelelen. Ismtelje ezt meg a 12.11. feladat alternatv
llts halmaznak felhasznlsval.
12.19.
Tekintse meg az 6. szakasz - Folytonos tervkszts rsz listjt, ami felsorolja, hogy mit nem tud az jratervez
gens vgrehajtani. Vzoljon fel egy algoritmust nhny problma kezelsre.
12.20.
Vegyk a kvetkez feladatot: egy pciens olyan tnetekkel rkezik az orvoshoz, amelyet kiszrads vagy D
fertzs okozhat (de nem mindkett). Kt lehetsges cselekvs van: Iszik, ami felttel nlkl krlja a
kiszradst, s Gygyszert szed, amely a D fertzst krlja ki, de kros mellkhatsa van, ha a pciens
kiszradt. rja fel a problma lerst PDDL-ben, s az sszes relevns vilg szmbavtele mellett brzolja az
rzkelmentes tervet, ami megoldja a problmt.
406

vilgban
12.21.
Az elz feladat gygyszerszedsi problmjhoz adja hozz a Vizsgl cselekvst, melynek feltteles
kvetkezmnye a TenyszetNvekeds, amennyiben a Fertzs igaz, s minden esetben van egy rzkelsi
kvetkezmnye: Ismert(TenyszetNvekeds). brzolja a feltteles tervet, ami megoldja a problmt s
minimalizlja a GygyszertSzed cselekvs felhasznlst.
407
13. fejezet - Bizonytalansg

Ebben a fejezetben megltjuk, mit kell egy gensnek tennie, ha nem minden kristlytiszta.
1. Cselekvs bizonytalan tuds esetn

Fontos
A III. s IV. rszben lert logikai gensek ismeretelmleti kijelentseket tesznek az lltsok igaz, hamis
vagy ismeretlen voltrl. Ha egy gens elegend mennyisg tnyt ismer a krnyezetre vonatkozan,
akkor a logikai megkzelts rvn olyan terveket tud szrmaztatni, amelyek biztostjk a sikert. Ami
nagyon j. Sajnos azonban az gensek szinte soha nem frnek hozz a krnyezetket rint teljes
igazsghoz. Vagyis az genseknek bizonytalansg (uncertainty) kzepette kell mkdnik. A 7.
fejezet wumpus vilgnak gense pldul csak olyan szenzorokkal rendelkezik, amelyek loklis
informcit szolgltatnak; a vilg nagy rsze nem figyelhet meg kzvetlenl. A wumpus gens
gyakran kptelen felfedezni, hogy kt ngyzet kzl melyik tartalmaz csapdt. Ha a kt ngyzet az
aranyhoz vezet ton van, akkor az gensnek kockztatnia kell, s r kell lpnie az egyikre.
A vilg a valsgban nagysgrendekkel bonyolultabb a wumpus vilgnl. Egy logikai gens nem biztos, hogy
kpes kimert s helyes lerst adni arrl, hogy a cselekedetei mennyire lesznek eredmnyesek. Tegyk fel
pldul, hogy az gens ki szeretne vinni valakit a repltrre egy bizonyos jrathoz. Ehhez egy A90 nev tervet
tekint, amely szerint a jrat indulsa eltt 90 perccel kell elindulnia otthonrl s normlis sebessggel kell
vezetnie. Mindemellett, mg ha a repltr csak 15 kilomterre van is, az gens nem juthat a kvetkez
hatrozott kijelentsre: az A90 terv alapjn idben kirnk a repltrre, hanem csak egy gyengbb
kvetkeztetsre: az A90 terv alapjn idben kirnk a repltrre, ha az autm nem romlik el vagy nem fogy ki
belle az zemanyag, tovbb, ha nem trtnik velnk baleset, valamint a hdon sem lesz baleset, s a gp nem
szll fel korbban, tovbb ha nem lesz fldrengs E felttelek egyike sem vezethet le, gy a terv sikere sem
kvetkeztethet ki biztosan. Mindez a 10. fejezetben emltett minstsi problmra (qualification problem)
mutat pldt.
Ha egy logikai gens nem tud arra a kvetkeztetsre jutni, hogy valamely cselekvssorozat elri a cljt, akkor
kptelen lesz cselekedni. A feltteles tervezs bizonyos mrtkben rr lehet a bizonytalansgon, de csak akkor,
ha az gens rzkelsi tevkenysgei kpesek megszerezni a szksges informcit, tovbb ha nincs tl sok
klnbz eshetsg. Egy msik lehetsg az lehetne, ha az genst egy egyszer, de hibs elmlettel ruhznnk
fel, amely biztosan lehetv tenn valamely terv szrmaztatst; egy ilyen terv az esetek tbbsgben valban
mkdik is, ugyanakkor problmk lpnek fel, ha az esemnyek az gens elmletnek ellentmondanak. St az
gens elmletnek pontossga s hasznlhatsga kztti egyensly kezelse maga is megkveteli a
bizonytalansg vgiggondolst. sszegezve, egyetlen tisztn logikai gens sem lesz kpes arra a
kvetkeztetsre jutni, hogy az A90 tervet kell kvetnie.
Fontos
Mindazonltal tegyk fel, hogy az A90 tnylegesen a helyes s kvetend terv. De mit is rtnk ezen a
kijelentsen? Ahogy mr a 2. fejezetben kifejtettk, ez a kijelents azt takarja, hogy a vgrehajthat
sszes lehetsges terv kzl az A90 az, amelyik a krnyezetre vonatkoz adott informci mellett
vrhatan az gens teljestmnynek legnagyobb mrtkt biztostja. A teljestmny foka magban
foglalja a jrathoz idben val kirst a repltrre, tovbb a repltren val hossz, rtelmetlen
vrakozs s a gyorshajts miatti megbrsgols elkerlst. Az gens rendelkezsre ll informci
ezen kimenetelek kzl egyiket sem szavatolja az A90 esetn, de bizonyos mrtk hihetsgt nyjtja
annak, hogy azok be fognak kvetkezni. Ms tervek, mint pldul az A120, megnveln az gens hitt
abban, hogy idben kirnek a repltrre, de egyben megnveln a hossz vrakozs valsznsgt is.
A helyes cselekedet az sszer dnts (rational decision) ezrt fgg mind a klnbz clok
viszonylagos fontossgtl, mind pedig a megvalsulsuk valsznsgtl s mrtktl. Az alfejezet
htralev rszben ezeket a gondolatokat szeretnnk hangslyozni, elksztvn az ebben s a
kvetkez fejezetekben bemutatott bizonytalan kvetkeztets s az sszer dnts ltalnos
elmleteinek a kifejlesztst.
1.1. Bizonytalan tuds kezelse

408
Bizonytalansg
Ebben az alfejezetben a bizonytalan tuds termszett vizsgljuk meg kzelebbrl. Egy egyszer diagnosztikai
pldn keresztl mutatjuk be az rintett fogalmakat. A diagnosztika legyen az orvosi, gpjrm-javtsi vagy
brmi egyb olyan feladat, amely szinte mindig tartalmaz bizonytalansgot. Hogy lssuk a logikai
megkzelts sikertelensgt, prbljuk meg egy fogorvosi diagnosztikai rendszer szablyait meghatrozni
elsrend logika segtsgvel. Tekintsk a kvetkez szablyokat:
p Tnet(p, Fogfjs) Betegsg(p, Lyuk)
A gond az, hogy ez a szably rossz. Nincs minden fogfjs betegnek lyukas foga; nhnyuknak lehet
nysorvadsa vagy tlyoga, vagy valamilyen ms problmja.
p Tnet(p, Fogfjs) Betegsg(p, Lyuk)
Tlyog)
Betegsg(p, nysorvads)
Betegsg(p,
Sajnos, ahhoz, hogy igazz tegyk a szablyt, kzel vgtelen sok okot kellene hozztennnk. Megprblhatjuk a
szablyt ok-okozati szablly formlni:
p Betegsg(p, Lyuk) Tnet(p, Fogfjs)
De mg ez a szably sem lesz helyes, hiszen nem minden lyukas fog okoz fjdalmat. Az egyetlen mdja, hogy
kijavtsuk a szablyt, az az, hogy logikailag teljess tesszk: a bal oldalt ki kell bvteni minden olyan
lehetsges okkal, amely lyukas fogak esetn fogfjst okoz. De mg ebben az esetben is figyelembe kell venni a
diagnzis megllaptsnl annak lehetsgt, hogy a betegnek egymstl teljesen fggetlenl is lehet fogfjsa
s lyukas foga.
Prblkozsaink az elsrend logika alkalmazsra olyan terleteken, mint az orvosi diagnosztika, hrom f
okbl is kudarcot vallanak:
Lustasg (laziness): tl nagy munkt jelent az ok s okozatok teljes esemnyhalmaznak felsorolsa, amely
elengedhetetlenl szksges annak biztostsra, hogy egy szably mindig rvnyes legyen. Ezenkvl tl
krlmnyes az eredmnyl kapott hatalmas mret szablyok hasznlata.
Az elmleti tudatlansg (theoretical ignorance): az orvosi tudomnyterlet elmlete nem teljes.
A gyakorlati tudatlansg (practical ignorance): mg ha ismerjk is a teljes szablyrendszert, egy bizonyos
beteggel kapcsolatban akkor is lehetnk bizonytalanok, mert elfordulhat, hogy mg nem fejezdtt be, vagy
egyltaln nem vgezhet el az sszes szksges vizsglat.
Arrl van sz, hogy a fogfjs s a lyuk kztti kapcsolat egyik irnyban sem felttlen logikai kvetkezmny.
Ez jellemz az orvosi terletekre, valamint ms szakrti terletekre (jog, zlet, tervezs, autjavts,
kertszkeds, idpontok sszeegyeztetse stb.). Az gens tudsa legjobb esetben is csak egy bizonyos mrtk
meggyzdst vagy hiedelmet (degree of belief) nyjthat az adott kijelentsekkel kapcsolatban. A
meggyzdsi rtkek kezelsre az elsdleges eszkznk a valsznsg-szmts (probability theory) lesz,
amely egy 0 s 1 kztti szmszer meggyzdsi mrtket rendel az egyes mondatokhoz. (A bizonytalan
kvetkeztetsre alkalmas nhny ms lehetsges mdszerrl a 14.7. alfejezetben olvashatunk.)
Fontos
A valsznsg lehetsget nyjt a lustasgunkbl vagy tudshinyunkbl fakad bizonytalansg
kifejezsre (sszegzsre). Nem lehetnk biztosak abban, hogy mi knoz egy bizonyos beteget,
ugyanakkor hihetjk, hogy mondjuk 80% az esly arra azaz 0,8 a valsznsge annak , hogy a
betegnek van lyukas foga, ha fogfjsra panaszkodik. Azaz, vrakozsaink szerint az sszes, az gens
tudsa alapjn a jelenlegi szitucitl megklnbztethetetlen eset 80%-ban a pciensnek van lyukas
foga. Ezt a valsznsget statisztikai adatokbl vonhatjuk le az eddig vizsglt fogfjs betegek 80%nak lyukas volt a foga , vagy valamilyen ltalnos szablybl, illetve tnyek kombincijbl
szrmaztathatjuk. A 80% azokat az eseteket foglalja magban, amikor minden olyan tnyez jelen van,
amely hatsra a lyuk fogfjssal jr, valamint amikor a betegeknek teljesen fggetlenl van fogfjsa
s lyukas foga is. A hinyz 20%-ban pedig a fogfjs sszes tbbi lehetsges oka tallhat, amelyek
megerstshez vagy tagadshoz tl lustk vagy tudatlanok vagyunk.
Egy adott kijelentshez rendelt 0 valsznsg annak az egyrtelm meggyzdsnek felel meg, hogy a mondat
lltsa hamis, mg az 1 valsznsg egyenrtk azzal a hatrozott meggyzdssel, hogy a mondat lltsa
409
Bizonytalansg
igaz. A 0 s 1 kztti valsznsgek a mondat igazsgtartalmban val hit kzbens mrtkeinek felelnek meg.
Az llts valjban persze vagy igaz, vagy hamis. Fontos teht megjegyeznnk, hogy a meggyzds mrtke
s az igazsgtartalom mrtke klnbz fogalmak. A 0,8 valsznsg nem jelent 80%-ban igaz-at, hanem
egy 80%-os mrtk meggyzdst vagyis egy igen ers elvrst (remnyt) az llts igazsgval szemben.
Kvetkezskppen a valsznsg-szmts a logikval azonos ltelmleti llsfoglalst hordoz nevezetesen,
hogy a vilgban a tnyek vagy rvnyesek, vagy nem. Az igazsg mrtke, mint a meggyzds mrtknek az
ellentte, a fuzzy logika (fuzzy logic) trgya, amelyet a 14.7. alfejezetben trgyalunk.
A logikban egy olyan llts, mint a pciensnek van lyukas foga az interpretcijtl s a vilgtl fggen
vagy igaz, vagy hamis; csak akkor igaz, ha az a tny, amelyre hivatkozik, megfelel a tnyllsnak. A
valsznsg-szmtsban egy olyan mondat, mint 0,8 annak a valsznsge, hogy a betegnek lyukas a foga
az gens meggyzdst fejezi ki, s nem kzvetlenl a valsgra vonatkozik. Ez a meggyzds az gens
addigi szlelseitl fgg. Az szlelsek alkotjk azt a tnyt vagy tnyllst (evidence), amelyen a valsznsgi
kijelentsek alapulnak. Tegyk fel pldul, hogy az gens kihz egy lapot egy megkevert krtyapaklibl.
Mieltt rnz a lapra, 1/52 valsznsget kell rendelnie a mell az llts mell, hogy a kihzott lap a pikk sz.
Megnzs utn ugyanennek a valsznsge vagy 0, vagy 1. Vagyis, egy kijelentshez rendelt valsznsg
inkbb annak felel meg, hogy egy logikai llts (vagy annak tagadsa) kvetkezik-e a tudsbzisbl, mint
annak, hogy igaz-e vagy sem. Ahogy a tudsbzishoz hozzadott lltsok megvltoztatjk az abbl levonhat
kvetkeztetseket, ugyangy a valsznsg is megvltozik, amikor tbb tny birtokba jutunk. 1
Ebbl kvetkezen minden valsznsgi kijelentsnek hivatkoznia kell azokra a tnyekre, amelyek alapjn az
adott valsznsg az lltshoz lett rendelve. Amint egy gens j szlelsek birtokba jut, ezek
figyelembevtelvel mdostja a valsznsgek becslst. Mieltt tnyek birtokba jutunk, elzetes, illetve a
priori (prior) vagy felttel nlkli (unconditional) valsznsgrl beszlnk, a tnyek birtokban pedig
utlagos, illetve a posteriori (posterior) vagy feltteles (conditional) valsznsgrl. Az gens a legtbb
esetben rendelkezni fog bizonyos tnyekkel az rzkelsei hatsra, s rdekelt lesz az ltala felgyelt
kimenetelek a posteriori valsznsgeinek kiszmtsban.
1.2. Bizonytalansg s racionlis dntsek

A bizonytalansg megjelense gykeresen megvltoztatja azt a mdot, ahogy az gens a dntseit meghozza.
Egy logikai gensnek ltalban van valamilyen clja, s brmely tervet vgrehajt, amely biztostja a cl elrst.
Azon az alapon vlaszt ki vagy utast vissza egy cselekvst, hogy az elri a clt vagy sem, fggetlenl attl,
hogy ms cselekvsek mire vezetnek. Ms lesz a helyzet azonban, amint a bizonytalansg belp a kpbe.
Gondoljuk vgig jra az A90 tervet a repltrre juts szempontjbl. Tegyk fel, hogy ez 95%-os
valsznsggel biztostja a sikert. sszer dntst jelent ez? Nem felttlenl: lehetnek ms tervek, pldul az
A120, amelynek nagyobb eslye van a sikerre. Ha letbevg az, hogy ne kssk le a jratot, akkor clszerbb
megkockztatni egy hosszabb vrakozst a repltren. Mi a helyzet pldul az A1440 tervvel, amely a felszlls
eltt 24 rval val indulst javasolja. A legtbb esetben ez nem j vlaszts, mert br majdnem biztosra
vehetjk az idben val rkezst, sajnos a trhetetlenl hossz vrakozst is.
Ilyen tpus dntsek meghozatala eltt az gensnek fel kell lltania egy preferencia-sorrendet (preferences)
a klnbz tervek lehetsges kimenetelei (outcome) kztt. Egy adott kimenetel teljesen hatrozott llapotot
jelent, magban foglalva, hogy az gens idben rkezik a repltrre vagy sem, s hogy milyen hossz lesz a
repltri vrakozs. A preferencik figyelembevtelvel trtn lersra s kvetkeztetsre a
hasznossgelmletet (utility theory) fogjuk hasznlni. (A hasznossg utility fogalmn a tovbbiakban az
rtend, hogy milyen a haszon minsge, s nem valamifajta kzhasznsg, mint az elektromos mvek vagy
vzmvek esetben.) A hasznossgelmlet szerint minden llapotnak van egy hasznavehetsgi mrtke vagy
haszna az gens szmra, s az a szmra tbb hasznot hoz llapotokat fogja elnyben rszesteni.
Egy llapot hasznossga viszonylagos az gens szmra, akinek preferencia-sorrendjt a hasznossgfggvny
hivatott kpviselni. A 6. fejezet jtszmiban szerepl jutalmak pldul hasznossgfggvnyek. Sakkozs kzben
annak az llapotnak a hasznossga, amelyben Fehr jtszmt nyer, nyilvnvalan igen magas a fehr bbukkal
jtsz gens szmra, ugyanakkor igen alacsony a feketvel jtsz szmra. Vagy bizonyos jtkosok (belertve
a szerzket is) igen elgedettek lehetnek egy vilgbajnok elleni dntetlennel, ugyanakkor ms jtkosok
(belertve a korbbi vilgbajnokot) nem. Az zlst vagy a szemlyes vlasztst nem lehet megindokolni: azt
gondolhatjuk, hogy egy gens, aki a mfagyit elnyben rszesti a csokireszelkkel szemben klns, st flre
Ez teljesen eltr attl, hogy a vilg megvltozsa kvetkeztben egy llts igazz vagy hamiss vlik. Ha valsznsgeket akarunk
hasznlni egy vltoz vilg kezelsre, akkor ugyanolyan mechanizmusokra llapot, tvolsg s esemnyek lesz szksgnk, mint
amelyet a 10. fejezetben hasznltunk a logikai reprezentciban. Ezeket a mechanizmusokat a 15. fejezetben trgyaljuk.
1
410
Bizonytalansg
van vezetve, de azt nem mondhatjuk, hogy irracionlis. A hasznossgelmlet mg az nzetlensget is

megengedi, egyszeren azltal, hogy az gens a sajt hasznossgt nvel tnyezk kz beleveszi msok
jltt.
A preferencik sorrendje, amit a hasznossggal fejezhetnk ki, az sszer dntsek ltalnos elmletben
valsznsgekkel van kombinlva. Ezt hvjuk dntselmletnek (decision theory):
dntselmlet = valsznsg-elmlet + hasznossgelmlet
Fontos
A dntselmlet alapgondolata szerint egy gens akkor s csak akkor racionlis, ha olyan cselekvst
vlaszt, amely az adott cselekvs sszes lehetsges kimenetelre tlagolt legmagasabb vrhat hasznot
hozza. Ezt hvjk a Maximlis Vrhat Haszon (MVH, Maximum Expected Utility, MEU) elvnek.
Az elv mkdst a 6. fejezetben lthattuk, amikor az ostblajtk optimlis lpst vizsgltuk rviden.
A ksbbiekben ltni fogjuk, hogy ez az elv teljesen ltalnos rvny.
1.3. Egy dntselmleti gens tervezse

A 13.1. bra egy, a cselekvsei kivlasztshoz dntselmleti mdszereket alkalmaz gens felptst mutatja.
Egy absztrakt szinten az gens megegyezik a 7. fejezetben lert logikai gens felptsvel. Az elsdleges
klnbsg kzttk az, hogy a dntselmleti gens pillanatnyi llapotra vonatkoz tudsa bizonytalan; az
gens meggyzdsi vagy hiedelemllapota (belief state) a vilg sszes lehetsges aktulis llapotainak a
valsznsgeit megjelenti. Az id elrehaladtval az gens egyre tbb tnyt gyjt ssze, s meggyzdsi
llapota is vltozik. Adott meggyzdsi llapotra alapozva az gens valsznsgi becslseket tud adni az
egyes cselekedetek kimeneteleire vonatkozan, kvetkezskppen ki tudja vlasztani a legnagyobb vrhat
hasznossggal br lpst. Ez s a kvetkez fejezet a valsznsgi informci ltalnos megjelentsre s az
azon alapul szmtsokra sszpontost. A 15. fejezet a meggyzdsi llapot reprezentlsnak s
aktualizlsnak, valamint a krnyezet becslsnek specilis mdszereivel foglalkozik. A 16. fejezet a
hasznossgelmletet taglalja mlysgeiben, mg a 17. fejezetben a komplex dntsek mdszereit ptjk fel.
13.1. bra - Dntselmleti gens, amely racionlis cselekvseket vlaszt ki. A lpseket
a kvetkez t fejezetben rszletezzk.
2. Valsznsgi alapfogalmak
Miutn fellltottuk a racionlis gens ltalnos kerett, szksgnk lesz egy formlis nyelvre a bizonytalan
tuds lershoz s a kvetkeztetshez. Minden olyan jellsnek, amely a meggyzdsnk foknak lersra
szolgl, kpesnek kell lennie kt f dolog kezelsre: az egyik a kijelentsek jellege, amelyekhez meggyzdsi
mrtket akarunk rendelni, a msik pedig a meggyzds mrtknek az gens tapasztalattl val fggse. A
valsznsg-elmlet itt bemutatott vltozata az tletlogika egy kiterjesztst hasznlja lltsaihoz. A
tapasztalattl val fggs az a priori valsznsgi kijelentsek s a feltteles valsznsgi lltsok szintaktikai
megklnbztetsben tkrzdik. Az a priori valsznsgi kijelentseket akkor alkalmazzuk, mieltt mg
tnyek birtokba jutnnk, mg a feltteles valsznsgi kijelentsek explicit mdon tartalmazzk a megszerzett
tnyeket.
411
Bizonytalansg
2.1. lltsok
A hiedelmi mrtkeket mindig lltsokhoz (propositions) rendeljk amelyek ez s ez a helyzet tpus
kijelentsek. Az lltsok lersra eddig kt formlis nyelvet az tletlogikt s az elsrend logikt
hasznltuk. Ez az alfejezet egy olyan nyelvet r le, amelyet a valsznsg-elmlet jellegzetesen hasznl, s
amely valamelyest kifejezbb az tletlogiknl. (A 14.6. alfejezet azokat a mdszereket taglalja, amelyek
megadjk, hogy milyen hiedelmi mrtkek tulajdonthatk az elsrend logika egyes kijelentseinek.)
A nyelv alapeleme a valsznsgi vagy vletlen vltoz (random variable), ami gy tekinthet, mint ami egy
kezdetben ismeretlen llapot vilg egy rszre vonatkozik. Pldul a Lyuk a bal als blcsessgfogam
esetleges lyukassgt mutatja. A vletlen vltozk a knyszerkielgtsi problmknl megismert CSPvltozkhoz s az tletlogiknl hasznlt tletszimblumhoz hasonl szerepet jtszanak.
A vletlen vltozkat mindig nagybetvel kezdjk. (Ugyanakkor az ismeretlen vletlen vltozkat vltozatlanul
kis- s egybets nevekkel fogjuk jellni, pldul: P(a) = 1 P(a).)
Minden valsznsgi vltozhoz tartozik egy rtktartomny (domain), amelybl az rtkeit veheti. Pldul a
Lyuk tartomnya az igaz, hamis lehetne.2 (Az rtkeket kisbets nevekkel fogjuk jellni.) Az lltsok
legegyszerbb fajtja azt jelenti ki, hogy a valsznsgi vltoz valamilyen konkrt rtket vesz fel a
tartomnyon bell. Pldul a Lyuk = igaz azt reprezentlja, hogy nekem valban lyukas a bal als
blcsessgfogam.
A vletlen vltozk a CSP-vltozkhoz hasonlan tipikusan hrom csoportba sorolhatk a tartomny
fajtjtl fggen:
(Boole-tpus) logikai vletlen vltozk (Boolean random variables), mint a Lyuk, amelyeknek az igaz,
hamis a tartomnya. Az olyan lltsokat, mint a Lyuk = igaz gyakran rvidtve, csak a kis kezdbets
nevvel lyuk fogjuk jellni, mg a Lyuk = hamis llts rvidtett jellse: lyuk.
Diszkrt vletlen vltozk (discrete random variables), amelyek specilis esetben logikai vltozk is
lehetnek, egy megszmllhat tartomnybl vesznek fel rtket. Pldul az Idjrs tartomnya a napos,
ess, felhs, havazik lehet. A tartomny rtkeinek egymst kizrknak s sszessgben kimertknek
(teljeseknek) kell lennik. Ha ez nem okozhat flrertst, akkor a havazik rvidts fogja jellni pldul az
Idjrs = havazik lltst.
Folytonos vletlen vltozk (continuous random variables), amelyek vals rtket vehetnek fel. A
tartomny lehet akr a teljes vals tengely, akr annak egy rszhalmaza, mint a [0, 1] intervallum. Pldul az
az llts, hogy X = 4,02 azt jelenti ki, hogy az X vletlen vltoz rtke pontosan 4,02. A vletlen vltozkra
vonatkoz lltsok egyenltlensgek is lehetnek, mint pldul X 4,02.
Nhny kivteltl eltekintve, mi a diszkrt esetre fogunk koncentrlni.
Az sszetett lltsok ltrehozshoz az olyan elemi lltsok, mint a Lyuk = igaz vagy a Fogfjs = hamis,
brmely szoksos logikai kapcsolat felhasznlsval kombinlhatk. Pldul a Lyuk = igaz Fogfjs = hamis
egy olyan llts, amelyhez valamilyen hihetsgi (hihetetlensgi) mrtket rendelhetnk. Ahogy az elz
bekezdsben lertuk, a fenti lltst gy is jellhetjk, hogy fogszuvasods fogfjs.
2.2. Elemi esemnyek

Az elemi esemny (atomic event) jells hasznos a valsznsg-elmlet alapjainak megrtsben. Egy elemi
esemny a vilg amely tekintetben az gens bizonytalan llapotnak egy teljes lerst jelenti. gy is
tekinthetjk, mint a vilgot alkot sszes vltozhoz val konkrt rtk hozzrendelst. Pldul, ha a vilgomat
csak a Lyuk s a Fogfjs logikai vltozk alkotjk, akkor pontosan ngy klnbz elemi esemny ltezik;
amelyek kzl a Lyuk = hamis Fogfjs = igaz egy esemny.3
Egyesek elvrsa szerint a tartomnyt halmazknt kellene megadni: {igaz, hamis}. Mi lltsok n-eseknt rjuk le, mivel a ksbbiekben ez
megknnyti egy rendezs hozzrendelst.
3
A valsznsg-elmlet szmos formja az elemi esemnyt, ms nven mintt (sample point) egy primitvnek tekinti. A vletlen vltozt
pedig, mint egy fggvnyt definilja, amelynek bemenete egy elemi esemny, kimenetknt pedig a megfelel tartomny egy rtkt adja. Ez
a megkzelts taln ltalnosabb, de ugyanakkor kevsb intuitv.
2
412
Bizonytalansg
Az elemi esemnyeknek van nhny fontos tulajdonsga:

Az elemi esemnyek egymst klcsnsen kizr esemnyek legfeljebb egyikk lehet igaz. Pldul, nem
lehet egyszerre igaz a lyuk fogfjs, valamint a lyuk fogfjs.
Az sszes elemi esemny halmaza kimert legalbb az egyiknek igaznak kell lennie. Azaz az sszes elemi
esemny egyestse logikailag egyenrtk az igaz lltssal.
Minden egyes elemi esemny maga utn vonja kvetkezmnyknt az sszes llts igazsgt vagy hamissgt
fggetlenl attl, hogy azok egyszerek vagy sszetettek. Ez a logikai kapcsolatok szoksos szemantikjnak
alkalmazsa rvn mutathat meg (lsd 7. fejezet). Pldul a lyuk fogfjs elemi esemny kvetkezmnye
a fogszuvasods igaz volta s a lyuk fogfjs hamissga.
Brmely llts logikailag egyenrtk azon elemi esemnyek diszjunkcijval, amelyekbl az llts
kvetkezik. Pldul a lyuk llts ekvivalens a lyuk fogfjs s a lyuk fogfjs elemi esemnyek
egyestsvel.
A 13.4. feladat a fenti tulajdonsgok bizonytst clozza.
2.3. A priori valsznsg

Az a lltshoz tartoz felttel nlkli (unconditional) vagy a priori valsznsg (prior probability) azt a
meggyzdsi mrtket jelenti, amely brmely ms informci hinyban az lltshoz kapcsolhat; jellse
P(a). Pldul ha 0,1 annak az a priori valsznsge, hogy van lyukas fogam, akkor
P(Lyuk = igaz) = 0,1 vagy P(lyuk) = 0,1-et rhatunk.
Fontos megjegyeznnk, hogy P(a) csak akkor hasznlhat, ha nincs semmilyen ms informci a birtokunkban.
Amint ismertt vlik valamilyen j informci, a tovbbiakban mr a adott j informci melletti feltteles
valsznsgvel kell kvetkeztetnnk. A feltteles valsznsgekkel a kvetkez alfejezet foglalkozik.
Bizonyos esetekben elfordulhat, hogy beszlni szeretnnk egy vletlen vltoz sszes lehetsges rtknek
valsznsgrl. Ilyen esetekben a P(Idjrs) kifejezs hasznlhat, amely az idjrs minden egyes
llapothoz rendelt valsznsgi rtkekbl kpzett vektort jelli. Kvetkezskppen, ahelyett hogy az albbi
ngy egyenletet rnnk le
P(Idjrs = napos) = 0,7
P(Idjrs = ess) = 0,2
P(Idjrs = felhs) = 0,08
P(Idjrs = havazik) = 0,02
elegend egyszeren azt rnunk, hogy

P(Idjrs) = 0,7, 0,2, 0,08, 0,02
Az ilyen kijelents az Idjrs vletlen vltoz elzetes valsznsg-eloszlst (probability distribution)

definilja.
Olyan kifejezseket is hasznlni fogunk, mint a P(Idjrs, Lyuk), hogy egy vletlen vltozhalmaz sszes
lehetsges kombincijnak valsznsgeit jellni tudjuk.4 Ekkor a P(Idjrs, Lyuk) egy 4 2-es
valsznsgi tblzatot jelent. Ez az Idjrs s Lyuk egyttes valsznsg-eloszlsa (joint probability
distribution).
Hasznos lehet az is, ha vilgot ler vletlen vltozk teljes halmazrl gondolkozunk. Az olyan egyttes
valsznsg-eloszlst, amely lefedi a teljes halmazt teljes egyttes valsznsg-eloszlsnak (full joint
probability distribution) nevezzk. Pldul, ha a vilg csak a Lyuk, a Fogfjs s az Idjrs vltozkbl ll,
akkor a teljes egyttes valsznsg-eloszlst a
Az ltalnos jellsi szably szerint az eloszls a nagybets vltozk sszes rtkt tartalmazza. Azaz, a P(Idjrs, lyuk) a valsznsgek
egy olyan ngyelem vektort jelenti, amelyben minden egyes idjrs-llapot valsznsge szerepel Lyuk = igaz mellett.
4
413
Bizonytalansg
P(Lyuk, Fogfjs, Idjrs)
adja meg. Ez az egyttes valsznsg-eloszls egy 16 elem, 2 2 4-es tblzattal reprezentlhat. A teljes
egyttes valsznsg-eloszls minden egyes elemi esemny valsznsgt, s gy a krdses vilggal
kapcsolatos sszes bizonytalansgot meghatrozza. A 13.4. alfejezetben ltni fogjuk, hogy a teljes egyttes
valsznsg-eloszls alapjn brmely valsznsgi krds megvlaszolhat.
Folytonos vltozk esetn az eloszls nem foglalhat ssze tblzatos formban, mivel a lehetsges rtkek
szma vgtelen. Ehelyett annak valsznsge, hogy egy valsznsgi vltoz egy adott x rtket vesz fel,
ltalban x egy paramterezett fggvnyeknt definilhat. Pldul az X vletlen vltoz jellje a holnapi
hmrsklet maximumt Berkeleyben. Ezzel a
P(X = x) = U[18, 26](x)
kijelents azt a hiedelmet fejezi ki, hogy X egyenletes eloszlst mutat 18 s 26 C kztt. (Nhny hasznos
folytonos valsznsgi vltoz defincijt az A) fggelkben talljuk meg.) A folytonos valsznsgi
vltozkra vonatkoz valsznsgi eloszlst valsznsg-srsgfggvnynek (probability density
function) nevezzk. A srsgfggvnyek jelentse klnbzik a diszkrt eloszlsoktl. Pldul a
korbbiakban megadott hmrskleteloszlsbl kiindulva P(X = 20,5) = U[18, 26](20,5) = 0,125/C addik. Ez
nem azt jelenti, hogy annak az eslye, hogy a holnapi maximlis hmrsklet pontosan 20,5 C lesz 12,5%;
ennek a valsznsge termszetesen 0. Technikailag ez azt jelenti, hogy annak a valsznsge, hogy a
krdses hmrsklet a 20,5 C egy kicsiny krnyezetbe fog esni, hatrrtkt tekintve egyenl azzal, hogy a
0,125-t elosztjuk a szakasz C-ban megadott szlessgvel:
Nhny szerz a diszkrt eloszlsok s a srsgfggvnyek jellsre ms szimblumot hasznl; mi P-vel

fogjuk jellni mindkettt, mivel ritkn lehet ezeket sszekeverni, s az egyenletek ltalban azonos formjak.
Jegyezzk meg ugyanakkor, hogy mg a valsznsgek mrtkegysg nlkli szmok, a srsgfggvnyeknek
van mrtkegysge, a fenti pldban 1/C.
2.4. Feltteles valsznsg

Amint az gens bizonyos tnyek birtokba jut a korbban ismeretlen, a tartomnyra jellemz vletlen vltozra
vonatkozan, az a priori valsznsgek tbb nem hasznlhatk. Ehelyett a feltteles (conditional) vagy a
posteriori (posterior) valsznsgeket hasznlhatjuk. Jellse P(a b), ahol a s b tetszleges llts lehet.5
rtelmezse: a valsznsge, ha b-t s csak b-t tudjuk. Pldul,
P(Lyuk Fogfjs) = 0,8
azt jelenti, hogy ha egy betegnl megfigyeltk, hogy fogfjsa van, s semmilyen ms informcink nincs vele
kapcsolatban, akkor annak a valsznsge, hogy szuvas a foga 0,8. Egy P(lyuk) tpus a priori valsznsg
tekinthet a P(lyuk ) feltteles valsznsg specilis esetnek, ahol a felttelt a semmi bizonytk jelenti.
A feltteles valsznsgek megadhatk felttel nlkliek segtsgvel. A definci
minden P(b) > 0 esetn igaz. Az egyenletet rhatjuk

P(a b) = P(a b)P(b)
alakban is, amelyet szorzatszablynak (product rule) hvunk. A szorzatszablyt taln knnyebb megjegyezni:
ez abbl kvetkezik, hogy a s b egyttes teljeslshez, szksges, hogy b igaz legyen, valamint hogy a is igaz
legyen b felttele mellett. A szablyt megadhatjuk fordtva is:
P(a b) = P(b a)P(a)
A opertor a lehet legkevesebb elzmnyt jelenti, azaz a P(a b|c d) P((a b)|(c d))-vel egyenrtk.
414
Bizonytalansg
Bizonyos esetekben knnyebb a konjunkcik felttel nlkli (a priori) valsznsgeit hasznlni, azonban mi az
esetek tbbsgben feltteles valsznsgeket fogunk alkalmazni valsznsgi kvetkeztetseink eszkzeknt.
A P jellst hasznlhatjuk feltteles eloszlsokra is. P(X Y) a P(X = xi Y = yi) rtkeit adja meg minden
lehetsges i-re, j-re. Annak pldjaknt, hogy ez mennyivel tmrebb teszi a jellst, kpzeljk el a
szorzatszably alkalmazst minden olyan esetre, ahol az a s b lltsok X s Y bizonyos rtkeit veszik fel. A
kvetkez egyenleteket fogjuk kapni:
P(X = x1 Y = y1) = P(X = x1 Y = y1) = P(Y = y1)
P(X = x1 Y = y2) = P(X = x1 Y = y2) = P(Y = y2)
Mindezt sszefoglalhatjuk egyetlen egyenletben is:

P(X, Y) = P(X Y)P(Y)
Ne felejtsk, hogy ez egy olyan egyenlethalmaz jellsre szolgl, amely kapcsolatba hozza a tblzatok
megfelel elemeit, s nem a tblzatok mtrix szorzsrl van sz. Csbt, de helytelen a feltteles
valsznsgeket bizonytalansggal kiegsztett logikai implikcikknt tekinteni. Pldul a P(a b) = 0,8
lltst nem lehet gy rtelmezni, hogy amikor csak igaz b, P(a) 0,8-del egyenl. Ez kt okbl is tves: elszr is
P(a) mindig a elzetes valsznsgt, s nem a valamilyen tny meglte esetn alkalmazand utlagos
valsznsgt jelli; msrszrl pedig a P(a|b) = 0,8 csak akkor alkalmazhat, ha b az egyetlen tny, amelynek
birtokban vagyunk. Ha ismernk egy tovbbi c informcit is, akkor a hihetsgi mrtkt P(a b c) fogja
adni, amely akr fggetlen is lehet P(a b)-tl. Pldul c megadhatja kzvetlenl azt is, hogy a igaz vagy hamis.
Ha megvizsglunk egy beteget, aki fogfjsra panaszkodik, s tallunk egy lyukas fogat, akkor a tovbbi, lyuk
informcinak jutottunk birtokba, s gy termszetesen, arra a kvetkeztetsre fogunk jutni, hogy
P(lyuk fogfjs lyuk) = 1,0.
3. Valsznsgi aximk
Az eddigiekben az lltsokra, az a priori, valamint a feltteles valsznsgi kijelentsekre vonatkoz szintaxist
definiltunk. A tovbbiakban meg kell fogalmaznunk a valsznsgi kijelentsek valamilyen szemantikjt is.
Ezt azokkal az alapvet aximkkal kezdjk, amelyek a valsznsgi sklt s annak vgpontjait hatrozzk
meg:
1. Minden valsznsg 0 s 1 kz esik. Brmely a kijelentsre
0 P(a) 1
2. A biztosan igaz (azaz rvnyes) lltsok valsznsge 1, a biztosan hamis (azaz kielgthetetlen) lltsok
pedig 0.
P(igaz) = 1 P(hamis) = 0
Ezutn egy olyan aximra van szksgnk, amely a logikailag sszefgg lltsokat kapcsolja ssze. A
legegyszerbb, ha a diszjunkcira vonatkoz valsznsget az albbiak szerint definiljuk:
3. A diszjunkci valsznsge
P(a b) = P(a) + P(b) P(a b)
Ez utbbi szablyt knny megjegyezni arrl, hogy azok az esetek, ahol a igaz s azok az esetek, ahol b igaz,
egytt termszetesen lefedik azokat az eseteket, ahol a b igaz; ugyanakkor a kt halmazba es eseteket
sszeadva ktszer szmoljuk azokat, amelyek a halmazok kzs rszbe esnek, gy ki kell vonnunk P(a b)-t.
Ezt a hrom aximt gyakran nevezik Kolmogorov-aximknak (Kolmogorovs axioms) az orosz
matematikus Andrei Kolmogorov emlkre, akinek a nevhez fzdik az ezen alapaximkbl kiindul
valsznsg-elmlet felptse. Vegyk szre, hogy az aximk csak az a priori valsznsgekkel, s nem a
feltteles valsznsgekkel foglalkoznak; ennek oka, hogy az utbbiakat mr a korbbiakban definiltuk a
(13.1) egyenlet szerint.
Fontos
415
Bizonytalansg
Honnan szrmaznak a valsznsgek?

Vg nlkli vitk folytak a valsznsgi szmok forrsa s rtelme krl. A
frekvencionistab(frequentist) llspont szerint ezek az rtkek csak ksrletekbl szrmazhatnak: ha
100 ember vizsglata sorn az derl ki, hogy 10-nek szuvas a foga, akkor azt mondhatjuk, hogy a
szuvas fog valsznsge krlbell 0,1. E szemllet szerint az az llts, miszerint a lyuk
valsznsge 0,1 azt jelenti, hogy ha vgtelen sok mintt megvizsglnnk, hatrrtkt tekintve 0,1
lenne annak a rsznek a hnyada, ahol ezt tapasztalnnk. Tetszleges, de vges szm minta esetn
pedig megbecslhetjk a vals arnyt, valamint kiszmthatjuk azt is, hogy vrhatan mekkora lesz a
becslsnk pontossga.
Az objektivista (objectivist) megkzelts szerint a valsznsgek inkbb az univerzum valsgos
jellemzinek tekinthetk ahol egy jellemz a dolgok hajlama bizonyos tpus viselkedsre , mint
egy megfigyel meggyzdsi foka lersnak. Pldul az, hogy egy nem hamis pnzdarab
feldobsnl 0,5-es valsznsggel fej jn ki, magnak a pnzdarabnak a hajlandsga. E szemllet
szerint a frekvencionista mrsek ezen hajlandsgok megfigyelsre tett ksrletek. A legtbb fizikus
egyetrt abban, hogy a kvantumjelensgek valjban valsznsgiek, de makroszkopikus szinten
pldul a pnzfeldobsnl a bizonytalansg a kezdeti felttelek elhanyagolsa miatt lp fel, ami
ltszlag nem konzisztens a hajlandsgalap szemllettel.
A szubjektivista (subjectivist) szemllet szerint a valsznsgek inkbb az gens meggyzdsnek
jellemzsre szolglnak, s nincs kls fizikai jelentsgk. E szerint az orvos vagy az elemz aszerint
tallhatja ki a szmokat, hogy mondhassa vlemnyem szerint a lyuk valsznsge 0,1 krl vrhat.
Kifejlesztettek olyan tovbbi, mg megbzhatbb mdszereket is mint pldul az 3.1. szakasz - A
valsznsgi aximk hasznlata rszben rszletezett fogadsi rendszereket , amelyekkel az emberek
valsznsg-hozzrendelst szerettk volna kiismerni. A vonatkoztatsi osztly (reference class)
problma jl illusztrlja a szubjektivits jelenltt. Kpzeljnk el egy frekvencionista orvost, aki meg
akarja llaptani annak az eslyeit, hogy egy pciens egy bizonyos betegsgben szenved. Ehhez az
orvos ms, de fontos szempontokbl (kor, tnet, esetleg nem tekintetben) azonos betegeket akar
figyelembe venni, majd megnzni kzttk az ilyen betegsgben szenvedk arnyt. Azonban, ha az
orvos mindent figyelembe vesz, amit ismer a beteggel kapcsolatban a grammra pontos testslyt, a
haja sznt, az anyja lenykori nevt stb. arra az eredmnyre fog jutni, hogy nincs mg egy olyan
ember, aki pontosan megegyezne a beteggel, s gy nincs olyan vonatkoztatsi osztly sem, amelyrl
ksrleti eredmnyeket lehetne gyjteni. Mindez nyugtalant krdse a tudomnyfilozfinak.
Laplace kzmbssgi elve (principle of indifference) (Laplace, 1816) szerint a tny tekintetben
szintaktikailag szimmetrikus lltsokhoz azonos valsznsget kell rendelni. Erre vonatkozan
trtntek klnbz finomtsi javaslatok, amelyek Carnap s ms filozfusok azon trekvseiben
cscsosodtak ki, hogy egy olyan precz induktv logikt (inductive logic) fejlesszenek ki, amely kpes
brmely llts helyes valsznsgt tetszleges megfigyelsek alapjn meghatrozni. Jelenlegi
felfogsunk szerint nem ltezik klnll induktv logika; inkbb gy gondoljuk, hogy minden ilyen
logika egy szubjektv a priori valsznsgi eloszlson alapszik, amelynek hatsa a megfigyelsek
szmnak nvekedsvel cskken.
3.1. A valsznsgi aximk hasznlata

A valsznsgi aximkbl nagyon sok hasznos tny vezethet le. Pldul a tagadsra vonatkoz jl ismert
szably kvetkezik, ha a-val helyettestjk b-t a harmadik aximban:
P(a a) = P(a) + P(a) P(a a) (a 3. aximbl, b = a helyettestssel)
P(igaz) = P(a) + P(a) P(hamis) (logikai ekvivalencia alapjn)
1 = P(a) + P(a) (a 2. aximbl)
P(a) = 1 P(a) (algebrai mveletekkel)
A kvetkeztets harmadik sora nmagban is hasznos tny s kiterjeszthet a Boole-tpus logikai esetbl az
ltalnos diszkrt esetre. Legyen d1, , dn a D diszkrt vltoz rtelmezsi tartomnya. Knny megmutatni
(13.2. feladat), hogy
416
Bizonytalansg
Azaz, egyetlen vltoz tetszleges valsznsgi eloszlsa sszegzsnek 1-et kell adnia.6 Igaz az is, hogy
vltozk tetszleges halmaznak brmely egyttes valsznsgi eloszlst sszegezve, eredmnyl szintn 1-et
kapunk: ennek beltsra elegend egyetlen tbbdimenzis, az eredeti vltozk rtelmezsi tartomnyai
Descartes-szorzataknt ltrehozott tartomny felett rtelmezett vltozt ltrehoznunk.
Fontos
Emlkezznk, hogy brmely a llts egyenrtk minden olyan elemi esemny diszjunkcijval, ahol
a igaz; nevezzk az esemnyek ezen halmazt e(a)-nak. Emlkezznk arra is, hogy az elemi
esemnyek egymst klcsnsen kizrjk, gy a 2. axima szerint az ilyen esemnyek konjunkcija
nulla. Kvetkezskppen a 3. aximbl a kvetkez egyszer sszefggsre juthatunk: Egy llts
valsznsge megegyezik azon elemi esemnyek valsznsgeinek sszegvel, ahol az llts igaz,
azaz
Ez az egyenlet egyszer mdszert knl brmilyen llts valsznsgnek meghatrozsra, ha adott az sszes
elemi esemny valsznsgt meghatroz teljes egyttes valsznsg-eloszls (lsd 13.4. alfejezet). A
kvetkez alfejezetekben a valsznsgek kezelsnek tovbbi szablyait fogjuk szrmaztatni. Mindenekeltt
azonban az aximk megalapozottsgt vizsgljuk meg.
3.2. Ami a valsznsgi aximkat indokolja

A valsznsgi aximk tekinthetk az gens ltal elhihet valsznsgi hiedelmek korltainak. Ez
valamennyire hasonlt a logikai esethez, amikor pldul egy logikai gens nem hihet egyszerre A-ban, B-ben s
(A B)-ben. De van itt egy tovbbi bonyodalom is. A logikai esetben az egyttes bekvetkezs defincijnak
jelentse szerint a fenti lltsok kzl legalbb egynek hamisnak kell lennie a valsgban, vagyis egy gens
szmra sszertlen mindhromban hinni. A valsznsgeket tekintve azonban a kijelentsek nem kzvetlenl
a valsgra vonatkoznak, hanem az gens sajt ismereteire. Akkor mirt nem hihet egy gens a meggyzdsek
kvetkez a harmadik aximt egyrtelmen megsrt valsznsg-hozzrendelsek halmazban?
P(a) = 0,4 P(a b) = 0,0
P(b) = 0,3 P(a V b) = 0,8 (13.3)
Az effajta krds vtizedekig vita trgya volt azok kztt, akik a valsznsgek hasznlatt tartottk egyedl
jogosnak a meggyzdsi mrtkek kifejezsre, s azok kztt, akik ms megkzeltsi mdokat javasoltak. Itt
most egy olyan rvelst mutatunk be a valsznsgi aximkkal kapcsolatban, amelyet elszr Bruno de Finetti
fejtett ki 1931-ben.
De Finetti rvelsnek kulcsa a meggyzdsi fok s a cselekvsek kztti sszefggs. A gondolat lnyege,
hogy ha egy gensnek van valamilyen szint meggyzdse egy a lltssal kapcsolatban, akkor kpesnek kell
lennie olyan tteket megadni, amelyek mellett mindegy, hogy az a lltsra, vagy ellene fogad. Kpzeljk el
gy, mint egy jtszmt kt gens kztt: az 1. gens szerint az n hiedelmem az a esemnyben 0,4. A 2. gens
ezutn szabadon dnthet, hogy a mellett vagy ellen fogad akkora tttel, amely a nyilatkozott hiedelemfokkal
konzisztens. Vagyis a 2. gens vlaszthatja azt, hogy arra fogad, hogy a esemny bekvetkezik, 4 dollrt tve az
1. gens 6 dollrjval szemben, vagy tehet 6 dollrt az 1. gens 4 dollrja ellenben arra fogadva, hogy a nem
fog bekvetkezni.7 Ha egy gens meggyzdsben nem tkrzdik pontosan a vilg ismerete, akkor
szmthatunk arra, hogy hossz tvon veszteni fog a szemben ll genssel szemben, akinek a hiedelmei
pontosabb kpet mutatnak a vilg llapotrl.
Folytonos vltozknl az sszegzst integrllal kell helyettesteni:

rvelhetnk azzal, hogy az gens dntst a bankviszonyok fogjk meghatrozni, azaz 1 dollr elvesztse nincs kiegyenslyozva 1 dollr
azonos valsznsg mellett val megnyersvel. Kellen kicsire vlasztva azonban a ttet, ez a problma elkerlhet. Savage (Savage,
1954) analzise az egsz problmt elkerli.
6
7
417
Bizonytalansg
Fontos
De Finetti ennl sokkal ersebb lltst is bizonytott: ha az 1. gens olyan meggyzdsi mrtkekben
hisz, amelyek megsrtik a valsznsg-szmts aximit, akkor ltezik olyan stratgia a 2. gens
szmra, amely biztostja, hogy az 1. gens minden alkalommal veszteni fog. Teht ha elfogadjuk,
hogy egy gensnek a valsznsgeknek megfelelen kell feltennie a pnzt, akkor azt is el kell
fogadnunk, hogy sszertlen olyan meggyzdseket vallani, amelyek megsrtik a valsznsgi
aximkat.
Azt gondolhatjuk, hogy ez a fogadsdi nagyon krmnfont. Mi van pldul, ha valaki megtagadja, hogy
fogadjon? Elrontja-e ez az egsz rvelst? Minderre az a vlasz, hogy a fogadsos jtk elvont modellje annak a
dntsi helyzetnek, amelyben minden gens minden pillanatban elkerlhetetlenl rszt vesz. Minden cselekvs
(belertve a ttlensget is) egyfajta fogads, s a kvetkezmny tekinthet a fogads nyeremnynek. pp gy
nem utasthatjuk vissza a fogadst, mint ahogy nem llthatjuk meg az id mlst.
Nem mutatjuk be de Finetti elmletnek bizonytst, de mutatunk r egy pldt. Tegyk fel, hogy az 1. gens
meggyzdse megfelel a (13.3) egyenletnek. A 13.2. bra azt mutatja, hogy ha a 2. gens azt vlasztja, hogy 4
dollrt tesz a-ra, 3 dollrt b-re s 2 dollrt (a b)-re, akkor az 1. gens mindig veszteni fog, fggetlenl attl,
hogy a vagy b fog bekvetkezni.
13.2. bra - Mivel az 1. gens meggyzdse nem kvetkezetes, ezrt a 2. gens tud gy
tteket tenni, amely a s b kimeneteltl fggetlenl biztostja, hogy az 1. gens vesztsen
Ms, ersen filozofikus rvelseket is elterjesztettek a valsznsgek hasznlata mellett, amelyek kzl a
legnevezetesebb Cox s Carnap nevhez fzdik (Cox, 1946; Carnap, 1950). Lvn a vilg olyan, amilyen, a
gyakorlati pldk sokszor minden bizonytknl ersebbek. gy a valsznsg-szmtson alapul kvetkeztet
rendszerek sikere minden rvelsnl hatkonyabb volt a hitetlenek megtrtsben. A kvetkezkben azt
vizsgljuk meg, hogy az aximk hogyan hasznlhatk a kvetkeztetsben.
4. Teljes egyttes valsznsg-eloszlson alapul

kvetkeztets
Ebben az alfejezetben a valsznsgi kvetkeztets (probabilistic inference) egy egyszer mdszert fogjuk
lerni hogy hogyan hatrozhatk meg az lltsok a posteriori valsznsgekre vonatkoz megfigyelt
bizonytkok alapjn. Tudsbzisknt, a teljes egyttes valsznsg-eloszlst fogjuk hasznlni, amelybl az
sszes krdsre adand vlasz levezethet. Menet kzben szmos hasznos, a valsznsgeket tartalmaz
egyenletek kezelsre alkalmas mdszert is bevezetnk.
Kezdjk egy egszen egyszer pldval, egy olyan tartomnnyal, amely mindssze hrom logikai vltozbl ll.
Ezek: Fogfjs, Lyuk, Beakads (a fogorvos kellemetlen aclszondja beleakad a fogamba). A teljes egyttes
eloszls a 13.3. bra szerinti 2 2 2-es tblzatbl fog llni.
13.3. bra - A Fogfjs, Lyuk, Beakads vilg egy teljes egyttes valsznsg-eloszlsa
418
Bizonytalansg
Vegyk szre, hogy az egyttes valsznsg-eloszlsban a valsznsgi aximknak megfelelen a

valsznsgek sszege 1. Hasonlkppen, a (13.2) egyenlet kzvetlen mdot nyjt brmely, egyszer vagy
sszetett llts valsznsgnek a meghatrozsra: egyszeren azokat az elemi esemnyeket kell
meghatroznunk, amelyekben az llts igaz, majd sszegeznnk kell a hozzjuk rendelt valsznsgeket.
Pldul, hat olyan elemi esemny van, amelyben a lyuk fogfjs igaz:
P(lyuk fogfjs) = 0,108 + 0,012 + 0,072 + 0,008 + 0,016 + 0,064 = 0,28
Az egyik ltalnos feladat a vltozk egy rszhalmaza vagy egyetlen vltoz fltti valsznsgi eloszls
kifejezse. Pldul az els sor bejegyzseinek sszege a lyuk felttel nlkli vagy peremeloszlst8 (marginal
probability) adja:
P(lyuk) = 0,108 + 0,012 + 0,072 + 0,008 = 0,2
Ezt a folyamatot marginalizlsnak (marginalization) vagy kitlagolsnak (summing out) hvjuk, mivel a
Lyuk-on kvli vltozkat kitlagoljuk. A kvetkez ltalnos behatrolsi szablyt fogalmazhatjuk meg a
vltozk tetszleges Y s Z halmaza esetn:
Azaz, egy Y feletti eloszls megkaphat, ha az sszes tbbi vltozt kitlagoljuk az Y-t tartalmaz egyttes
eloszlsokbl a szorzat szablyban
Ezt a szablyt felttelfeloldsnak (conditioning) hvjuk. A marginalizls s a felttelfelolds szablyai

elnyseknek fognak bizonyulni mindenfajta valsznsgi kifejezseket tartalmaz kvetkeztetsben.
A legtbb esetben valamely vltoz, bizonyos msokra vonatkoz tnyek esetn fennll, feltteles
valsznsgnek kiszmtsa fog bennnket rdekelni. A feltteles valsznsgek meghatrozshoz, elszr
is alkalmazzuk a (13.1) egyenletet, hogy egy felttel nlkli valsznsgen alapul kifejezsre jussunk, majd
ezen kifejezs rtkt meghatrozzuk a teljes egyttes eloszlsbl. Pldul a lyuk valsznsgt a fogfjs tny
fennllsa esetre az albbiak szerint hatrozhatjuk meg:
Ellenrzskppen kiszmthatjuk annak valsznsgt, hogy nincs lyuk, de tudjuk, hogy fogfjs igen:
Vegyk szre, hogy a fenti kt szmtsban az 1/P(fogfjs) konstans rtk marad fggetlenl attl, hogy a
Lyuk mely rtkt szmtjuk. Valjban ez egy, a P(Lyuk fogfjs)-t normalizls (normalization)
konstansnak tekinthet, amely biztostja, hogy a feltteles valsznsgek sszege 1 lesz. A valsznsgekkel
foglalkoz fejezetekben az ilyen konstansokat a-val fogjuk jellni. E jells segtsgvel a kt elz kifejezs
egybefoglalhat:
Azrt hvjk gy, mert a biztostsi matematikusok/statisztikusok ltalnos gyakorlata szerint a megfigyelt gyakorisgokat a biztostsi
tblzatok szlre (margjra) szoktk rni.
8
419
Bizonytalansg
P (Lyuk fogfjs) = P (Lyuk, fogfjs)

= [P(Lyuk, fogfjs, beakads) + P(Lyuk, fogfjs, beakads)]
= [ 0,108, 0,016 + 0,012, 0,064 = 0,12, 0,08 = 0,6, 0,4
A normalizls sok valsznsgi szmtsnl hasznos rvidtsnek bizonyul.

A pldbl levezethet egy ltalnos kvetkeztetsi eljrs. Ragaszkodjunk ahhoz az esethez, ahol a keress egy
vltozt rint. A kvetkez jellsekre lesz mg szksgnk: jellje X a keress vltozjt (a pldban ez a
Lyuk), E jelentse a tny vltozk halmazt (a pldban a Fogfjs az egyetlen ilyen), e ezek megfigyelt rtkt
mutatja s a tbbi, meg nem figyelt vltozt Y foglalja magban (a plda esetben csak a Beakads tartozik ide).
P(X e)-t keressk, s a kvetkezkppen szmthatjuk ki:
ahol az sszegzst az sszes lehetsges y fltt vgezzk (azaz az Y meg nem figyelt vltozk rtkeinek sszes
lehetsges kombincija esetn). Vegyk szre, hogy az X, E s Y vltoz egyttesen a vltozk teljes halmazt
alkotja az adott trgytartomnyban, gy P(X, e, y) egyszeren a teljes valsznsgi eloszls egy valsznsgi
rszhalmaza. Az algoritmust a 13.4. bra mutatja.
13.4. bra - A valsznsgi kvetkeztets egy olyan algoritmusa, amely valamely teljes
egyttes valsznsgi eloszls bejegyzseit veszi szmba
Az eljrs ciklusa mind X, mind Y sszes rtke fltt fut, szmba vve minden olyan elemi esemnyt, amely e
rgztett rtke mellett lehetsges, az egyttes valsznsgi tbla alapjn sszegzi ezek valsznsgeit, s
normalizlja az eredmnyeket.
Ha adott a teljes egyttes valsznsgi eloszls, akkor a FELSOROL-EGYTTES-KRDEZS egy teljes algoritmus,
amely alkalmas minden diszkrt vltozra vonatkoz valsznsgi lekrdezs megvlaszolsra. Azonban nem
minsthet jnak: egy n db Boole-tpus logikai vltoz ltal lert tartomnyban O(2n) mret bemeneti tblra
van szksge, s a tbla feldolgozsa is O(2n) idt ignyel. Vals problmk esetn nem csupn hrom, hanem
tbb szz vagy tbb ezer vletlen vltoz figyelembevtelre van szksg. Nagyon hamar teljesen
kivitelezhetetlenn vlik a szksges hatalmas szm valsznsg definilsa nem ltezik ugyanis olyan
tapasztalat, amellyel a tblzat egyes bejegyzsei kln-kln becslhetk lennnek.
Ezrt a tblzatos formban megadott teljes egyttes valsznsgi eloszls a gyakorlatban nem hasznlhat
eszkz kvetkeztet rendszerek felptsre (mindemellett a fejezet vgn tallhat trtneti megjegyzsekben
tallkozhatunk egy ilyen mdszeren alapul vals alkalmazssal). E technikt gy kell tekintennk, mint egy
elmleti alapot, amelyre a hatkonyabb mdszerek plhetnek. A fejezet tovbbi rszeiben bemutatjuk azokat az
alaptleteket, amelyekre szksgnk lesz a 14. fejezet vals rendszereinek kifejlesztshez.
420
Bizonytalansg
5. Fggetlensg
Bvtsk ki a 13.3. brn lthat teljes egyttes valsznsgi eloszlst egy negyedik, Idjrs vltozval. Ezzel
a teljes egyttes valsznsgi eloszls P(Fogfjs, Beakads, Lyuk, Idjrs) lesz 32 bejegyzssel (mivel az
Idjrs vltoznak ngy rtke lehet). A teljes eloszls a 13.3. brn mutatott tblzat ngy pldnyt
minden egyes idjrstpusra egyet fogja magban foglalni. Termszetes krdsnek tnik, hogy vajon ezeknek
a tblzatpldnyoknak mi az egymshoz s az eredeti hromvltozs tblhoz val viszonyuk? Hogyan fgg
ssze pldul a P(fogfjs, beakads, lyuk, Idjrs = felhs) a P(fogfjs, beakads, lyuk)-kal?
A megvlaszols egyik lehetsges mdja a szorzatszably alkalmazsa:
P(fogfjs, beakads, lyuk, Idjrs = felhs) = P(Idjrs = felhs|fogfjs, beakads,
lyuk)P(fogfjs, beakads, lyuk)
Amennyiben eltekintnk az isteni hatalommal br pciensektl, nem gondolhatjuk komolyan, hogy valakinek a
fogszati problmi befolysoljk az idjrst. Ezrt sszernek tnik a kvetkez kijelents:
P(Idjrs = felhs fogfjs, beakads, lyuk) = P(Idjrs = felhs) (13.7)
Ebbl a kvetkezre kvetkeztethetnk:

P(fogfjs, beakads,
beakads, lyuk)
lyuk,
Idjrs
felhs)
P(Idjrs
felhs)P(fogfjs,
Hasonl egyenlet rhat fel a P(Fogfjs, Beakads, Lyuk, Idjrs) eloszls minden egyes bejegyzshez. Az
ltalnos egyenletet pedig a kvetkezkppen rhatjuk fel:
P(Fogfjs, Beakads, Lyuk, Idjrs) = P(Fogfjs, Beakads, Lyuk)P(Idjrs)
Ebbl kvetkezen a ngyvltozs, 32 elemes tblzat ltrehozhat egy 8 s egy 4 elemes tblzatbl. A
dekompozci sematikus vzlatt a 13.5. (a) bra mutatja.
Azt a tulajdonsgot, ami alapjn a (13.7) egyenletet felrtuk fggetlensgnek (ms szval marginlis
fggetlensgnek vagy abszolt fggetlensgnek) (independence, marginal independence, absolute
independence) nevezzk. Esetnkben az idjrs fggetlen brkinek a fogszati problmitl. Az a s b
lltsok fggetlensge felrhat:
P(a b) = P(a) vagy P(b a) = P(b) vagy P(a b) = P(a)P(b) (13.8)
A fenti kpletek egymssal ekvivalensek (13.7. feladat). Az X s Y vltozk kztti fggetlensg a

kvetkezkppen fejezhet ki (mg egyszer felhvjuk a figyelmet, hogy ezek ekvivalensek):
P(X Y) = P(X) vagy P(Y X) = P(Y) vagy P(X, Y) = P(X)P(Y)
A fggetlensgi lltsok ltalban a tartomnnyal kapcsolatos ismereteken alapulnak. Mint korbban lthattuk,
ezek jelentsen lecskkenthetik a teljes egyttes eloszls meghatrozshoz szksges informci mennyisgt.
Ha a vltozk teljes halmaza sztbonthat fggetlen rszhalmazokra, akkor a teljes egyttes eloszls felbonthat
ezen rszhalmazok felett rtelmezett, egymstl fggetlen egyttes eloszlsokra. Pldul n fggetlen
pnzfeldobs eredmnynek egyttes eloszlsa P(C1, , Cn) felrhat n egyvltozs P(Ci) eloszls szorzataknt.
Mg kzzelfoghatbban: a fogszat s a meteorolgia fggetlensge j dolog, klnben a fogszati gyakorlat
mly meteorolgiai ismereteket ignyelne, s fordtva.
13.5. bra - Kt plda nagymret egyttes eloszlsok kisebb eloszlsokra val

felbontsra az abszolt fggetlensg alapjn. (a) Az idjrs s a fogszati problmk
fggetlenek. (b) A pnzfeldobsok fggetlenek.
421
Bizonytalansg
Amennyiben rendelkezsre llnak, akkor a fggetlensgi lltsok segthetnek lecskkenteni a tartomnylersok

mrett, valamint a kvetkeztetsi feladat bonyolultsgt. Sajnos azonban a vltozk teljes halmazait csak
nagyon ritkn lehet fggetlensg alapjn egyrtelmen sztvlasztani. A fggetlensg nem lesz igaz az olyan
esetekben, amikor brmilyen, akr indirekt kapcsolat is, de fennll kt vltoz kztt. Ezen kvl, a fggetlen
rszhalmazok mrete is lehet egszen nagy pldul a fogszat problmakre egymssal sszefgg betegsgek
tucatjait s tnetek szzait takarhatja. Az ilyen tpus problmk kezelsre a fggetlensg kzvetlen
kimondsnl kifinomultabb mdszerekre lesz szksgnk.
6. A Bayes-ttel s hasznlata
Az 2.3. szakasz - A priori valsznsg rszben definiltuk a szorzatszablyt (product rule), s rmutattunk,
hogy ez a konjunkci kommutativitsa miatt kt alakban rhat:
P(a b) = P(a | b)P(b)
P(a b) = P(b | a)P(a)
A jobb oldalak egyenlsgbl P(a)-val val oszts utn kvetkezik, hogy
Ezt az egyenletet Bayes-szablyknt (Bayes rule) ismerjk (nevezik Bayes-trvnynek vagy Bayes-ttelnek
is).9 Ez az egyszer egyenlet az alapja az sszes korszer valsznsgi kvetkeztetst alkalmaz MIrendszernek. A tbbrtk vltozkat tartalmaz ltalnosabb eset a P jellsekkel a kvetkez trssal adhat
meg:
amelyet ismtelten gy kell rtelmezni, hogy egy egyenlethalmazt kpvisel, amely egyenletek mindegyike a
vltozk meghatrozott rtkeire vonatkozik. Lesznek olyan esetek, amikor egy mg ltalnosabb felrst
hasznlhatunk, valamilyen e httrtny felttelvel:
6.1. Bayes ttelnek alkalmazsa: egyszer eset

Az angol irodalomban Bayes rule az elnevezse. Strunk s White The Elements of Style c. knyvnek 1. oldaln tallhat 1. szably
rtelmben a Bayes helyett inkbb a Bayess lenne a helyes jells, azonban az elbbit elterjedtebben hasznljk. (Szerencsre ilyen
problma a magyarban nincs. A szerk.)
9
422
Bizonytalansg
A Bayes-ttel els pillantsra nem tnik tl hasznlhatnak. Egyetlen feltteles valsznsg kiszmtshoz
hrom kifejezs egy feltteles s kt felttel nlkli valsznsg megadsa szksges.
A gyakorlatban a Bayes-ttel jl hasznlhat, mivel gyakran rendelkeznk a fenti hrom kifejezsre vonatkoz
j valsznsgi becslssel, mikzben a negyediket kell kiszmtanunk. Olyan feladatoknl, mint az orvosi
diagnosztika, gyakran ismerjk az ok-okozati kapcsolatok feltteles valsznsgeit, mikzben egy diagnzist
szeretnnk fellltani. Az orvos tudja azt, hogy az agyhrtyagyullads az esetek mondjuk 50%-ban
nyakmerevedst okoz a betegeknl. Az orvos ezenfell ismer nhny felttel nlkli tnyt is: annak elzetes
valsznsge, hogy egy beteg agyhrtyagyulladst kap, 1/50 000, mg annak elzetes valsznsge, hogy egy
betegnek merev a nyaka 1/20. Jellje s azt az lltst, hogy a betegnek megmerevedett a nyaka, valamint m azt
az lltst, hogy a betegnek agyhrtyagyulladsa van. Ekkor
Vagyis a nyakmerevedsrl panaszkod 5000 beteg kzl vrhatan csak egynek lesz agyhrtyagyulladsa.
Vegyk szre, hogy annak ellenre, hogy az agyhrtyagyulladsnak igen gyakori tnete (0,5 valsznsggel) a
nyakmereveds, annak valsznsge, hogy egy nyakmerevedses betegnek tnylegesen agyhrtyagyulladsa
van, mgis csekly. Ez abbl kvetkezik, hogy a nyakmereveds a priori valsznsge sokkal nagyobb, mint az
agyhrtyagyullads.
A 13.4. alfejezetben bemutattunk egy eljrst, amely segtsgvel elkerlhet a tny valsznsgnek
(pldnkban P(s)) megbecslse, gy, hogy a lekrdezett vltoz minden egyes rtkhez (itt m s m) egy
utlagos valsznsget szmtunk ki, majd az eredmnyeket normalizljuk. Hasonl eljrs alkalmazhat, ha a
Bayes-ttelt hasznljuk. Ismert, hogy
P(M|s) = P(s|m)P(m), P(s|m)P(m)
Kvetkezskppen ahhoz, hogy ezt a megkzeltst hasznlni tudjuk, P(s) helyett P(s m)-et kell tudnunk
becslni. Nincs ingyenebd van, hogy ez knnyebb s van, hogy nehezebb. A normalizlt Bayes-ttel
ltalnos alakja
P(Y|X) = P(X\Y)P(Y) (13.11)
ahol a a normalizl konstanst jelli, amely segtsgvel a P(Y|X) elemeinek sszegt 1-gy tudjuk tenni.
Fontos
A Bayes-ttellel kapcsolatban magtl rtetd krds, hogy mirt ismerhetjk a feltteles
valsznsget az egyik irnybl, a msik irnybl pedig nem. Az agyhrtyagyullads tartomnyban a
doktor tudhatja, hogy a nyakmerevedsbl csak minden 5000-dik esetben kvetkezik
agyhrtyagyullads, vagyis a doktor a tnetektl a kivlt ok fel, azaz diagnosztikai (diagnostic)
irnyban rendelkezik mennyisgi informcival. Egy ilyen orvosnak nincs szksge a Bayes-ttel
alkalmazsra. Sajnlatos mdon azonban a diagnosztikai tuds gyakran sokkal trkenyebbnek
bizonyul az ok-okozati sszefggseknl. Ha pldul hirtelen agyhrtyagyullads-jrvny tr ki, akkor
az agyhrtyagyullads elzetes valsznsge, P(m) megn. Az az orvos, aki a jrvnyt megelz
statisztikai adatok alapjn szmtotta ki P(m|s)-t, nem fogja tudni, hogyan vltoztassa meg az
agyhrtyagyulladsra vonatkoz rtket, mg az a doktor, aki a msik hrom rtk segtsgvel szmtja
P(m|s)-t, ltni fogja, hogy ennek rtke P(m)-mel arnyosan meg fog nni. Mg fontosabb azonban,
hogy a P(s|m) okozati informci rtkt a jrvny nem befolysolja, hiszen ez kizrlag az
agyhrtyagyullads lefolystl fgg. Ez a fajta kzvetlen ok-okozati s modellalap tuds alkalmazsa
teszi a valsznsgi rendszereket dnten robusztuss, amely a valdi vilgban val
felhasznlhatsghoz szksges.
6.2. A Bayes-ttel alkalmazsa: tbb egyttes tny

figyelembevtele
423
Bizonytalansg
Lttuk, hogy a Bayes-ttel hasznos lehet az egyetlen tny pldul nyakmereveds felttelezse melletti
valsznsgi krdsek megvlaszolsnl. Nevezetesen, megmutattuk, hogy a valsznsgi informci
gyakran P(okozat ok) formban ll rendelkezsre. Mi trtnik azonban akkor, ha kett vagy tbb tny van a
birtokunkban? Pldul milyen kvetkeztetsre juthat a fogorvos, ha az az undok aclszondja lyukra akad a
beteg fj fogban? Ha ismerjk a teljes egyttes eloszlst (lsd 13.3. bra), a vlasz kiolvashat:
P(Lyuk fogfjs beakads) = 0,018, 0,016 0,871, 0,129
Azt is tudjuk ugyanakkor, hogy ez a megkzelts nagyszm vltoz esetn nem hasznlhat.
Megprblkozhatunk a Bayes-ttel alkalmazsval is, tfogalmazva a krdst:
P(Lyuk fogfjs beakads) = P(fogfjs beakads Lyuk)P(Lyuk) (13.12)
Ahhoz, hogy ez az tfogalmazs mkdjn, a Lyuk minden rtkre ismernnk kell a fogfjs beakads
egyttes bekvetkezsnek feltteles valsznsgt. Noha ez kt tnyvltoz esetn hasznlhat lehet,
nagyszm vltoz esetn mr nem alkalmazhat. Ha n figyelembe veend tnyvltoznk van (rntgen, dita,
szjhiginia stb.), akkor a megfigyelt rtkek lehetsges kombinciinak szma 2 n, amely esetek mindegyiknl
ismernnk kell a feltteles valsznsget. Ennyi ervel akr vissza is trhetnk a teljes egyttes valsznsgeloszls hasznlathoz. Ez vezetett arra, hogy a kutatk a valsznsg-szmts helyett kzelt mdszereket
kezdtek el hasznlni tbb tny egyttes figyelembevtelnl, mert br az gy kapott vlaszok pontatlanok, de
kevesebb szmolst ignyelnek.
A fenti t kvetse helyett inkbb tovbbi lltsokat kell keresnnk a trgytartomnyrl, amelyek lehetv
teszik a kifejezsek egyszerstst. A 13.5. alfejezetben bevezetett fggetlensg (independence) fogalma
knlja a megolds kulcst, azonban finomtst ignyel. Kellemes lenne, ha a Fogfjs s a Beakads
fggetlenek lennnek, de nem azok: ha a szonda megakad a fogban, akkor az valsznleg lyukas, ami
vrhatan fjdalmat okoz. Mindemellett, ezek a vltozk fggetlenek, amennyiben a lyuk meglte vagy hinya
adott tny. Mindkett a lyuk kzvetlen kvetkezmnye, azonban egyiknek sincs kzvetlen hatsa a msikra: a
fogfjs a fogidegek llapottl fgg, mg a szonda pontossgt a fogorvos szakrtelme hatrozza meg,
amelyben nincs szerepe a fogfjsnak.10 Ezt a tulajdonsgot matematikailag a kvetkezkppen rhatjuk le
P(fogfjs beakads Lyuk) = P(fogfjs Lyuk)P(beakads Lyuk) (13.13)
Ez az egyenlet a Lyuk tnye esetn a fogfjs s beakads kztt fennll feltteles fggetlensget (conditional
independence) fejezi ki. (13.13)-at (13.12)-be behelyettestve megkapjuk a lyuk valsznsgt:
P(Lyuk fogfjs beakads) = P(fogfjs Lyuk)P(beakads) Lyuk)P(Lyuk)
Ezzel ugyanarra az informciignyre jutottunk, mint a minden egyes tnyt kln hasznl kvetkeztetsnl: a
keress vltozjnak P(Lyuk) a priori valsznsgt, valamint minden egyes okozat sajt oknak fennllsa
esetn igaz feltteles valsznsgt kell ismernnk.
Kt vltoz, X s Y egy adott Z harmadik melletti feltteles fggetlensgnek ltalnos defincijta kvetkez
egyenlet adja:
P(X, Y Z) = P(X Z)P(Y Z)
A fogorvostartomnyban, pldul, logikusnak tnik a Fogfjs s Beakads kztt feltteles fggetlensget

felttelezni a Lyuk tnye esetn:
P(Fogfjs, Beakads Lyuk) = P(Fogfjs Lyuk)P(Beakads Lyuk) (13.14)
Vegyk szre, hogy ez a kijelents valamelyest ersebb, mint amit a (13.13) egyenlet fejez ki. Ez utbbi csak a
Fogfjs s Beakads bizonyos rtkeihez rendel fggetlensget. ppgy, mint a (13.8) egyenletben az abszolt
fggetlensgnl, a kvetkez ekvivalens kifejezsek is hasznlhatk:
P(X Y, Z) = P(X Z) s P(Y X, Z) = P(Y Z)
A 13.5. alfejezetben megmutattuk, hogy a teljes fggetlensg bizonythatsga esetn a teljes egyttes
valsznsgi eloszls sztbonthat sokkal kisebb rszekre. Ugyanez lesz igaz feltteles fggetlensg esetn is.
Pldnak okrt, a (13.14) szerinti kijelents fennllsa esetn, a felbonts a kvetkezt jelentheti:
10
Felttelezve, hogy a beteg s a fogorvos kt klnbz szemly.
424
Bizonytalansg
P(Fogfjs, Beakads, Lyuk)

= P(Fogfjs, Beakads Lyuk)P(Lyuk) (szorzatszably)
= P(Fogfjs Lyuk)P(Beakads Lyuk)P(Lyuk) (13.14)-et hasznlva
Fontos
Ezzel a mdszerrel az eredeti nagy tblzat felbonthat hrom kisebbre. Az eredeti tblzat ht
fggetlen szmot tartalmaz (231, mivel a szmok sszegnek 1-et kell adnia). A kisebb tblzatokban
t fggetlen szm tallhat (mindegyik feltteles valsznsgi eloszlsra 2 (211), valamint 211 a
Lyuk elzetes valsznsgi eloszlsra). Ez nem tnik tl nagy gyzelemnek, azonban, ha a Lyuk
tnye mellett n tnet bizonyul fggetlennek, akkor a reprezentci O(n) nagysgrendben nvekszik
O(2n) helyett. Kvetkezskppen a feltteles fggetlensgi kijelentsek lehetv teszik nagy
valsznsgi rendszerek kezelhetsgt, st, a feltteles fggetlensgi kijelentsek gyakrabban
rendelkezsre is llnak, mint az abszolt fggetlensgre vonatkozk. A Lyuk fogalmilag sztvlasztja
(separate) a Fogfjs-t s a Beakads-t, mivel mindkettnek kzvetlen kvetkezmnye. Nagy
valsznsgi tartomnyok feltteles fggetlensgen keresztl lazn kapcsold rszhalmazokra
trtn sztbontsa a modern MI trtnetnek legnagyobb eredmnyei kz tartozik.
A fogorvosi eset j plda az olyan, rendszeresen bekvetkez mintra, ahol egyetlen ok kzvetlenl befolysol
szmos olyan okozatot, amelyek az ok fennllsa esetn felttelesen fggetlenek. A teljes valsznsgi eloszls
az albbiak szerint rhat fel:
Az ilyen valsznsgi eloszlsokat naiv Bayes-modellnek hvjuk naiv, mert gyakran hasznljk
(egyszerstsknt) olyan esetekben is, ahol az okozati vltozk valjban nem fggetlenek az ok fennllsa
esetn. (A naiv Bayes-modellt nha Bayes-osztlyoznak (Bayes classifier) is hvjk nmileg
meggondolatlanul, ami arra sarkallta az igazi Bayes-kvetkeztetst alkalmazkat, hogy a naiv Bayes-modellt
egygy Bayes- (idiot Bayes) modellnek hvjk.) A naiv Bayes-modellek a gyakorlatban akkor is meglepen
jl mkdnek, ha a valsznsgi felttelezs nem igaz. A 20. fejezetben olyan mdszereket runk le,
amelyekkel a naiv Bayes-eloszlsok megtanulhatk a megfigyelsekbl.
7. A wumpus vilg jraltogatsa

E fejezet gondolatai kzl sok eredmnyesen kombinlhat a wumpus vilg valsznsgi kvetkeztetsi
problminak megoldsra. (A wumpus vilg teljes lersa a 7. fejezetben tallhat.) A wumpus vilgban fellp
bizonytalansgot az gens rzkelsnek a vilgra vonatkozan a csak helyi informcit szolgltat
rszlegessge okozza. Pldul a 13.6. bra egy olyan szitucit brzol, amelyben mindhrom elrhet ngyzet
[1, 3], [2, 2] s [3, 1] tartalmazhat csapdt. Egyszer logikai kvetkeztetssel nem dnthet el, hogy melyik
a legvalsznbben biztonsgos ngyzet, gy a logikai gens knytelen vletlenszeren vlasztani. Ltni fogjuk
ugyanakkor, hogy egy valsznsgi gens sokkal sikeresebb, mint egy logikai gens.
A clunk az lesz, hogy mindhrom ngyzetre kiszmtsuk a csapda valsznsgt. (A plda erejig elfelejtjk a
wumpust s az aranyat.) A wumpus vilg idevg tulajdonsgai a kvetkezk: (1) egy csapda szellt okoz a
szomszdos ngyzetekben, s (2) az [1,1]-en kvl minden ngyzet 0,2 valsznsggel tartalmaz csapdt. Els
lpsknt a szmtshoz szksges vletlen vltozkat kell meghatroznunk:
Az tletlogikhoz hasonlan, itt is minden ngyzethez egy (Ci,j) logikai vltozra van szksgnk, amelynek
rtke akkor s csak akkor igaz, ha az [i,j] ngyzet tartalmaz csapdt.
Vannak tovbb Si,j logikai vltozink is, amelyek igaz rtke egyrtelmen az [i,j] ngyzetben tapasztalhat
szellre utal; pldnkban csak a megfigyelt esetnkben az [1, 3], [2, 2] s [3, 1] ngyzetekre vonatkoz
vltozkat hasznljuk.
A kvetkez lps a P(C1,1,, C4,4, S1,1, S1,2, S2,1) teljes valsznsgi eloszls meghatrozsa. A szorzatszably
alkalmazsval
P(C1,1,, C4,4, S1,1, S1,2, S2,1) = P(S1,1, S1,2, S2,1 C1,1,, C4,4)P(C1,1,, C4,4)
425
Bizonytalansg
addik.
13.6. bra - (a) Az gens beragad, miutn [1, 2]-ben s [2, 1]-ben is szellt szlel nincs
feltrhat biztonsgos hely. (b) A ngyzetek sztosztsa Ismert, Perem s Egyb
csoportokba az [1, 3]-ra vonatkoz lekrdezshez.
A dekompozci nagyon knnyv teszi az egyttes valsznsgi rtkek meghatrozst. Az els rsz a szell
feltteles valsznsg konfigurcijt adja adott csapda konfigurcinl; ennek rtke 1, ahol a szell
szomszdos egy csapdval, minden ms esetben 0. A msodik tag a csapdakonfigurci elzetes valsznsge.
A ngyzetek a tbbi ngyzettl fggetlenl 0,2 valsznsggel tartalmaznak csapdt; kvetkezskppen
Egy n csapdt tartalmaz konfigurcinl ennek rtke 0,2 n 0,816n.

A 13.6. (a) bra szerinti helyzetnl a bizonytk magban foglalja minden megltogatott ngyzetre az ott
megfigyelt szellt (vagy annak hinyt) azzal a tnnyel egytt, hogy a megltogatott ngyzetek nem
tartalmaznak csapdt. Ezeket az s = s1,1 s1,2 s2,1 s ismert = c1,1 c1,2 c2,1 rvidtsekkel fogjuk jellni.
A mi szmunkra a P(C1,3 ismert, s) tpus lekrdezsek megvlaszolsa rdekes: adott megfigyelsek mellett
mennyire valszn, hogy az [1, 3] csapdt tartalmaz?
A vlaszhoz kvethetjk a (13.6) egyenlet szerinti szabvnyos megkzeltst, amelyet a FELSOROL-EGYTTESKRDEZS eljrs valst meg, azaz a teljes egyttes valsznsgi eloszls bejegyzsei szerinti sszegzst.
Jellje Ismeretlen azt az sszetett vltozt, amelyet a nem Ismert csoportba tartoz ngyzetek s a lekrdezett
[1, 3] ngyzet Ci,j vltozi alkotnak. Ezzel a (13.6) egyenletbl
A teljes egyttes valsznsgeket korbban mr meghatroztuk, gy kszen is vagyunk kivve, ha a szmtsi

bonyolultsg krdsvel is trdnk. 12 ismeretlen ngyzetnk van; gy az sszegzs 212 = 4096 tagbl fog llni.
ltalnossgban, az sszegzs exponencilisan n a ngyzetek szmval.
Az intuci azt sgja, hogy itt valamit mg figyelmen kvl hagyunk. s tnyleg, brki megkrdezheti, hogy a
tbbi ngyzet nem lnyegtelen-e? A [4, 4] tartalma nincs hatssal arra, hogy az [1, 3] tartalmaz-e csapdt! Ez az
intuci valban helyes. Jellje Perem azokat a lekrdezs vltozjtl klnbz vltozkat, amelyek a
megltogatott ngyzetekkel szomszdosak, esetnkben a [2, 2] s a [3, 1]. Tovbb Egyb legyen a tbbi
ismeretlen ngyzet vltozja; pldnkban ahogy a 13.6. (b) bra is mutatja 10 ilyen ngyzet van. A kulcs
meglts az, hogy megfigyelt szellk felttelesen fggetlenek a tbbi vltoztl, ha adottak az ismert, a perem s
a lekrdezs vltozk. A tbbi, ahogy mondjk, mr csak egy kis algebra.
426
Bizonytalansg
A fenti meglts hasznlathoz a lekrdezst olyan alakra hozzuk, amelyben a szell az sszes tbbi vltoz
felttele mellett van megadva, majd az egszet egyszerstjk a feltteles fggetlensg alapjn:
ahol az utols lps hasznlja ki a feltteles fggetlensget. E kifejezs els tagja nem fgg a tbbi vltoztl,
gy az sszegzs bellre vihet:
Fggetlensg esetn a (13.15) egyenlethez hasonlan az elz kifejezs tnyezkre bonthat, majd a tnyezk
sorrendje trendezhet:
ahol az utols lpsben C(ismert)-et belefoglaltuk a normalizl konstansba, s kihasznltuk, hogy

rtke 1.
Most mr csak ngy tag van a C2,2 s C3,1 peremvltozk feletti sszegzsben. A fggetlensg s feltteles
fggetlensg miatt egyltaln nem szksges figyelembe vennnk a tbbi ngyzetet. Vegyk szre, hogy a
P(s ismert, C1,3, perem) kifejezs rtke 1, ha a hatr megegyezik a szell rzkelsekkel s minden ms
esetben 0. Azaz, C1,3 minden rtkre azon hatrvltozk logikai modelljei fltt vgezzk az sszegzst,
amelyek az megfelelnek az ismert tnyeknek. (rdemes ezt sszehasonltani a 7.5. bra modelljei szerinti
szmtssal.) A modelleket s a hozzjuk kapcsold C(perem) a priori valsznsgeket a 13.7. bra mutatja.
Ezzel
P(C1,3 ismert, s) = ' 0,2(0,04 + 0,16 + 0,16), 0,8(0,04 + 0,16) 0,31, 0, 69
Azaz, az [1, 3] (s a szimmetria miatt a [3, 1]) nagyjbl 31% valsznsggel tartalmaz csapdt. Hasonl
szmtsokbl (amelyet az olvas knnyen elvgezhet) a [2, 2]-re 86%-os valsznsggel addik csapda. A
wumpus gensnek hatrozottan el kell kerlnie a [2, 2]-t!
13.7. bra - C2,2 s C3,1 peremvltozk, az egyes modellek C(perem) rtkt mutat
konzisztens modelljei: (a) hrom, kt vagy hrom csapdt jelz modell C1,3 = igaz
mellett, s (b) kt, egy vagy kt csapdt jelz modell C1,3 = hamis mellett.
427
Bizonytalansg
Ebben az alfejezetben azt mutattuk meg, hogy mg a ltszlag bonyolult problmk is pontosan
megfogalmazhatk valsznsg-elmleti alapokon, s meg is oldhatk egyszer algoritmusok segtsgvel.
Hogy hatkony megoldsokat kapjunk, a szksges sszegzseket a fggetlensgekre s feltteles
fggetlensgekre alapozva egyszerstjk. Ezek az sszefggsek gyakran egybeesnek a problma
rszproblmkra val felbontsra vonatkoz termszetes felfogsunkkal. A kvetkez fejezetben ilyen
sszefggsek formlis megjelentsre alkalmazunk mdszereket, valamint olyan algoritmusokat fejlesztnk
ki, amelyek hatkonyan hasznlhatk e reprezentcik alapjn elvgzett valsznsgi kvetkeztetsek
vgrehajtsra.
8. sszefoglals
Ez a fejezet arra mutat r, hogy a valsznsg megfelel mdja a bizonytalansgra vonatkoz
kvetkeztetseknek.
Bizonytalansg kvetkezik mind a lustasgbl, mind pedig a tudatlansgbl. sszetett, dinamikus vagy
hozzfrhetetlen vilgok esetn mindez elkerlhetetlen.
A bizonytalansg azt jelenti, hogy a tovbbiakban sok olyan egyszersts, amely deduktv kvetkeztets
sorn megengedhet, hamis eredmnyre vezet.
A bizonytalansg az gens kptelensgt fejezi ki arra, hogy egyrtelm dntst hozzon egy llts igazsgt
illeten. A valsznsgek az gens meggyzdsnek fokt fejezik ki.
Az alapvet valsznsgi lltsok magukban foglaljk az egyszer s az sszetett lltsokra vonatkoz a
priori s feltteles valsznsgeket (prior and conditional probabilities).
A teljes egyttes valsznsg-eloszls (full joint probability distribution) valsznsget rendel a vletlen
vltoz minden teljes kr rtk-hozzrendelshez. A teljes egyttes valsznsg-eloszls ltalban sokkal
nagyobb mret annl, semhogy ltrehozzuk vagy hasznljuk.
A valsznsgi aximk knyszereket jelentenek az lltsokhoz sszeren hozzrendelt valsznsgek
rtkre vonatkozan. Az aximkat megsrt gens bizonyos krlmnyek kztt sszertlenl fog
viselkedni.
Ha rendelkezsre ll a teljes valsznsgi eloszls, akkor a lekrdezsek megvlaszolst egyszeren a
lekrdezsek lltshoz tartoz elemi esemnyek bejegyzseinek sszeadsval elvgezhetjk.
A vletlen vltozk rszhalmazai kztt fennll abszolt fggetlensg (absolute independence) maga utn
vonja a teljes egyttes valsznsgi eloszls kisebb egyttes valsznsgi eloszlsokbl ll
szorzattnyezkre bontsnak lehetsgt. Ez nagymrtkben cskkentheti a bonyolultsgot, azonban a
gyakorlatban ritkn fordul el.
A Bayes-ttel (Bayes rule) lehetv teszi, hogy ismert feltteles valsznsgekbl szmtsunk ki
ismeretleneket, ltalban az okozat irnyba kvetkeztetve. Nagy mennyisg tny rendelkezsre llsa
esetn a Bayes-ttel alkalmazsa ugyanolyan szmtsigny-robbanshoz vezet, mint a teljes egyttes
valsznsgi eloszls.
A tartomnyon belli kzvetlen oksgi kapcsolatok okozta feltteles fggetlensg (conditional
independence) lehetv teszi, hogy a teljes valsznsgi eloszlst kisebb, feltteles valsznsgi eloszlsok
428
Bizonytalansg
szorzataknt rhassuk fel. A naiv Bayes- (naive Bayes) modell adott okvltoz mellett felttelezi az okozati
vltozk feltteles fggetlensgt, a modell mrete pedig az okozati vltozk szmval linerisan n.
A wumpus vilg gense ki tudja szmtani a vilg meg nem figyelt esemnyeinek valsznsgt is, s azokat
hasznlva jobb kvetkeztetsekre tud jutni, mint egy egyszer logikai gens.

Br a szerencsejtkok mr i. e. 300 krl is ismertek voltak, az eslyek s a valsznsgek matematikai
analzise jval ksbbre tehet. Mahaviracarya Indiban nagyjbl az i. e. 9. szzadban kezdte meg a tma
vizsglatt. Eurpban az els ksrletek csak az olasz renesznsz idejre, kb. 1500-ra tehetk. Az els jelents
kvetkezetes elemzs Girolamo Cardano nevhez fzdik (1565), amely azonban 1663-ig nem kerlt
nyilvnossgra. Ekkorra Blaise Pascalnak a valsznsgek szisztematikus kiszmtsra vonatkoz felfedezse
(Pierre Fermat-val levelezve 1654-ben) megalapozta a valsznsg-szmtst, mint a matematika szles krben
s eredmnyesen vizsglt gt. Az els valsznsgekkel kapcsolatos tanknyv a De Ratiociniis in Ludo Aleae
volt (Huygens, 1657). Pascal bevezette a feltteles valsznsg fogalmt is, amelyrl szintn sz van Huygens
knyvben. Thomas Bayes anglikn lelksz (17021761) nevhez fzdik a ksbb rla elnevezett szably,
amely feltteles valsznsgek szmtsra alkalmas. Eredmnye csak halla utn jelent meg nyomtatsban
(Bayes, 1763). Kolmogorov volt az els (Kolmogorov, 1950; els megjelens nmetl 1933), aki a
valsznsg-szmtst szigoran axiomatikus keretek kztt trgyalta. Rnyi (Rnyi, 1970) olyan
aximarendszert vezetett be, amely nem a felttel nlkli, hanem a feltteles valsznsg fogalmra pl.
Pascal tbbflekppen hasznlta a valsznsg fogalmt, gy ignyelte mind az objektivista rtelmezst
amely szerint a valsznsg a vilghoz tartoz, szimmetrin vagy relatv gyakorisgon alapul sajtsg , mind
pedig a valsznsg meggyzdsi mrtken alapul szubjektv megkzeltst: elbbit a szerencsejtkokra
vonatkoz valsznsg elemzseiben, mg az utbbit a hres pascali fogads rvelsben Isten ltezse vagy
nemlte kapcsn. Mindemellett, Pascal nem ltta vilgosan a kt megkzelts kztti klnbsget. Ezt jl
rtheten elszr James Bernoulli (16541705) fogalmazta meg.
Leibniz nevhez fzdik a valsznsg klasszikus fogalmnak mint a szmba vett azonos esly esetek
arnynak lersa. Ugyanezt a fogalmat hasznlta Bernoulli is, br igazbl Laplace (17491827) vezette be a
gyakorlatba. A fogalom azonban a frekvencionista, illetve a szubjektv rtelmezsi md kztt nem tud
klnbsget tenni. Az esetek tekinthetk azonos eslyeknek akr a termszetes fizikai szimmetrik miatt, akr
pedig egyszeren azrt, mert nincs olyan informcink, amely arra mutatna, hogy az egyik bekvetkezsnek
nagyobb az eslye, mint a msiknak. Ez utbbit, amikor egyni megfontolsok alapjn igazoljuk az egyenl
valsznsgek hozzrendelst, a prtatlansg elvnek (principle of indifference) hvjuk (Keynes, 1921).
A valsznsg objektivista s szubjektivista rtelmezse kztti vita a 20. szzadban kilesedett. A relatv
gyakorisg szszli Kolmogorov (Kolmogorov, 1963), R. A. Fisher (Fisher, 1922) s Richard von Mises (von
Mises, 1928) voltak. Karl Popper (Popper, 1959; els megjelens nmetl 1934) hajlam (propensity)
rtelmezse a mgttes fizikai szimmetrit ltja a relatv gyakorisgban. Frank Ramsey, Bruno de Finetti, R. T.
Cox, Leonard Savage s Richard Jeffrey gy rtelmeztk a valsznsget, mint meghatrozott egynek
meggyzdsnek mrtkt (Ramsey, 1931; de Finetti, 1937; Cox, 1946; Savage, 1954; Jeffrey, 1983). A
hiedelem mrtkre vonatkoz elemzsk szorosan ktdtt a hasznossghoz s a viselkedshez, klnsen
ahhoz a szndkhoz, hogy fogadsokat kssnk. Rudolf Carnap, Leibnizet s Laplace-t kvetve, a szubjektv
valsznsg egy msfajta rtelmezst javasolta: nem mint az adott egyn meggyzdst, hanem mint azt a
hiedelemfokot, amelyet egy eszmnyi szemlynek kell hinnie egy adott a lltsrl e tny fennllsa esetn.
Carnap megprblt Leibniz-nl s Laplace-nl tovbb menni, s ezt a megerstsi (confirmation) mrtk
fogalmat, mint a s e kztt fennll logikai kapcsolatot, matematikailag is pontosan lerni. A kapcsolat
tanulmnyozsa rvn akarta a megszokott deduktv logika (Carnap, 1948; 1950) mintjra, a matematika egy
induktv logiknak (inductive logic) nevezett diszciplinjt megalaptani. Carnap kptelen volt az induktv
logikt lnyegesen kiterjeszteni az tletkalkuluson tlra, s Putnam mutatta meg, hogy alapvet nehzsgek
histjk meg az aritmetikt is kifejezni kpes nyelvek irnyba trtn szabatos kiterjesztst (Putnam, 1963).
A vonatkoztatsi osztly krdse szorosan ktdik az induktv logika megtallsra tett trekvsekhez. Az
elgsges mret legjobban specifikus vonatkoztatsi osztly kivlasztsra val trekvst Reichenbach
javasolta (Reichenbach, 1949). Erfesztsek trtntek kifinomultabb irnyelvek kialaktsra, amelyekkel el
lehet kerlni a Reichenbach-szablybl kvetkez, Henry Kyburg ltal szlelt ellentmondsokat (Kyburg, 1977;
1983), azonban ezek a trekvsek leginkbb ad hoc jellegek maradtak. Egy jabb, Bacchus, Grove, Halpern s
Koller nevhez fzd munka (Bacchus s trsai, 1992) Carnap mdszereit kiterjeszti az elsrend elmletekre,
kikszblve ezltal sok, a vonatkoztatsi osztlyokkal kapcsolatos nehzsget.
429
Bizonytalansg
A bayesi valsznsgi kvetkeztet rendszereket a hatvanas vek ta hasznljk az MI-ben, klnsen az

orvosi diagnosztikban. Nemcsak azrt, hogy meglev tnyekbl kvetkeztetseket vonjanak le, hanem azrt is,
hogy az informcirtk-elmlet (lsd 16.6. alfejezet) segtsgvel tovbbi krdseket s vizsglatokat
vlasszanak, amikor a meglev tnyek nem meggyzk (Gorry, 1968; Gorry s trsai, 1973). Az egyik rendszer
fell is mlta az emberi szakrtket a heveny hasi megbetegedsek diagnzisban (de Dombal s trsai, 1974).
Mindemellett azonban ezekkel a korai bayesi rendszerekkel igen sok gond is volt. Lvn, semmilyen elmleti
modellel nem rendelkeztek azokrl a krlmnyekrl, amelyeket diagnosztizltak, sebezhetk voltak mindazon
esetekben, amikor olyan helyzetekre jellemz adatok tntek fel, amelyeket csak kisszm mintahalmaz
kpviselt (de Dombal s trsai, 1981). Mg ennl is alapvetbb, hogy mivel nem volt tmr ler mdszerk
(mint amilyet a 14. fejezetben ismertetnk) a feltteles fggetlensg megjelentsre s hasznlatra, ersen
fggtek a hatalmas mennyisg valsznsgi adat gyjtstl, trolstl s feldolgozstl. E nehzsgek
miatt 1970-tl a nyolcvanas vek kzepig a bizonytalansgkezels valsznsgi mdszerei kegyvesztettek
lettek az MI-ben. A nyolcvanas vek vge ta bekvetkezett fejldst a kvetkez fejezet rja le.
Az egyttes eloszlsok naiv bayesi megkzeltst az alakfelismerssel foglalkoz irodalom alaposan
tanulmnyozta az 1950-es vektl kezdve (Duda s Hart, 1973). A megkzeltst Maron munkjnak
megjelense (Maron, 1961) ta gyakran hasznltk sokszor akaratlanul az adatbnyszat terletn is. A
mdszer valsznsgi megalapozst, amelyet rszletesen a 13.18. feladat r le, Robertson s Sparck Jones
tisztzta (Robertson s Jones, 1976). A naiv Bayes-kvetkeztetsnek a mg olyan tartomnyokban is jelentkez
meglep sikerre, ahol a fggetlensgi felttelezs egyrtelmen srl, Domingos s Pazzani ad magyarzatot
(Domingos s Pazzani, 1977).
A valsznsg-szmts tmakrben nagyon sok kivl tanknyv ltezik, belertve a Chung s Ross ltal
rtakat (Chung, 1979; Ross, 1988). Morris DeGroot kt knyve kzl az egyik (DeGroot, 1989) a bayesi
llspont fell kzeltve ad kzs bevezetst a valsznsg-szmtsba s a statisztikba, a msik pedig
mlyebb ismereteket tartalmaz (DeGroot, 1970). Richard Hamming tanknyve matematikailag megalapozott
bevezetst nyjt a valsznsg-szmts elmletbe a fizikai szimmetrin alapul hajlammegkzelts fell
(Hamming, 1991). Hacking s Hald a valsznsg fogalmnak korai trtnett trjk elnk (Hacking, 1975;
Hald, 1990), Bernstein pedig szrakoztat npszerst ttekintst ad a kockzatelemzs trtnetrl (Bernstein,
1996).
8.2. Feladatok
13.1.
Mutassa meg az alapelvek segtsgvel, hogy
P(a b a) = 1
13.2.
A valsznsg-szmts aximit hasznlva bizonytsa be, hogy diszkrt vletlen vltozk tetszleges
valsznsgi eloszlsa sszegnek 1-et kell adnia.
13.3.
sszer lehet-e egy gens szmra a kvetkez hrom meggyzdsben hinni: P(A) = 0,4, P(B) = 0,3 s P(A
B) = 0,5? Ha igen, milyen valsznsgsvot tart sszernek A B-re vonatkozan? Ksztsen a 13.2. brhoz
hasonl tblzatot, s mutassa meg, hogyan tmasztja ez al az n rvelst. Ezutn ksztsen egy msik
vltozatot, amelynl P(A B) = 0,7. Magyarzza el, mirt racionlis egy ekkora valsznsg hozzrendelse,
mindamellett hogy a tblzat mutat egy olyan esetet, ami vesztesg, s hrom olyat, ami ki van egyenltve.
(Segtsg: milyen valsznsgi hozzrendels mellett ktelezte el magt az 1. gens a ngy esetben, de
klnsen a vesztesg esetn?)
13.4.
Ez a krds az 2.1. szakasz - lltsok rszben trgyaltaknak megfelelen, az elemi esemnyek tulajdonsgaival
foglalkozik.
a. Bizonytsa be, hogy az sszes lehetsges elemi esemny egyestse logikailag megegyezik az igaz lltssal.
(Segtsg: bizonytkknt alkalmazzon indukcit a vletlen vltozk szmra vonatkozan.)
430
Bizonytalansg
b. Bizonytsa be, hogy brmely llts logikailag ekvivalens azon elemi esemnyek diszjunkcijval, amelyek
maguk utn vonjk annak igazsgt.
13.5.
Kpzeljk el a szokvnyos 52 lapos krtyacsomagbl osztott tlapos pker jtszmk tartomnyt, annak
feltevsvel, hogy az oszt becsletes.
a. Hny elemi esemnyt tartalmaz az egyttes valsznsg-eloszls (azaz hnyfle 5 lapos leoszts ltezik egy
kzben)?
b. Mekkora a valsznsge az egyes elemi esemnyeknek?
c. Mekkora a valsznsge a fell szos sznsornak (royal flush, egyszn sz, kirly, dma, bubi s tzes)? s
ngy egyforma lapnak?
13.6.
Szmtsa ki az albbiakat, ha adott a 13.3. bra szerinti teljes egyttes valsznsgi eloszls.
a. P(fogfjs)
b. P(Lyuk)
c. P(Fogfjs lyuk)
d. P(Lyuk fogfjs beakads)
13.7.
Mutassa meg, hogy a fggetlensg (13.8) egyenlet szerinti hrom felrsi mdja ekvivalens egymssal.
13.8.
Az venknt esedkes orvosi ellenrzse utn a doktor rossz s j hreket mond. A rossz hr az, hogy komoly
betegsget mutattak ki nnl, s a teszt 99%-ban megbzhat (azaz, annak a valsznsge, hogy a teszt
kimutatja a meglev betegsget, 0,99, s ugyangy, annak a valsznsge, hogy a teszt negatv lesz,
amennyiben nem ll fenn a betegsg, szintn 0,99). A j hr az, hogy ez a betegsg nagyon ritka, amelyet az n
korban minden 10 000 emberbl csak egy kap meg. Mirt j hr az, hogy a betegsg ritka? Mekkora az eslye
annak, hogy n tnyleg beteg?
13.9.
Sokszor clszerbb adott lltsok hatst bizonyos rgztettnek felttelezett ltalnos httrtnyek
felttelezsvel vgiggondolni, mint az informci teljes hinyban. Az albbi krdsek a szorzatszably s a
Bayes-ttel ltalnos alakjainak bizonytst clozzk, valamely e httrtny felttelezse mellett.
a. Bizonytsa be az ltalnos szorzatszably valamely felttel fennllsa esetn felrhat alakjt:
P(X, Y e) = P(X Y, e)P(Y e)
b. Bizonytsa be a Bayes-ttel (13.10) egyenlet szerinti, valamilyen felttel fennllsa esetre felrt vltozatt.
13.10.
Mutassa meg, hogy a
P(A,B C) = P(A C) P(B C)
llts mindkt albbi lltssal egyenrtk

P(A B,C) = P(A C) s P(B A,C) = P(B C)
13.11.
431
Bizonytalansg
Tegyk fel, hogy kapott egy n darab egyforma pnzrmt tartalmaz zskot. Azt is tudjuk, a pnzek kzl n1
szablyos, azaz egyik oldaln fej, a msikon rs tallhat, ugyanakkor van egy darab hamis, amelynek mindkt
oldala fej.
a. Tegyk fel, hogy benyl a zskba, majd vletlenszeren kiemel egy pnzdarabot. Ezt feldobva fejet kap
eredmnyl. Mekkora a (feltteles) valsznsge annak, hogy a kivett pnzdarab a hamis?
b. Tegyk fel, hogy k-szor folytatva a pnz feldobst, ezutn is minden alkalommal fejet kap. Most mennyi
lesz a feltteles valsznsge annak, hogy a kivett pnzdarab a hamis?
c. Tegyk fel, hogy a k-szori feldobssal akarta eldnteni, hogy a hamis vagy egy j pnzrmt emelt ki a
zskbl. A dntsi eljrs HAMIS-at ad, ha mind a k feldobs alkalmval a fej van fll, egybknt pedig
J-t. Mekkora annak a (felttel nlkli) valsznsge, hogy az eljrs tvedni fog?
13.12.
Ebben a feladatban befejezheti az agyhrtyagyulladsra vonatkoz plda normalizlst. Elszr is vegyen fel
egy megfelel rtket P(S M)-re, s ennek segtsgvel szmtsa ki P(M S) s P(M S) normalizlatlan
rtkeit (azaz ne vegye figyelembe P(S)-t a Bayes-ttel kifejezsben), majd normalizlja az rtkeket gy, hogy
sszegk 1 legyen.
13.13.
Ez a feladat azt vizsglja, hogy a feltteles fggetlensg fennllsa hogyan befolysolja a valsznsgi
becslsekhez szksges informci mennyisgt.
a. Tegyk fel, hogy P(h e1,e2)-t szeretnnk kiszmtani gy, hogy nincs feltteles fggetlensgre vonatkoz
informcink. Az albbiak kzl melyik az az adathalmaz, amelyikre a szmtsokhoz szksgnk van?
i. P(E , E ), P(H), P(E H), P(E H)
1
ii. P(E , E ), P(H), P(E , E H)

1
iii. P(H), P(E H), P(E H)

1
d. Tegyk fel, hogy tudjuk, hogy P(E1 H, E2) = P(E1 H), H, E1, E2 minden rtkre. Hogyan vltozik az elbbi
krdsre adott vlasz?
13.14.
X, Y s Z legyenek logikai vletlen vltozk. A P(X, Y, Z) egyttes eloszls nyolc lehetsges esett jelljk a,
, h-val. Fejezze ki az X s Y adott Z mellett felttelesen fggetlenek lltst az a, , h-t sszekapcsol
egyenletek segtsgvel. Hny lesz ezek kzl redundanciamentes?
13.15.
(A (Pearl, 1988)-bl tvve.) Kpzeljk el, hogy n egy jszakai taxis cserbenhagysos baleset tanja
Athnban. Athnban minden taxi kk vagy zld. n azt vallja esk alatt, hogy a taxi kk volt. Egy szles kr
vizsglat azt mutatja, hogy ilyen gyenge fnyben a kk s zld szn kztti tveszts valsznsge 75%.
Kiszmthat-e, hogy milyen szn taxi volt a legvalsznbb? (Segtsg: gondosan klnbztessk meg azt az
lltst, hogy a taxi kk, s azt, hogy a taxi kknek tnik.)
Mi van akkor, ha minden 10 athni taxibl 9 zld?
13.16.
(A (Pearl, 1988)-bl tvve.) Hrom fegyenc, A, B s C cellikba vannak zrva. Kzismert, hogy egyikket
msnap ki fogjk vgezni, mg a msik kett kegyelmet kap. Azt, hogy kit vgeznek ki, csak a brtnigazgat
tudja. A fegyenc egy krssel fordul a brtnrhz: Legyen szves, krdezze meg az igazgattl, hogy kit
fognak holnap kivgezni, s a bartaim kzl az egyiknek, B-nek vagy C-nek rulja el, hogy reggel kegyelmet
fog kapni. Az r beleegyezik, majd ksbb azzal jn vissza, hogy B-nek szlt a kegyelemrl.
432
Bizonytalansg
Mekkork A eslyei a kivgzsre a trtntek utn? (Ne csak erteljes kzlegyintssel, hanem matematikailag
megalapozottan vlaszoljon.)
13.17.
rja meg azt az ltalnos, naiv Bayes-eloszlst hasznl algoritmust, amely alkalmas P(Ok e) alak keressek
megvlaszolsra. Fel kell tteleznie azt is, hogy az e bizonytk az rintett vltozk tetszleges rszhalmazhoz
rendel rtkeket.
13.18.
A szvegosztlyozs olyan feladat, amely egy adott dokumentumot a benne lev szveg alapjn elre
rgztett kategrik valamelyikbe sorol be. Erre gyakran hasznlnak naiv Bayes-modellt. Ezekben a
modellekben a lekrdezs vltozja a dokumentumkategria s az okozati vltozk a nyelv egyes szavainak
meglte vagy hinya. Felttelezzk azt is, hogy a szavak egymstl fggetlenl, a dokumentumkategrira
jellemz srsggel jelennek meg a szvegekben.
a. Magyarzza el pontosan, hogyan lehet egy ilyen modellt ltrehozni, ha tant mintaknt adott egy, mr
osztlyozott dokumentumhalmaz.
b. Magyarzza el pontosan, hogyan trtnik egy j dokumentum besorolsa.
c. Elfogadhat-e a fggetlensg felttelezse? Rszletezze.
13.19.
A wumpus vilg vizsglatnl abbl a tnybl indultunk ki, hogy a ngyzetek a tbbi ngyzet tartalmtl
fggetlenl 0,2 valsznsggel tartalmaznak csapdt. Ehelyett most tegyk fel, hogy az [1, 1]-en kvli N
ngyzetben pontosan N/5 csapda van egyenletes eloszlsban vletlenszeren elhelyezve. Fggetlenek-e tovbbra
is a Ci,j s a Ck,l vltozk? Hogyan fog most kinzni a P(C1,1, , C4,4) egyttes eloszls? Szmolja jra az [1, 3]
s a [2, 2] ngyzetekben tallhat csapda valsznsgt.
433
14. fejezet - Valsznsgi

kvetkeztets
Ebben a fejezetben ismertetjk, hogyan pthetk olyan kvetkeztet rendszerek, amelyek hls modelleket
hasznlnak a bizonytalansgnak a valsznsg-szmts trvnyeinek megfelel kezelsre.
A 13. fejezetben bemutattuk a valsznsg-szmts szintaxist s szemantikjt. Kln hangslyoztuk a
fggetlensgi s a feltteles fggetlensgi kapcsolatok fontossgt a vilg valsznsgi reprezentcijnak az
egyszerstsben. Ez a fejezet egy szisztematikus mdszert vezet be az ilyen relcik explicit reprezentlsra,
a Bayes-hlk formjban. Ezeknek a hlzatoknak definiljuk a szintaxist s szemantikjt, s megmutatjuk,
hogyan hasznlhatk fel bizonytalan tuds megragadsra termszetes s hatkony mdon. Ezt kveten
ismertetjk, hogyan vgezhet el a valsznsgi kvetkeztets, ami br legrosszabb esetben exponencilis
komplexits, a gyakorlatban sok esetben hatkonyan alkalmazhat. Lerunk tovbb klnbz kzelt
kvetkeztet algoritmusokat, amelyek gyakran akkor is alkalmazhatk, amikor egzakt kvetkeztets nem
lehetsges. Megvizsglunk olyan mdszereket is, hogy hogyan alkalmazhat a valsznsg-szmts egy
objektumokat s relcikat is tartalmaz vilgra azaz az tletlogikval szemben az elsrend
reprezentcikra. Vgl ttekintjk a bizonytalan kvetkeztets egyb alternatv megkzeltseit.
1. A tuds reprezentlsa bizonytalansg esetn

A 13. fejezetben lttuk, hogy az egyttes valsznsg-eloszls fggvny alapjn minden krds
megvlaszolhat a modellezett trgytartomnnyal kapcsolatban, de a vltozk szmnak nvekedsvel ez
ltalban kivitelezhetetlenn vlik. Tovbb az elemi esemnyek valsznsgnek megadsa is igen mesterklt
s nehz is lehet, hacsak nem ll rendelkezsre nagy mennyisg adat a valsznsgek statisztikai becslshez.
A vltozk kztti fggetlensgi s feltteles fggetlensgi relcikkal kapcsolatban azt is lttuk, hogy ezek
nagyban cskkenthetik az egyttes valsznsg-eloszls fggvny megadshoz szksges valsznsgek
szmt. Ez a fejezet bevezet egy Bayes-hlnak (Bayesian network1) nevezett adatstruktrt a vltozk kztti
fggsg lershoz, s brmely egyttes valsznsg-eloszls fggvny tmr megadshoz.
A Bayes-hl egy irnytott grf, amelyben minden csomponthoz szmszer valsznsgi informcik vannak
csatolva. A teljes megads a kvetkez:
1. A hl csompontjait valsznsgi vltozk egy halmaza alkotja. A vltozk lehetnek diszkrtek vagy
folytonosak.
2. Irnytott lek (nyilak) egy halmaza sszekt bizonyos csompontprokat. Ha ltezik nyl az X csomponttl
az Y csompontig, azt mondjuk, hogy az X a szlje az Y-nak.
3. Minden Xi csomponthoz tartozik egy P(Xi Szlk(Xi)) feltteles valsznsg-eloszls, ami szmszeren
megadja a szlk hatst a csomponti vltozra.
4. A grf nem tartalmaz irnytott krt (azaz irnytott, krmentes grf Directed, Acyclic Graph, DAG).
A hl topolgija a csompontok s lek halmaza megadja a trgyterleten fennll feltteles fggetlensgi
kapcsolatokat, hogy mily mdon, azt hamarosan pontosan kifejtjk. Egy helyesen ltrehozott hlban az X
csompontot az Y csomponttal sszekt nyl intuitv jelentse rendszerint az, hogy az X-nek kzvetlen
befolysa van az Y-ra. A trgyterlet szakrtje szmra ltalban knny eldnteni, hogy milyen kzvetlen
befolysok teljeslnek egy adott terleten valjban sokkal knnyebb, mint a megfelel valsznsgeket
megadni. Ha pedig a Bayes-hl topolgija ksz, mr csak az egyes vltozkhoz tartoz feltteles
valsznsg-eloszlsokat kell meghatrozni a szlkkel mint felttelekkel. Ltni fogjuk, hogy a topolgia s a
feltteles eloszlsok egyttese elegend, hogy megadja (implicit mdon) az sszes vltoz feletti egyttes
valsznsg-eloszls fggvnyt.
Az angol nyelv szakirodalomban a Bayes-hl a legelterjedtebb megnevezs, de szmos ms is ltezik: bizonyossghl (belief
network), valsznsgi hl (probabilistic network), okozati hl (causal network), tudshl (knowledge map). A statisztikban a
grfos modell (graphical model) bvebb modellosztlyt jelent, ami a Bayes-hlt is magban foglalja. A Bayes-hlk egy kiterjesztsnek
neve a dntsi hl (decision network) vagy hatsdiagram (influence diagram) lsd 16. fejezet.
1
434
Valsznsgi kvetkeztets
Idzzk fel a 13. fejezetben lert egyszer vilgot, amely a Fogfjs, a Lyuk, a Beakads s az Idjrs vltozt
tartalmazza. gy rveltnk, hogy az Idjrs fggetlen az sszes tbbi vltoztl; tovbb, hogy a Fogfjs s a
Beakads felttelesen fggetlenek a Lyuk ismeretben. Ezeket a viszonyokat a 14.1. brn bemutatott Bayeshl reprezentlja. Formlisan, a Fogfjs s a Beakads feltteles fggetlensgt a Lyuk ismeretben a
Fogfjs s a Beakads kztti nyl hinya jelzi. Szemlletesen, a hl azt a tnyt fejezi ki, hogy a Lyuk
kzvetlen oka a Fogfjs-nak s a Beakads-nak, tovbbi kzvetlen okozati kapcsolat azonban nem ltezik a
Fogfjs s a Beakads kztt.
14.1. bra - Egy egyszer Bayes-hl, amelyben az Idjrs fggetlen a tbbi hrom
vltoztl, a Fogfjs s a Beakads pedig felttelesen fggetlenek a Lyuk ismeretben
Most vizsgljuk meg a kzvetkez pldt, ami csak egy rnyalatnyival szetettebb. Otthonunkban egy j
betrsjelzt szereltek fel. Ez megbzhatan szleli a betrseket, de idnknt kisebb fldrengsek esetn is
jelez. (Ez a plda Judea Pearltl szrmazik, aki Los Angeles-i lakos; innen ered a fldrengsek irnti klns
rdekldse.)2 Kt szomszdunk is van, Jnos s Mria, akik meggrtk, hogy felhvnak a munkahelynkn, ha
meghalljk a riasztnkat. Jnos mindig felhv minket, ha meghallja a riasztst, de nha sszekeveri a
telefoncsrgst a riaszt csengsvel, s ekkor is telefonl. Mria viszont, mivel szereti hangosan hallgatni a
zent, nha meg sem hallja a riasztt. Mi teht a hvsok bekvetkezte vagy hinya alapjn szeretnnk
megbecslni a betrs valsznsgt. Ezt az egyszer problmt a 14.2. brn lthat Bayes-hl rja le.
14.2. bra - Egy tipikus Bayes-hl, amely a topolgit s a feltteles valsznsgi

tblkat (FVT) is mutatja. Az FVT-kben B, F, R, J s M szerepel Betrs, Fldrengs,
Riaszts, JnosTelefonl s MriaTelefonl helyett.
Judea Pearl meghatroz szerepet jtszott a Bayes-hlk egzakt matematikai htternek s gyakorlati alkalmazhatsgnak a vizsglatban.
(A ford.)
2
435
Egyelre hagyjuk figyelmen kvl az brn szerepl feltteles eloszlsokat, s sszpontostsunk a hl

topolgijra. A betrs hl esetn a topolgia azt mutatja, hogy a betrs s a fldrengs kzvetlenl
befolysolja a riaszt megszlalsnak valsznsgt, ellenben Jnos vagy Mria hvsnak bekvetkezse
csak magn a riasztn mlik. A hl gy tartalmazza azon feltevseinket, hogy k kzvetlenl nem vesznek
szre betrseket, nem vesznek szre kisebb fldrengseket, s nem egyeztetnek hvs eltt.
Megfigyelhet, hogy a hlban nincsenek olyan csompontok, amelyek azt rnk le, hogy Mria ppen hangos
zent hallgat, vagy hogy a telefon cseng, s megzavarja Jnost. Ezeket a tnyezket a Riaszts csomponttl a
JnosTelefonl s MriaTelefonl csompontig tart lekhez rendelt bizonytalansg foglalja magban. Ebben
mind a lustasg, mind pedig a tudatlansg tetten rhet: rengeteg munka volna olyan tnyezk meghatrozsa,
amelyek valsznbb vagy kevsb valsznv vlnnak adott esetekben, s nincs semmilyen sszer
mdszernk, hogy ezekre vonatkozan rdemi informcit szerezznk. A valsznsgek valjban a lehetsges
krlmnyek egy potencilisan vgtelen halmazt sszegzik, amikor is a riaszt elmulaszt megszlalni (magas
pratartalom, elektromos hlzat hibja, lemerlt elem, elvgott drt, dgltt egr beragadva a csengbe),
vagy, hogy Jnos s Mria elmulaszt rtesteni minket (ebdelni mentek, szabadsgon vannak, idlegesen
megsketltek, egy thalad helikopter). Ezen a mdon egy kis gens is kpes megbirkzni egy igen
bonyolult vilggal, legalbbis kzeltleg. A kzelts mrtke tetszlegesen javthat tovbbi relevns
informcik bevezetsvel.
Most folytassuk a 14.2. brn mutatott feltteles eloszlsokkal. Az brn minden eloszls mint feltteles
valsznsgi tblzat FVT (conditional probability table, CPT) van feltntetve. (A tblzatos formt
diszkrt vltozk esetn lehet hasznlni; ms reprezentcikat, amelyek mr folytonos vltozknl is
hasznlhatk, a 14.2. alfejezetben runk le.) Az FVT-tblzatban minden sor az egyes csomponti rtkek
feltteles valsznsgt tartalmazza az adott sorhoz tartoz szli felttel (conditioning case) esetn. A szli
felttel a szl csompontok rtkeinek egy lehetsges kombincija (egyfajta elemi esemny, ha gy tetszik).
Az egyes sorokban szerepl szmok sszegnek 1-et kell adnia, mivel az adott vltoz sszes lehetsges rtke
szerepel a bejegyzsekben. Binris vltozk esetn, ha ismerjk, hogy az igaz rtk valsznsge p, a hamis
rtk valsznsgnek 1 p-nek kell lennie, gy gyakran a msodik szmot elhagyjuk, ahogyan ezt a 14.2.
brn is tettk. ltalnosabban, egy k binris szlvel rendelkez binris vltoz esetn 2 k valsznsg adhat
meg tetszs szerint. Szl nlkli csompontok esetn a tblzat csak egyetlen sort tartalmaz, a vltoz egyes
rtkeinek a priori valsznsgeit.
2. A Bayes-hlk szemantikja
Az elz alfejezetben bemutattuk a hlt, de annak jelentst nem. A Bayes-hlk szemantikjt ktfle mdon
lehet megrteni. Az els szerint a hl az egyttes valsznsg-eloszls fggvny egy lersa. A msodik
szerint a hl feltteles fggetlensgekrl szl lltsok egyttest rja le. A kt szemllet ekvivalens, de az
els inkbb abban segt, hogyan hozzunk ltre egy hlt, mg a msodik a kvetkeztetsi eljrsok tervezst
segti.
2.1. Az egyttes valsznsg-eloszls fggvny lersa

A Bayes-hl a trgytartomny teljes lerst adja meg. A benne tallhat informcik segtsgvel az egyttes
valsznsg-eloszls fggvny brmely bejegyzse kiszmthat.3 Az egyttes valsznsg-eloszls fggvny
egy ltalnos bejegyzse egy teljes minden egyes vltozhoz trtn hozzrendels konjunkcijnak a
valsznsge, gymint P(X1 = x1 Xn = xn). Erre a tovbbiakban a P(x1, , xn) rvidtst fogjuk hasznlni.
Egy bejegyzs rtkt a kvetkez egyenlsg adja meg:
ahol a szlk(Xi) a Szlk(Xi)-ben szerepl vltozk adott rtkeinek egyttest jelli. gy az egyttes
valsznsg-eloszls fggvnyt ler tblzat minden bejegyzse a Bayes-hlban szerepl, feltteles
valsznsgi tblk (FVT) megfelel elemeinek a szorzata. Ezzel az FVT-k valjban az egyttes
valsznsg-eloszls fggvny dekomponlt lerst adjk meg. Ennek illusztrlsra kiszmtjuk annak az
esemnynek a valsznsgt, hogy a riaszt megszlal, de nem volt sem betrs, sem fldrengs, azonban
Jnos s Mria is telefonl. A kezdbetkkel jellve a vltozkat:
3
A diszkrt vltozkra utal szhasznlat ellenre az lltsok analgjai folytonos vltozk esetn is fennllnak. (A ford.)
436
P(j m a b e)
= P(j a)P(m a)P(a b e)P(b)P(e)
= 0,90 0,70 0,001 0,999 0,998 = 0,00062
A 13.4. alfejezetben bemutattuk, hogy az egyttes valsznsg-eloszls fggvny alapjn a trgytartomnnyal

kapcsolatos brmely krds megvlaszolhat. Ha egy Bayes-hl lerja az egyttes valsznsg-eloszls
fggvnyt, akkor ez alapjn brmely krds megvlaszolhat, sszegezve a relevns egyttes bejegyzseket. A
14.4. alfejezet elmagyarzza, hogy ez hogyan vgezhet el, azonban sokkal hatkonyabb mdszereket is
ismertet.
Egy mdszer Bayes-hlk ptsre
A (14.1) egyenlet definilja, hogy mit is jelent egy adott Bayes-hl. Azonban arra nzve nem ad felvilgostst,
hogyan pthetnk olyan Bayes-hlt, hogy az ltala meghatrozott egyttes valsznsg-eloszls fggvny az
adott trgytartomny megfelel lersa legyen. Most megmutatjuk, hogy a (14.1) egyenlet tartalmaz bizonyos
feltteles fggetlensgi relcikat, amelyeket a tudsmrnk felhasznlhat a hl topolgijnak
meghatrozsnl. Elsknt rjuk fel az egyttes valsznsg-eloszls fggvnyt feltteles valsznsgek
szorzataknt, felhasznlva a szorzatszablyt (lsd 13. fejezet):
P(x1, , xn) = P(xn|xn1, , x1)P(xn1, , x1)
Majd ismtelten alkalmazzuk ezt a lpst, minden egyes egyttes valsznsget felbontva egy feltteles
valsznsgre s egy kisebb egyttes valsznsgre. Vgezetl egyetlen hossz szorzatot kapunk:
Ez a lncszablyknt (chain rule) ismert azonossg valsznsgi vltozk brmely halmazra fennll.
sszehasonltva ezt a (14.1.) egyenlettel lthatjuk, hogy az egyttes valsznsg-eloszls fggvny megadsa
ekvivalens azzal az ltalnos lltssal, hogy a hl minden Xi vltozjra
P(Xi|Xi1, , X1) = P(Xi|Szlk(Xi)) (14.2)
feltve, hogy Szlk(Xi) {Xi1, , X1}. Ez utbbi felttel a csompontok brmely olyan sorszmozsval
teljesthet, ami konzisztens a grf struktrjbl add implicit rszleges rendezssel.
Fontos
A (14.2) egyenlet szerint, egy Bayes-hl csak abban az esetben lehet helyes reprezentcija a
trgytartomnynak, ha az adott szlk mellett, minden csompont felttelesen fggetlen a csompontot
sorrendezsben t megelzktl. gy a trgytartomny struktrjnak megfelel Bayes-hl megptse
sorn, minden egyes csomponthoz gy kell a szlket megvlasztanunk, hogy ez a felttel teljesljn.
Szemlletesen ez azt jelenti, hogy az Xi csompont szlei halmaznak tartalmaznia kell az {X1, , Xi1}
kzl mindazokat a csompontokat, amelyek kzvetlenl befolysoljk Xi-t. Pldul ttelezzk fel,
hogy a 14.2. brn lthat hlt mr teljesen befejeztk, csupn a MriaTelefonl szleit kell mg
megvlasztanunk. A MriaTelefonl-t egyrtelmen befolysolja, hogy trtnt-e Betrs vagy
Fldrengs, de nem kzvetlenl. A helyzettel kapcsolatos ismereteink alapjn tudhatjuk, hogy ezek az
esemnyek csak a riaszt ltal befolysolhatjk Mria telefonlssal kapcsolatos viselkedst.
Hasonlan, ha a riaszt llapota ismert, akkor Jnos hvsnak bekvetkezte vagy elmaradsa mr
nincs hatssal Mria telefonlsra. Formlisan fogalmazva, gy vljk, hogy a kvetkez feltteles
fggetlensg teljesl:
P(MriaTelefonl|JnosTelefonl, Riaszts, Fldrengs, Betrs)
= P(MriaTelefonl|Riaszts)
Tmrsg s a csompontok sorrendje
437
Amellett hogy egy teljes s nem redundns reprezentcija a trgytartomnynak, egy Bayes-hl gyakran sokkal
tmrebb, mint az egyttes valsznsg-eloszls fggvny. Ez a tulajdonsga teszi hasznlhatv a sokvltozs
trgyterletek kezelsben. A Bayes-hl tmrsge a loklisan strukturlt (locally structured) (vagy ritka
sparse) rendszerek egy igen ltalnos tulajdonsgnak pldja. Egy loklisan strukturlt rendszerben egy
komponens csak korltos szm ms komponenssel van kapcsolatban kzvetlenl, fggetlenl a komponensek
teljes szmtl. Loklis struktrkhoz ltalban inkbb a lineris, mint az exponencilis komplexitsnvekeds
kapcsolhat. A Bayes-hl esetben jogos azt felttelezni, hogy a legtbb trgytartomny esetn egy
valsznsgi vltozt csak k szm ms vltoz befolysol, ahol k konstans. Ha binris vltozkat tteleznk
fel az egyszersg kedvrt, akkor az egy csomponthoz tartoz feltteles valsznsgi tbla megadshoz
legfeljebb 2k rtk szksges, gy a teljes hl n2k rtkkel megadhat. Ezzel szemben az egyttes valsznsgeloszls fggvny 2n rtket tartalmaz. Egy konkrt pldval lve, ha 30 csompontunk van (n = 30), s
mindegyiknek legfeljebb 5 szlje van (k = 5), akkor a Bayes-hl 960 szmot ignyel, mg az egyttes
valsznsg-eloszls fggvny tbb mint egy millirdot.
Lteznek olyan trgytartomnyok, ahol a vltozk mindegyikt kzvetlenl befolysolhatja az sszes tbbi, gy
a hl teljesen sszekttt. A feltteles valsznsgi tblk megadsa ekkor ugyanakkora mennyisg
informcit ignyel, mint az egyttes valsznsg-eloszls fggvny megadsa. Bizonyos trgytartomnyokban
lteznek olyan gyenge fggsgek, amiket felttlenl modellezni kell egy j kapcsolat felvtelvel. De ha ezek a
fggsgek igen gyengk, akkor lehet, hogy nem ri meg a hl komplexitst megnvelni a pontossg
kismrtk nvelsnek rdekben. Pldul a betrses hlnkkal kapcsolatban kifogsolhat az, hogyha
fldrengs van, akkor Mria s Jnos akkor sem telefonlna, ha hallank a riasztt, mivel felttelezik, hogy a
fldrengs okozta. Az, hogy hozzkapcsoljuk-e a Fldrengs-t a MriaTelefonl-hoz s a JnosTelefonl-hoz
(s gy megnveljk a tblkat) azon mlik, hogy mennyire fontos pontosabb valsznsgeket kapni, s
mennyire kltsges meghatrozni az extra informcit.
Fontos
Azonban mg egy loklisan strukturlt problmnl sem egyszer loklisan strukturlt Bayes-hlt
felpteni. Ugyanis nemcsak azt kveteljk meg, hogy minden egyes vltozt csak nhny msik
befolysoljon kzvetlenl, hanem azt is, hogy a hl topolgija valban mutassa azokat a kzvetlen
hatsokat a szlk megfelel megvlasztsval. A konstrukcis eljrsunk mkdse miatt elbb a
kzvetlen befolysolkat kell a hlhoz adni, ha azt szeretnnk, hogy szlknek tudjuk ket
vlasztani az ltaluk befolysolt csompontnl. Ezrt a helyes sorrend a csompontok hozzadsnl
az, hogy elszr az alapvet okokat adjuk a hlhoz, majd a vltozkat, amelyeket befolysolnak, s
ezt addig folytatjuk, amg el nem rjk a leveleket, amelyeknek mr nincs kzvetlen okozati hatsa
ms vltozkra.
Mi trtnik, ha trtnetesen rossz sorrendet vlasztunk? Vizsgljuk meg jra a betrses pldt. Ttelezzk fel,
hogy a vltozkat a kvetkez sorrendben adjuk a hlhoz: MriaTelefonl, JnosTelefonl, Riaszts, Betrs,
Fldrengs. Ekkor egy kicsit bonyolultabb hlt kapunk (14.3. (a) brn). Az eljrs a kvetkez:
MriaTelefonl hozzadsa: szlk nincsenek.
JnosTelefonl hozzadsa: ha Mria telefonl, az valsznleg azt jelenti, hogy a riaszt megszlalt, ami
termszetesen valsznbb teszi, hogy Jnos telefonljon. gy a JnosTelefonl-nak szksgszeren szlje a
MriaTelefonl.
14.3. bra - A hl struktrja fgg a hozzads sorrendjtl. A csompontokat

mindegyik hlhoz fellrl lefel haladva adtuk hozz.
438
Riaszts hozzadsa: nyilvnval, ha mindketten telefonlnak, akkor valsznbb, hogy a riaszt megszlalt,
mintha csak egyikk, vagy egyikk sem. gy mind a JnosTelefonl, mind a MriaTelefonl szksges mint
szl.
Betrs hozzadsa: ha ismerjk a riaszt llapott, akkor a Jnostl vagy Mritl jv telefonhvsok lte
vagy hinya csupn azt jelezhetik, hogy cseng-e a telefonunk, vagy hogy Mria zenje hangosra van-e lltva,
de a betrsrl nem nyjtanak tovbbi informcit. Azaz
P(Betrs Riaszts, JnosTelefonl, MriaTelefonl) = P(Betrs Riaszts)
gy csak a Riaszts szksges mint szl.

Fldrengs hozzadsa: ha a riaszt bekapcsolt, akkor valsznbb, hogy bekvetkezett egy fldrengs
(mivel a riaszt valamifle fldrengsszlel). De ha tudjuk, hogy betrs trtnt, akkor ez megmagyarzza a
riasztst, s a fldrengs valsznsge csak picit nagyobb a normlisnl. gy a Betrs s a Riaszts is
szksges mint szl.
Fontos
A kiadd hlnak kettvel tbb le van, mint az eredetinek a 14.2. brn, s hrommal tbb
valsznsg meghatrozst ignyli. Ami mg rosszabb, hogy nhny kapcsolds megfoghatatlan
viszonyt reprezentl, ami nehz s nem termszetes valsznsgi tleteket ignyel, pldul a
Fldrengs feltteles valsznsgnek a megbecslst, a Betrs s a Riaszts felttelekkel. Ez a
jelensg igen ltalnos, s kapcsoldik az okozati s diagnosztikai modelleknek a 8. fejezetben
bevezetett megklnbztetshez. Ha gy prblunk meg egy diagnosztikai modellt megpteni, hogy
a kapcsolatok okozat-ok irnyak (mint pldul a MriaTelefonl-tl a Riaszts-ig vagy a Riaszts-tl
a Betrs-ig kapcsolat), akkor vgl egybknt fggetlen okok kztt kell fggst meghatroznunk (s
gyakran a klnllan bekvetkez okozatok kztt is). Ha ragaszkodunk az okozati modellhez, akkor
kevesebb rtket kell megadnunk, s az rtkeket ltalban knnyebb meghatrozni. Orvosi
trgytartomnyon pldul Tversky s Kahneman demonstrlta, hogy orvos szakrtk szvesebben
hoznak valsznsgi tleteket okozati, mint diagnosztikai sszefggsek esetn (Tversky s
Kahneman, 1982).
A 14.3. (b) bra a vltozk igazn szerencstlen sorrendjt mutatja: MriaTelefonl, JnosTelefonl,
Fldrengs, Betrs, Riaszts. Ez a hl 31 nll valsznsg meghatrozst ignyli pontosan annyit,
amennyi a teljes egyttes valsznsg-eloszls fggvny megadsa. Azonban fontos felismerni, hogy a hrom
hl brmelyike kpes pontosan ugyanannak az egyttes valsznsg-eloszls fggvnynek a reprezentlsra.
A kt utbbi egyszeren csak nem reprezentlja az sszes feltteles fggetlensgi relcit, s gy rengeteg
szksgtelen rtk meghatrozsra knyszerl.
439
2.2. Feltteles fggetlensgi relcik Bayes-hlkban

A Bayes-hlkra egy numerikus szemantikt adtunk meg a teljes egyttes eloszls reprezentcijnak a
szempontjbl, mint a (14.1) egyenletben. Ezt a szemantikt alkalmazva a Bayes-hlk konstrukcis
mdszereinek a szrmaztatsnl azt a kvetkezmnyt kaptuk, hogy egy csompont felttelesen fggetlen az t
megelzktl, ha a csompont szli adottak. Kiderl, hogy ms mdon is eljrhatunk. Elindulhatunk egy
topolgiai szemantiktl, ami a grf ltal kdolt feltteles fggetlensgi relcikat adja meg, s ezekbl
szrmaztatjuk a numerikus szemantikt. A topolgiai szemantikt a kvetkez kt egymssal ekvivalens
meghatrozs brmelyike rgzti:4
1. Egy csompont felttelesen fggetlen a nem leszrmazottaitl (non-descendants), feltve, hogy a szlei
adottak. Pldul a 14.2. brn JnosTelefonl fggetlen a Betrs-tl s a Fldrengs-tl, ismerve a Riaszts
rtkt.
2. Egy csompont felttelesen fggetlen az sszes tbbi csomponttl a hlzatban, a szlei, gyermekei s
gyermeki szleinek az ismeretben azaz a Markov-takarjnak (Markov blanket) ismeretben. Pldul, a
Betrs fggetlen JnosTelefonl-tl s MriaTelefonl-tl, a Betrs-t s Fldrengs-t ismerve.
Ezeket a meghatrozsokat mutatja be a 14.4. bra. Ezekbl a feltteles fggetlensgi lltsokbl s az FVTkbl a teljes egyttes eloszlst rekonstrulni lehet; gy a numerikus szemantika s a topolgiai szemantika
ekvivalens.
14.4. bra - (a) Az X csompont felttelesen fggetlen a nem leszrmazottaitl (Zij-ktl) a

szlei (a szrke terleten lthat Ui-k) ismeretben. (b) Az X csompont felttelesen
fggetlen a hl sszes tbbi csompontjtl a Markov-takarjnak ismeretben (a
szrke terlet).
3. Feltteles eloszlsok hatkony reprezentcija

Mg ha a szlk maximlis szma, k meglehetsen kicsi is, egy csompont feltteles valsznsgi tbljnak
kitltse akr O(2k) szm rtket s az sszes lehetsges feltteles esetet figyelembe vve is nagy szakrtelmet
ignyelhet. Valjban azonban az a legrosszabb eset, amikor a kapcsolat a szlk s a gyermek kztt teljesen
nknyes. ltalban az ilyen kapcsolatok egy kanonikus eloszlssal (canonical distribution) rhatk le,
Ltezik egy tovbbi ltalnos topolgiai kritrium a d-elvlaszts (d-separation) annak eldntsre, hogy a csompontok egy X halmaza
fggetlen-e egy msik Y halmaztl egy harmadik Z halmaz felttel esetn. A kritrium elg bonyolult, s nem szksges a fejezetben az
algoritmusok szrmaztatsnl, ezrt nem trgyaljuk. A rszletek megtallhatk Russell s Norvig, valamint Pearl munkiban (Russell s
Norvig, 1995; Pearl, 1988). Shachter egy sokkal szemlletesebb mdszert ad a d-elvlasztsok meghatrozshoz (Shachter, 1998).
4
440
amelyek valamilyen szabvnyos mintt kvetnek. Ilyen esetekben a teljes tbla megadhat a mintzat s esetleg
nhny paramter meghatrozsval sokkal knnyebben, mint exponencilis szm paramter megadsval.
A legegyszerbb pldt a determinisztikus csompontok (deterministic nodes) szolgltatjk. Egy
determinisztikus csompont rtkt a szleinek az rtke teljesen meghatrozza, mindenfajta bizonytalansgtl
mentesen. A relci lehet egy logikai kapcsolat pldul ha a szlcsompontok azt jelentik, hogy Kanadai,
Egyeslt llamokbeli s Mexiki, a gyermekcsompont pedig azt, hogy szak-Amerikai, akkor a kzttk lv
kapcsolat egyszeren a szlk diszjunkcija. A relci lehet numerikus is pldul ha a szlcsompontok egy
gpkocsi klnbz rai klnbz forgalmazknl, a gyermekcsompont pedig az az r, amit egy legolcsbbat
keres vev vgezetl fizetne, akkor a gyermekcsompont rtke a szlk rtkeinek a minimuma. Msik plda,
ha a szlcsompontok az egy tba bejv vzmennyisgek (folyk, vzlevezetk, csapadk) s az onnan
eltvoz vzmennyisgek (folyk, prolgs, elszivrgs), a gyermek pedig a t szintjnek a megvltozsa, akkor
a gyermek rtke a kifoly s befoly szlk rtkeinek a klnbsge.
Bizonytalan relcikat gyakran jellemezhetnk gynevezett zajos logikai relcikkal. A mintaplda erre az
gynevezett zajos-VAGY (noisy-OR) relci, ami a logikai VAGY relci ltalnostsa. tletlogikban
kijelenthetjk, hogy a Lz akkor s csak akkor igaz, ha a Megfzs vagy az Influenza vagy a Malria igaz. A
zajos-VAGY modell megenged bizonytalansgot, hogy egyes szlk okozhatjk-e a gyermekek igaz rtkt
az okozati kapcsolat a szl s gyermek kztt gtolt lehet, s gy lehet, hogy a pciens meg van fzva, de nincs
lza. A modell kt feltevsre pl. Elsknt felttelezi, hogy az sszes lehetsges ok fel van sorolva. (Ez nem
annyira szigor megkts, mint amilyennek tnik, mivel mindig ltrehozhatunk egy gynevezett
szivrgscsompontot (leak node), ami vegyes okokat fed le.) Msodikknt felteszi, hogy brmely szl
gtlsa fggetlen a tbbi szl gtlstl: pldul akrmi is gtolja, hogy a Malria lzat okozzon, ez fggetlen
attl, hogy mi gtolja az Influenz-t, hogy lzat okozzon. Ezekkel a feltevsekkel a Lz akkor s csak akkor
hamis, ha az sszes igaz rtk szl gtolt, aminek a valsznsge a gtls-valsznsgek szorzata.
Ttelezzk fel, hogy ezek az nll gtlsi valsznsgek a kvetkezk:
P(lz megfzs, influenza, malria) = 0,6
P(lz megfzs, influenza, malria) = 0,2l
P(lz megfzs, influenza, malria) = 0,1
Ekkor ennyi informcibl s a zajos-VAGY feltevsbl a teljes FVT-t fel lehet pteni. A kvetkez
tblzat azt mutatja, hogy hogyan:
ltalnossgban, a zajos logikai relcik, amelyekben egy vltoz k szm szltl fgg, O(k) paramterrel
rhatk le, a teljes feltteles valsznsg-eloszls tblzathoz tartoz O(2k) helyett. Ez sokkal knnyebb teszi a
becslst s a tanulst. Pldul a CPSC-hl (Pradhan s trsai, 1994) zajos-VAGY- s zajos-MAX-eloszlsokat
hasznl a betegsgek s tnetek kztti kapcsolatok modellezsre. 448 csompont s 906 l esetn ez csak
8254 rtket ignyel a 133 931 430 helyett, ami egy teljes FVT-ket hasznl hl esetn lenne szksges.
3.1. Bayes-hlk folytonos vltozkkal

Szmos vals problmban fordulnak el folytonos mennyisgek, mint a magassg, tmeg, hmrsklet s
pnz; valjban a statisztika nagy rsze olyan valsznsgi vltozkkal foglalkozik, amelyek rtktartomnya
441
folytonos. Definci szerint, a folytonos vltozknak vgtelen szm rtke lehet, gy lehetetlen feltteles
valsznsgeket megadni minden egyes rtkre. Egy lehetsges mdszer a folytonos vltozk kezelsre, ha
elkerljk ket diszkretizlssal (discretization) azaz felosztjuk a lehetsges rtkeket intervallumok adott
halmaza szerint. Pldul, a hmrskletet feloszthatjuk (<0C), (0C100C) s (>100C) intervallumokra. A
diszkretizls nha adekvt megolds, de gyakran eredmnyezi a pontossg jelents romlst, valamint nagyon
nagy FVT-ket. Egy msik megolds, ha a valsznsg srsgfggvnyek alapvet csaldjaibl vlasztunk
(lsd A) fggelk), amelyek vges szm paramterrel megadhatk. Pldul, a Gauss- (vagy norml)
eloszlshoz N(, 2)(x) a tlag s 2 szrsngyzet tartozik mint paramterek.
Egy diszkrt s folytonos vltozkat is tartalmaz hlt hibrid Bayes-hlnak (hybrid Bayesian network)
neveznk. Egy hibrid hl megadshoz kt jfajta eloszlst kell megadnunk: feltteles eloszlst folytonos
vltozhoz diszkrt s/vagy folytonos szlk esetn; tovbb feltteles eloszlst diszkrt vltozkhoz folytonos
szlk esetn. Fontoljuk meg a 14.5. bra egyszer pldjt, amelyben a vsrl valamilyen gymlcst vsrol
az ra fggvnyben, ami viszont a terms mennyisgtl fgg s attl, hogy ppen van-e llami tmogats. Az
r vltoz folytonos, a szlei pedig folytonosak s diszkrtek; a Vsrol vltoz diszkrt, s van egy folytonos
szlje.
Az r vltozhoz meg kell adnunk a P(r Terms, Tmogats) eloszlst. A diszkrt szlt explicit
felsorolssal kezeljk azaz megadjuk mind a P(r Terms, tmogats), mind a P(r Terms, tmogats)
valsznsgeket. A Terms kezelshez megadjuk, hogy a c r feletti eloszlsa hogyan fgg a t Terms
folytonos rtktl. Mshogy fogalmazva, az r eloszlsnak a paramtereit a terms t rtknek fggvnyben
adjuk meg.
14.5. bra - Egy egyszer hl diszkrt (Tmogats s Vsrol) s folytonos (Terms s

r) vltozkkal
A leggyakoribb vlaszts a lineris Gauss-eloszls (linear Gaussian), amelyben a gyermek Gauss-eloszls,

ahol a vrhat rtk linerisan vltozik a szl rtkvel, s ahol a szrs rgztett. Kt eloszlsra van
szksgnk, a tmogats s a tmogats esetre klnbz paramterekkel:
442
Ebben a pldban ekkor, az r feltteles eloszlst a lineris normlis eloszls kivlasztsval s az ai, bi, i, ah,
bh s h paramterekkel adhatjuk meg. A 14.6. (a) s (b) bra mutatjk ezt a kt kapcsolatot. Figyeljk meg, hogy
mindegyik esetben a meredeksg negatv, mivel az r cskken a knlat nvekedsvel. (Termszetesen a
linearits feltevse azt is jelenti, hogy az r egy bizonyos pontnl negatv lesz; a lineris modell csak akkor
sszer, ha a terms mennyisgt egy szk tartomnyra korltozzuk.) A 14.6. (c) bra a P(c|t) eloszlst mutatja,
tlagolva a Tmogats kt lehetsges rtke felett felttelezve, hogy mindegyik a priori valsznsge 0,5. Ez
mutatja, hogy mg igen egyszer modellekkel is, elg rdekes eloszlsok reprezentlhatk.
14.6. bra - Az (a) s (b) grafikonok az r valsznsg-eloszlst mutatjk a Terms

fggvnyben s a Tmogats igaz s hamis rtke mellett. A (c) diagram a
P(r Terms) eloszlst mutatja, ami a kt aleset sszegzseknt addik.
A lineris normlis feltteles eloszlsnak vannak bizonyos specilis tulajdonsgai. Egy csak folytonos, lineris
normlis feltteles eloszls vltozkat tartalmaz hl egyttes eloszlsa egy tbbvltozs normlis eloszls az
sszes vltoz felett (lsd 14.5. feladat).5 [A tbbvltozs normlis eloszls egy fellet tbb mint egy
dimenziban, aminek van egy cscsa az tlagnl (n dimenziban), rtke pedig ettl tvolodva minden irnyban
cskken.] Ha diszkrt vltozkat adunk a hlhoz (feltve, hogy egyetlen diszkrt vltoz sem gyermeke egy
folytonos vltoznak), a hl egy feltteles Gauss- (conditional Gaussian) vagy FG-eloszlst definil:
brmilyen rtket is rendelnk a diszkrt vltozkhoz, a folytonos vltozk feletti eloszls egy tbbvltozs
Gauss-eloszls lesz.
Most a folytonos szlvel rendelkez diszkrt vltozk eloszlsval kezdnk foglalkozni. Fontoljuk meg
pldul a Vsrol csompontot a 14.5. brn. sszernek tnik azt felttelezni, hogy a vsrl vsrol, ha az r
alacsony, nem vsrol, ha magas, a vsrls valsznsge pedig folytonosan vltozik egy kzbens rgiban.
Mshogy fogalmazva, a feltteles eloszls hasonl egy elmosdott (soft) kszbfggvnyhez. Az
elmosdott kszbk ltrehozsra egy mdszer a standard normlis eloszls integrljnak a hasznlata:
Ekkor a Vsrls valsznsge az r ismeretben ez lehet

P(vsrol r = c) = (( c = )/)
ami azt jelenti, hogy az r kszbe krl van, s a kszbrgi szlessge arnyos -val, illetve, hogy a
vsrls valsznsge cskken, ahogy az r nvekszik.
14.7. bra - (a) A Vsrls valsznsgnek probit eloszlsa az r ismeretben, = 6,0

s = 1,0 mellett. (b) Logit eloszls hasonl paramterekkel.
Kvetkezskppen lineris normlis hlkban a kvetkeztets idignye legrosszabb esetben is csak O(n3), fggetlenl a hl
topolgijtl. A 14.4. alfejezetben ltni fogjuk, hogy diszkrt vltozs hlban a kvetkeztets NP-nehz.
5
443
Ezt a probit eloszlst (probit distribution) a 14.7. (a) bra illusztrlja. Alakja azzal az rvelssel igazolhat,
hogy az alapul szolgl dntsi folyamatnl ltezik egy pontos kszb, de ennek pontos helyt egy vletlen
normlis eloszls zaj befolysolja. A probit modell egy alternatvja a logit eloszls (logit distribution), amely
a szigmoid fggvnyt (sigmoid function) hasznlja egy elmosdott kszb ellltshoz:
Ezt a 14.7. (b) bra mutatja. A kt eloszls hasonlan nz ki, de valjban a logit sokkal lassabban tart a
hatrrtkekhez. A probit gyakran jobban illeszkedik a valdi helyzetekhez, de a logit esetenknt
matematikailag knnyebben kezelhet, pldul szles krben hasznlatos a neurlis hlkban (lsd 20. fejezet).
Mind a probit, mind a logit ltalnosthat tbb folytonos szlre a szlk rtkeinek lineris kombincijt
vve. Tbbrtk diszkrt gyermekre trtn kiterjesztseket a 14.6. feladatban taglalunk.
4. Egzakt kvetkeztets Bayes-hlkban

Az alapvet feladat brmely valsznsgi kvetkeztet rendszer szmra az, hogy kiszmtsa a clvltozk
(query variables) egy halmaznak a posteriori valsznsg-eloszlst egy adott megfigyelt esemny (event)
esetn azaz bizonytkvltozk (evidence variables) egy halmazhoz trtn rtk-hozzrendels esetn. A
13. fejezetben bevezetett jellst fogjuk hasznlni: X a clvltozt jelli; E a bizonytkvltozk E1, , Em
halmazt, e pedig a megfigyelt esemnyt; Y fogja jellni az (olykor rejtett vltozknak (hidden variables)
nevezett) nem-bizonytkvltozk Y1, , Yk halmazt. gy a vltozk teljes halmaza X = {X} E Y. Egy
jellemz lekrdezs a P(X e) a posteriori eloszlsra irnyul.6
A riaszts hlban pldul megfigyelhetnnk azt az esemnyt, ahol JnosTelefonl = igaz s MriaTelefonl =
igaz. Ekkor megkrdezhetnnk mondjuk a betrs megtrtntnek a valsznsgt:
P(Betrs JnosTelefonl = igaz, MriaTelefonl = igaz) = 0,284, 0,716
Ebben a fejezetben az a posteriori valsznsgek kiszmtsra szolgl egzakt algoritmusokat trgyalunk, s

tgondoljuk ennek a feladatnak a komplexitst. Kiderl, hogy ltalnos esetben ez kivitelezhetetlen, ezrt a
14.5. alfejezet kzelt kvetkeztetsi mdszereket ismertet.
4.1. Kvetkeztets felsorolssal
Feltesszk, hogy a clvltoz nincs a bizonytkvltozk kztt; amgy X a posteriori eloszlsa a megfigyelt rtkre 1 valsznsget ad.
Az egyszersg kedvrt azt is feltettk, hogy a krds egyetlen vltozra irnyul. Az algoritmusaink knnyen kiterjeszthetk tbb vltoz
egyttesnek lekrdezsre.
6
444
A 13. fejezet elmagyarzta, hogy brmely feltteles valsznsg kiszmthat a teljes egyttes eloszls
tagjainak sszegzsvel. Pontosabban, egy P(X e) lekrdezs megvlaszolhat a (13.6) egyenlet
felhasznlsval, amit a jobb kvethetsg kedvrt itt megismtlnk:
Fontos
Tovbb, mint ismeretes, a Bayes-hl a teljes egyttes eloszls egy teljes reprezentcijt nyjtja.
Mg pontosabban, a (14.1) egyenlet azt mutatja, hogy az egyttes eloszls P(x, e, y) tagjai felrhatk a
hlbl szrmaz feltteles valsznsgek szorzataiknt. Ezrt egy lekrdezs megvlaszolhat a
Bayes-hl felhasznlsval, kiszmtva a hlbl szrmaz feltteles valsznsgek szorzatainak az
sszegt.
A 13.4. brn a FELSOROL-EGYTTES-KRDEZS algoritmust adtuk meg a teljes egyttes eloszlsbl
felsorolssal trtn kvetkeztetsre. Az algoritmus bemenetknt fogadja a P teljes egyttes eloszlst, s
rtkeket nz meg benne. Egyszer mdostssal elrhet, hogy az algoritmus egy bn Bayes-hlt fogad
bemenetknt, s az egyttes bejegyzseket a bn megfelel FVT-bejegyzseinek sszeszorzsval nzi meg.
Vegyk a P(Betrs JnosTelefonl = igaz, MriaTelefonl = igaz) lekrdezst. A rejtett vltozk ennl a
krdsnl a Fldrengs s a Riaszts. A (13.6) egyenletbl, a kifejezsek rvidtse miatt a kezdbetket
hasznlva, azt kapjuk, hogy7
A Bayes-hlk szemantikja (14.1) egyenlet pedig az FVT-bejegyzsek felhasznlsval egy kifejezst ad.
Az egyszersg kedvrt ezt csak a Betrs = igaz esetre adjuk meg:
Ennek a kifejezsnek a kiszmtshoz ngy tagot kell sszeadnunk, amelyek mindegyikt t szm
sszeszorzsval kapjuk. Legrosszabb esetben, amikor majdnem minden vltoz felett sszegezni kell, az
algoritmus komplexitsa egy n binris vltozs hl esetn O(n2n).
A kvetkez egyszer megfigyelssel egy javtshoz juthatunk: a P(b) tag lland, s ki lehet vinni az a s e
feletti sszegzsek el, a P(e) tag pedig kivihet az a feletti sszegzs el. gy azt kapjuk, hogy
14.8. bra - A (14.3) egyenletben szerepl kifejezs struktrja. A kirtkels fentrl

lefel halad, sszeszorozva az rtkeket az egyes tvonalak mentn, s sszegezve a +
csompontoknl. Vegyk szre, a j-hez s az m-hez tartoz tvonalak megismtldst.
Egy olyan kifejezs mint a

a P(A = a, E = e) -nek az sszegzst jelenti minden lehetsges e rtkre. Ez tbbrtelmsget
rejt magban, mivel a P(e) jellst hasznljk mind a P(E = igaz), mind a P(E = e) jelents kifejezsre, azonban a szndkolt jelentsnek a
szvegkrnyezetbl ki kell derlnie; egy sszegzs esetben az utbbirl van sz.
7
445
Ez a kifejezs egy ciklussal rtkelhet ki, sorban vgighaladva a vltozkon, mikzben sszeszorozzuk az
FVT-bejegyzseket. Minden sszegzsnl, a vltoz lehetsges rtkei szerint is iterlnunk kell. A szmts
struktrjt a 14.8. bra mutatja. Felhasznlva a 14.2. bra rtkeit, azt kapjuk hogy P(b j,m) =
0,00059224. A b-hez tartoz szmtst tfutva az 0,0014919-et eredmnyez; gy
14.9. bra - A felsorol algoritmus Bayes-hls lekrdezsek megvlaszolsra
P(B j,m) = 0,00059224, 0,0014919 0,284, 0,716
Azaz a betrs valsznsge, ha mindkt szomszd telefonl krlbell 28%.

A 14.8. bra a (14.3) egyenlet kirtkelsi folyamatt mutatja, kifejezs fa alakban. A FELSOROL-KRDEZ
algoritmus a 14.9. brn ilyen fkat mlysgi rekurzival rtkel ki. gy a FELSOROL-KRDEZ trkomplexitsa
csak lineris a vltozk szmban az algoritmus gy hatkonyan, anlkl sszegez a teljes egyttes eloszls
felett, hogy azt explicit mdon megkonstruln. Sajnos az algoritmus idkomplexitsa egy n binris vltozs
hlnl minden esetben O(2n) ami jobb, mint az egyszer megkzeltshez tartoz O(n2n), de mg mindig elg
446
nyomaszt. Egy figyelemre mlt dolog a 14.8. bra fjval kapcsolatban, hogy nyilvnvalv teszi a
megismtelt alkifejezseket, amelyeket az algoritmus kirtkel. A P(j a) P(m a) s a P(j a) P(m a)
szorzatok ktszer kerlnek kiszmtsra, e minden rtknl. A kvetkez fejezet egy ltalnos mdszert r le,
ami elkerli az ilyen felesleges jraszmtsok elvgzst.
4.2. A vltoz elimincis algoritmus

A felsorol algoritmus lnyegesen javthat a 14.8. bra ltal szemlltetett ismtld szmtsok
kikszblsvel. Az tlet egyszer: egyszer vgezzk el a szmtst, s rizzk meg az eredmnyeket ksbbi
hasznlatra. Ez egyfajta dinamikus programozs. Ennek a megkzeltsnek tbb vltozata is ltezik; mi a
legegyszerbbet, a vltoz elimincis (variable elimination) algoritmust mutatjuk be. A vltoz eliminls a
(14.3) egyenlet tpus kifejezseket jobbrl balra (azaz a 14.8. brn lentrl felfel) sorrendben rtkeli ki. A
kztes eredmnyeket eltroljuk, s brmely vltoz feletti sszegzs a kifejezsnek csak azon rsze felett
trtnik meg, amely fgg ettl a vltoztl.
Szemlltessk ezt a folyamatot a betrs hl esetn. rtkeljk ki a kvetkez kifejezst:
Vegyk szre, hogy a kifejezs minden rszt megjelltk a kapcsold vltoz nevvel; ezeket tnyezknek
(factors) nevezzk. A lpsek a kvetkezk:
Az M tnyez, P(m a) nem ignyel M feletti sszegzst (mivel M rtke mr rgztett). Eltroljuk a
valsznsget a minden rtkre egy ktelem vektorban,
(Az fM azt jelli, hogy f ltrehozsban M-et felhasznltuk.)

Hasonlan, troljuk a J-hez tartoz tnyezt egy ktelem fJ(A) vektorban.
Az A-hoz tartoz tnyez, P(a B, e), ami egy 2 2 2-es mtrix lesz, fA(A, B, E).
Most ki kell sszegeznnk A-t ennek a hrom tnyeznek a szorzatbl. Ez egy 2 2-es mtrixot
eredmnyez, aminek indexei mr csak B s E felett futnak. A mtrix nevben A-nl egy fellvonssal
jelezzk, hogy A mr ki lett sszegezve:
Az itt hasznlt szorzst pontonknti szorzsnak (pointwise product) nevezik, s hamarosan ismertetjk.
Hasonl mdon dolgozzuk fel E-t: kisszegezzk E-t fE(E) s
szorzatbl:
Most pedig kiszmthatjuk az eredmnyt egyszeren sszeszorozva B tnyezjt (azaz fB(B) = P(B)-t) az
kiaddott mtrixszal:
A 14.7. (a) feladatban azt krjk, hogy ellenrizze, helyes eredmnyt ad-e ez a folyamat.
A lpsek sorozatt megvizsglva lthatjuk, hogy kt alapvet mvelet szksges: tnyezprok pontonknti
sszeszorzsa s egy vltoz kisszegzse tnyezk szorzatbl.
447
A pontonknti szorzs nem mtrixszorzs s nem is egy elemenknti szorzs. Kt, f1 s f2 tnyeznek a
pontonknti szorzata egy j f tnyezt eredmnyez, amelynek vltozit az f1 s f2 vltozinak az unija adja.
Ttelezzk fel, hogy a kt tnyezben az Y1, ..., Yk vltozk kzsek. Ekkor azt kapjuk, hogy
f(X1 Xj, Y1 Yk, Z1 Zl) = f1(X1 Xj, Y1 Yk)f2(Y1 Yk, Z1 Zl)
Ha minden vltoz binris, akkor f1-nek s f2-nek 2j+k s 2k+l eleme van, pontonknti szorzatuknak pedig 2j + k + l.
Pldul az f1(A,B) s az f2(B,C) tnyezk esetn a lentebb mutatott valsznsg-eloszlssal, az f1 f2
pontonknti szorzata f3(A, B, C)-vel adott:
Egy vltoz kisszegzse tnyezk szorzataibl szintn egyrtelm szmts. Az egyetlen szreveend trkk az,
hogy brmely tnyez, ami nem fgg a kisszegzend vltoztl, az az sszegzsen kvlre mozgathat.
Pldul:
Most a pontonknti szorzat kerl kiszmtsra az sszegzsen bell, a vltozt pedig kisszegezzk a kiadd
mtrixbl:
Vegyk szre, hogy mtrixokat nem szorzunk, ameddig nem kell kisszegeznnk egy vltozt a kiadd
szorzatbl. Annl a pontnl csak azokat a mtrixokat szorozzuk szsze, amelyek magukban foglaljk a
kisszegzend vltozt. A pontonknti szorzs s a kisszegzs eljrsok meglte esetn maga a vltoz
eliminls algoritmusa, amint azt a 14.10. bra mutatja, igen egyszeren felrhat.
Nzznk mg egy lekrdezst: P(JnosTelefonl Betrs = igaz). Szoksos mdon, az els lps az egymsba
gyazott sszegzsek felrsa:
Ha ezt a kifejezst jobbrl balra kirtkeljk, valami rdekeset vesznk szre:

definci szerint 1gyel egyenl. gy ezt eleve kihagyhattuk; a vltoz M a krdsre irrelevns. Mshogy fogalmazva, a
P(JnosTelefonl Betrs = igaz) lekrdezs eredmnyt nem vltoztatja meg a MriaTelefonl eltvoltsa a
hlbl. ltalban, brmely levlcsompontot eltvolthatunk, ami nem clvltoz vagy bizonytkvltoz.
Eltvolts utn lehetnek jabb levlcsompontok, amelyek szintn irrelevnsak lehetnek.
Fontos
Ezt az eljrst folytatva vgl szksgszeren arra jutunk, hogy minden vltoz, ami nem se a
clvltoznak vagy egy bizonytkvltoznak, irrelevns a lekrdezsre. A vltoz eliminl algoritmus
ezrt az sszes ilyen vltozt eltvolthatja a lekrdezs kirtkelse eltt.
14.10. bra - A
megvlaszolsra
vltoz
eliminls
algoritmus
448
Bayes-hls
lekrdezsek
4.3. Az egzakt kvetkeztets komplexitsa

Megmutattuk, hogy a vltozeltvolts hatkonyabb, mint a felsorols, mivel elkerli a szmtsok
megismtlst (ahogyan az irrelevns vltozkat is kiejti). A vltoz eliminls id- s trignyt az algoritmus
mkdse alatt ltrejv legnagyobb tnyez mrete befolysolja a legerteljesebben. Ezt viszont a vltozk
eliminlsnak sorrendje s a hl struktrja hatrozza meg.
Fontos
A 14.2. bra betrs hlja a hlknak azon csaldjhoz tartozik, ahol a hl brmely kt csompontja
kztt legfeljebb egyetlen irnytatlan t ltezik. Ezeket egyszeresen sszekttt (singly connected)
hlknak vagy polifknak (polytree) nevezzk, amelyeknek van egy klnsen kellemes
tulajdonsguk: az egzakt kvetkeztets id- s trkomplexitsa a polifkban a hl mretben lineris.
Itt a mret az FVT-bejegyzsek szmval van definilva; ha minden egyes csompont szleinek a
szma egy konstanssal korltozott, akkor a komplexits a csompontok szmban is lineris. Ezek az
eredmnyek brmely a hl topolgiai sorrendjvel konzisztens sorrendezs esetn fennllnak (lsd
14.7. feladat).
Fontos
A tbbszrsen sszekttt (multiply connected) hlban (lsd pldul 14.11. (a) bra) a vltoz
eliminls legrosszabb esetben exponencilis id- s trkomplexits lehet, mg akkor is, ha a
csompontonknti szlk szma korltos. Ez nem meglep, figyelembe vve, hogy a Bayes-hlkban
val kvetkeztets NP-nehz, mivel ez specilis alesetknt tartalmazza az tletlogikai kvetkeztetst is.
Valjban megmutathat (lsd 14.8. feladat), hogy a problma ugyanannyira nehz, mint kiszmtani
egy tletlogikai formula esetn a formult kielgt rtkadsok szmt. Ez azt jelenti, hogy ez #Pnehz (szmossg-P-nehz), azaz szigoran nehezebb, mint az NP-teljes problmk.
Szoros kapcsolat ll fenn a Bayes-hlkban trtn kvetkeztets komplexitsa s a knyszerkielgtsi
problmk (CSP) komplexitsa kztt. Amint az 5. fejezetben trgyaltuk, egy diszkrt CSP megoldsnak
nehzsge ahhoz kapcsoldik, hogy a knyszergrf mennyire faszer. Olyan mrtkek, mint a
hiperfaszlessg (hypertree width), amelyek a CSP megoldsi komplexitst hatroljk, kzvetlenl
alkalmazhatk Bayes-hlknl is. Ezenfell a vltoz eliminls algoritmusa ltalnosthat gy, hogy
knyszerkielgtsi problmkat is s Bayes-hlkat is megoldjon.
4.4. Csoportost algoritmusok

A vltoz eliminls algoritmusa egyszer s hatkony egyedi lekrdezsek megvlaszolsra. Azonban ha a
hl sszes vltozjnak az a posteriori eloszlst szeretnnk kiszmtani, akkor kevsb hatkony is lehet.
Pldul egy polifa hlban O(n) egyenknt O(n) kltsg lekrdezst kell kiadni, sszessgben O(n2)
idkltsggel. Csoportost (clustering) eljrsokkal (amit egyestsi fa join tree algoritmusnak is
neveznek) ez az id O(n)-re cskkenthet. Emiatt ezeket az algoritmusokat gyakran hasznljk kereskedelmi
Bayes-hls eszkzkben.
A csoportosts alaptlete, hogy a hl nll csompontjait egyestjk, klasztercsompontokat formlva gy,
hogy a kiadd hl polifa legyen. Pldul a 14.11. (a) brn mutatott, tbbszrsen sszekttt hl egy
polifv konvertlhat a Locsol s az Es csompontok egy Locsol+Es-nek nevezett klasztercsompontba
449
(cluster node) val sszevonsval, ahogy azt a 14.11. (b) bra mutatja. A kt binris csompontot egyetlen
megacsompont vltotta fel, ami ngy lehetsges rtket vesz fel: hh, hi, ih, ii. A megacsompontnak csak egy
szlje van, a binris Felhs vltoz, gy kt feltteles eset ltezik.
A hl polifv konvertlsa utn, egy specilis cl kvetkeztetsi algoritmust alkalmazunk. Alapveten az
algoritmus egyfajta knyszerterjeszts (lsd 5. fejezet), ahol a knyszerek biztostjk, hogy a szomszdos
csoportokban megegyeznek a kzs vltozk a posteriori eloszlsai. Gondos nyilvntartssal ez az algoritmus
kpes O(n) idben ahol n most a mdostott hl mrete kiszmolni a hl sszes nem bizonytk
csompontjnak a posteriori eloszlst. Azonban a problma NP-nehz volta nem tnt el: ha a hl
exponencilis id- s trigny a vltoz eliminls esetn, akkor a csoportostott hlhoz tartoz FVT-k
megkonstrulsa exponencilis id- s trigny lesz.
14.11. bra - (a) Egy tbbszrsen sszekttt hl feltteles valsznsgi tblkkal. (b)
Egy tbbszrsen sszekttt hl csoportostott ekvivalense.
5. Kzelt kvetkeztets Bayes-hlkban

Az egzakt kvetkeztets nagy, tbbszrsen sszekttt hlkban val kezelhetetlensge miatt, elengedhetetlen
kzelt kvetkeztetsi mdszerek tgondolsa. Ez a fejezet vletlen mintavteli, Monte Carlo-mdszereknek is
nevezett, eljrsokat r le, amelyek kzelt vlaszokat nyjtanak, ahol a pontossg a generlt mintk szmtl
fgg.
Az utbbi vekben a Monte Carlo-algoritmusok szles krben elterjedtek a szmtstudomnyban olyan
mennyisgek megbecslsre, amelyeket nehz egzakt mdon kiszmolni. Pldul a 4. fejezetben lert szimullt
lehts algoritmus egy Monte Carlo-eljrs optimalizcis problmkra. Ebben a fejezetben a
mintavtelezsnek az a posteriori valsznsgek kiszmtsban trtn alkalmazsban vagyunk rdekeltek.
Algoritmusok kt nagy csaldjt rjuk le: a kzvetlen mintavtelezst s a Markov-lncos mintavtelezst. Kt
msik megkzeltst a varicis mdszert s a hurkos (loopy) terjesztst a fejezet vgi megjegyzsekben
emltjk meg.
5.1. Kzvetlen mintavtelezsi mdszerek

Az alapelem minden mintavteli algoritmusban a mintk generlsa egy ismert valsznsg-eloszlsbl.
Pldul egy szablyos rme felfoghat egy rme valsznsgi vltoznak fej,rs rtkekkel s P(rme) =
0,5, 0,5 a priori eloszlssal. A mintavtel ebbl az eloszlsbl pontosan megfelel egy rme doblsnak: 0,5
valsznsggel fej-et ad, s 0,5 valsznsggel rs-t. Ha rendelkezsre ll a [0, 1] tartomnyba es vletlen
szmoknak egy forrsa, akkor brmely egyvltozs eloszlsbl egyszer dolog mintavtelezni (lsd 14.9.
feladat).
A vletlen mintavtelezsi folyamat legegyszerbb fajtja Bayes-hlk esetn a hlbl generl olyan
esemnyeket, amelyekhez nem kapcsoldik bizonytk. Az tlet az, hogy mintavtelezznk minden vltozt
egyms utn, topolgiai sorrendben. A valsznsg-eloszls, amibl az rtket mintavtelezzk, felttelesen
450
fgg a vltoz szleihez mr hozzrendelt rtkektl. Ez az algoritmus lthat a 14.12. brn. A mkdst a
14.11. (a) brn lthat hln szemlltetjk, felttelezve egy [Felhs, Locsol, Es, VizesPzsit] sorrendezst:
1. Sorsoljunk a P(Felhs) = 0,5, 0,5 eloszlsbl; tegyk fel, hogy igaz-at kapunk.
2. Sorsoljunk a P(Locsol Felhs = igaz) = 0,1, 0,9 eloszlsbl; tegyk fel, hogy hamis-at kapunk.
3. Sorsoljunk a P(Es Felhs = igaz) = 0,8, 0,2 eloszlsbl; tegyk fel, hogy igaz-at kapunk.
4. Sorsoljunk a P(VizesPzsit Locsol = hamis, Felhs = igaz) = 0,9, 0,1 eloszlsbl; tegyk fel, hogy
igaz-at kapunk.
Ebben az esetben a PRIOR-MINTA a kvetkez esemnyt adja [igaz, hamis, igaz, igaz].
Knnyen lthat, hogy a PRIOR-MINTA a hl ltal meghatrozott a priori egyttes eloszlsbl generl mintkat.
Elszr, legyen SPS(x1, , xn) annak a valsznsge, hogy egy adott esemnyt legenerl a PRIOR-MINTA
algoritmus. Pusztn a mintavteli folyamat alapjn felrhat, hogy
mivel minden mintavteli lps a szl rtkektl fgg.
14.12. bra - Egy mintavtelez algoritmus, amely esemnyeket generl egy Bayeshlbl
Ez a kifejezs ismers, mivel ahogy ezt a (14.1) egyenlet kimondja ez egyben a valsznsge is az egyttes
eloszls Bayes-hls reprezentcija szerinti esemnynek is. Arra jutottunk teht, hogy
SPS(x1xn) = P(x1xn)
Ez az egyszer tny nagyon knnyv teszi lekrdezsek mintk felhasznlsval trtn megvlaszolst.
Brmilyen mintavteli algoritmusban a vlasz kiszmtsa a generls sorn elll mintk megszmllsa
alapjn trtnik. Ttelezzk fel, hogy N teljes mintnk van, s jellje N(x1, , xn) az x1, , xn esemny
gyakorisgt. Azt vrjuk, hogy ez a gyakorisg hatrrtkben konvergljon a vrhat rtkhez a mintavteli
valsznsg szerint:
Pldul gondoljuk meg az elbb generlt esemnyt: [igaz, hamis, igaz, igaz]. Ennek az esemnynek a
mintavteli valsznsge:
SPS(igaz, hamis, igaz, igaz) = 0,5 0,9 0,8 0,9 = 0,324
gy, N nagy rtkeinl azt vrjuk, hogy a mintk 32,4%-a ez az esemny legyen.
A kvetkezkben, amikor a kzelt egyenlsg jelet () hasznljuk, pontosan ilyen rtelemben hasznljuk
azaz a becslt valsznsg egzaktt vlik a nagy mintaszm hatresetben. Az ilyen becslseket
konzisztensnek (consistent) nevezzk. Pldul brmely rszlegesen meghatrozott x1, , xm esemny
valsznsgnek egy konzisztens becslse a kvetkezkppen kaphat meg, ha m n:
451
P(x1,, xm) NPS(x1,, xm)/N
(14.5)
Azaz, az esemny valsznsge megbecslhet a mintavteli folyamat ltal generlt sszes teljes esemny azon
hnyadval, amelyek illeszkednek a rszlegesen meghatrozott esemnyre. Pldul ha generlunk 1000 mintt a
locsols hlbl, s 511-ben kzlk az Es = igaz, akkor az es becslt valsznsge
Elutast mintavtelezs Bayes-hlkban

Az elutast mintavtelezs (rejection sampling) ltalnos mdszer mintk ellltsra egy nehezen
mintavtelezhet eloszlsbl, felhasznlva egy knnyen mintavtelezhet eloszlst. Legegyszerbb formjban
feltteles valsznsgek kiszmtsra azaz P(X e) meghatrozsra hasznlhat fel. Az ELUTASTMINTAVTELEZS algoritmusa a 14.13. brn lthat. Elszr a hl ltal megadott a priori eloszlsbl generl
mintkat, majd elutastja azokat, amelyek nem illeszkednek a bizonytkhoz. Vgl, a
megkaphat az X = x elfordulsainak megszmllsval a megmaradt mintban.
Legyen
becsls
az algoritmus ltal kiadott becslt eloszls. Az algoritmus defincija szerint fennll, hogy
A 14.5 egyenletbl kapjuk, hogy
Azaz az elutast mintavtel az igazi valsznsg konzisztens becslst adja.
14.13. bra - Az elutast mintavtel algoritmusa, ami Bayes-hls lekrdezseket

vlaszol meg bizonytkok esetn
Folytatva a 14.11. (a) bra szerinti pldnkat, ttelezzk fel, hogy meg szeretnnk becslni a P(Es Locsol =
igaz)-t, 100 minta felhasznlsval. A 100 ltalunk generlt mintbl, tegyk fel, hogy 73-ban teljesl, hogy
Locsol = hamis, s gy elutastott, mg 27-ben fennll, hogy Locsol = igaz; a 27-bl 8-ban Es = igaz, 19-ben
pedig Es = hamis. gy a
P(Es Locsol = igaz) Normalizl( 8, 19 ) = 0,296, 0,704
A helyes rtk 0,3, 0,7 . A begyjttt mintk szaporodsval a becsls konverglni fog a helyes rtkhez. A
becsls szrsa az egyes valsznsgeknl arnyos lesz
szma.
-nel, ahol n a becslshez felhasznlt mintk
Az elutast mintavtel legnagyobb hibja, hogy nagyon sok mintt utast el! Az e bizonytkkal konzisztens
mintk arnya exponencilisan egyre kevesebb, ahogy a bizonytkvltozk szma n, gy az eljrs egyszeren
hasznlhatatlan komplex problmkban.
452
Vegyk szre, hogy az elutast mintavtel nagyon hasonl a feltteles valsznsgek becslshez, ha
kzvetlenl a valdi vilgbl trtnik a becsls. Pldul a P(Es VrsAzgEste = igaz) becslsnl
egyszeren megszmoljuk, milyen gyakran esik az utn, hogy az elz este az g vrs volt figyelmen kvl
hagyva azokat az estket, amikor az g nem volt vrs. (Itt a vilg maga jtssza a mintagenerl algoritmus
szerept.) Nyilvnvalan, ha az g nagyon ritkn vrs, akkor ez hossz idt vehet ignybe, s ez az, ami az
elutast mintavtel gyengesge.
Valsznsgi slyozs
A valsznsgi slyozs (likelihood weighting) elkerli az elutast mintavtelezs gyengesgt azltal, hogy
csak az e bizonytkkal konzisztens esemnyeket generl. Az algoritmus mkdsnek a lersval kezdjk;
majd megmutatjuk, hogy helyesen mkdik azaz, hogy konzisztens valsznsg becslseket generl. A
VALSZNSGI-SLYOZS (lsd 14.14. bra) rgzti az E bizonytkvltozk rtkeit, s csak a maradk X s
Y vltozkat mintavtelezi. Ez garantlja, hogy minden generlt esemny konzisztens a bizonytkkal. Azonban
nem minden esemny egyenl. Mieltt megllaptannk a szmllsi eredmnyeket a clvltoz eloszlsban,
minden esemnyt slyozunk azzal a valsznsggel, amely megadja, hogy az esemny mennyire van
sszhangban a bizonytkkal. Ezt a valsznsget az egyes bizonytkvltozk feltteles valsznsgeinek a
szorzatval mrjk, a szleik ismeretben. Szemlletesen, azoknak az esemnyeknek, ahol a bizonytk
valszntlennek tnik, kisebb slyt kell adni.
Alkalmazzuk az algoritmust a 14.11. (a) brn lthat hl esetn a P(Es Locsol = igaz, VizesPzsit = igaz)
krdsre. A folyamat a kvetkezkppen halad: elszr a w slyt 1,0-ra lltjuk. Aztn generlunk egy
esemnyt:
1. Sorsoljunk a P(Felhs) = 0,5, 0,5 eloszlsbl; tegyk fel, hogy igaz-at kapunk.
2. A Locsol egy bizonytkvltoz igaz rtkkel. Ezrt belltjuk, hogy
w w P(Locsol = igaz Felhs = igaz) = 0,1
3. Sorsoljunk a P(Es Felhs = igaz) = 0,8, 0,2 eloszlsbl; tegyk fel, hogy igaz-at kapunk.
3. A VizesPzsit egy bizonytkvltoz igaz rtkkel. Ezrt belltjuk, hogy
w w P(VizesPzsit = igaz Locsol = igaz, Es = igaz) = 0,099
Itt a SLYOZOTT-MINTA az [igaz, igaz, igaz, igaz] esemnyt adja ki 0,099 sllyal, s ezt az Es = igaz esetnl
vesszk szmtsba. A sly alacsony, mivel az esemny egy felhs napot r le, amikor valszntlen, hogy a
locsol be van kapcsolva.
Hogy megrtsk, mirt is mkdik a valsznsgi slyozs, azzal kezdjk, hogy megvizsgljuk a SLYOZOTTMINTA SWS mintavteli eloszlst. Emlkezznk, hogy az E bizonytkvltozk rtke (e) rgztett. A tbbi
vltozt Z-vel jelljk, azaz Z = {X} Y. Az algoritmus Z minden vltozjt mintavtelezi, szlei adott
rtkei mellett:
Vegyk szre, hogy a Szlk(Zi) tartalmazhat mind rejtett, mind bizonytkvltozkat is. A P(z) a priori
eloszlstl eltren az SWS eloszls szentel valamennyi figyelmet a bizonytknak is: a mintavtelezett rtkeket
minden Zi esetn befolysoljk a Zi sei kztt lev bizonytkok. Msfell, SWS kevesebb figyelmet szentel a
bizonytkoknak, mint a P(z e) valdi a posteriori eloszls, mivel a mintavtelezett rtkek minden Zi esetn
figyelmen kvl hagyjk azokat a bizonytkokat, amelyek Zi-nek nem sei.8
A w valsznsgi sly ptolja ki a klnbsget a valdi s a kvnt mintavteli eloszls kztt. Egy adott z-bl
s e-bl ll x minta slya az sszes bizonytkvltoz valsznsgnek szorzata a szlei rtkei mellett
(amelyek kzl nhny vagy akr az sszes a Zi-k kztt lehet):
Idelisan, a P(z e) valdi a posteriori eloszlssal megegyez mintavteli eloszlst szeretnnk hasznlni, hogy az sszes bizonytkot
figyelembe vegyk. Ez azonban nem tehet meg hatkonyan. Ha lehetne, akkor a kvnt valsznsget tetszleges pontossggal
kzelthetnnk polinomilis szm mintval. Megmutathat, hogy nem ltezhet ilyen polinom idej kzelt sma.
8
453
A (14.6) s (14.7) egyenleteket sszeszorozva lthatjuk, hogy egy minta slyozott valsznsge klnsen
knyelmes alak
mivel a kt szorzat lefedi az sszes vltozt a hlban, lehetv tve, hogy az egyttes valsznsgre a (14.1)
egyenletet hasznljuk.
14.14. bra - A
kvetkeztetshez
valsznsgi
slyozs
algoritmusa
Bayes-hlban
trtn
Most mr knnyen megmutathat, hogy a valsznsgi slyozsos mintavtel konzisztens. Az X brmely

konkrt x rtkre a becslt a posteriori valsznsg a kvetkezkppen szmthat ki:
gy a valsznsgi slyozs konzisztens becslseket szolgltat.

Mivel a valsznsgi slyozs az sszes generlt mintt felhasznlja, sokkal hatkonyabb lehet, mint az
elutastsos mintavtel. Azonban a teljestmnye leromlik, amint a bizonytkvltozk szma nvekszik. Ez
azrt kvetkezik be, mert a legtbb mintnak nagyon kis slya lesz, s gy a slyozott becslst fknt a mintk
azon csekly tredke hatrozza meg, amelyek egy elenysz valsznsgnl jobban illeszkednek a
bizonytkokhoz. A problma mg erteljesebben jelentkezik, ha a bizonytkvltozk ksbb fordulnak el a
vltoz sorrendben, mivel ekkor a mintk olyan szimulcik, amelyek kevs hasonlsgot mutatnak a
bizonytkok ltal sugalmazott valsghoz.
454
5.2. Kvetkeztets Markov-lnc szimulcival

Ebben a fejezetben a Markov lnc Monte Carlo (MCMC, Markov chain Monte Carlo) algoritmust
ismertetjk, hogy Bayes-hlkban kvetkeztethessnk. Elszr lerjuk, mit is csinl az algoritmus, majd
elmagyarzzuk, hogy mirt is mkdik, s mirt van ilyen bonyolult neve.
Az MCMC algoritmus
Az elz kt mintavteli algoritmustl eltren, amelyek az egyes esemnyeket a semmibl generljk, az
MCMC minden esemnyt az azt megelz esemny vletlen mdostsval generl. Ezrt a hlt hasznos gy
elkpzelni, mint aminek van egy konkrt jelenlegi llapota, ami minden vltozra meghatroz egy rtket. A
kvetkez llapot generlsa egy Xi nem bizonytkvltozhoz tartoz rtk vletlenszer mintavtelezsvel
trtnik, az Xi Markov-takarjba tartoz vltozk jelenlegi rtkeinek felttele mellett. (Emlkezznk vissza az
2.2. szakasz - Feltteles fggetlensgi relcik Bayes-hlkban rszre: egy vltoz Markov-takarja a szleibl,
gyermekeibl s gyermekei szleibl ll.) Az MCMC gy vletlen bolyongst vgez az llapottrben a
lehetsges teljes rtk hozzrendelsek terben , egyszerre egy vltozt billentve t, de rgztetten tartva a
bizonytkvltozkat.
Gondoljuk meg a P(Es Locsol = igaz, VizesPzsit = igaz) krdst a 14.11. (a) brn lthat hl esetn. A
Locsol s a VizesPzsit bizonytkvltozk rgztettek a megfigyelt rtkeikre, mg a rejtett Felhs s Es
vltozk vletlenszeren inicializltak mondjuk az egyik igaz-ra, a msik hamis-ra. gy a kezdeti llapot [igaz,
igaz, hamis, igaz]. Ekkor a kvetkez lpseket hajtjuk vgre ismtlden:
1. A Felhs-t mintavtelezzk a Markov-takarjba es vltozk jelenlegi rtkeinek ismeretben: ebben az
esetben a P(Felhs Locsol = igaz, Es = hamis) szerint mintavteleznk. (Hamarosan megmutatjuk,
hogyan szmthat ki ez az eloszls.) Tegyk fel, hogy az eredmny Felhs = hamis. Ekkor az j llapot
[hamis, igaz, hamis, igaz].
2. Az Es-t mintavtelezzk a Markov-takarjba es vltozk jelenlegi rtkeinek ismeretben: ebben az
esetben a P(Es Felhs = hamis, Locsol = igaz, VizesPzsit = igaz) szerint mintavteleznk. Tegyk fel,
hogy ennek eredmnye Es = igaz. Ekkor az j llapot [hamis, igaz, igaz, igaz].
A folyamat sorn megltogatott minden egyes llapot egy olyan minta, ami hozzjrul az Es clvltoz
megbecslshez. Ha a folyamat 20 llapotot ltogatott meg, ahol az Es igaz, s 61 llapotot, ahol az Es hamis,
akkor a krdsre a vlaszt a NORMALIZL ( 20, 60 ) = 0,25, 0,75 adja. A teljes algoritmus a 14.15. brn
lthat.
Mirt mkdik az MCMC?
Fontos
Most megmutatjuk, hogy az MCMC konzisztens becslseket szolgltat az a posteriori
valsznsgekre. A fejezet anyaga elgg technikai jelleg, de az alapllts egyszer: a mintavteli
folyamat egy olyan dinamikus egyenslyban llapodik meg, amelyben az egyes llapotokban tlttt
id hossz tvon szmolt hnyada pontosan az a posteriori valsznsggel arnyos. Ez a figyelemre
mlt tulajdonsg a specilis tmenetvalsznsg (transition probability) miatt ll fent, amely
szerint a folyamat egyik llapotbl a msikba lp t, ahogyan ezt a feltteles eloszlst a mintavtelezett
vltoz Markov-takarja meghatrozza.
14.15. bra - Az MCMC algoritmus Bayes-hlban trtn kzelt kvetkeztetshez
455
Legyen q(xx) az a valsznsg, hogy a folyamat x llapotbl x llapotba lp t. Ez az tmenet-valsznsg

definilja az gynevezett Markov-lncot (Markov chain) az llapottren. (A Markov-lncok a 15. s 17.
fejezetben is kiemelked szerepet jtszanak.)
Tegyk fel most, hogy t lpsnyit futtatjuk a Markov-lncot, s legyen t(x) annak a valsznsge, hogy a
rendszer a t idpillanatban az x llapotban van. Hasonlan, legyen t=1(x) annak a valsznsge, hogy a
rendszer t = 1 idpillanatban x llapotban van. Ismerve t(x)-et a t=1(x) kiszmthat gy, hogy minden olyan
llapotra, amiben a rendszer t idpillanatban lehet, sszegezzk az llapot valsznsgnek s az ebbl az
llapotbl az x-be val tlps valsznsgnek szorzatt:
Akkor mondjuk, hogy egy lnc elrte a stacionrius eloszlst (stationary distribution), ha t = t+1. Jelljk
ezt a stacionrius eloszlst -vel; az ezt definil egyenlet gy
Ha a q tmenet-valsznsg eloszls eleget tesz nhny alapvet feltevsnek,9 akkor brmely q esetn pontosan
egyetlen eloszls elgti ki ezt az egyenletet.
A (14.9) egyenlet gy tekinthet, mint ami azt lltja, hogy az egyes llapotokbl a kilpsek vrhat rtke
(azaz a jelenlegi populci) egyenl az sszes llapotbli belpsek vrhat rtkvel. Ez a kapcsolat
nyilvnvalan teljesthet, ha a vrhat tlpsek mindkt irnyban ugyanakkork brmely llapotpr esetn. Ez
a tulajdonsg a teljes egyensly (detailed balance):
(x)q(x
x) = (x)q(x
x) minden x, x-re (14.10)
Megmutathatjuk, hogy a teljes egyensly maga utn vonja a stacionaritst, egyszeren az x-ek felett sszegezve
a (14.10) egyenletben. Azt kapjuk, hogy
ahol az utols lps abbl kvetkezik, hogy x-bl biztosan trtnik tmenet.
Most megmutatjuk, hogy az MCMC-KRDEZ mintavteli lpsben megadott q(xx) tmenet-valsznsg eleget
tesz a teljes egyensly egyenletnek, ahol a stacionrius eloszls a P(x e), a rejtett vltozk valdi a posteriori
eloszlsa. Ezt kt lpsben teszszk meg. Elszr, egy Markov-lncot definilunk, amelyben minden vltozt az
szszes tbbi vltozval felttelesen mintavteleznk, s megmutatjuk, hogy ez eleget tesz a teljes egyensly
egyenletnek. Majd egyszeren megllaptjuk, hogy Bayes-hlknl ez ekvivalens azzal a feltteles
A q ltal definilt Markov-lncnak ergodikusnak (ergodic) kell lennie azaz lnyegben, minden llapotnak elrhetnek kell lennie
brmely msik llapotbl, s nem lehetnek szigoran periodikus ciklusok.
9
456
mintavtelezssel, hogy a felttel a vltoz Markov-takarja (lsd 2.2. szakasz - Feltteles fggetlensgi
relcik Bayes-hlkban rszben).
Legyen Xi a mintavtelezett vltoz, s jellje
az sszes tbbi rejtett vltozt. A jelenlegi llapotban az
rtkk xi s . Ha az Xi-nek j xi rtket mintavteleznk felttelesen az sszes tbbi vltozval, belertve a

bizonytkot is, akkor
Ezt az tmenet-valsznsget nevezik Gibbs-mintavteleznek (Gibbs sampler), ami az MCMC egy nagyon
knyelmes alakja.
Most megmutatjuk, hogy a Gibbs-mintavtelez teljes egyenslyban van a helyes a posteriori eloszlsa szerint:
Ahogy az 2.2. szakasz - Feltteles fggetlensgi relcik Bayes-hlkban rszben kimondtuk, egy vltoz
fggetlen az sszes tbbi vltoztl a Markov-takarjnak a felttelben; gy:
ahol mb(Xi) jelli az Xi Markov-takarjban, MB(Xi)-ben lv vltozk rtkeit. Amint a 14.10. feladat mutatja,
egy vltoz valsznsge a Markov-takarjnak ismeretben arnyos a vltoz szleivel vett feltteles
valsznsgnek s az egyes gyermekek azok szleivel vett feltteles valsznsgeinek a szorzatval:
gy egy vltoz tlptetshez az Xi gyermekeinek szmval megegyez szm szorzs szksges.

Itt csupn az MCMC-nek egy egyszer vltozatt trgyaltuk, nevezetesen a Gibbs-mintavtelezt.
Legltalnosabb formjban az MCMC hatkony mdszer valsznsgi modellekkel val szmolsra, s
szmos vltozatt fejlesztettk ki, kzttk a 4. fejezetben bemutatott szimullt lehts algoritmust, a 7.
fejezetben a sztochasztikus kielgthetsg algoritmust, valamint a 15. fejezetben a MetropolisHastingsmintavtelezt.
6. Elsrend reprezentcik valsznsgi

kiterjesztse
Fontos
A 8. fejezetben kifejtettk az elsrend logika reprezentcis elnyeit az tletlogikhoz kpest. Az
elsrend logika objektumok s kzttk lv relcik ltezst veszi alapul, s kpes tnyeket
kifejezni a trgyterlet nhny vagy sszes objektumrl. Ez gyakran vezet olyan reprezentcikra,
amelyek sszehasonltathatlanul tmrebbek, mint az ekvivalens tletlogikai lersok. Mrpedig a
Bayes-hlk alapveten az tletlogikhoz kapcsoldnak: a vltozk halmaza rgztett s vges, s
minden vltoznak rgztett rtkkszlete van. Ez a tny korltozza a Bayes-hlk felhasznlhatsgt.
Ha sikerl tallnunk egy mdszert arra, hogy az elsrend reprezentcik kifejezerejt a
valsznsg-szmtssal kombinljuk, vrhat, hogy ugrsszeren megnveljk a kezelhet problmk
krt.
Fontos
457
Ennek a clnak az elrshez a kvetkez alapvet felismers szksges: az tletlogika szemszgbl

nzve a Bayes-hl elemi esemnyek feletti valsznsgeket hatroz meg, amelyek mindegyike a
hlzat minden vltozjra meghatroz egy rtket. Azaz, az tletlogika terminolgija szerint egy
elemi esemny egy modell vagy egy lehetsges vilg. Az elsrend felfogs szerint egy modell (az
rtelmezsvel egytt) meghatrozza az objektumok egy trgykrt, a kzttk fennll kapcsolatokat,
s a tudsbzisbeli konstansok s prediktumok egy megfeleltetst a modellbeli objektumokra s
kapcsolatokra. Ezrt egy elsrend valsznsgi tudsbzisnak az sszes lehetsges elsrend modell
valsznsgt definilnia kell. Legyen (M) a tudsbzis ltal az M modellhez rendelt valsznsg.
Ekkor brmely elsrend lltsnak a P( ) valsznsgt a szoksos mdon kapjuk, sszegezve
azon lehetsges vilgok felett, ahol igaz:
Eddig rendben is volna. Azonban van egy problma: az elsrend modellek halmaza vgtelen. Ez azt jelenti,
hogy (1) az sszegzs kivitelezhetetlen, s (2) egy teljes, konzisztens eloszls meghatrozsa a vilgok egy
vgtelen halmazn igen bonyolult lehet.
Fogadjunk el ezrt bizonyos korltozsokat, legalbbis idlegesen. Nevezetesen, hogy tervezznk egy olyan
korltozott nyelvet, amelyhez csak vges modell tartozik. Ez szmos mdon megtehet. Itt a relcis
valsznsgi modelleket (relational probability models, RPM) vagy RVM-eket ismertetjk, amelyek a
szemantikus hlk (lsd 10. fejezet) s objektumrelcis adatbzisok elmletbl is vettek t elemeket. Egyb
megkzeltsek az irodalmi s trtneti megjegyzsekben szerepelnek.
Az RVM-ek megengednek konstans szimblumokat, amelyek objektumokat neveznek meg. Pldul legyen
KovcsProf egy professzor neve, Jnos pedig egy dik neve. Minden objektum az osztly egy pldnya: pldul
KovcsProf egy Professzor s Jnos egy Dik. Feltesszk, hogy minden konstans szimblum osztlya ismert.
Fggvnyszimblumaink ktfel lesznek osztva. Az els fajtba tartozk, az egyszer fggvnyek (simple
functions), egy objektumot nem egy msik strukturlt objektumra kpeznek le, hanem egy rtkre egy rgztett
rtktartomnybl, pontosan gy, ahogy egy valsznsgi vltoznl. Pldul az Intelligencia(Jnos) s a
Finanszrozs(KovcsProf) lehet magas vagy alacsony; a Siker(Jnos) s a Hrnv(KovcsProf) lehet igaz vagy
hamis. Fggvnyszimblumok nem alkalmazhatk olyan rtkekre, mint az igaz vagy a hamis, gy nem
lehetsges egyszer fggvnyek egymsba gyazsa. Ezzel elkerljk a vgtelensg egyik forrst. Egy adott
objektumon alkalmazott egyszer fggvny rtke lehet megfigyelt vagy ismeretlen; reprezentcinkban ezek
lesznek az elemi valsznsgi vltozk.10
Megengednk emellett komplex fggvnyeket (complex functions) is, amelyek objektumokat kpeznek le ms
objektumokra. Pldul a Konzulens(Jnos) lehet KovcsProf. Minden komplex fggvnynek van egy megadott
rtktartomnya s rtkkszlete, amik osztlyok. Pldul a Konzulens rtktartomnya a Dik s rtkkszlete a
Professzor. A fggvnyek csak helyes osztlyokra alkalmazhatk; pldul a KovcsProf Konzulens-e nem
definilt. Komplex fggvnyek egymsba gyazhatk: a TanszkVezet(Konzulens(Jnos)) lehet MrProf.
Egyelre feltesszk, hogy minden komplex fggvny rtke ismert az sszes konstans szimblumra. Mivel a TB
vges, ez maga utn vonja, hogy komplex fggvnyek alkalmazsnak minden lncolata elvezet a vges szm
objektum egyikhez.11
Az utols elem, amire szksgnk van, az a valsznsgi informci. Minden egyszer fggvnyhez
specifikljuk a szlk egy halmazt, csakgy, mint a Bayes-hlknl. A szlk lehetnek ugyanannak az
objektumnak ms egyszer fggvnyei; pldul egy Professzor-nak a Finanszrozs-a fgghet a Hrnv-tl. A
szlk lehetnek mg kapcsold objektumok egyszer fggvnyei pldul egy dik Sikere fgghet a dik
Intelligenci-jtl s a dik konzulensnek Hrnv-tl. Ezek valban univerzlisan kvantifiklt lltsok egy
osztly minden objektumnak szleirl. gy rhatjuk azt, hogy
x x Dik Szlk(Siker(x)) = {Intelligencia(x), Hrnv(Konzulens(x))}
(Kevsb formlisan a 14.16. (a) brhoz hasonl diagrammokat rajzolhatunk.) Most megadjuk a gyermek
feltteles valsznsg eloszlst, ahol a felttelt a szlei jelentik. Pldul mondhatjuk, hogy:
Nagyon hasonl szerepet tltenek be, mint a vltozmentes atomi mondatok, amelyek a 9.1. alfejezetben lert tletlogikai lltsokra val
visszavezetsi folyamatban generldnak.
11
Ez a megkts azt jelenti, hogy nem hasznlhatunk olyan komplex fggvnyeket, mint Apa vagy Anya, amelyek potencilisan vgtelen
lncokat eredmnyezhetnnek egy ismeretlen objektummal vgzdve. Ezt a megktst ksbb jra meggondoljuk.
10
458
x x Dik P(Siker(x) = igaz | {Intelligencia(x) = magas, Hrnv(Konzulens(x)) =
igaz) = 0,95
Csakgy, mint a szemantikus hlkban, csatolhatunk feltteles eloszlsokat maghoz az osztlyhoz is, gy a
pldnyok rklik (inherit) a fggseket s a feltteles valsznsgeket az osztlytl.
14.16. bra - (a) Egy kt osztlyt (Professzor s Dik) ler RVM. Kt professzor s kt
dik van, mindkt dik konzulense KovcsProf. (b) Az (a)-beli RVM Bayes-hl
ekvivalense.
Az RVM nyelv szemantikja felteszi, hogy minden konstans szimblum egy klnll objektumra hivatkozik
az egyedi nv felttelezst (unique names assumption) a 10. fejezetben rtuk le. Ezen feltevs mellett s a
korbban felsorolt megktsekkel, meg lehet mutatni, hogy minden RVM valsznsgi vltozk egy rgztett,
vges halmazt generlja, amelyek mindegyike egy egyszer fggvny egy konstans szimblumra alkalmazva.
Ekkor feltve, hogy a szl-gyermek fggsek krmentesek megkonstrulhatunk egy ekvivalens Bayeshlt. Azaz az RVM s a Bayes-hl azonos valsznsgeket hatroz meg minden lehetsges vilgra. A 14.6.
(b) bra mutatja azt a Bayes-hlt, ami a 14.16. (a) bra RVM-jhez tartozik. Vegyk szre, hogy az RVM-ben
szerepl Konzulens kapcsolatok nincsenek jelen a Bayes-hlban. Ennek oka, hogy rgztettek s ismertek.
Azonban kzvetetten feltnnek a hl topolgijban; pldul a Siker(Jnos) szlje a Hrnv(KovcsProf),
mivel a Konzulens(Jnos) rtke a KovcsProf. ltalban, az objektumok kztt fennll relcik
meghatrozzk az ezen objektumok tulajdonsgai kztt fennll fggsgeket.
Az RVM-ek kifejezsi erejnek megnvelsre szmos mdszer knlkozik. Megengedhetnk rekurzv
fggseket (recursive dependencies) a vltozk kztt, hogy bizonyosfajta visszatr kapcsolatokat kezelni
tudjunk. Pldul tegyk fel, hogy a gyorsttermi telektl val fggsget egy McGn okozza. Ekkor minden xre McGn(x) fgg a McGn(Apa(x)) s McGn(Anya(x))-tl, amelyek viszont fggnek a McGn(Apa(Apa(x))) s
a McGn(Anya(Apa(x)))-tl s gy tovbb. Br az ilyen tudsbzisok vgtelen vltozt tartalmaz Bayeshlkhoz tartoznak, fixpont-egyenletekbl olykor megoldsokhoz juthatunk. Pldul a kiszmthat a McGn
egyenslyi eloszlsa, az rklds adott feltteles valsznsge mellett. A rekurzv tudsbzisok egy msik
igen fontos csaldja a 15. fejezetben lert idbeli valsznsgi modelleket (temporal probability models)
tartalmazza. Ezekben a modellekben a t idpillanatbeli llapot tulajdonsgai a t 1 idpillanatbeli llapot
tulajdonsgaitl fggnek s gy tovbb.
Az RVM-ek szintn kiterjeszthetk, hogy megengedjenek kapcsolati bizonytalansgot (relational
uncertainty) is azaz bizonytalansgot a komplex fggvnyek rtkeinl. Pldul lehet, hogy nem tudjuk,
kicsoda a Konzulens(Jnos). Ekkor a Konzulens(Jnos) egy valsznsgi vltoz lesz, aminek lehetsges
rtkei KovcsProf s MrProf. A megfelel hlt a 14.17. bra mutatja.
Szintn jelen lehet azonossgi bizonytalansg (identity uncertainty); pldul esetleg nem tudjuk, hogy Mria
s KovcsProf ugyanaz a szemly-e. Azonossgi bizonytalansg esetn az objektumok s az lltsok szma
vltozhat a lehetsges vilgokban. Annak a vilgnak, ahol Mria s KovcsProf ugyanaz a szemly eggyel
kevesebb objektuma van, mint annak a vilgnak, ahol k klnbz szemlyek. Ez a kvetkeztetsi eljrst
bonyolultabb teszi, de a (14.12) egyenlet ltal lefektetett alapelv rvnyben marad: brmely kijelents
valsznsge jl definilt s kiszmthat. Az azonossgi bizonytalansg klnsen fontos robotok s
begyazott rzkelrendszerek esetn, amelyeknek tbb objektumot is kvetnik kell. Erre a problmra a 15.
fejezetben viszszatrnk.
459
14.17. bra - Egy Bayes-hl rszlete, ami egy olyan RVM-hez tartozik, amelyben a
Konzulens(Jnos) ismeretlen, de vagy KovcsProf, vagy MrProf. A konzulens
vlasztsa az egyes professzorok finanszrozstl fgg. Vegyk szre, hogy a
Siker(Jnos) most mind a kt professzor Hrnev-tl fgg, br a Konzulens(Jnos) rtke
meghatrozza, hogy valjban melyiknek is van hatsa.
Vizsgljuk meg most a kvetkeztets krdst. Vilgos, hogy a kvetkeztets elvgezhet az ekvivalens Bayeshlban, feltve, hogy az RVM nyelvet gy korltozzuk, hogy az ekvivalens hl vges s rgztett struktrj.
Ez analg azzal a mdszerrel, ahogy elsrend logikai kvetkeztetst vgezhetnk el tletlogikai
kvetkeztetssel, az ekvivalens tletlogikai tudsbzisban (lsd 9.1. alfejezet). Ahogy a logikai esetben is, az
ekvivalens hl tlsgosan nagy ahhoz, hogy megkonstruljuk, klnsen ahhoz, hogy kirtkeljk. A sr
sszektttsg szintn problma (lsd 14.12. feladat). A kzelt algoritmusok, mint az MCMC (lsd 14.5.
alfejezet), ezrt igen hasznosak RVM-kben val kvetkeztetsre.
Amikor az MCMC-t egy egyszer RVM-tudsbzisnak az ekvivalens Bayes-hljra alkalmazzuk, ahol a
tudsbzis nem tartalmaz kapcsolati vagy azonossgi bizonytalansgot, az algoritmus a lehetsges vilgok
terbl mintavtelez, amit az objektumok egyszer fggvnyeinek rtkei hatroznak meg. Vilgosan lthat,
hogy ez a megkzelts kiterjeszthet a kapcsolati s az azonossgi bizonytalansgok kezelsre is. Ebben az
esetben a lehetsges vilgok kztti tmenet lehet, hogy egy egyszer fggvny rtkt vagy egy komplex
fggvnyt vltoztat meg, ami a fggsi struktra megvltozshoz is vezethet. Az tmenetek szintn
megvltoztathatjk a konstans szimblumok kztti azonossgi relcikat. gy az MCMC elegns mdszernek
tnik kvetkeztetsek elvgzsre igen nagy kifejezerej, elsrend valsznsgi tudsbzisokban.
A kutats ezen a terleten mg a kezdeteknl tart, de az egyre nyilvnvalbb, hogy az elsrend valsznsgi
rvels az MI-rendszerek risi hatkonysgnvekedst eredmnyezi a bizonytalansg kezelse kapcsn. A
potencilis alkalmazsok kztt jelen van a szmtgpes lts, a szmtgpes nyelvszet, az informcivisszakeress s a szitucirtkels. Ezen terletek mindegyikn az objektumok halmaza s gy valsznsgi
vltozk halmaza nem ismert elre, gy a tisztn kijelentseken alapul mdszerek, mint pldul a Bayeshlk, nem kpesek a helyzetet teljesen lerni. Ezen mdszereket kiegsztettk a modellek tere feletti
keresssel, de az RVM-ek egyetlen modellben teszik lehetv a kvetkeztetst ilyen tpus bizonytalansg
esetn is.
7. Egyb mdszerek a bizonytalan krnyezetben

trtn kvetkeztetshez
Ms tudomnygak (pldul fizika, genetika, kzgazdasgtan) rgta a valsznsgszmtst rszestettk
elnyben a bizonytalansg modellezsre.12 Pierre Laplace 1819-es megfogalmazsban A valsznsgszmts semmi egyb, mint a jzan sz szmokban megfogalmazva. James Maxwell 1850-ben tett kijelentse
szerint a vilg igazi logikja a valsznsgek kalkulusa, ami figyelembe veszi a valsznsg nagysgt,
ahogy azt minden gondolkod ember megteszi vagy meg kellene tennie.
A bizonytalan ismereteket s/vagy bizonytalan kvetkeztsi formkat tartalmaz kvetkeztetseket a tovbbiakban egysgesen
bizonytalansgi kvetkeztetseknek nevezzk. (A ford.)
12
460
Ezt a rgi tradcit ltva taln meglep, hogy az MI a valsznsg-szmts helyett szmos alternatvval
ksrletezett. Az 1970-es vekbeli els szakrti rendszerek teljesen figyelmen kvl hagytk a
bizonytalansgot, s szigoran logikai kvetkeztetst hasznltak, de hamar kiderlt, hogy ez a legtbb vals
problmnl nem alkalmazhat. A szakrti rendszerek kvetkez genercija (klnsen az orvosi
trgytartomnyokban) valsznsgi technikkat hasznlt. A kezdeti eredmnyek biztatk voltak, de nem voltak
sklzhatk nagyobb problmkra a teljes egyttes valsznsg-eloszls megadshoz szksges exponencilis
szm rtk miatt. (Hatkony Bayes-hls algoritmusok ekkor mg nem voltak ismertek.) Ennek
eredmnyekppen a valsznsgi megkzeltsek elvesztettk vonzerejket 1975 s 1988 kztt, s szmos
egyb alternatvt prbltak ki:
Egy elterjedt nzet szerint a valsznsg-szmts alapveten numerikus jelleg, mg az emberi tlethozatal
sokkal kvalitatvabb. Az bizonyos, hogy nem vagyunk tudatban, hogy klnbz fok bizonyossggal
vgznk numerikus szmtsokat. (Ahogyan a logikai egyests elvgzsnek sem vagyunk tudatban, mgis
gy tnik, hogy kpesek vagyunk valamilyenfajta logikai rvelsre.) Lehetsges, hogy a bizonyossg
valamilyen numerikus fokt kzvetlenl troljk az idegsejtek kapcsolatainak s aktivciinak erssgei.
Ebben az esetben ezen erssgek tudatos elrsnek a nehzsge nem meglep. Azt is el kell ismerni, hogy a
kvalitatv kvetkeztetsi mechanizmus a valsznsg-szmtsi alapokra is felpthet, gy a nincsenek
szmok rv a valsznsgek ellen nem meggyz. Mindazonltal nhny kvalitatv mdszer igen
hasznosnak tnhet a sajtos tulajdonsgaik miatt. Az egyik legjobban tanulmnyozott mdszer az
alaprtelmezseken alapul kvetkeztets (default reasoning), ami nem gy kezeli a kvetkeztetetseket,
mint amikben bizonyos fokig hisznk, hanem mint amikben addig hisznk, amg nincs jobb indok valami
mst hinni. Az alaprtelmezseken alapul kvetkeztets a 10. fejezetben szerepel.
Szablyalap (rule-based) megkzeltsekkel is megprbltak bizonytalansgot kezelni. Ezek a mdszerek a
logikai szablyrendszerek sikereit akartk felhasznlni, de hozzadva minden szablyhoz valamilyen
kiagyalt ad hoc tnyezt, ami a bizonytalansgot kezeli. Ezeket az eljrsokat az 1970-es vek kzepn
fejlesztettk ki, s igen nagy szm szakrti rendszer alapjul szolgltak, klnsen orvosi s egyb
terleteken.
Az ismerethiny (ignorance) (ami a bizonytalansggal bizonyos rtelemben szembellthat) krdseit eddig
mg nem rintettk. Fontoljuk meg egy rme feldobst. Ha tudjuk, hogy az rme szablyos, akkor
sszernek tnik, hogy a fej valsznsge 0,5. Ha tudjuk, hogy az rme szablytalan, de nem tudjuk, milyen
mdon, akkor 0,5 az egyetlen sszernek tn valsznsg. Nyilvnval, hogy a kt eset klnbz, de a
valsznsgk lthatan nem klnbzteti meg ket. A Dempster Shafer-elmlet (DempsterShafer
theory) intervallumrtkeket (interval-valued) hasznl a bizonyossg fokozataira, gy reprezentlja az
gens tudst egy llts valsznsgrl. Ms, msodrend valsznsgeket hasznl mdszereket is
trgyalunk majd.
A valsznsg-szmts ugyanazt a ltelmleti feltevst hasznlja, mint a logika: az esemnyek vagy igazak,
vagy hamisak a vilgban, mg ha az gens bizonytalan is, melyik is ll fenn. A fuzzy logika (fuzzy logic)
kutati egy msik ontolgit javasoltak, ami megengedi a meghatrozatlansgot (vagueness) is: azt, hogy
egy esemny lehet valamennyire igaz. A meghatrozatlansg s a bizonytalansg valjban ortogonlis
tmakrk, ahogy azt ltni fogjuk.
A kvetkez hrom alfejezet ezen megkzeltsek mindegyikt egy kicsit rszletesebben mutatja be. Nem
tartalmaznak rszletes technikai lersokat, de a megadott hivatkozsok segtsget nyjtanak tovbbi rszletek
elrshez.
7.1. Bizonytalansgi kvetkeztets szablyalap eljrsokkal

A szablyalap rendszerek a logikai kvetkezts gyakorlati s szemlletes rendszerein val korai munkkbl
alakultak ki. A logikai rendszerek ltalban, s a logikai szablyalap rendszerek specilisan, rendelkeznek az
albbi hrom tulajdonsggal:
Lokalits (locality): logikai rendszerekben, ha van A B formj szably, akkor a B kikvetkeztethet, ha
az A bizonytk adott, brmely ms szablyra val tekintet nlkl. Valsznsgi rendszerekben a Markovtakarban rendelkezsre ll sszes tnyt figyelembe kell venni.
Levlaszts (detachment): ha egyszer talltunk egy logikai bizonytst B llts kikvetkeztetshez, az
lltst tetszs szerint felhasznlhatjuk, a szrmaztatstl fggetlenl. Vagyis levlaszthat (detached) a
461
megokolsaitl. Valsznsgek esetn azonban a bizonyossg bizonytknak a forrsa fontos az

elkvetkez kvetkeztetsekben.
Igazsgfggvny (truth-functionality): a logikban az sszetett kifejezsek igazsgrtke kiszmthat az
alkotinak igazsgrtkbl. Valsznsgek kombinlsa nem lehetsges ezen a mdon, csak szigor, teljes
fggetlensgi felttelezsek mellett.
Szmos ksrlet trtnt olyan bizonytalansgi kvetkeztetsek kifejlesztsre, ahol ezek az elnys
tulajdonsgok megmaradnak. Az elkpzels szerint a bizonyossg mrtkt hozzrendeljk lltsokhoz s
szablyokhoz, s kifejlesztnk tisztn loklis smkat a bizonyossgmrtkek kombinlsra s terjesztsre. A
smk egyben igazsgfggvnyek, pldul az A B bizonyossgmrtke, az A- s B-beli bizonyossgok
fggvnye.
Fontos
A rossz hr a szablyalap rendszerek szmra, hogy a lokalits, a levlaszts s az igazsgfggvny
egyszeren nem alkalmas a bizonytalansgi kvetkeztets szmra. Vizsgljuk elszr az
igazsgfggvnyt. Legyen F1 az az esemny, hogy fejet kapunk egy szablyos rme feldobsakor,
legyen I1 az az esemny, hogy ugyanekkor rst kapunk, s legyen F2 az az esemny, hogy fejet kapunk
egy szablyos rme msodik feldobsakor. Vilgos, hogy mindhrom esemny valsznsge 0,5, s
egy igazsgtart rendszernek ugyanazt az rtket kell hozzrendelnie brmely kett konjunkcijhoz.
De lthatjuk, hogy a konjunkci valsznsge fgg maguktl az esemnyektl is, nem csak a
valsznsgektl.
A helyzet mg rosszabb, ha bizonytsokat lncolunk. Az igazsgfggvnyeken alapul rendszerekben lteznek

A B alak szablyok (rules), amelyek lehetv teszik, hogy kiszmtsuk B-beli bizonyossgunk rtkt, mint
annak fggvnyt, hogy mennyire hisznk a szablyban, s mennyire hisznk A-ban. Ekkor termszetesen mind
elre-, mind htrahalad rendszereket is ki lehet fejleszteni. A szablybeli bizonyossgunkat konstansnak
ttelezzk fel, amit ltalban a tudsmrnk hatroz meg, pldul A0,9 B.
Gondoljuk a 14.11. (a) brn lthat vizes-pzsit szitucira. Ha kpesek szeretnnk lenni mind okozati, mind
diagnosztikai kvetkeztets elvgzsre, a kt albbi szablyra lesz szksgnk:
Es VizesPzsit s VizesPzsit Es
Ha nem vigyzunk, ez a kt szably visszacsatolsos mdon fog mkdni gy, hogy az Es-re vonatkoz
bizonytk megnveli a VizesPzsit-hoz tartoz bizonyossgot, ami viszont mg inkbb megnveli az Es-hz
tartoz bizonyossgot. Nyilvnval, hogy bizonytalansgi kvetkeztet rendszereknek nyilvn kell tartaniuk,
hogy milyen utakon terjedt a bizonytk.
Az okok kztti kvetkeztets (vagy kimagyarzs) szintn bonyodalmas. Gondoljuk meg, mi is trtnik, ha a
kvetkez kt szablyunk van:
Locsol VizesPzsit s VizesPzsit Es
Ttelezzk fel, hogy ltjuk a locsolt bekapcsolva. Elrelncolssal a szablyainkon keresztl ez megnveli azt
a bizonyossgot, hogy a pzsit vizes, ami viszont megnveli az eshz tartoz bizonyossgot. De ez
kptelensg: a locsol bekapcsolt llapota megmagyarzza a pzsit vizessgt, gy cskkentenie kell az eshz
tartoz bizonyossgot. Egy igazsgfggvnyen alapul rendszer gy viselkedik, mintha a LocsolEs
szablyban is hinne.
462
Ezen nehzsgek mellett hogyan lehetsges, hogy az igazsgfggvnyen alapul rendszereket valaha is
hasznosnak tartottk? A megolds abban rejlik, hogy korltoztk a feladatokat krt, s a szablybzist
gondosan gy terveztk meg, hogy nemkvnatos klcsnhatsok ne kvetkezzenek be. A leghresebb
igazsgfggvnyen alapul rendszer bizonytalansgi kvetkeztetsre a bizonyossgi tnyez (certainty factor)
modell, amit a MYCIN orvosi diagnosztikai program szmra fejlesztettek ki, s szles krben hasznltk
szakrti rendszerekben az 1970-es s az 1980-as vekben. A bizonyossgi tnyezk majdnem minden
alkalmazsa vagy tisztn diagnosztikai (mint a MYCIN), vagy tisztn okozati szablybzist tartalmazott. Tovbb
a tnyek csak a szablybzis gykereinl lptek be, s a legtbb szablybzis egyszeresen sszekttt volt.
Heckerman megmutatta, hogy ezen felttelek mellett a bizonyossgi tnyezkn alapul kvetkeztets kicsit
eltr vltozata ekvivalens a polifabeli Bayes-kvetkeztetssel (Heckerman, 1986). Ms krlmnyek kztt, a
bizonyossgi tnyezk katasztroflisan helytelen bizonyossgot eredmnyezhetnek a tnyek tlzott
figyelembevtele miatt. Amint a szablyhalmaz naggy vlik, a szablyok kztt a nemkvnatos interakcik
egyre gyakoribbak, s a felhasznlk azt talltk, hogy szmos szablynak kell hangolni a bizonyossgi
faktort, amikor j szablyokkal bvtenek. Szksgtelen mondani, hogy ez a megkzelts mr nem ajnlott.
7.2. Az ismerethiny reprezentlsa: a DempsterShafer-elmlet

A DempsterShafer-elmletet (DempsterShafer theory) azzal a cllal hoztk ltre, hogy
megklnbztethetv vljon a bizonytalansg (uncertainty) s az ismerethiny (ignorance). Ez az elmlet
egy lltsnak nem a valsznsgt szmtja ki, hanem helyette azt, hogy mennyi annak a valsznsge, hogy a
bizonytk tmogatja az lltst. A bizonyossgnak ezt a mrtkt bizonyossgfggvnynek (belief function)
nevezik, s Bel(X)-szel jellik.
Most visszatrnk a pnzrms pldnkhoz, a bizonyossgfggvny bemutatshoz. Ttelezzk fel, hogy egy
rossz kinzet alak odamegy nhz s felajnlja, hogy fogadjon 1000 forintba, hogy a kvetkez esetben fej
lesz az eredmny. Mivel az rme lehet szablyos, de lehet szablytalan is, milyen bizonyossgot kell ahhoz az
esemnyhez rendelni, hogy a kvetkez eredmny fej lesz? A DempsterShafer-elmlet szerint mivel nincs
bizonytk egyik esetre sem, gy azt kell mondani, hogy a bizonyossg Bel(Fej) = 0 s Bel(Fej) = 0. Ez
szkeptikuss teszi a DempsterShafer-elmletet hasznl kvetkeztet rendszereket, aminek van egy intuitv
vonzereje. Most tegyk fel, hogy rendelkezsre ll egy szakrt, aki 90%-os bizonyossggal tanstja, hogy az
rme szablyos (azaz 90%-ban biztos, hogy P(Fej) = 0,5). Ekkor a DempsterShafer-elmlet azt adja, hogy
Bel(Fej) = 0,9 0,5 = 0,45, s hasonlan Bel(Fej) = 0,9 0,5 = 0,45. Ekkor mg mindig 10% az a hiny,
amit a tnyeink nem fednek le. Dempster szablya (Dempster, 1968) megmutatja, hogy hogyan kombinljunk
tnyeket, hogy j Bel rtket kapjunk, Shafer munkja pedig ezt egy teljes szmtsi modellknt fogalmazta
meg.
Mint az alaprtelmezses kvetkeztetsnl, itt is problma a bizonyossg s a cselekvsek sszekapcsolsa.
Valsznsgek esetn a dntselmlet szerint, ha P(Fej) = 0,5 s P(Fej) = 0,5, akkor (feltve, hogy nyerni s
veszteni 1000 forintot pontosan egyms ellentettjei) a kvetkeztet szmra kzmbs lesz a tt elfogadsa
vagy elutastsa. Egy DempsterShafer-kvetkeztet esetn Bel(Fej) = 0, s gy nincs oka elfogadni, de
ugyanakkor Bel(Fej) = 0, s gy nincs oka vonakodni sem. gy lthat, hogy ebben az esetben a Dempster
Shafer-kvetkeztet ugyanarra a kvetkeztetsre jutott, hogy hogyan cselekedjen. Sajnos a DempsterShaferelmlet szmos ms esetben is megenged nem definilt dntseket, amikor a valsznsgi kvetkeztets
konkrt vlasztst eredmnyez. Valjban a hasznossg fogalma a DempsterShafer-modellben mg nem
kellen tisztzott.
DempsterShafer-elmlet egyik rtelmezse, hogy egy valsznsgi intervallumot definil az intervallum a
Fej esetn a szakrt tansgttele eltt [0, 1], mg utna [0,45, 0,55]. Az intervallum nagysga hasznos
segtsget adhat annak megtlsben, hogy mikor van szksgnk tovbbi tnyekre: elrulhatja, hogy a
szakrt tansgttele akkor fog segteni, ha nem tudjuk, hogy szablyos-e az rme, de nem fog segteni, ha mr
tudjuk, hogy az rme szablyos. Azonban nincsenek vilgos irnyelvek ennek megttelre vonatkozan, mivel
nincs vilgos rtelmezs arra, hogy mit is jelent az intervallum szlessge. A Bayes-megkzeltsben ez a fajta
kvetkeztets knnyen elvgezhet, ha megvizsgljuk azt, hogy jabb tnyek begyjtsvel hogyan vltozna
egy bizonyossg. Pldul a fejek megjelensvel kapcsolatos bizonyossgunkat jelentsen befolysoln, ha
tudjuk, hogy az rme szablyos, s aszimmetrikus sly szrevtele jelentsen befolysoln azon
bizonyossgunkat, hogy az rme szablyos. Egy teljes Bayes-modell magban foglalna ehhez hasonl
tnyezkre vonatkoz valsznsgi becslseket is, megengedve, hogy a tudatlansgunkat bizonyossgaink
azon megvltozsnak mrtkvel fejezzk ki, amelyek jvbeli megfigyelsek esetn kvetkeznnek be.
463
7.3. A meghatrozatlansg reprezentlsa: fuzzy halmazok s

logikk
Fontos
A fuzzy halmazok elmlete (fuzzy set theory) egy eszkz annak specifiklsra, hogy egy objektum
milyen mrtkben illeszkedik egy bizonytalan lershoz. Pldul fontoljuk meg azt az lltst, hogy
Nri magas. Igaz ez akkor, ha Nri 175 cm magas? A legtbb ember vonakodna igent vagy
nemet mondani, s inkbb azt vlasztan, hogy olyasmi. Lthat, hogy ez nem egy kls vilgra
vonatkoz bizonytalansg mi biztosak vagyunk Nri magassgban. A problma az, hogy a magas
nyelvi kifejezs nem az objektumok les kettosztst jelenti a magassgnak fokozatai vannak. Ezrt
a legtbb szerz szerint a fuzzy halmazelmlet egyltaln nem hasznlhat bizonytalansgi
kvetkeztetsekre. Ehelyett a fuzzy halmazelmlet a MagasSzemly-t egy fuzzy prediktumnak tekinti,
aminek az igazsgrtke inkbb egy 0 s 1 kztti rtk, mint hogy igaz vagy hamis lenne. A fuzzy
halmaz nv a prediktum rtelmezsbl szrmazik, ahogyan implicite definilja a halmaz tagjait
egy halmazt, aminek nincsenek les hatrai.
A fuzzy logika (fuzzy logic) egy eljrs olyan logikai kifejezsekkel val kvetkeztetsre, amelyek fuzzy
halmazbeli tagsgi lltsokat rnak le. Pldul annak az sszetett kifejezsnek, hogy MagasSzemly(Nri)
Nehz(Nri) van fuzzy igazsgrtke, ami a kifejezsben lv komponensek igazsgrtkeinek a fggvnye.
Egy sszetett kifejezs T fuzzy igazsgrtknek a kirtkelsre a kvetkez alapvet szablyok szolglnak:
T(A B) = min(T(A), T(B))
T(A B) = max(T(A), T(B))
T(A) = 1 T(A)
A fuzzy logika teht egy igazsgfggvnyen alapul rendszer, s ez komoly nehzsgeket okoz. Tegyk fel
pldul, hogy T(MagasSzemly(Nri)) = 0,6 s T(Nehz(Nri)) = 0,4. Ekkor azt kapjuk, hogy
T(MagasSzemly(Nri) Nehz(Nri)) = 0,4, ami elfogadhatnak tnik, de az is addik, hogy
T(MagasSzemly(Nri) MagasSzemly(Nri)) = 0,4, ami mr nem. Vilgos, hogy a problma amiatt lp fel,
hogy az igazsgfggvnyen alapul megkzelts nem kpes kezelni a pozitv s negatv korrelcikat az llts
rszei kztt.
A fuzzy szablyozs (fuzzy control) egy metodolgia olyan szablyozsi rendszerek alkotsra, amelyekben a
vals rtk bemenetek lekpezst a kimeneti paramterekre fuzzy szablyok reprezentljk. A fuzzy
szablyozs nagyon sikeresnek bizonyult olyan kereskedelmi termkekben, mint az automatikus sebessgvltk,
a videokamerk s a villanyborotvk. A kritikusok [lsd pldul (Elkan, 1993)] gy rveltek, hogy ezek az
alkalmazsok azrt sikeresek, mert kicsi a szablybzisuk, nem vgeznek tbblpses kvetkeztetst, s
hangolhat paramtereik vannak, amelyek lltsval a rendszer teljestmnye javthat. Az a tny, hogy fuzzy
mveleteket hasznlnak, mellkes a sikereik szempontjbl; a magyarzat egyszeren az, hogy egy tmr s
szemlletes mdszert biztostanak egyenletesen interpoll, vals rtk fggvnyek megadsra.
Voltak arra irnyul ksrletek, hogy a fuzzy logikt a valsznsg-szmts keretein bell rtelmezzk. Az
egyik elgondols az, hogy az olyan kijelentseket, mint Nri magas gy fogjuk fel, mint egy folytonos rejtett
vltoz, Nri valdi Magassg-nak diszkrt megfigyelseit. A valsznsgi modell meghatrozza a
P(Megfigyel lltja, hogy Nri magas Magassg) valsznsget, pldul az 3.1. szakasz - Bayes-hlk
folytonos vltozkkal rszben lert probit eloszls (probit distribution) felhasznlsval. Ekkor az a posteriori
eloszls Nri magassga felett a megszokott mdon szmolhat ki, pldul ha a modell rsze egy hibrid Bayeshlnak. Egy ilyen megkzelts termszetesen nem igazsgfggvnyen alapul. Pldul a feltteles eloszls
P(Megfigyel lltja, hogy Nri magas Magassg, Sly)
kapcsolatot enged meg a magassg s a sly kztt, ahogyan a megfigyelst okozzk. gy nagyon valszntlen,
hogy valakit, aki kt s fl mter magas s kilencven kilogramm, magas s nehz-nek nevezznk, br a kt s
fl mter magas-nak s a kilencven kilogramm nehz-nek minsl.
A fuzzy prediktumoknak szintn adhat egy valsznsgi rtelmezs a valsznsgi halmazokat (random
sets) felhasznlva azaz olyan valsznsgi vltozkat, amiknek lehetsges rtkei objektumok halmazai.
Pldul a MagasSzemly egy valsznsgi halmaz, amelynek lehetsges rtkei emberek halmazai. A P(Magas
464
= S1) valsznsg, ahol S1 az embereknek valamely konkrt halmaza, annak a valsznsge, hogy pontosan ezt
a halmazt minsten magas-nak a megfigyel. Ekkor a Nri magas valsznsge minden olyan halmaz
valsznsgnek az sszege, amelyben Nri elemknt jelen van.
Mind a hibrid Bayes-hls megkzelts, mind a valsznsgi halmaz megkzelts gy tnik, hogy modellezi
a meghatrozatlansg egyes vetleteit bizonyossgok felhasznlsa nlkl. Mindazonltal szmos
megvlaszolatlan krds van a nyelvi megfigyelsek s folytonos mennyisgek helyes reprezentcijval
kapcsolatban, amely krdsekkel a fuzzy kutati kzssgen kvl a tbbsg nem foglalkozik.
8. sszefoglals
Ez a fejezet a Bayes-hlkat (Bayesian networks) mutatta be, amelyek egy jl kidolgozott reprezentcit
jelentenek a bizonytalan tuds szmra. A Bayes-hlk nagyjbl hasonl szerepet tltenek be, mint amit az
tletlogika a biztos tuds szmra.
A Bayes-hl egy irnytott krmentes grf, aminek csompontjai valsznsgi vltozkhoz tartoznak;
minden csomponthoz tartozik egy feltteles eloszls, ahol a felttelt a csompont szlei jelentik.
A Bayes-hlk tmr mdot adnak a trgyterlet feltteles fggetlensgi (conditional independence)
kapcsolatainak a reprezentlsra.
Egy Bayes-hl egy teljes egyttes eloszlst specifikl; egy egyttes bejegyzst a megfelel loklis feltteles
eloszlsokbeli bejegyzsek szorzata hatroz meg. Egy Bayes-hl gyakran exponencilisan kisebb mret,
mint a teljes egyttes eloszls.
Szmos feltteles eloszlst lehet tmren reprezentlni eloszlsok kanonikus csaldjaival. A hibrid Bayeshlk (hybrid Bayesian networks), amelyek mind diszkrt, mind folytonos vltozkat tartalmaznak, sokfle
kanonikus eloszlst hasznlnak.
A kvetkeztets Bayes-hlkban a clvltozk egy halmaza valsznsg-eloszlsnak kiszmtst jelenti,
feltve a tnyvltozk egy halmazt. Az egzakt kvetkeztetsi algoritmusok, mint a vltoz eliminls
(variable elimination) feltteles valsznsgek szorzatainak sszegt rtkelik, amilyen hatkonyan csak
lehet.
Polifkban (polytrees) (egyszeresen sszekttt hlkban) az egzakt kvetkeztets szmtsi ideje a hl
mretvel linerisan n. ltalnos esetben a problma kezelhetetlen.
Sztochasztikus kzelt szmtsi technikk, mint a valsznsgi slyozs (likelihood weighting) s a
Markov lnc Monte Carlo (Markov chain Monte Carlo) mdszerek elfogadhat becslseket adnak a
hlbeli valdi a posteriori valsznsgekre, s sokkal nagyobb hlkkal is megbirkznak, mint az egzakt
algoritmusok.
A valsznsg-szmts kombinlhat az elsrend logikbl vett reprezentcis tletekkel, hogy nagyon
hatkony rendszereket hozzunk ltre bizonytalansg esetn trtn kvetkeztetshez. A relcis valsznsgi
modellek (RVM-ek) eleget tesznek olyan reprezentcis megktseknek, amelyek egy olyan jl definilt
valsznsg eloszlst garantlnak, amely egy ekvivalens Bayes-hlval kifejezhet.
Szmos egyb rendszert is javasoltak a bizonytalansg esetn trtn kvetkeztetshez. Nagy ltalnossgban
azt lehet mondani, hogy az igazsgfggvnyen (truth-functional) alapul rendszerek az ilyen rvelshez
nem a legmegfelelbb eszkzk.

A hlk felhasznlsa valsznsgi informcik reprezentlsra Sewall Wright munkjval kezddtt el a 20.
szzad elejn a genetikai rklds analzisvel s az llatok nvekedsi tnyezivel kapcsolatban (Wright,
1921; 1934). Az hlinak egyike ltszik ennek a knyvnek a bortjn. I. J. Good, Alan Turinggal
egyttmkdve, olyan valsznsgi reprezentcikat s Bayes kvetkeztetsi mdszereket fejlesztett ki,
465
amelyeket a modern Bayes-hlk elfutrnak lehet tekinteni br a cikkre nem hivatkoznak gyakran ebben a
kontextusban (Good, 1961).13 Ugyanez a cikk az eredeti forrsa a zajos-VAGY modellnek.
A dntsi problmk hatsdiagram (influence diagram) reprezentcijt ami a valsznsgi vltozk
reprezentcijhoz egy irnytott krmentes grfot tartalmazott dntselemzsek sorn hasznltk az 1970-es
vek vge fel (lsd 16. fejezet), de a kirtkelsre csak felsorolst hasznltak. Judea Pearl fejlesztette ki az
zenetvlt eljrst, a fa hlkban (Pearl, 1982a) s az egyszeresen sszekttt (polifa) hlkban (Kim s Pearl,
1983) trtn kvetkeztetsre, s szemben az akkor npszer bizonyossgi tnyezs rendszerekkel, a
diagnosztikai helyett a kazulis valsznsgi modellek ltrehozsnak fontossga mellett rvelt. Az els
szakrti rendszer, ami Bayes-hlkat hasznlt, a CONVINCE volt (Kim, 1983; Kim s Pearl, 1987). A ksbbi
rendszerek kztt talljuk a mozgatidegekkel kapcsolatos rendellenessgek diagnosztizlsra szolgl MUNIN
(Andersen s trsai, 1989) s a patolgis helyzetek feldertsre szolgl PATHFINDER rendszert (Heckerman,
1991). Messze a legtbbet hasznlt Bayes-hls rendszerek a Microsoft Windows diagnziskijavts moduljai
(pldul a Nyomtat varzsl) (Breese s Heckerman, 1996) s az Office segd a Microsoft Office-ban (Horvitz
s trsai, 1998).
ltalnos Bayes-hlkban trtn egzakt kvetkeztetsre Pearl fejlesztett ki egy csoportostson alapul
algoritmust, felhasznlva egy konverzit vltozk csoportjai feletti irnytott polifba, amelyben zenetvltsok
biztostjk a csoportok kzs vltozi feletti konzisztencit. Egy hasonl mdszer, amit David Spiegelhalter s
Steffen Lauritzen fejlesztett ki (Spiegelhalter, 1986; Lauritzen s Spiegelhalter, 1988), egy irnytatlan Markovhlba viv konverzin alapul. Az eljrst a HUGIN rendszerben valstottk meg, ami egy hatkony s szles
krben hasznlt eszkz a bizonytalansgi kvetkeztetsek esetn (Andersen s trsai, 1989). Ross Shachter, a
hatsdiagramok kutati kzssgbl, egy egzakt mdszert fejlesztett ki, ami a hl clirnyos cskkentsn
alapul a posteriori megrz talaktsokat felhasznlva.
A fejezetben lert vltoz elimincis mdszer Shachter mdszerhez ll legkzelebb, amibl a szimbolikus
valsznsgi kvetkeztets (SzVK) mdszere alakult ki (Shachter, 1990). Az SzVK megksrli optimalizlni az
olyan kifejezsi fk kirtkelst, mint amilyen a 14.8. brn lthat. Az ltalunk ismertetett algoritmus a Zhang
s Poole ltal kifejlesztetthez ll a legkzelebb (Zhang s Poole, 1994; 1996). Irrelevns vltozk eltvoltsra
szolgl kritriumokat Geiger s trsai, illetve Lauritzen s trsai fejlesztettek ki (Geiger s trsai, 1990;
Lauritzen s trsai, 1990); az ltalunk megadott kritrium ezeknek egy egyszer specilis esete. Rina Dechter
(Dechter, 1999) mutatta meg, hogy a vltoz eliminls tlete lnyegben megegyezik a nem folytatlagos
dinamikus programozssal (nonserial dynamic programming) (Bertele s Brioschi, 1972). Ez egy
algoritmikus megkzelts, amit Bayes-hlkban elll kvetkeztetsi problmk szles krre lehet sikerrel
alkalmazni. Ilyen problma pldul megfigyelsek egy adott halmazhoz a legvalsznbb magyarzat
megkeresse. Ez sszekapcsolja a Bayes-hls algoritmusokat a knyszerkielgtsi problmkat megold
kapcsold mdszerekkel, s kzvetlen mdszereket szolgltat az egzakt kvetkeztets komplexitsra a hl
hiperfjnak a szlessge alapjn.
Folytonos valsznsgi vltozk jelenltt Bayes-hlkban Pearl, illetve Shachter s Kenley vizsglta (Pearl,
1988; Shachter s Kenley, 1989); ezek a cikkek kizrlag folytonos vltozkat tartalmaz hlkat trgyaltak,
amelyek loklis fggsi modelljei lineris normlis eloszlsak. Diszkrt vltozk bevezetst Lauritzen s
Wermuth vizsglta (Lauritzen s Wermuth, 1989), amit a cHUGIN rendszerben meg is valstottak (Olesen,
1993). A probit eloszlst elszr Finney vizsglta (Finney, 1947), szigmoid eloszlsnak nevezve. Az eloszlst
szles krben hasznljk diszkrt vlasztsi jelensgek modellezsre, s kiterjeszthet tbb mint kt vlasztsi
lehetsg kezelsre (Daganzo, 1979). A logit eloszls hasznlathoz Bishop ad indoklst (Bishop, 1995).
Cooper mutatta meg, hogy a kvetkeztets ltalnos problmja tetszleges Bayes-hlban NP-teljes (Cooper,
1990), Paule Dagum s Mike Luby pedig azt, hogy ennek a kzelt megoldsa is NP-teljes (Dagum s Luby,
1993). A trkomplexits szintn komoly problma mind a csoportost, mind a vltoz elimincis
mdszereknl. A vghalmaz felttelezseken (cutset conditioning) alapul eljrs, amit a knyszerkielgtsi
problmkra az 5. fejezetben mutattunk be, elkerli az exponencilis mret tblk ltrehozst. Egy Bayeshlban a vghalmaz a csompontok azon halmaza, amelyek rtkeinek rgztse esetn a fennmarad
csompontok fggsei egy fagrfra egyszersdnek, ami mr lineris idben s trben megoldhat. A
lekrdezst sszegzssel adhatjuk meg a vghalmaz minden lehetsges rtkadsa mellett, gy az sszes
trigny mg mindig lineris (Pearl, 1988). Darwiche (Darwiche, 2001) egy rekurzvan felttelez algoritmust
ad meg, ami tetszleges tr/id egyenslyt tesz lehetv.
I. J. Good vezet statisztikus volt Turing kdfeltr csapatban a msodik vilghbor sorn. A 2001: rodsszeia c. mvben Arthur C.
Clarke Goodnak s Minskynek tulajdontotta azokat az ttrseket, amelyek a HAL szmtgp kifejlesztshez vezettek (Clarke, 1968a).
13
466
Gyors kzelt algoritmusok Bayes-hlkra val kifejlesztse nagyon aktv terlet, a statisztika, a
szmtselmlet s a fizika hatrterletn. Az elutast mintavtelezs mdszere egy ltalnos, a statisztikban
rgta ismert technika; Bayes-hlknl Max Henrion alkalmazta elszr, aki logikai mintavtelezsnek (logic
sampling) nevezte (Henrion, 1988). A valsznsgi slyozs, amit Fung s Chang (Fung s Chang, 1989),
illetve Shachter s Peot fejlesztettek ki (Shachter s Peot, 1989), egy pldja a fontossgi mintavtel
(importance sampling) jl ismert statisztikai mdszernek. A valsznsgi slyozs nagymrv felhasznlst
az orvosi diagnosztikban Shwe s Cooper jelenti (Shwe s Cooper, 1991). Cheng s Druzdzel a valsznsgi
slyozs adaptv verzijt kzlik (Cheng s Druzdzel, 2000), ami akkor is jl mkdik, ha a bizonytk a priori
valsznsge nagyon alacsony.
A Markov lnc Monte Carlo (MCMC) mdszerek a Metropolis algoritmussal kezddtek, ami Metropolisnak
ksznhet (Metropolis s trsai, 1953), ami a 4. fejezetben lert szimullt lehts algoritmusnak szintn a
forrsa. A Gibbs-mintavtelezt Geman s Geman fejlesztette ki irnytatlan Markov-hlkban trtn
kvetkeztetsre (Geman s Geman, 1984). Az MCMC Bayes-hlkban trtn alkalmazsa Pearlnek
ksznhet (Pearl, 1987). A Gilks s trsai ltal sszegyjttt cikkek MCMC-alkalmazsok szles skljt
lelik fel, szmos kzlk a jl ismert BUGS csomaggal lett kifejlesztve (Gilks s trsai, 1996).
A kzeltsi mdszereknek kt nagyon fontos csaldja ltezik, amelyeket nem trgyaltunk a fejezetben. Az els
csald a varicis kzelts (variational approximation) mdszere, ami mindenfajta komplex szmts
egyszerstsre felhasznlhat. Az alaptlet az, hogy az eredeti problmnak ellltjuk egy olyan reduklt
verzijt, ami annyira egyszer, hogy dolgozni lehessen vele, de amennyire lehet hasonl az eredeti
problmhoz. A reduklt problma lersa tartalmazza a varicis paramtereket (variational parameters),
amelyeket gy lltunk be, hogy minimalizljon egy D tvolsgfggvnyt az eredeti s a reduklt problmk
kztt, gyakran a D/ = 0 egyenletrendszer megoldsval. Szmos esetben pontos fels s als korltok
kaphatk. Varicis mdszereket rgta hasznlnak a statisztikban (Rustagi, 1976). A statisztikus fizikban a
meztlag (mean field) mdszer egy specilis varicis mdszer, amelyben a modellt alkot egyes vltozkat
teljesen fggetlennek ttelezzk fel. Ezt az tletet felhasznlva sikerlt kezelni nagy irnytatlan Markovhlkat (Peterson s Anderson, 1987; Parisi, 1988). A varicis mdszerek Bayes-hlkra trtn
alkalmazsnak matematikai megalapozst Saul s trsai fejlesztettk ki, s k kaptak a szigmoid hlkra
pontos als korlt kzeltseket a meztlag mdszerrel (Saul s trsai, 1996). Jaakkola s Jordan gy
terjesztettk ki a mdszert (Jaakkola s Jordan, 1996), hogy mind az als, mind a fels korlt kinyerhet legyen.
A varicis mdszereket Jordan tekintette t (Jordan, 1999).
A kzelt algoritmusok msodik csaldja Pearl fagrfon fut zenetvltsos algoritmusn alapszik (Pearl,
1982a). Az algoritmust ltalnos hlkra is lehet alkalmazni, ahogy Pearl javasolta (Pearl, 1988). Az
eredmnyek lehetnek helytelenek, s lehet, hogy az algoritmus nem ll le, de szmos esetben a szolgltatott
rtkek kzel vannak a helyes rtkekhez. Ez az gynevezett bizonyossgterjesztses (belief propagation)
vagy hurkos terjesztses (loopy propagation) megkzelts kevs figyelmet kapott, mindaddig, amg
McEliece s trsai fel nem figyeltek (McEliece s trsai, 1998) arra, hogy az zenetvlts tbbszrsen
sszekttt Bayes-hlkban pontosan megegyezik a turb dekdols (turbo decoding) algoritmus ltal vgzett
szmtssal (Berrou s trsai, 1993), ami jelents ttrst eredmnyezett a hibajavt kdok tervezsben. Ebbl
az a kvetkeztets vonhat le, hogy a bizonyossgterjeszts gyors is s pontos is a nagyon nagy mret s
nagyon srn sszekttt dekdolsra hasznlt hlkban, s ezrt lehet, hogy ltalnosabban is hasznos lehet.
Murphy s trsai egy ksrletrl szmoltak be, ahol ez valban mkdtt (Murphy s trsai, 1999). Yedidia s
trsai tovbbi kapcsolatokra mutattak r a bizonyossgterjeszts s a statisztikus fizika kztt (Yedidia s trsai,
2001).
A valsznsg s az elsrend nyelvek kztti kapcsolatot Carnap tanulmnyozta (Carnap, 1950). Gaifman,
illetve Scott s Krauss megadott egy nyelvet, amelyben valsznsgeket elsrend mondatokhoz lehet
kapcsolni, s amelyre a modellek valsznsgi mrtkek voltak lehetsges vilgokon (Gaifman, 1964; Scott s
Krauss, 1966). Az MI-n bell ezt az tletet az tletlogikra Nilsson, a prediktumlogikra pedig Halpern
fejlesztette ki (Nilsson, 1986; Halpern, 1990). A tudsreprezentcis krdsek els kiterjedt vizsglatt ilyen
nyelvek esetn Bacchus vgezte (Bacchus, 1990), Wellman s trsainak a tanulmnya a korai implementcikat
tekinti t (Wellman s trsai, 1992), amelyek egy ekvivalens (tletlogikai) Bayes-hl ltrehozsn alapulnak.
Napjainkra a kutatk elkezdtk megrteni a teljes tudsbzisok fontossgt, azaz olyan tudsbzisok
fontossgt, amelyek akr a Bayes-hlk, egy egyrtelm egyttes eloszlst definilnak az sszes lehetsges
vilg felett. Az erre szolgl eljrsok a logikai programozs valsznsgi verziin (Poole, 1993; Sato s
Kameya, 1997) vagy szemantikus hlkon (Koller s Pfeffer, 1998) alapultak. A fejezetben ismertetett tpus
relcis valsznsgi modelleket Pfeffer vizsglta rszletesebben (Pfeffer, 2000). Pasula s Russell mind a
relcis, mind az azonossgi bizonytalansgot vizsglta az RVM-ekben s az MCMC kvetkeztets
felhasznlsban (Pasula s Russell, 2001).
467
Amint a 13. fejezetben kifejtettk, a korai valsznsgi rendszerek kegyvesztettek lettek az 1970-es vekben,
helyt adva az alternatv mdszerek megjelensnek. A bizonyossgi tnyezket a MYCIN orvosi szakrti
rendszerbeli felhasznlsra fejlesztettk ki (Shortliffe, 1976), amit egyrszt mrnki megoldsnak is, msrszt
az emberi tlethozatal modelljnek is javasoltk, bizonytalansg esetben. A Rule-Based Expert Systems
gyjtemny (Buchanan s Shortliffe, 1984) teljes ttekintst ad a MYCIN-rl s leszrmazottairl (lsd mg
[Stefik, 1995]). David Heckerman megmutatta, hogy a bizonyossgi tnyezs szmtsok kicsit mdostott
verzija mr helyes valsznsgeket ad bizonyos esetekben, de ms esetekben a bizonytkok hibt okoz,
tlzott figyelembevtelre vezet (Heckerman, 1986). A PROSPECTOR szakrti rendszer (Duda s trsai, 1979)
szablyalap megkzeltst hasznlt, amiben a szablyokat (ritkn tarthat) globlis fggetlensgi
felttelezsekkel igazoltk.
A DempsterShafer-elmlet Arthur Dempster publikcijval kezddtt, amiben a pontszer valsznsgi
rtkek ltalnostst javasolta intervallumrtkekre, s szablyokat javasolt a kombinlsukra (Dempster,
1968). Glenn Shafer ksbbi munkja vezetett el a DempsterShafer-elmlet s a valsznsg-szmts
egymssal verseng szemllethez (Shafer, 1976). Ruspini a DempsterShafer-elmlet s a valsznsgszmts kapcsolatt elemezte (Ruspini s trsai, 1992). Shenoy a DempsterShafer bizonyossgfggvny
alapjn egy eljrst javasolt a dntshozatalra (Shenoy, 1989).
A fuzzy halmazokat Lotfi Zadeh dolgozta ki vlaszul arra a nehzsgre (Zadeh, 1965), hogy egzakt bemeneti
rtkeket adjunk az intelligens rendszerek szmra. Zimmermann lersa (Zimmermann, 2001) rszletes
bevezetst nyjt a fuzzy halmazok elmletbe; a (Zimmermann, 1999) pedig fuzzy alkalmazsokrl szl
cikkek gyjtemnye. Amint korbban emltettk, a fuzzy logikt gyakran tekintik a valsznsg-szmts
versenytrsnak, pedig valjban eltr krdsekkel foglalkozik. A lehetsgelmletet (possibility theory)
(Zadeh, 1978) a bizonytalansg kezelsre vezettk be fuzzy rendszerekben, s sok kzs vonsa van a
valsznsg-szmtssal. Dubois s Prade alapos ttekintst nyjt a lehetsgelmlet s a valsznsgszmts kapcsolatrl (Dubois s Prade, 1994).
A valsznsg-szmts MI-n belli feltmadsa fknt a Bayes-hlk felfedezsn mlt, ami mdszert adott a
feltteles fggetlensgek reprezentlsra s kihasznlsra. Ez az jjszlets igen kzdelmes volt; Peter
Cheeseman harcias In defense of Probability (Cheeseman, 1985) s a ksbbi An Inquire into Computer
Understanding (Cheeseman, 1988, megjegyzsekkel) c. cikke zeltt ad a vitbl. A logika mvelinek egyik
legfbb kifogsa az volt, hogy a valsznsg-szmts miatt szksgesnek vlt szmtsok nelemzssel nem
rhetk el, s egy nem relis pontossgi szintet tteleznek fel a bizonytalan tudsunkban. A kvalitatv Bayeshlk (qualitative probabilistic networks) (Wellman, 1990a) lehetsget adnak a Bayes-hlk tisztn
kvalitatv absztrakcijra, csupn a vltozk kztti hatsok pozitv s negatv jellegt kihasznlva. Wellman
megmutatta, hogy szmos esetben ennyi informci is elegend az optimlis dntshozatalhoz a valsznsgi
rtkek precz meghatrozsa nlkl. Adnan Darwiche s Matt Ginsberg munkja kivonatolja a valsznsgszmts elmletben szerepel felttelessg s a tnyek kombinlsnak alapvet tulajdonsgait, s
megmutatja, hogyan lehet ezeket alkalmazni logikai s alaprtelmezsi kvetkeztetsekben (Darwiche s
Ginsberg, 1992).
A fejezetben lert szvbetegsg-kezel rendszer Lucastl szrmazik (Lucas, 1996). A Bayes-hlk ms terleten
trtn alkalmazsai kztt talljuk egyebek kztt a Microsoftnl vgzett fejlesztseket a felhasznl cljainak
kikvetkeztetsre (Horvitz s trsai, 1998) s a kretlen elektronikus levelek szrsre (Sahami s trsai, 1998),
az Electric Power Research Institute fejlesztst ramgenertorok figyelsre s a NASA fejlesztst idkritikus
informcik megjelentsre a Mission Controlnl Houstonban (Horvitz s Barry, 1995).
Az MI-n belli bizonytalansgi kvetkeztetssel kapcsolatos szmos fontos korai publikci megtallhat a
Readings in Uncertain Reasoning (Shafer s Pearl, 1990) s az Uncertainty in Artifical Intelligence (Kanal s
Lemmer, 1986) antolgikban. A Bayes-hlk tmakrnek fejldsben a legfontosabb egyedlll publikci
vitathatatlanul a Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference (Pearl, 1988).
Tbb kivl munka tartalmazza az jabb anyagokat, mint pldul (Lauritzen, 1996; Jensen, 2001; Jordan, 2003).
A valsznsgi kvetkeztetssel kapcsolatos j eredmnyek mind az MI f irnyait meghatroz fbb
lapokban, mint pl. az Artificial Intelligence-ben, mind a specializltabb folyiratokban, mint amilyen az
International Journal of Approximate Reasoning jelennek meg. A grfos modellekrl (graphical models),
amely modellosztly magban foglalja a Bayes-hlkat is, szmos cikk statisztikai jsgokban jelenik meg. Az
Uncertainty in Artificial Intelligence (UAI), a Neural Information Processing Systems (NIPS) s az Artificial
Intelligence and Statistics (AISTATS) konferencik kiadvnyai kivl forrsai a legfrissebb kutatsoknak.
468
14.18. bra - Egy gpkocsi elektromos s motorikus rendszereinek rszeit ler Bayeshl. Minden vltoz binris, s az igaz rtk jelzi a megfelel funkci helyes
mkdst.
8.2. Feladatok
14.1.
Tekintsk a 14.18. brn lthat gpkocsi-diagnosztikai hlt.
a. Egsztse ki a hlt a JegesId s az IndtMotor binris vltozkkal.
b. Adjon meg sszer feltteles valsznsgi tblkat az sszes csompontra.
c. Hny fggetlen rtket tartalmaz a teljes egyttes valsznsg-eloszls fggvny 8 binris csompont
esetn, felttelezve, hogy nincs kzttk feltteles fggetlensgi relci?
d. Hny fggetlen valsznsgi rtket tartalmaznak az n hljnak tblzatai?
e. A Beindul feltteles valsznsg eloszlsa megadhat egy zajos-S eloszlssal. rja le ezt az
eloszlscsaldot ltalban s kapcsolatt a zajos-VAGY eloszlshoz.
14.2.
A helyi nukleris ermben van egy riaszt, ami rzkeli, ha a hmrskletmr egy adott kszbrtket
meghalad. A mr a reaktormag hmrsklett mri. Tekintse a kvetkez binris vltozkat: R (riaszt hangja),
HR (hibs riaszt), HM (hibs mr) s a kvetkez tbbrtk vltozkat: M (mr) s H (egy aktulis bels
hmrsklet).
a. Rajzoljon fel egy Bayes-hlt a trgytartomnyra, felttelezve, hogy valsznbb, hogy a mr akkor
hibsodik meg, ha a hmrsklet tl magas.
b. A hlzata polifa lett?
c. Ttelezze fel, hogy a hmrskletnek csak kt lehetsges rtke van: normlis s magas; s hogy a mr
helytelen hmrskletet mr az esetek x%-ban, ha mkdik, s y%-ban, ha hibs. Adja meg az M feltteles
valsznsg-tblit.
469
d. Ttelezze fel, hogy a riaszt tkletesen mkdik, hacsak nem hibs, mely utbbi esetben egyltaln nem
riaszt. Adja meg az R-hez tartoz feltteles valsznsg-tblt.
e. Ttelezze fel, hogy a mr s a riaszt mkdik, s a riaszt megszlal. Fejezze ki annak a valsznsgt,
hogy a reaktormag hmrsklete magas a hl feltteles valsznsgeinek a fggvnyben.
14.3.
Kt csillagsz tvcsveiket hasznlva a vilg klnbz rszein M1 s M2 mrseket vgeznek az gbolt egy
kis rszn lthat csillagok szmrl (Sz). ltalban egy kis e valsznsge a hibnak, ami egy csillagnyi
eltrst jelent. Brmelyik tvcsvel megtrtnhet az is (egy sokkal kisebb f valsznsggel), hogy nincs
rendesen fkuszlva (F1 s F2 esemnyek), amely esetben a tuds 3 vagy tbb csillaggal kevesebb csillagot
szmll (ha Sz kisebb mint 3, akkor egyetlen csillagot sem szlel). Tekintsk a 14.19. brn lthat hrom hlt.
a. Melyik Bayes-hl reprezentlja helyesen (de nem felttlenl hatkonyan) a fenti ismereteket?
b. Melyik a legjobb hl? Adjon magyarzatot.
c. Adjon meg egy sszer feltteles valsznsgi tblt a P (M1 Sz) rtkeire, amikor M1 {0, 1, 2, 3, 4} s Sz
{1, 2, 3}. A feltteles eloszls minden rtkt az e s az f paramterek fggvnyben fejezze ki.
14.18. bra - Hrom lehetsges hl a tvcsproblmra
d. Ttelezze fel, hogy M1 = 1 s M2 = 3. Mik a csillagok lehetsges szmai, ha a priori nem korltozzuk Sz
rtkt?
e. Mi a csillagok legvalsznbb szma ezen megfigyelsek esetn? Magyarzza el ennek kiszmtst, vagy ha
nem lehetsges kiszmtani, magyarzza el, milyen tovbbi informcikra van szksg, s hogy az miknt
befolysoln az eredmnyt.
14.4.
Tekintsk a 14.19. (ii) brn lthat hlt, s tegyk fel, hogy a kt teleszkp azonosan mkdik. Legyen M1, M2
{0, 1, 2, 3, 4} s Sz {1, 2, 3} a 14.3. feladatban megadott szimbolikus FVT-kkel. A felsorol algoritmus
felhasznlsval szmolja ki a kvetkez valsznsg-eloszlst: P(Sz M1 = 2, M2 = 2).
14.5.
Tekintsk a lineris Gauss loklis eloszls hlk csaldjt, amit az 3.1. szakasz - Bayes-hlk folytonos
vltozkkal rsz illusztrl.
a. Egy ktvltozs hlban legyen X1 az X2 szlje, X1-nek legyen normlis a priori eloszlsa, P(X2 X1) pedig
egy lineris normlis eloszls. Mutassa meg, hogy a P(X1, X2) egyttes eloszls egy tbbvltozs Gausseloszls, s szmolja ki ennek a kovarianciamtrixt.
b. Bizonytsa be indukcival, hogy egy ltalnos lineris Gauss-hl X1, , Xn-en vett egyttes eloszlsa szintn
tbbvltozs Gauss-eloszls.
470
14.6.
Az 3.1. szakasz - Bayes-hlk folytonos vltozkkal rszben definilt probit eloszls egy binris gyermek
valsznsg-eloszlst rja le, egyetlen folytonos szl esetn.
a. Hogyan terjeszthet ki a definci tbb folytonos szl esetre?
b. Hogyan terjeszthet ki, hogy tbbrtk gyermekvltozra is alkalmazhat legyen? Gondolja vgig mind a
kt esetet, amikor a gyermek rtkei sorrendezettek (ahogyan a vezetsnl a sebessgfokozat megvlasztsa a
sebessg, a lejts, a kvnt gyorsuls stb. fggvnye), s amikor nem llthatk sorba (mint pldul a busz, a
vonat vagy a kocsi vlasztsa munkba menetelnl). (Segtsg: gondoljunk a lehetsges rtkek kt csoportra
osztsra, hogy binris vltozt szimulljunk.)
14.7.
Ez a feladat a 14.10. brn lthat vltoz elimincis algoritmusra irnyul.
a. A 14.4. alfejezet a vltoz eliminlst alkalmazza arra a lekrdezsre, hogy
P(Betrs JnosTelefonl = igaz, MriaTelefonl = igaz)
Vgezze el a jelzett szmtsokat, s ellenrizze, hogy helyes-e a vlasz.

b. Szmolja ssze az elvgzett aritmetikai mveletek szmt, s hasonltsa ssze a felsorolsi algoritmus ltal
elvgzettek szmval.
c. Tegyk fel, hogy a hl egy lncot alkot: binris vltozk szekvencijt, ahol Szlk(Xi) = {Xi1} i = 2, ..., n
esetn. Mi a P(X1 Xn = igaz) kiszmtsnak a komplexitsa a felsorolst hasznlva? s mi, ha vltoz
eliminlst hasznlunk?
d. Bizonytsa be, hogy a vltoz eliminls futsnak komplexitsa egyszeresen sszekttt hlban lineris a
hl mretben brmely, a hl struktrjval konzisztens vltoz sorrendezs mellett.
14.8.
Vizsgljuk meg az egzakt kvetkeztets komplexitst ltalnos Bayes-hlkban.
a. Bizonytsa be, hogy brmely 3-SAT problma reduklhat egy egzakt kvetkeztetsre egy olyan Bayeshlban, amely a konkrt problmt reprezentlja, s gy az egzakt kvetkeztets NP-nehz. (Segtsg:
gondoljon egy olyan hlra, amiben minden kijelentsszimblumhoz, minden klzhoz s a klzok minden
konjunkcijhoz rendre egy-egy csompont tartozik.)
b. A 3-SAT problmban a kielgt rtk-hozzrendelsek szmnak meghatrozsa #P-teljes. Bizonytsa be,
hogy az egzakt kvetkeztets legalbb ennyire nehz.
14.9.
Tekintsk egy vletlen minta egy megadott egyvltozs eloszlsbl trtn generlsnak a problmjt.
Felttelezhetjk, hogy rendelkezsre ll egy vletlenszm-genertor, ami egyenletes eloszls szerint 0 s 1
kztti vletlen szmokat ad.
a. Legyen X egy diszkrt valsznsgi vltoz P(Xi = xi) = pi i {1, ..., k} tmegfggvnnyel. Az X
eloszlsfggvnye (cumulative distribution) minden lehetsges j-re megadja annak valsznsgt, hogy X
{x1, ..., xj}.
Magyarzza el, hogyan szmolhat ki az eloszlsfggvny O(k) idben, s hogyan generlhatunk vele egy X
eloszlsa szerinti mintt. Ez utbbi megtehet kevesebb mint O(k) idben?
b. Most tegyk fel, hogy N mintt szeretnnk generlni X szerint, ahol N >> k. Magyarzza el, hogyan tehet ez
gy meg, hogy a mintnknti vrhat futsi id konstans (azaz fggetlen k-tl).
c. Most tekintsnk egy folytonos rtk vltozt egy parametrikus eloszlssal (pldul normlissal). Hogyan
generlhatunk mintkat egy ilyen eloszlsbl?
471
d. Tegyk fel, hogy egy folytonos rtk vltozt szeretne lekrdezni, s egy olyan mintavtelez algoritmust
hasznl a kvetkeztetsre, mint a VALSZNSGISLYOZS. Hogyan kellene mdostania a lekrdezsvlaszads folyamatt?
14.10.
Egy vltoz Markov-takarjt (Markov blanket) az 2.2. szakasz - Feltteles fggetlensgi relcik Bayeshlkban definiltuk.
a. Bizonytsa be, hogy a vltoz fggetlen a hl sszes tbbi vltozjtl, ha Markov-takarja ismert.
b. Vezesse le a (14.11) egyenletet.
14.11.
Tekintsk a P(Es Locsol = igaz, VizesPzsit = igaz) lekrdezst a 14.11. (a) bra szerint, s annak az MCMC
mdszerrel val megvlaszolst.
a. Hny llapota van a Markov-lncnak?
Szmtsa ki a Q llapottmenet-mtrixot (transition matrix Q), ami tartalmazza az sszes q(yy) rtket
minden y-ra s y-ra.
b. Mit reprezentl Q2, az llapottemeneti mtrix ngyzete?
c. Mi lesz Qn, ha n ?
d. Magyarzza el, hogy hajtsunk vgre valsznsgi kvetkeztetst Bayes-hlkban, ha Qn elrhet. Hatkony
mdja ez a kvetkeztetsnek?
14.12.
Hrom focicsapat, A, B s C jtszik egyms ellen. Minden meccsen kt csapat vesz rszt, az eredmny pedig
gyzelem, veresg vagy dntetlen lehet. Minden csapatnak egy rgztett, ismeretlen fokozat jtkszintje van
ami egy 0 s 3 kztti egsz rtk , s egy meccs eredmnye a kt csapat jtkszintje kztti klnbsgtl fgg
sztochasztikusan.
a. Hozzon ltre egy relcis valsznsgi modellt a trgyterletre, s javasoljon rtkeket az sszes szksges
valsznsg-eloszlsra.
b. Hozzon ltre egy ekvivalens Bayes-hlt.
c. Tegyk fel, hogy az els kt meccsen A megveri B-t, C-vel pedig dntetlent jtszik. Egy tetszleges egzakt
kvetkeztetst felhasznlva, szmtsa ki a harmadik meccs a posteriori eloszlst.
d. Tegyk fel, hogy n csapat vesz rszt a bajnoksgon, s minden eredmnynk megvan, kivve az utolst.
Hogyan vltozik az utols meccs megjslsnak a komplexitsa az n fggvnyben?
e. Vizsglja meg az MCMC alkalmazst ezen a problmn. Milyen gyorsan konvergl az MCMC a
gyakorlatban, s hogyan sklzhat fel?
472
15. fejezet - Idbeli valsznsgi

kvetkeztets
Ebben a fejezetben megprbljuk rtelmezni a jelent, megrteni a mltat s esetleg megjsolni a jvt, mg
akkor is, ha igencsak kevss kristlytiszta.
A bizonytalan krnyezetben lv genseknek a logikai gensekhez hasonlan kpesnek kell lennik
krnyezetk aktulis llapotnak nyomon kvetsre. Ezt a feladatot nehezebb teszi a rszleges s zajos
rzkels, s az a bizonytalansg, ahogyan a krnyezet az id elrehaladtval vltozik. Az gens a legjobb
esetben is a jelenlegi helyzetnek csak egy valsznsgi rtkelshez kpes hozzjutni. Ez a fejezet olyan
reprezentcikat s kvetkeztetsi algoritmusokat r le, amelyek lehetv teszik ezt az rtkelst, a 14.
fejezetben bemutatott tletekre ptve.
Az alapvet megkzelts lersa a 15.1. alfejezetben szerepel: egy vltoz vilgot gy modelleznk, hogy a
vilg llapotnak minden vonatkozsra, minden idpillanatban egy valsznsgi vltozt hasznlunk. Ezen
vltozk kzti kapcsolatok rjk le az llapot fejldst. A 15.2. alfejezet meghatrozza az alapvet
kvetkeztetsi feladatokat, s lerja az idbeli modellekhez tartoz kvetkeztet algoritmusok ltalnos
struktrjt. Ezutn hrom klnbzfajta modellt runk le: a rejtett Markov-modelleket (hidden Markov
model), a Kalman-szrket (Kalman filters) s a dinamikus Bayes-hlkat (dynamic Bayesian networks)
(ami mint specilis aleseteket magban foglalja a rejtett Markov-modelleket s a Kalman-szrket). Vgl a
15.6. alfejezet bemutatja, miknt alkotjk az idbeli valsznsgi modellek a modern beszdfelismer
rendszerek magjt. Ezen modellek mindegyiknek ltrehozsban kzponti szerepet tlt be a tanuls, de a
tanulsi algoritmusok rszletes vizsglata a VI. rszre marad.
1. Id s bizonytalansg
A valsznsgi kvetkeztetsre szolgl technikinkat vltozatlan (static) vilgok esetn fejlesztettk ki,
amelyekben minden egyes valsznsgi vltoznak egyetlen rgztett rtke van. Pldul egy gpkocsi
javtsnl feltesszk, hogy ami meghibsodott, az a diagnosztizls alatt is hibs marad; a feladatunk a
gpkocsi llapotnak kikvetkeztetse a megfigyelt bizonytkokbl, amelyek szintn vltozatlanok maradnak.
Most vegynk fontolra egy msfle problmt: egy cukorbeteg pciens kezelst. Akrcsak a gpkocsijavts
esetn, rendelkeznk bizonytkokkal: a jelenlegi inzulinadagok, az lelmiszer-bevitel, a vrcukorszint
mrsnek eredmnyei s egyb testi tnetek. A feladat a pciens jelenlegi llapotnak rtkelse, belertve az
aktulis vrcukorszintet s inzulinszintet. Ezeknek az informciknak az alapjn az orvos (vagy a pciens)
dntst hoz a pciens lelmiszer-beviteli s inzulinadagjrl.
A gpkocsijavts esettl eltren, itt a problma dinamikai vonatkozsai alapvetek. A vrcukorszintek s
mrseik idvel gyorsan vltozhatnak, amit befolysol a pciens aktulis lelmiszer-bevitele s inzulinadagja, az
anyagcsere aktivitsa, a napszak s egyb tnyezk. Ahhoz, hogy a bizonytkok idbeli alakulsbl a jelenlegi
llapotot megbecsljk, s egy kezels kimenetelt megjsoljuk, modelleznnk kell ezeket a vltozsokat.
Ugyanezek a szempontok szmos ms esetben is jelentkeznek, egy nemzet gazdasgi aktivitsnak kzelt s
rszleges statisztikk alapjn trtn kvetstl, beszdszekvencik zajos s tbbrtelm akusztikai
mrsekbl trtn megrtsig. Addik a krds: hogyan lehet az ezekhez hasonl dinamikai helyzeteket
modellezni?
1.1. llapotok s megfigyelsek

Az alapvet megkzelts, amit kvetnk, hasonl a 10. fejezetben lert szitucikalkulus alapjul szolgl
tlethez: a vltozs folyamatt pillanatfelvtelek sorozatnak tekinthetjk, amelyek mindegyike egy adott
pillanatban rja le a vilg llapott. Minden pillanatfelvtel vagy idpont (time slice) valsznsgi vltozk
egy halmazt tartalmazza, amelyek nmelyike megfigyelhet, nmelyike pedig nem.
Az egyszersg kedvrt a tovbbiakban fel fogjuk tenni, hogy a vltozknak ugyanaz a rszhalmaza minden
idpontban megfigyelhet (br az elkvetkezkben ez teljes mrtkben sehol sem szksgszer). A t
idpillanatban nem megfigyelhet vltozk halmaznak a jellsre Xt-t fogjuk hasznlni, s Et-t a
473
Idbeli valsznsgi kvetkeztets
megfigyelhet vltozk halmaznak a jellsre. A t idpontbeli megfigyels Et = et az rtkek valamely et

halmazra.
Gondoljuk t a kvetkez leegyszerstett pldt: tegyk fel, hogy egy titkos, fldalatti ltestmny biztonsgi
rei vagyunk. Szeretnnk tudni, hogy vajon aznap esik-e, de a klvilghoz val egyetlen hozzfrsnket az
jelenti, hogy reggelenknt ltjuk, hogy az igazgat esernyvel vagy eserny nlkl jn be. Minden egyes t
napon az Et halmaz gy egyetlen bizonytkvltozt tartalmaz, az Ut-t (van-e eserny), s Xt az Rt-t, az egyetlen
llapotvltozt tartalmazza (esik-e). Ms problmkhoz vltozk nagyobb halmaza tartozhat. A cukorbetegsg
pldjban a bizonytkvltozk lehetnek a MrtVrcukort s a Pulzusszmt, s az llapotvltozk lehetnek a
Vrcukort s a Gyomortartalomt.1
Az idpontok kztti intervallum szintn problmafgg. A cukorbetegsg kvetsnl az alkalmas intervallum
inkbb egy ra, mint egy nap. Ebben a fejezetben ltalban egy rgztett vges intervallumot tteleznk fel, ami
azt jelenti, hogy az idpillanatok egsz szmokkal felcmkzhetk. Feltesszk, hogy az llapotsorozat t = 0-nl
kezddik; s jelentktelen okokbl feltesszk, hogy a bizonytkok t = 1-nl kezdenek berkezni, s nem t = 0nl. gy az esernys vilgot az R0, R1, R2, ... llapotvltozk s az U1, U2, ... bizonytkvltozk reprezentljk.
Az a : b jellst fogjuk hasznlni az egszek a-tl b-ig tart sorozatnak jellsre (a hatrokat belertve), s
Xa:b jelli a vltozk megfelel halmazt Xa-tl Xb-ig. Pldul U1:3 az U1, U2, U3 vltozknak felel meg.
1.2. Stacionrius folyamatok s a Markov-felttel

Egy adott problmnl az llapotvltozk s a bizonytkvltozk halmaznak meghatrozsa utn a kvetkez
lps a vltozk kztti fggsgek megadsa. Kvethetnnk a 14. fejezetben megllaptott eljrst, valahogyan
sorrendezve a vltozkat, s krdseket feltve az eldktl val feltteles fggetlensgre, adott szli halmaz
esetn. Egy nyilvnval vlaszts, hogy a vltozkat a termszetes idsorrendjk szerint sorrendezzk, mivel az
ok ltalban megelzi a hatst, s a vltozkat lehetleg az ok-okozati sorrendjk szerint vesszk.
Azonban hamar beletkzhetnk egy akadlyba: a vltozk halmaza nem korltos, mivel minden idpontra
tartalmazza az llapot- s bizonytkvltozkat. Valjban ez kt problmt is felvet: (1) korltlan szm
feltteles valsznsgi tblt kell megadnunk minden vltozra, minden idpillanatban; (2) ezek korltlan
szm szlt tartalmazhatnnak.
Az els problmt megoldja annak felttelezse, hogy a vilg llapotnak a vltozsait egy stacionrius
folyamat (stationary process) okozza azaz egy vltozsi folyamat, amit olyan trvnyek hatroznak meg,
amik maguk nem vltoznak az idvel. (Ne keverjk ssze a stacionaritst a statikussggal: egy statikus
folyamatban maga az llapot nem vltozik.) Az esernys vilgban ekkor a P(Ut|Szlk(Ut)) feltteles
valsznsg, hogy az eserny feltnik, minden t-re azonos. A stacionarits feltevsnl ezrt csak egy
reprezentatv idpillanathoz tartoz vltozk feltteles valsznsgeit kell megadnunk.
A msodik problmt, a potencilisan vgtelen szm szl kezelst, az gynevezett Markov-felttel
(Markov assumption) elfogadsa oldja meg azaz, hogy a jelenlegi llapot a korbbi llapotoknak csak vges
trtnettl fgg. Ennek a feltevsnek eleget tv folyamatokat elsknt Andrei Markov orosz matematikus
tanulmnyozta rszletesen. Ezeket a folyamatokat Markov-folyamatoknak (Markov processes) vagy Markovlncoknak (Markov chains) neveznek. (A Markov-folyamatok feloszthatk aszerint, hogy az llapottr
folytonos vagy diszkrt, illetve hogy az id folytonos vagy diszkrt. Markov-lncoknak a diszkrt idej s/vagy
diszkrt llapotter Markov-folyamatokat nevezik a ford.) A Markov-folyamatok klnbz jellemzkkel
rendelkezhetnek; a legegyszerbb az elsrend Markov-folyamat (first-order Markov process), amelyben a
jelenlegi llapot csak az elz llapottl fgg, s nem fgg egyetlen korbbitl sem. Mshogy fogalmazva,
egyetlen llapot ismeretre van szksg, hogy a jv a mlttl felttelesen fggetlen legyen az llapot
ismeretben. A jellsnket felhasznlva, a megfelel feltteles valsznsgi llts azt mondja ki, hogy
minden t-re
P(Xt|X0:t1) = P(Xt|Xt1) (15.1)
gy egy elsrend Markov-folyamatban az llapotok idbeli vltozst ler szablyokat teljes mrtkben
tartalmazza a P(Xt|X1t) feltteles eloszls, amit az elsrend folyamat llapottmenet-modelljnek (transition
model) neveznk.2 A 15.1. bra elsrend s msodrend Markov-folyamatokhoz tartoz Bayeshlstruktrkat mutat.
1
2
Vegyk szre, hogy a Vrcukort s a MrtVrcukort kt klnbz vltoz, gy kezeljk az aktulis mennyisgek zajos mrst.
Az llapottmenet-modell a valsznsgi analgja a 7. fejezet logikai frisst ramkrnek s a 10. fejezet kvet llapot aximinak.
474
15.1. bra - (a) Egy elsrend Markov-folyamathoz tartoz Bayes-hlstruktra. A

reprezentlt Markov-folyamatban az llapotot az Xt vltozk definiljk. (b) Egy
msodrend Markov-folyamat.
Az Xt llapotvltozk szleinek a korltozsn tl korltoznunk kell az Et bizonytkvltozk szleit is.

Tipikusan feltesszk, hogy a bizonytkvltozk egy t idpillanatban csak az aktulis llapottl fggnek:
P(Et|X0:t, E0:t1) = P(Et|Xt) (15.2)
A P(Et|Xt) feltteles eloszlst rzkel modellnek (sensor model) nevezik (vagy nha megfigyelsi modellnek
[observational model]), mivel lerja, hogy az rzkelket azaz a bizonytkvltozkat hogyan
befolysolja a vilg aktulis llapota. Vegyk szre a fggs irnyt: a nyl az llapottl az rzkel rtkre
mutat, mivel a vilg llapota okozza azt, hogy az rzkelk bizonyos rtkeket vegyenek fel. Az esernys
vilgban pldul az es okozza az eserny feltnst. (A kvetkeztetsi folyamat termszetesen a msik
irnyban halad; a modellezett fggsek irnya s a kvetkeztets irnya kztti klnbsgttel a Bayes-hlk
egyik f elnye.)
Az llapottmenet-modellhez s az rzkel modellhez mg meg kell adnunk egy P(X0) a priori eloszlst a 0.
idpontbeli llapotok felett. Ez a hrom eloszls, kombinlva a (15.1) s a (15.2) egyenletekben megfogalmazott
feltteles fggetlensgi lltsokkal, biztostja szmunkra a teljes egyttes eloszls meghatrozst az sszes
vltoz felett. Brmely vges t-re azt kapjuk, hogy
A fggetlensgi lltsok egy nagyon egyszer Bayes-hlstruktrnak felelnek meg, ami az egsz rendszert
lerja. A 15.2. brn lthat a hl struktrja az esernys plda esetn, belertve az llapottmenet- s az
rzkel modellekhez tartoz feltteles eloszlsokat.
Az brn lv struktra elsrend Markov-folyamat felttelezsen alapul, mivel feltesszk, hogy az es
valsznsge csak attl fgg, hogy az elz nap esett-e. Egy ilyen feltevsnek a helynvalsga magtl a
trgyterlettl fgg. Az elsrend Markov-felttel kimondja, hogy az llapotvltozk az sszes olyan
informcit tartalmazzk, amely a kvetkez idpontbeli valsznsg-eloszlsok megadshoz szksges.
Nha ez a feltevs pontosan teljesl pldul ha egy rszecske vletlen bolyongst (random walk) vgez az x
tengelyen, 1-gyel vltoztatva meg a pozcijt minden idpontban, ekkor az x koordintt hasznlva
llapotknt, egy Markov-lnc addik. Gyakran a feltevs csak kzelt, mint amikor az es jslsa csak az
alapjn trtnik, hogy esett-e az elz napon. Kt lehetsges javts ltezik, ha a kzelts tlsgosan
pontatlannak bizonyul:
1. A Markov-folyamat rendjnek a megnvelse. Pldul ltrehozhatnnk egy msodrend modellt, felvve egy
Est2-t mint az Est szljt, ami lehet, hogy valamivel pontosabb predikcit adna (pldul Palo Altban
nagyon ritkn esik tbb mint kt napig egyfolytban).
2. Az llapotvltozk halmaznak megnvelse. Pldul felvehetnnk az vszakt vltozt, hogy ez lehetv
tegye szmunkra az ess vszakok trtneti feljegyzseinek beptst, vagy hozzadhatnnk a Hmrsklett,
a Pratartalomt s a Lgnyomst vltozkat, hogy az es feltteleinek fizikai modelljeit felhasznlhassuk.
475
15.2. bra - Az esernys vilgot ler Bayes-hlstruktra s feltteles eloszlsok. Az

lapottmenet-modell a P(Est|Est1) feltteles valsznsg-eloszls, az rzkel modell
a P(Esernytt|Est).
A 15.1. feladat annak megmutatst kri, hogy az els megolds a folyamat rendjnek a megnvelse
mindig tfogalmazhat az llapotvltozk halmaznak megnvelsre, vltozatlanul hagyva a rendet. Vegyk
szre, hogy llapotvltozk hozzadsa javthatja a rendszer elrejelz erejt, de megnveli a predikcis
kvetelmnyeket is: ekkor mr az j vltozkat is jsolni kell. gy a vltozknak egy nmagban elgsges
halmazt keressk, ami valjban azt jelenti, hogy meg kell rtennk a modellezett folyamat fizikjt. A
folyamat pontos modellezse irnti kvetelmny nyilvnvalan mrskeltebb, ha j rzkelket vehetnk fel
(pldul a hmrsklet s a nyoms mrsre), amelyek kzvetlenl az j llapotvltozkrl szolgltatnak
informcit.
Gondoljuk meg pldul egy XY skon vletlenszeren stl robot kvetsnek a problmjt. Egy javaslat az
llapotvltozk egy elgsges halmazra ekkor a pozci s a sebessg lehet: Newton trvnyeit felhasznlva
kiszmolhat az j pozci, s a sebessg megjsolhatatlanul vltozik. Ha azonban a robot akkumultorrl
zemel, akkor az elem lemerlsnek tipikusan van egy szisztematikus hatsa a sebessg megvltozsra. Mivel
ez viszont fgg attl, hogy mennyi energia hasznldott el az sszes korbbi manverben, a Markov-tulajdonsg
srl. A Markov-tulajdonsgot helyrellthatjuk egy Akkumultort feltltttsgi szintnek mint az Xt-t alkot
llapotvltozk egyiknek a felvtelvel. Ez segt a robot mozgsnak a jslsban, de ugyanakkor megkveteli
az Akkumultort jslst az Akkumultort1-bl s a sebessgbl. Bizonyos esetekben ez megbzhatan
megtehet; a pontossg azonban javulna egy, az akkumultor feltltttsgt mr j rzkel felvtelvel.
2. Kvetkeztets idbeli modellekben

Egy ltalnos idbeli modellstruktra kidolgozsa utn, most mr megfogalmazhatjuk a megoldand alapvet
kvetkeztetsi feladatokat:
Szrs (filtering) vagy ellenrz megfigyels (monitoring). Ez a bizonyossgi llapot (belief state)
kiszmtsnak a feladata ami a jelenlegi llapot feletti a posteriori eloszls, az adott idpontig vett sszes
bizonytk ismeretben. Azaz szeretnnk kiszmtani a P(Xt|e1:t) mennyisget, feltve, hogy a bizonytkok
folyamatos sorozatban rkeznek kezdve a t = 1 idponttl. Az esernys pldban ez az aznapi es
valsznsgnek a kiszmtst jelenten, az esernyhordoz eddigi sszes megfigyelsnek az ismeretben.
A szrs az, amit egy racionlis gensnek el kell vgeznie ahhoz, hogy a jelenlegi llapotot kvetni tudja, s
gy racionlis dntseket hozhasson (lsd 17. fejezet). Kiderl, hogy majdnem azonos szmts szolgltatja a
bizonytksorozat megfigyelsnek a valsznsgt (likelihood), P(e1:t)-t.
Elrejelzs (prediction). Ez egy jvbeli llapot feletti a posteriori eloszls kiszmtsnak a feladata, az
adott idpontig vett sszes bizonytk ismeretben. Azaz, szeretnnk kiszmtani a P(Xt+k|e1:t) mennyisget
valamely k > 0 esetn. Az esernys pldban ez jelentheti az es valsznsgnek a kiszmtst hrom
napra elre, az esernyhordoz eddigi sszes megfigyelsnek az ismeretben. Az elrejelzs hasznos a
cselekedetek lehetsges sorozatainak a kirtkelsben.
Simts (smoothing) vagy visszatekints (hindsight). Ez egy mltbeli llapot feletti a posteriori eloszls
kiszmtsnak a feladata, a jelen idpontig vett sszes bizonytk ismeretben. Azaz szeretnnk kiszmtani
476
a P(Xk|e1:t) mennyisget valamely 0 k < t esetn. Az esernys pldban ez jelentheti az es

valsznsgnek a kiszmtst mlt szerdra, ha ismerjk az esernyhordoznak a mai napig trtn sszes
megfigyelst. A visszatekints az llapotnak egy jobb becslst adja, mint ami akkor elrhet volt, mivel
tbb bizonytkot hasznl fel.
Legvalsznbb magyarzat (most likely explanation). A megfigyelsek egy sorozatnak ismeretben
lehet, hogy szeretnnk megtallni azt az llapotsorozatot, ami a leginkbb valszn, hogy az adott
megfigyelseket generlta. Azaz szeretnnk kiszmtani az
P(x1:t|e1:t) rtkt. Pldul ha az
eserny feltnik az els hrom nap mindegyikn, s hinyzik a negyediken, akkor a legvalsznbb
magyarzat az, hogy az els hrom napon esett s a negyediken nem esett. Az erre a feladatra szolgl
algoritmusok szmos alkalmazsban hasznosak, idertve a beszdfelismerst ahol a cl a szavak
legvalsznbb sorozatnak a megtallsa hangok sorozatnak ismeretben s egy zajos csatornn
tovbbtott binris szekvencik rekonstrukcijt.
Ezeken a feladatokon tl szksg van mg mdszerekre az llapottmenet- s rzkel modellek
megfigyelsekbl trtn megtanulsra. Csakgy, mint a statikus Bayes-hlknl, a dinamikus Bayes-hls
tanuls elvgezhet mint a kvetkeztets mellktermke. A kvetkeztets egy becslst ad arra, hogy milyen
tmenetek kvetkeztek be valjban, s milyen llapotok generltk az rzkelk rtkeit, s ezek a becslsek
felhasznlhatk a modell frisstsre. A frisstett modellek jobb becslseket adnak, s a folyamat a
konverglsig iterldik. A teljes folyamat a vrhatrtk-maximls vagy EM algoritmus egy esete (lsd 20.3.
alfejezet). Figyelemre mlt rszlet, hogy a tanuls teljes simts kvetkeztetst ignyel szrs helyett, mivel ez
jobb becslseket ad a folyamat llapotra. Lehet, hogy a szrssel val tanuls nem konvergl helyesen;
gondoljunk pldul a gyilkossgok feldertsnek a megtanulsra: a visszatekints mindig szksges annak
kikvetkeztetshez a megfigyelhet bizonytkok alapjn, hogy mi trtnt a gyilkossg helysznn.
Az elz szakaszban felsorolt ngy kvetkeztetsi feladatot megold algoritmusok elszr lerhatk ltalnos
szinten, fggetlenl az alkalmazott modell konkrt tpustl. Az egyes modellekhez igazod javtsokat a
kvetkez fejezetekben ismertetjk.
2.1. Szrs s elrejelzs

Kezdjk a szrssel. Megmutatjuk, hogy ez menet kzben egyszeren, online mdon elvgezhet: a t-edik
idpillanatig tart szrs eredmnyt ismerve, a t + 1-edik idpillanatra az eredmny knnyen kiszmthat az
j et+1 bizonytkbl. Azaz
P(Xt+1|e1:t+1) = f(et+1, P(Xt|e1:t))
valamely f fggvnnyel. Ezt a folyamatot gyakran nevezik rekurzv becslsnek (recursive estimation).
Tekinthetjk a szmtst gy, mint ami valjban kt rszbl ll: elsknt a jelenlegi llapot eloszlst
terjesztjk elre t-rl t + 1-re; azutn fogjuk frissteni, felhasznlva az j et+1 bizonytkot. Ez a ktlpses
folyamat elg egyszeren alakul:
P(Xt+1|e1:t+1) = P(Xt+1|e1:t, et+1) (felosztva a bizonytkot)
= P(et+1|Xt+1, e1:t) P(Xt+1|e1:t) (a Bayes-szablyt hasznlva)
= P(et+1|Xt+1) P(Xt+1|e1:t) (a bizonytk Markov-tulajdonsga miatt)
Itt s vgig a fejezetben, az egy normalizcis konstans, ami a valsznsgek 1-re sszegzst biztostja. A
msodik tnyez P(Xt+1|e1:t) reprezentlja a kvetkez llapot egylpses elrejelzst, s az els tnyez ezt
frissti az j bizonytkkal. Vegyk szre, hogy P(et+1|Xt+1) kzvetlenl kinyerhet az rzkel modellbl. Most a
jelenlegi Xt llapotot felttelnek vve a kvetkez llapot egylpses elrejelzshez jutunk:
(kihasznlva
Markov-
tulajdonsgot)(15.3)
Az sszegzsen bell az els tnyez egyszeren az llapottmenet-modell s a msodik a jelenlegi llapot
eloszlsa. gy megvan a kvnt rekurzv kplet. A szrt P(Xt|e1:t) becslsre gy gondolhatunk, mint egy f1:t
477
zenetre, amit elre terjesztnk vgig a sorozaton, minden tmenetnl az j megfigyelssel mdostva s
frisstve. A folyamat
f1:t+1 = Elre(f1:t, et+1)
ahol az ELRE a (15.3) egyenlet ltal lert frisstst hajtja vgre.
Fontos
Ha az sszes llapotvltoz diszkrt, minden frissts ideje lland (azaz t-tl fggetlen), s a trigny
is lland. (Ezek az llandk termszetesen fggnek az llapottr mrettl s a trgyalt idbeli modell
konkrt tpustl.) A frissts id- s trignynek llandnak kell lennie, ha egy korltos memrij
gensnek kvetnie kell az aktulis llapot eloszlst a megfigyelsek egy korltlan sorozata esetn.
Mutassuk be a szrsi folyamatot kt lpsen keresztl az alap esernys pldban (lsd 15.2. bra). Feltesszk,
hogy a biztonsgi rnknek van valamilyen a priori hite, hogy a 0. napon esett-e, ppen azeltt, hogy a
megfigyelsek sorozata elkezddik. Tegyk fel, hogy ez P(R0) = 0,5, 0,5 . Most a kt megfigyelst a
kvetkezkppen dolgozzuk fel:
Az 1. napon az eserny feltnik, gy U1 = igaz. Az elrejelzs t = 0-rl t = 1-re
s a t = 1-beli bizonytkkal val frissts azt adja, hogy

P(R1|u1) = P(u1|R1) P(R1) = 0,9, 0,2 0,5, 0,5
= 0,45, 0,1 0,818, 0,182
A 2. napon az eserny feltnik, gy U2 = igaz. Az elrejelzs t = 1-rl t = 2-re
a t = 2-beli bizonytkkal val frissts pedig azt adja, hogy

P(R2|u1, u2) = P(u2|R2) P(R2|u1) = 0,9, 0,2 0,627, 0,373
= 0,565, 0,075 0,883, 0,117
rzsnk szerint az es valsznsge azrt nvekedett az 1. naprl a 2. napra, mert az es folytatdik. A 15.2.
(a) feladat ennek a tendencinak a tovbbi vizsglatt kri.
Az elrejelzs feladatt tekinthetjk egyszeren szrsnek j bizonytk hozzadsa nlkl. Valjban a szrsi
folyamat mr magban foglal egy egylpses elrejelzst s knnyen szrmaztathat a kvetkez rekurzv
szmts a t + k + 1 llapot elrejelzsre a t + k elrejelzsbl:
Termszetesen ez a szmts csak az llapottmenet-modellt tartalmazza s nem az rzkel modellt.

rdekes meggondolni, hogy mi trtnik, ahogy egyre tvolabbra prblunk elre jelezni a jvben. A 15.2. (b)
feladat megmutatja, hogy az es elrejelzett eloszlsa a 0,5, 0,5 fix ponthoz konvergl, ami utn a
tovbbiakban lland marad. Ez az llapottmenet-modell ltal meghatrozott Markov-folyamat stacionrius
eloszlsa (stationary distribution) (lsd mg 5.2. szakasz - Kvetkeztets Markov-lnc szimulcival rsz).
Rengeteg ismeret gylt fel az ilyen eloszlsok tulajdonsgairl s a keversi idrl (mixing time) ami
nagyjbl a fix pont elrsig eltelt id. Gyakorlati szempontbl ez buksra tl minden olyan ksrletet, ami a
keversi id kis hnyadnl nagyobb szm lps mlva ksrli meg az aktulis llapot elrejelzst. Minl
bizonytalanabb az llapottmenet-modell, annl rvidebb a keversi id, s a jv annl homlyosabb.
478
A szrsen s az elrejelzsen tl, felhasznlhatjuk az elrehalad rekurzit egy bizonytksorozat P(e1:t)

valsznsgnek a kiszmtsra is. Ez egy hasznos mennyisg, ha klnbz idbeli modelleket szeretnnk
sszehasonltani, amelyek ugyanazt a bizonytksorozatot llthattk el; pldul a 15.6. alfejezetben klnbz
szavakat hasonltunk ssze, amelyek ugyanazt a hangsort llthattk el. Ehhez a rekurzihoz felhasznljuk az
1:t = P(Xt, e1:t) valsznsgi (likelihood) zenetet. Egyszer feladat azt megmutatni, hogy
1:t+1 = Elre(1:t, et+1)
Kiszmtva 1:t-t, az aktulis valsznsget az Xt feletti sszegzssel kapjuk:
2.2. Simts
Ahogy korbban meghatroztuk, a simts (smoothing) mltbeli llapotok feletti eloszls kiszmtsnak a
folyamata a jelenig tart bizonytkok ismeretben; azaz P(Xk|e1:t) szmtsa valamely 0 k < t esetn (lsd
15.3. bra). Ez legknyelmesebben kt rszletben vgezhet el a bizonytk k-ig s a bizonytk k + 1-tl t-ig,
P(Xk|e1:t) = P(Xk|e1:k, ek+1:t)
= P(Xk|e1:k) P(ek+1:t|Xk, e1:k) (a Bayes-szablyt hasznlva)
= P(Xk|e1:k) P(ek+1:t|Xk) (a feltteles fggetlensget hasznlva)
= f1:k bk+1:t (15.6)
ahol definiltuk a bk+1:t = P(ek+1:t|Xk) visszafel zenetet, analg mdon az f1:k elre zenethez. Az f1:k elre
zenetet elre szrssel lehet kiszmolni 1-tl k-ig, a (15.3) egyenlet alapjn. A bk+1:t visszafel zenetrl pedig
kiderl, hogy egy egyszer rekurzv folyamattal kiszmthat, ami t-tl visszafel halad:
ahol az utols lps az ek+1 s az ek+2:t feltteles fggetlensgbl kvetkezik az xk+1 melletti felttellel. Az
sszegzsben a hrom tnyezbl az els s a harmadik kzvetlenl a modellbl megkaphat, a msodik pedig a
rekurzv hvs. Az zenetjellst hasznlva kapjuk, hogy
bk+1:t = Htra(bk+2:t, ek+1:t)
ahol a HTRA a (15.7) egyenlet ltal lert frisstst hajtja vgre. Ahogy az elrefel rekurzinl, az egyes
frisstsekhez szksges id- s trigny lland, s gy t-tl fggetlen itt is.
15.3. bra - A simts egy mltbeli k idpontban az llapot a posteriori P(Xk|e1:t)

eloszlst szmtja ki egy teljes, 1-tl t-ig terjed megfigyels sorozat ismeretben
479
Most lthatjuk, hogy a (15.6) egyenlet mindkt tnyezje kiszmthat idbeli rekurzival, az egyik elrefel fut
1-tl k-ig, s a szrs (15.3) egyenlett hasznlja, a msik visszafel fut t-tl k+1-ig, s a (15.7) egyenletet
hasznlja. Figyeljnk arra, hogy a viszszafel fzist bt+1:t = P(et+1:t|Xt) = 1-gyel inicializljuk, ahol 1 egy
egyesekbl ll vektor. (Mivel et+1:t egy res sorozat, a megfigyelsnek valsznsge 1.)
Alkalmazzuk most ezt az algoritmust az esernys pldra, kiszmtva az es valsznsgnek simtott becslst
t = 1-nl, az els s msodik nap megfigyelseinek ismeretben. A (15.6) egyenlet szerint ezt az adja meg, hogy
P(R1|u1, u2) = P(R1|u1) P(u2|R1) (15.8)
A korbban lert elrefel szrsi folyamatbl mr tudjuk, hogy az els tnyez 0,818, 0,182 . A msodik
tnyezt a (15.7) egyenletbeli visszafel rekurzit alkalmazva szmthatjuk ki:
Ezt visszahelyettestve a (15.8) egyenletbe azt kapjuk, hogy a simtott becsls az esre az 1. napon
P(R1|u1, u2) = 0,818, 0,182 0,69, 0,41 0,883, 0,117
gy ebben az esetben a simtott becsls nagyobb, mint a szrt becsls (0,818). Ennek oka az, hogy az eserny a
2. napon valsznbb teszi, hogy esett a 2. napon, s mivel az es tartsan szokott esni, ez mg valsznbb
teszi, hogy esett az 1. napon.
Mind az elrefel, mind a visszafel halad rekurzi lpsenknt lland idt ignyel; gy a simts
idkomplexitsa e1:t bizonytk esetn O(t). Ez egy konkrt k idlpsbeli simts komplexitsa. Ha a teljes
szekvencit szeretnnk simtani, nyilvnval mdszer, hogy egyszeren az egsz simtsi folyamatot lefuttatjuk
minden egyes simtand idpillanatra. Ez O(t2) idkomplexitst eredmnyez. Jobb megkzelts a dinamikai
programozs nagyon egyszer alkalmazsval O(t)-re cskkenti a komplexitst. A megolds kulcsa megjelent
az esernys plda elz elemzsben, ahol az elrefel szrs folyamatnak eredmnyeit jra fel tudtuk
hasznlni. A lineris idej algoritmus kulcsa gy az elrefel szrs eredmnyeinek a trolsa az egsz
sorozatnl. Aztn a visszafel rekurzit futtatjuk t-tl 1-ig, kiszmtva a szrt becslst minden k lpsnl a
kiszmolt bk+1:t visszafel zenetbl s a trolt f1:k elrefel zenetbl. Az algoritmus, amit tallan elre-htra
algoritmusnak (forward-backward algorithm) neveznek, a 15.4. brn lthat.
15.4. bra - Az elre-htra algoritmus, ami llapotok egy sorozatnak az a posteriori

valsznsgeit szmtja ki adott megfigyelsi sorozat ismeretben. Az ELRE s a HTRA
mveleteket rendre a (15.3) s (15.7) egyenletek definiljk.
A figyelmes olvas szrevehette, hogy a 15.3. brn lthat Bayes-hlstruktra egy polifa (polytree) a 14.
fejezet szhasznlatban. Ez azt jelenti, hogy a csoportost algoritmus egy nyilvnval alkalmazsa szintn
lineris idej algoritmust eredmnyez, ami a teljes sorozatra kiszmtja a simtott becslst. Mra mr vilgoss
480
vlt, hogy az elre-htra algoritmus valjban a csoportost eljrsokban hasznlt polifa terjesztsi
algoritmusnak egy specilis esete (br a kettt egymstl fggetlenl fejlesztettk ki).
Az elre-htra algoritmus alkotja a gerinct azon szmtsi mdszereknek, amelyeket szmos zajos
megfigyelsek sorozatval foglalkoz alkalmazsban hasznlnak, a beszdfelismerstl a replgpek
radarkvetsig. Ahogy lertuk, kt gyakorlati htrnya van. Az els, hogy a trignye tl nagy lehet azoknl az
alkalmazsoknl, ahol az llapottr nagy, s a sorozatok hosszak, mivel O(|f|t) mret trat hasznl, ahol |f| az
elrefel zenet reprezentcijnak a mrete. A trigny O(|f|log t)-re cskkenthet az idkomplexitsnak egy
log t tnyezvel trtn egyidej megnvelse rn, ahogy a 15.3. feladat mutatja. Bizonyos esetekben (lsd
15.3. alfejezet) egy lland trigny algoritmus hasznlhat idbntets nlkl.
Az alapalgoritmus msodik htrnya, hogy a folyamatos (online) mkdshez mdostst ignyel. Ekkor
ugyanis a korbbi idpontokhoz simtott becslseket kell kiszmtanunk, amint folyamatosan j megfigyelsek
rkeznek a sorozat vghez. A leggyakoribb kvetelmny az lland idklnbsg simts (fixed-lag
smoothing), ami a P(Xtd|e1:t) simtott becsls kiszmtst jelenti egy rgztett d-re. Azaz a simtst a jelenlegi t
idpillanat eltt d lpssel lv idpontra vgezzk el; t nvekedst a simtsnak is kvetnie kell. Nyilvnval,
hogy lefuttathatjuk az elre-htra algoritmust a d lpses ablakban, amint egy j bizonytk addik, de ez nem
tnik hatkonynak. A 15.3. alfejezetben ltni fogjuk, hogy az lland idklnbsg simtsnl egy frissts
bizonyos esetekben lland id alatt megtehet, fggetlenl a d idklnbsgtl.
2.3. A legvalsznbb sorozat megtallsa

Tegyk fel, hogy a biztonsgi r esernysorozata a munkja els t napjban az [igaz, igaz, hamis, igaz, igaz].
Mi a legvalsznbb idjrs-sorozat, ami ezt megmagyarzza? Az eserny hinya a 3. napon azt jelenti, hogy
nem esett, vagy azt, hogy az igazgat elfelejtette elhozni? Ha a 3. napon nem esett, taln a 4. napon sem esik
(mivel az idjrs nem vltozik gyorsan), de ekkor az igazgat puszta vatossgbl hozta az esernyt.
sszessgben 25 lehetsges idjrs-sorozatot vlaszthatunk. Ltezik-e mdszer a legvalsznbb sorozat
megkeressre, az sszes felsorolsa nlkl?
Az egyik megkzelts, amit kiprblhatunk a kvetkez lineris idej algoritmus: hasznljuk a simt
algoritmust, hogy megtalljuk az idjrs a posteriori eloszlst minden idpillanatban; majd lltsuk el a
sorozatot minden egyes lpsnl az a posteriori szerinti legvalsznbb idjrst felhasznlva. Egy ilyen
megkzeltst ktelez gyanakvssal kell fogadnia az olvasnak, mivel a szrs ltal kiszmtott a posteriori
eloszlsok az egyes idpontok feletti eloszlsok, ezzel szemben a legvalsznbb sorozat megtallshoz az
sszes idpont feletti egyttes valsznsgeket kell figyelembe venni. Az eredmnyek valjban nagyon
klnbzk lehetnek (lsd 15.4. feladat).
Lineris idej algoritmus azonban ltezik a legvalsznbb sorozat megtallsra, de kicsit tbb gondolkozst
ignyel. Ugyanazon a Markov-tulajdonsgon alapul, mint ami hatkony algoritmusokat eredmnyezett a
szrsre s a simtsra. A problmrl val gondolkods legknnyebb mdja, hogy ha minden sorozatot egy
tvonalnak tekintnk egy grfban, aminek a csompontjai az egyes idpillanatokban a lehetsges llapotok. Egy
ilyen grf lthat az esernys problmra a 15.5. (a) brn. Most gondoljuk meg a grfon keresztl vezet
legvalsznbb t megkeressnek a problmjt, ahol egy t valsznsge (a likelihood rtk) az tvonal
menti tmenetek valsznsgeinek s az egyes llapotokban adott megfigyelsek valsznsgeinek a szorzata.
Koncentrljunk most azokra az tvonalakra, amelyek elrik az Es5 = igaz llapotot. A Markov-tulajdonsg
miatt fennll, hogy az Es5 = igaz llapotba vezet legvalsznbb tvonal tartalmazza azt a legvalsznbb
tvonalat, amely valamelyik 4. idpontbeli llapotba vezet, s amit egy tmenet kvet az Es5 = igaz-ba; a 4.
idpontbeli llapot pedig, ami rsze lesz az Es5 = igaz-ba vezet tnak, az az llapot, amelyik maximalizlja
ennek az tvonalnak a valsznsgt.
Fontos
Mskppen fogalmazva, van egy rekurzv kapcsolat az xt+1 llapotokba vezet legvalsznbb
tvonalak s az xt llapotokba vezet legvalsznbb tvonalak kztt. Ez a kapcsolat olyan
egyenletknt rhat fel, amely az tvonalak valsznsgeit kapcsolja ssze:
481
A (15.9) egyenlet megegyezik a szrs (15.3) egyenletvel, azzal a kivtellel, hogy

1. az f1:t= P(Xte1:t) elre zenet helyett a kvetkez zenet szerepel:
ami az xt llapotba vezet legvalsznbb t valsznsgeit adja meg; s

2. a (15.3) egyenletbeli xt feletti sszegzs helyett a (15.9) egyenletben az xt feletti maximalizls szerepel.
gy a legvalsznbb llapotsorozat kiszmtsa hasonl a szrshez: elrefel vgigfut a sorozaton, minden
idpontban kiszmtva az m zeneteket a (15.9) egyenlet szerint. A szmts menett a 15.5. (b) bra mutatja.
Vgl ez kiadja az sszes vgs llapothoz vezet legvalsznbb tvonal valsznsgt. gy mr knnyen
kivlaszthat a teljes hosszsg legvalsznbb sorozat (a vastagon szedettel kiemelt vgs llapottl). Az
aktulis sorozat azonostshoz szemben azzal, amikor csak a valsznsgt szmtjuk ki az algoritmusnak
minden llapotbl mutatkat kell nyilvntartania a legjobb hozz vezet llapothoz (vastagon szedettel lthat);
a sorozat a mutatknak a legjobb vgs llapottl val visszafel kvetsvel hatrozhat meg.
15.5. bra - (a) Az Est lehetsges llapotsorozatait tekinthetjk egy tvezet tnak egy
grfon, aminek csompontjai a lehetsges llapotok az egyes idpontokban. (Az
llapotokat ngyzetes csompont jelzi, hogy flrerthetetlenl megklnbztessk ket
egy Bayes-hl csompontjaitl.) (b) A Viterbi-algoritmus mkdse az [igaz, igaz,
hamis, igaz, igaz] megfigyelsi sorozatra. Minden t idpontra feltntettk az m1:t zenet
rtkeit, ami minden egyes t idpontbeli llapothoz megadja a legjobb, benne vgzd
sorozat valsznsgt. Minden egyes llapothoz egy vastag nyl is vezet, ami a legjobb
eldjt jelzi, a megelz sorozat valsznsgnek s az tmenet valsznsgnek a
szorzata szerint. A vastag nyilak visszafel kvetse az m1:5-beni legvalsznbb
llapotbl pedig megadja a legvalsznbb sorozatot.
Az elzleg lert algoritmust Viterbi-algoritmusnak nevezik a megalkotja utn. Hasonlan a szrsi

algoritmushoz, ennek a komplexitsa is lineris t-ben, a sorozat hosszban. Azonban eltren a szrstl, a
trignye szintn lineris t-ben. Ez azrt van gy, mert a Viterbi-algoritmusban mutatkkal kell nyilvntartani az
egyes llapotokhoz vezet legjobb sorozatot.
3. Rejtett Markov-modellek
Az elz fejezet idbeli valsznsgi kvetkeztetsre szolgl algoritmusokat vezetett be egy ltalnos
keretben, ami fggetlen volt az llapottmenet- s az rzkel modellek specilis formjtl. Ebben s a
482
kvetkez kt alfejezetben, olyan konkrtabb modelleket s alkalmazsokat trgyalunk meg, amelyek

bemutatjk az alapalgoritmusok erejt, s bizonyos esetekben tovbbi tkletestseket tesznek lehetv.
A rejtett Markov-modellekkel (RMM) (hidden Markov model, HMM) kezdjk. Egy RMM egy olyan
idbeli valsznsgi modell, amelyben a folyamat llapott egyetlen diszkrt valsznsgi vltoz rja le. [A
modell karakterisztikus tulajdonsga teht a rejtett llapot, azaz a (sztochasztikus) llapotfejlds s annak
passzv (sztochasztikus) megfigyelse. Az index idrtelmezse helyett brmely szekvencilis rtelmezs
lehetsges, gyakori pldul az indexnek mint egy egydimenzis pozcinak az rtelmezse is a ford.] A
vltoz lehetsges rtkei a vilg lehetsges llapotai. Az elz fejezetben lert esernys plda ezrt egy RMM,
mivel csak egyetlen llapotvltozja van az Est. Az RMM keretei kztt tovbbi llapotvltozk csak gy
adhatk hozz az idbeli modellhez, hogy az sszes llapotvltozt egyetlen megavltozba kombinljuk,
amelynek az rtkei az egyes llapotvltozk rtkeinek minden lehetsges kombincija. Ltni fogjuk, hogy az
RMM-ek korltozott struktrja lehetv teszi az sszes alapalgoritmus egy nagyon egyszer s elegns
mtrixos tfordtst.3 A 15.6. alfejezet bemutatja az RMM-ek hasznlatt a beszdfelismersben.
3.1. Egyszerstett mtrix algoritmusok

Egyetlen, diszkrt Xt llapotvltoz esetn konkrt forma adhat az llapottmenet-modell, az rzkel modell
s az elre s htra zenetek reprezentciira. Jelljk az Xt llapotvltoz rtkeit 1, , S egszekkel, ahol S a
lehetsges llapotok szma. A P(Xt |Xt1) llapottmenet-modell ekkor egy T S S mtrix, ahol
Tij = P(Xt = j|Xt1 = i)
Azaz Tij az tmenet valsznsge i-bl j-be. Pldul az esernys vilgban az llapottmenet-mtrix
Az rzkel modellt szintn mtrixalakra hozzuk. Ebben az esetben mivel az Et bizonytkvltoz rtke ismert,
mondjuk et, gy a modellnek csak azt a rszt hasznljuk, ami az et megjelensnek valsznsgt
meghatrozza. Minden t idpontra konstrulunk egy Ot diagonlis mtrixot, aminek az tlbeli elemeit a P(et|Xt
= i) rtkek adjk, a tbbi rtke pedig 0. Pldul az esernys vilgban az 1. napon az U1 = igaz, gy a 15.2. bra
szerint azt kapjuk, hogy
Most oszlopvektort hasznlva az elre s htra zenetek reprezentlsra, a szmtsok egyszer mtrix-vektor
mveletekk vlnak. A (15.3) elrefel egyenlet ekkor
f1:t + 1 = Ot
+ 1
T f1:t (15.10)
s a (15.7) visszafel egyenlet pedig

bk + 1:t = TOk + 1bk + 2:t (15.11)
Ezekbl az egyenletekbl lthat, hogy az elre-htra algoritmus (lsd 15.4. bra) idkomplexitsa egy t
hosszsg sorozatra trtn alkalmazsnl O(S2t), mivel minden lps egy S elem vektor szorzst ignyli egy
S S mtrixszal. A trigny pedig O(St), mivel az elrefel fzis t darab S mret vektort trol el.
Amellett hogy a mtrixos jells az RMM-ek esetben a szrs s a simts algoritmusaira egy elegns
lersmdot knl, ez javtott algoritmusokra is jelez lehetsgeket. Az els az elre-htra algoritmus egy
egyszer vltozata, ami simts elvgzst teszi lehetv lland trigny mellett, a sorozat hossztl
fggetlenl. Az tlet az, hogy egy konkrt k idpillanatban a simts mind az f1:k elre, mind a bk+1:t htra
zenetek egyidej jelenltt ignyli a (15.6) egyenlet szerint. Az elre-htra algoritmus ezt gy biztostja, hogy
az elrefel fzisban trolja az f-eket, hogy a htrafel fzisban elrhetk legyenek. Egy msik mdszer szerint
ez gy rhet el, hogy egyetlen menetben mind f-et, mind b-t ugyanabban az irnyban terjesztjk. Pldul az f
elre zenet terjeszthet htrafel, ha trendezzk a (15.10) egyenletet, hogy a msik irnyban mkdjn:
A vektor- s mtrixmvelekben jratlan olvas szmra hasznos lehet az A) fggelket tnzni, mieltt a fejezetben tovbbhaladna.
483
A mdostott szrsi algoritmus gy mkdik, hogy elszr lefut egy szabvnyos elre fzis, kiszmtva ft:t-t
(elfelejtve az sszes kzbens eredmnyt), majd lefut egy visszafel fzis egytt b-re s f-re, kiszmtva a
simtott becslst minden idpontban. Mivel mindegyik zenetnek csak egy pldnya szksges, a trigny
lland (azaz fggetlen t-tl, a sorozat hossztl). Az algoritmusra egyetlen jelents megkts vonatkozik: az
llapottmenet-mtrixnak invertlhatnak kell lennie, s az rzkel modellben nem lehetnek nullk azaz
minden megfigyelsnek lehetsgesnek kell lenni minden llapotban.
A msodik terlet, ahol a mtrixjells javtst jelez, a menet kzben trtn (online) simts lland
idklnbzettel. Az a tny, hogy a simts elvgezhet lland trignnyel azt jelzi, hogy lteznie kell egy
hatkony rekurzv algoritmusnak menet kzbeni simtsra azaz olyan algoritmusnak amelynek az
idkomplexitsa fggetlen az idklnbzet hossztl. Tegyk fel, hogy az idklnbzet d; azaz a simtst t
d idpontban vgezzk, ahol t a jelenlegi idpont. A (15.6) egyenlet szerint ki kell szmolnunk a t d idpontra
az
f1:td btd+1:t
rtkt. Majd amikor az j megfigyels berkezik, a t d + 1 idpontra kell kiszmtanunk az

f1:td+1 btd+2:t+1
rtket. Hogyan tehet ez meg inkrementlisan? Elszr is, az f1:td+1 kiszmthat az f1:td-bl a szabvnyos
szrs mvelett hasznlva a (15.3) egyenlet szerint.
A visszafel zenet inkrementlis kiszmtsa trkksebb, mivel nincs egyszer kapcsolat a rgi btd+1:t
visszafel zenet s az j btd+2:t+1 visszafel zenet kztt. Ehelyett, a rgi btd+1:t visszafel zenet s a sorozat
kezd bt+1:t visszafel zenete kztti kapcsolatot fogjuk megvizsglni. Ennek elrshez alkalmazzuk a (15.11)
egyenletet d alkalommal, s azt kapjuk, hogy
ahol a Btd+1:t mtrix a T s az O mtrixok sorozatnak a szorzata. A B-t felfoghatjuk egy transzformcis
opertornak, ami egy ksbbi visszafel zenetet egy korbbiba alakt. Egy hasonl egyenlet ll fenn az j
visszafel zenetekre a kvetkez megfigyels berkezse utn:
Ha a (15.12) s a (15.13) egyenletben megvizsgljuk a szorzatokat, lthatjuk, hogy egyszer kapcsolat van
kzttk: a msodik szorzathoz el kell osztani az els szorzatot TOtd+1-gyel, s megszorozni az j utols
elemmel TOt+1-gyel. Mtrixjellssel ekkor a rgi s az j B mtrixok kztt egy egyszer kapcsolat van:
Ez az egyenlet a B mtrix egy inkrementlis frisstst adja, amely viszont (a (15.3) egyenlet ltal) lehetv teszi
az j btd+2:t+1 visszafel zenet kiszmtst. A teljes algoritmus, ami az f s B trolst s frisstst ignyli, a
15.6. brn lthat.
15.6. bra - Egy lland d lpsnyi idklnbzettel simt algoritmus, folyamatos

mkds (online) algoritmusknt megvalstva: egy j idpontbeli megfigyelsre
kiadja az j simtott becslst
484
4. Kalman-szrk
Kpzeljnk el egy kismadarat, amint a dzsungel srjben repl szrkletkor: a mozgsnak csupn rvid,
szakaszos felvillansait pillanthatjuk meg; minden igyekezetnkkel azt prbljuk megjsolni, hogy hol van most
a madr, s legkzelebb hol fog felbukkanni, hogy nehogy szem ell tvesszk. Vagy kpzeljk azt, hogy a
msodik vilghborban radarkezelk vagyunk, egy gyenge, mozg radarjelet kmlelve, ami 10
msodpercenknt jelenik meg a kpernyn. Vagy, kiss mg tvolabbra visszalpve, kpzeljk magunkat Kepler
helybe, ahogy a bolygk mozgst prblja rekonstrulni igen pontatlan szgmrsek sokasgbl, amit
rendszertelen s pontatlanul mrt intervallumokban rgztettek. Mindegyik esetben egy fizikai rendszer llapott
prbljuk megbecslni (helyet s sebessget pldul) idben egymst kvet zajos megfigyelsekbl. A
problmt megfogalmazhatjuk egy idbeli valsznsgi modellben val kvetkeztetsknt, ahol az
llapottmenet-modell a mozgs fizikjt rja le, az rzkel modell pedig a mrsi folyamatot. Ez a fejezet
azokat a specilis reprezentcikat s kvetkeztetsi algoritmusokat vizsglja, amelyeket ilyen tpus
problmkra fejlesztettek ki; a trgyalt eljrst Kalman-szrsnek (Kalman filtering) nevezik, a kidolgozja
Rudolf E. Kalman4 utn.
Vilgos, hogy tbb folytonos vltozra lesz szksgnk a rendszer llapotnak megadshoz. Pldul a madr
replse megadhat egy (X, Y, Z) pozcival s egy (X, Y, Z) sebessggel minden egyes idpillanatban.
Szksgnk lesz mg alkalmas feltteles srsgfggvnyekre az llapottmenet- s rzkel modellekhez; a
14. fejezethez hasonlan, lineris Gauss-eloszlsokat (linear Gaussian) fogunk hasznlni. Ez azt jelenti, hogy
a kvetkez Xt+1 llapot a jelenlegi Xt llapot lineris fggvnye, amihez mg egy Gauss-zaj addik, amely
felttel a gyakorlatban igen elfogadhatnak bizonyul. Tekintsk pldul a madr X koordintjt, pillanatnyilag
figyelmen kvl hagyva a tbbi koordintt. Legyen a megfigyelsek kztti intervallum , s ttelezznk fel
lland sebessget; ekkor a pozci frisstsre az addik, hogy
Ha Gauss-zajt adunk hozz, akkor egy lineris Gauss-fle llapottmenet-modellt kapunk:
Az Xt pozci s
sebessgvektorok alkotta rendszerhez tartoz Bayes-hlstruktra a 15.7. brn lthat.
Vegyk szre, hogy ez a lineris Gauss-modellnek egy nagyon specilis alakja; az ltalnos alakot a fejezetben
4
Rudolf E. Kalman (Klmn Rudolf) magyar szrmazs matematikus.
485
ksbb rjuk le, ami alkalmazsok nagyon szles krt fedi le az els bekezds egyszer mozgsos pldin tl.
Az olvasnak hasznos lehet az A) fggelkben tnzni a Gauss-eloszlsok egyes matematikai tulajdonsgait; a
jelenlegi cljainkhoz a legfontosabb, hogy egy tbbvltozs Gauss-eloszlst (multivariate Gaussian) d
vltoz esetn egy d elem tlag s egy d d-s kovarianciamtrix ad meg.
15.7. bra - Egy Xt hely,

sebessg s Zt helymegfigyels alkotta lineris dinamikus
rendszerhez tartoz Bayes-hlstruktra
4.1. Gauss-eloszlsok frisstse

A 14. fejezetben hivatkoztunk a lineris Gauss-eloszlsok csaldjnak egy alaptulajdonsgra: az eloszlscsald
zrt a standard Bayes-hlbeli mveletekre. Most ezt az lltst pontostjuk az idbeli valsznsgi modellben
vgzett szrs esetre. A megkvetelt tulajdonsgok megfelelnek a szrs (15.3) egyenletben megadott
ktlpses szmtsnak:
1. Ha a jelenlegi P(Xt|e1:t) eloszls Gauss-eloszls s a P(Xt+1|xt) llapottmenet-modell lineris Gauss-modell,
akkor az egylpses elrejelzs eloszlsa
szintn Gauss-eloszls.
2. Ha az elrejelzs P(Xt+1|e1:t) eloszlsa Gauss-eloszls s a P(et+1|Xt+1) rzkel modell lineris Gauss-modell,
akkor az j bizonytkkal, mint felttellel, a frisstett eloszls
P(Xt+1|e1:t+1) = P(et+1|Xt+1)P(Xt+1|e1:t) (15.16)
szintn Gauss-eloszls.
gy a Kalman-szrs ELRE mvelete fogad egy t tlaggal s t kovarianciamtrixszal meghatrozott f1:t Gauss
elre zenetet, s elllt egy j tbbvltozs f t Gauss elre zenetet t+1 tlaggal s t+1 kovarianciamtrixszal.
gy, ha egy f1:0= P(X0) = N(0, 0) Gauss-eloszlssal indulunk, egy lineris Gauss-modellel val szrs az
llapotokon Gauss-eloszlst eredmnyez minden idpontban.
1: +1
486
Fontos
Ez tetszets s elegns eredmnynek tnik, de mirt is olyan fontos? Ennek a magyarzata az, hogy a
most trgyalt esethez hasonl nhny specilis esetet kivve, a szrs folytonos vagy hibrid (diszkrt s
folytonos) hlkkal olyan llapoteloszlsokat generl, amelyek reprezentcija az idvel korltlanul
n. Ezt az lltst ltalban nem knny bizonytani, de a 15.5. feladat egy egyszer pldn mutatja be,
hogy mi trtnik.
4.2. Egy egyszer egydimenzis plda

Azt lltottuk, hogy a Kalman-szrs ELRE mvelete egy Gauss-eloszlst egy j Gauss-eloszlsba visz t. Ez j
tlag- s kovarianciamtrix kiszmtst jelenti az elz tlagbl s kovarianciamtrixbl. Az ltalnos
(tbbvltozs) eset frisstsi szablynak szrmaztatsa igen sok lineris algebrai lpst ignyel, gy egyelre a
nagyon egyszer egyvltozs esetnl maradunk, s ksbb adjuk meg az eredmnyeket az ltalnos esetre. A
szmtsok mg az egyvltozs esetre is unalmasak kiss, de gy rezzk, hogy rdemes ltni ket, mivel a
Kalman-szr hasznossga olyan szorosan ktdik a Gauss-eloszlsok matematikai tulajdonsgaihoz.
A trgyalt idbeli modell egyetlen folytonos Xt llapotvltozs vletlen bolyongst (random walk) r le egy
zajos Zt megfigyelssel. Egy plda lehet erre a vsrli bizalom mutatja, amit modellezhetnk gy, mint ami
havonknt egy vletlen Gauss-eloszls vltozson megy t, s amelyet egy vletlen vsrli krdv mr fel,
ami szintn Gauss-mintavteli zajt okoz. Az a priori eloszlst gaussinak ttelezzk fel
szrsngyzettel:
(Az egyszersg kedvrt ebben a fejezetben ugyanazt az szimblumot fogjuk hasznlni minden
normalizcis lland jellsre.) Az llapottmenet-modell egyszeren a jelenlegi llapot egy Gauss-eloszls
mdostst jelenti lland
szrsngyzettel:
Az rzkel modell egy Gauss-eloszls zajt ttelez fel
szrsngyzettel:
Most, az a priori P(X0) eloszls ismeretben kiszmthatjuk az egylpses elrejelzs eloszlst felhasznlva a
(15.15) egyenletet:
Az integrl igen bonyolultnak nz ki. A tovbbhalads lehetsgt annak szrevtele jelenti, hogy a kitev kt
olyan kifejezs sszege, amelyek ngyzetesek x0-ban, s gy az maga is ngyzetes x0-ban. Egy egyszer trkk,
amit teljes ngyzett kiegsztsknt (completing the square) ismernk, lehetv teszi brmely
trst egy
ngyzetes tag s egy
tag az integrlbl kivihet, gy azt kapjuk, hogy
x0-tl fggetlen maradk tag sszegv. A maradk
487
Most az integrl pontosan egy Gauss-eloszls teljes tartomny feletti integrlja, ami egyszeren 1-et ad. gy
csupn a maradk tag maradt a ngyzetesbl.
A msodik kulcslps annak szrevtele, hogy a maradk tagnak x1-ben ngyzetesnek kell lennie; valban,
egyszersts utn azt kapjuk, hogy
15.8. bra - A Kalman-szrs frisstsi ciklusnak a lpsei egy vletlen bolyongs

esetn. A vletlen bolyongs a priori eloszlsa 0 = 0,0 s 0 = 1,0, az tmenet
bizonytalansga x = 2,0, az rzkel bizonytalansga z = 1,0, az els megfigyels pedig
z1 = 2,5 (az x tengelyen csillaggal jellve).Vegyk szre, ahogy a P(x1) elrejelzs ellapul a
P(x0)-hoz kpest az tmenet bizonytalansga miatt. Vegyk azt is szre, hogy az a
posteriori P(x1|z1) kiss balra helyezkedik el a z1 megfigyelstl, mivel az tlag az
elrejelzs s a megfigyels slyozott tlaga.
Azaz az egylpses elrejelzs eloszlsa Gauss-eloszls, ugyanazzal a 0 tlaggal, a szrsngyzet pedig

egyenl az eredeti
szrsngyzetnek s az tmenet
szrsngyzetnek az sszegvel. Egy pillanatnyi
belegondols utn ez szemlletesen is elfogadhatnak tnik.
A frissts lpsnek befejezshez mg szksges, hogy az els idpontbeli megfigyelst, x1-t felttelknt
vegyk szmtsba. A (15.16) egyenletbl erre az addik, hogy
488
Most ismt kombinljuk a kitevket, s ngyzett egsztsk ki (15.6 feladat), azt kapva, hogy
gy egy frisstsi ciklus utn egy j Gauss-eloszlsunk van az llapotvltozra.

A (15.17) egyenletben a Gauss-alakbl lthatjuk, hogy az j tlag s szrs kiszmthat a rgi tlagbl s
szrsbl a kvetkezkppen:
A 15.8. brn lthat egy frisstsi ciklus az llapottmenet- s az rzkel modell konkrt rtkei esetn.
Az elz egyenletpr pontosan ugyanazt a szerepet jtssza, mint az ltalnos szrs egyenlete (15.3) vagy az
RMM-szrs egyenlete (15.10). A Gauss-eloszlsok specilis tulajdonsga miatt azonban az egyenleteknek van
nhny tovbbi rdekes tulajdonsga. Elszr is, hogy az j t+1 tlag kiszmtsa rtelmezhet gy, mint
egyszeren az j zt+1 megfigyels s a rgi t tlag slyozott tlaga. Ha a megfigyels megbzhatatlan, akkor
nagy, s tbb figyelmet szentelnk a rgi tlagnak; ha a rgi tlag megbzhatatlan ( t2 nagy), vagy a folyamat
nehezen megjsolhat (
nagy), akkor tbb figyelmet szentelnk a megfigyelsnek. Msodszor, vegyk szre,
hogy a
szrsngyzet frisstse fggetlen a megfigyelstl. Ezrt elre kiszmthatjuk, hogy mi lesz a
szrsngyzetrtkek sorozata. Harmadszor, a szrsngyzetrtkek sorozata gyorsan konvergl egy adott
rtkhez, ami csak
15.7. feladat).
-tl s
-tl fgg, ezltal lnyegesen egyszerstve az elkvetkez szmtsokat (lsd
4.3. Az ltalnos eset

Az elz levezets szemlletesen bemutatta a Gauss-eloszlsoknak azt az alaptulajdonsgt, ami a Kalmanszrs mkdst lehetv teszi: azt a tnyt, hogy az exponens ngyzetes alak. Ez nem csak az egyvltozs
esetre igaz; a teljes tbbvltozs Gauss-eloszls alakja:
A kitevben lv tnyezk sszeszorzsa lthatv teszi, hogy a kitev is ngyzetes fggvnye az x-ben lv xi
valsznsgi vltozknak. Ahogy az egyvltozs esetben, a szrsi frissts megrzi az llapoteloszls gaussi
voltt.
Elsknt definiljuk a Kalman-szrsnl hasznlt ltalnos idbeli modellt. Mind az llapottmenet-modell,
mind az rzkel modell lineris transzformcit enged meg additv Gauss-zajjal. gy azt kapjuk, hogy
P(xt+1|xt) = N(Fxt, x)(xt+1)
P(zt|xt) = N(Hxt, z)(zt) (15.19)
ahol az F s a x mtrixok a lineris llapottmenet-modellt s az tmeneti zaj kovariancijt rjk le, a H s a z

pedig az rzkel modell megfelel mtrixai. Ekkor az tlag s a kovariancia frisstsnek az egyenletei a
maguk rmiszt valsgban:
t+1 = Ft + Kt+1(zt+1 HFt)
489
t+1 = (I Kt+1)(FtF + x) (15.20)
ahol a Kt+1 = (FtF + x)H (H(FtF + x)H + z)-1 mennyisg neve a Kalman-erstsmtrix (Kalman gain
matrix). Akr hihet, akr nem, ezeknek az egyenleteknek lehetsges egy szemlletes rtelmezse. Pldul,
gondoljuk meg a llapottlag-becsls frisstst. Az Ft tag a t+1 idpontban elre jelzett llapot, gy HFt az
elre jelzett megfigyels. Ezrt a zt+1 HFt tag az elre jelzett megfigyels hibjt reprezentlja. Ez van
megszorozva a Kt+1 tnyezvel az elre jelzett llapot korriglshoz; gy a Kt+1 annak mrtke, hogy mennyire
kell figyelembe venni az j megfigyelst az elrejelzshez kpest. Ahogyan a (15.18) egyenletben, az a
tulajdonsg most is fennll, hogy a szrsngyzet frisstse fggetlen a megfigyelstl. A t s a Kt rtkek
sorozata ezrt elre (offline) is kiszmolhat, s a kvets kzben szksges konkrt szmtsok igen
mrskeltek.
Hogy bemutassuk az egyenletek mkdst egy XY skon mozg trgy kvetsnek a problmjra
alkalmaztuk ket. Az llapotvltozk az
, gy az F, x, H s z 4 4-es mtrixok. A 15.9. (a)
brn lthat az igazi plyagrbe, a zajos megfigyelsek sorozata s a Kalman-szrssel becslt plyagrbe
vgig a kovariancival, amit az egysgnyi szrs mret krvonalak jeleznek. A szrsi folyamat jl teljest az
aktulis mozgs kvetsben, s ahogy vrhat, a szrsngyzet gyorsan bell egy rgztett rtkre.
Ahogyan szrsre, gy simtsra is szrmaztathatk egyenletek lineris Gauss-modell esetn. A simts
eredmnyei a 15.9. (b) brn lthatk. Vegyk szre, hogy a helyzetbecsls szrsngyzete gyorsan lecskken, a
plyagrbe vgt leszmtva (itt mirt nem?), s hogy a simtssal becslt plyagrbe sokkal egyenletesebb.
15.9. bra - (a) A Kalman-szrs eredmnye egy XY skon mozg objektumnl,

feltntetve a valdi (balrl jobbra halad) plyagrbt, a zajos megfigyelsek egy
sorozatt s a Kalman-szrs alapjn becslt plyagrbt. A helybecslsek szrsait az
ovlisok jelzik. (b) A Kalman-simts eredmnye ugyanarra a megfigyelsi sorozatra.
4.4. A Kalman-szrs alkalmazhatsga

A Kalman-szrst s kiterjesztseit alkalmazsok szles krben hasznljk. A klaszszikus alkalmazs lgi
jrmvek s raktk radar kvetse. Kapcsold alkalmazsok kztt van a tengeralattjrk s fldi jrmvek
akusztikai kvetse, s jrmvek s emberek kpi kvetse. Egy kiss elvontabb szemllettel a Kalman-szrket
rszecskk buborkkamrs plyagrbjnek rekonstrukcijra, valamint ceni ramlsok felszni mholdkpek
alapjn trtn rekonstrukcijra hasznljk. Az alkalmazsok kre sokkal szlesebb, mint csupn mozgsok
kvetse: brmely rendszerre alkalmazhat, ami folytonos llapotvltozkkal s zajos megfigyelsekkel
jellemezhet. Ilyen rendszerek magukban foglalnak zzdkat, vegyi zemeket, nukleris reaktorokat, nvnyi
koszisztmkat s nemzetgazdasgokat.
490
A Kalman-szrs alkalmazhatsgnak tnye egy rendszerre nem jelenti, hogy az eredmnyek rvnyesek vagy
hasznosak lesznek. A feltevsek lineris Gauss-fle llapottmenet-modell s rzkel modell igen ersek.
A kiterjesztett Kalman-szr (KKSZ) (extended Kalman filter, EKF) megprbl rr lenni a modellezett
rendszer nemlineris tulajdonsgain. Egy rendszer nemlineris, ha az llapottmenet-modell nem rhat le, mint
az llapotvektor mtrixszorzata, ahogyan ez a (15.19) egyenletben szerepel. A KKSZ gy mkdik, hogy
rendszert xt-ben loklisan linerisknt modellezi az xt = t krnyezetben, ahol t a jelenlegi llapoteloszls
tlaga. Ez jl mkdik sima, j magaviselet rendszereknl, s lehetv teszi a kvetnek, hogy egy olyan
Gauss-llapoteloszlst tartson nyilvn s frisstsen, ami elfogadhat kzeltse az igazi a posteriori eloszlsnak.
Azonban mit is jelent, hogy egy rendszer nem sima vagy rossz magaviselet? Technikailag ez azt jelenti,
hogy jelents nemlinearits van jelen a rendszer viselkedsben abban a rgiban, ami kzel van a jelenlegi t
tlaghoz (a t kovarianciamtrix szerint). Ennek a tulajdonsgnak a nem technikai megrtshez gondoljunk arra
a pldra, amikor egy dzsungelben szll madr kvetsvel prblkoztunk. A madr nagy sebessggel
egyenesen egy fatrzs fel tart. A Kalman-szr, akr regulris, akr kiterjesztett a madr pozcijra, csak
Gauss-elrejelzst adhat, s ennek a Gaussnak az tlaga a fatrzs kzepre esik, ahogyan a 15.10. (a) brn
lthat. A madr egy elfogadhat modellje azonban egy elkerl mveletet jelezne elre egyik vagy msik
oldalra, ahogy az a 15.10. (b) brn lthat. Egy ilyen modell ersen nemlineris, mivel a madr dntse nagyon
eltr a fatrzshz vett pontos pozcijnak fggvnyben.
15.10. bra - Egy fa fel repl madr (fellnzetben). (a) Egy Kalman-szr
elrejelzse a madr helyzetre, ami egyetlen Gauss-eloszls az akadly kzepre
illesztve. (b) Egy valsghbb modell szmtsba veszi a madr elkerl manvereit, s
azt jelzi elre, hogy az egyik vagy a msik oldalon fog elszllni.
Ilyen pldk kezelshez nyilvnvalan egy kifejezbb nyelvre van szksgnk a modellezett rendszer
viselkedsnek a reprezentlshoz. A szablyozselmlet terletn, ahol olyan problmk, mint pldul egy
replgp elkerl manverezse ugyanilyen tpus bonyodalmakat vetnek fel, a megszokott megolds a vlt
Kalman-szr (switching Kalman filter). Ebben a megkzeltsben, tbb Kalman-szr fut prhuzamosan,
mindegyik a rendszer klnbz modelljt hasznlva pldul egy az egyenes replsre, egy az les balra
fordulsra s egy az les jobbra fordulsra. Az elrejelzseknek egy slyozott sszegt hasznljuk, ahol a sly
attl fgg, hogy mennyire illeszkednek az egyes szrk az aktulis adatokhoz. A kvetkez fejezetben ltni
fogjuk, hogy ez egyszeren az ltalnos dinamikus Bayes-hl modell egy specilis esete, amit a 15.7. brn
lthat hlbl egy diszkrt manver llapotvltoz hozzadsval nyernk. A vlt Kalman-szrket a 15.5.
feladat trgyalja tovbb.
5. Dinamikus Bayes-hlk
Egy dinamikus Bayes-hl vagy DBH (dynamic Bayesian network, DBN) egy olyan Bayes-hl, ami egy a
15.1. alfejezetben lert tpus idbeli valsznsgi modellt reprezentl. (Ahogy korbban is emltettk az index
idbeli rtelmezse helyett brmely szekvencilis rtelmezs lehetsges, gyakori pldul az indexnek mint egy
491
egydimenzis helyzeti pozcinak az rtelmezse is a ford.) A DBH-kra mr lttunk pldkat, a 15.2. brn az
esernys hlt s a 15.7. brn a Kalman-szr hlt. ltalban egy DBH minden egyes szeletnek tetszleges
szm llapotvltozja (Xt) s bizonytkvltozja (Et) lehet. Az egyszersg kedvrt fel fogjuk tenni, hogy a
vltozk s kapcsolataik szeletrl szeletre pontosan ismtldnek, s hogy a DBH egy elsrend Markovfolyamatot reprezentl, gy minden vltoznak csak a sajt szeletben vagy a kzvetlenl megelz szeletben
lehetnek szlei.
Fontos
Nyilvnval, hogy minden rejtett Markov-modell reprezentlhat mint egy DBH, egyetlen
llapotvltozval s egyetlen bizonytkvltozval. Az is fennll, hogy minden diszkrt vltozs DBH
reprezentlhat mint egy RMM; ahogyan a 15.3. alfejezetben megmutattuk, a DBH sszes
llapotvltozja sszekombinlhat egyetlen llapotvltozv, aminek az rtkei az egyes
llapotvltozk rtkeinek az sszes lehetsges egyttese. Azonban ha minden RMM egy DBH, s
minden DBH tfordthat egy RMM-be, akkor mi a klnbsg? A klnbsg abban rejlik, hogy egy
komplex rendszer llapotnak az t alkot vltozkra trtn dekomponlsval a DBH kpes
kihasznlni az idbeli valsznsgi modell ritkasgt. Tegyk fel pldul, hogy egy DBH-nak 20
binris llapotvltozja van, amelyek mindegyiknek hrom szlje van az elz szeletben. Ekkor a
DBH llapottmenet-modellje 20 23 =160 valsznsgi rtket tartalmaz, mg a hozztartoz RMMnek 220 llapota s ezrt 240, azaz durvn egybilli tmenet-valsznsg rtke van az llapottmenetmtrixban. Ez legalbb hrom ok miatt is rossz: elszr, hogy az RMM maga sokkal tbb trat ignyel,
msodszor, hogy a hatalmas llapottmenet-mtrix az RMM-kvetkeztetst sokkal kltsgesebb teszi,
harmadszor, hogy ilyen hatalmas szm paramter megtanulsnak problmja a tiszta RMMmodelleket alkalmazhatatlann teszi nagy problmk esetn. A DBH-k s az RMM-ek kztti
kapcsolat nagyjbl analg a hagyomnyos Bayes-hlk s a teljes tblzatos egyttes eloszlsok
kztti kapcsolathoz.
Mr megmutattuk, hogy minden Kalman-szr reprezentlhat egy DBH-ban folytonos vltozkkal s lineris
Gauss feltteles eloszlsokkal (lsd 15.7. bra). Az elz fejezet vgn trgyaltak miatt azzal is tisztban kell
lenni, hogy nem minden DBH reprezentlhat egyetlen Kalman-szr modellel. Egy Kalman-szrnl az
aktulis llapoteloszls mindig egy egyedlll tbbvltozs Gauss-eloszls azaz egyetlen dudor egy
konkrt helyen. A DBH-k ezzel szemben tetszleges eloszlst kpesek modellezni. Szmos vals alkalmazsnl
ez a rugalmassg elengedhetetlen. Gondoljuk meg pldul a kulcsaim jelenlegi helyt. Lehetnek a zsebeimben,
az jjeli szekrnyen, a konyhapulton vagy a bejrati ajtban himbldzva. Egyetlen Gauss-dudornak, ami ezt az
sszes helyet magban foglalja, jelents valsznsget kell rendelni ahhoz, hogy a kulcsok az elszobban a
levegben vannak. A vals vilg olyan aspektusai, mint cltudatos gensek, akadlyok s zsebek
nemlinearitsokat vezetnek be, amelyek diszkrt s folytonos vltozk kombincijt ignylik, hogy egy
elfogadhat modellhez jussunk.
5.1. DBH-k ltrehozsa

Egy DBH ltrehozshoz hromfajta informcit kell megadni: a P(X0) a priori eloszlst az llapotvltozk
felett; a P(Xt+1|Xt) llapottmenet-modellt; s a P(Et|Xt) rzkel modellt. Az llapottmenet- s rzkel modell
megadshoz, meg kell adni az egymst kvet szeletek kztti s az llapot- s bizonytkvltozk kztti
kapcsolatok topolgijt. Mivel az llapottmenet- s rzkel modelleket stacionriusnak minden t-re
azonosnak ttelezzk fel, a legknyelmesebb egyszeren az els szeletre megadni ket. Pldul az esernys
vilg teljes DBH-specifikcijt megadja az a hrom csompontos hl, ami a 15.11. (a) brn lthat. Ebbl a
specifikcibl a teljes (egyik irnyban vgtelen) DBH megkonstrulhat az els szelet megfelel msolsval.
Gondoljunk most t egy rdekesebb pldt: egy akkumultorhajts, az XY skon mozg robot kvetest,
ahogyan azt a 15.1. alfejezetben bevezettk. Elsknt szksgnk van llapotvltozkra, amelyek mind az Xt =
(Xt, Yt) pozci-, mind az
sebessgkomponenseket magukban foglaljk. Feltteleznk valamilyen
pozcimr mdszert akr egy rgztett kamert vagy egy felszni GPS-t (Global Positioning System) , ami
a Zt mrseket eredmnyezi. A pozci a kvetkez idpontban a jelenlegi pozcitl s sebessgtl fgg,
ugyangy, mint a standard Kalman-szr modellben. A sebessg a kvetkez idpontban a jelen sebessgtl s
az akkumultor llapottl fgg. Felvesznk mg egy Akkumultort vltozt az aktulis akkumultor tltsi
szintjnek reprezentlsra, aminek szli az elz akkumultorszint s a sebessg, s felvesznk mg egy
AMrt vltozt, ami az akkumultor tltsi szintjt mri. Ez szolgltatja a 15.11. (b) brn lthat alapmodellt.
492
rdemes rszletesebben megvizsglni az AMrt-hez tartoz rzkelmodell tulajdonsgait. Tegyk fel az

egyszersg kedvrt, hogy mind az Akkumultort, mind az AMrt diszkrt rtkeket vehetnek fel 0-tl 5-ig
igen hasonlan egy tipikus laptop szmtgp akkumultormrjhez. Ha a mr mindig pontos akkor a
P(AMrt|Akkumultort) FVT-nek vgig 1,0 valsznsgeket kell tartalmaznia az tljban s 0,0
valsznsgeket mshol. A valsgban a mrsekben a zaj mindig felbukkan. Folytonos mrsekre, egy kis
szrs Gauss-eloszlst lehetne ehelyett hasznlni.5 A diszkrt vltozinknl a Gauss-eloszlst egy olyan
eloszlssal kzelthetjk, amelyben a hiba valsznsge a megfelel mdon cskken, gy nagy hiba
valsznsge igen kicsi. A Gauss-hibamodell (Gaussian error model) kifejezst fogjuk hasznlni mind a
folytonos, mind a diszkrt vltozatokra.
15.11. bra - (a) Az esernys DBH-hoz tartoz a priori eloszls, az llapottmenetmodell s az rzkel modell megadsa. Az sszes kvetkez szelet feltevsnk szerint az
1. szelet msolata. (b) Egy XY skon val robotmozgshoz tartoz egyszer DBH.
A robotikban brki, aki egy kevs gyakorlattal rendelkezik a szmtgpes folyamatvezrlsben vagy az
automatikus rzkels ms eseteiben, rgtn tanskodik arrl a tnyrl, hogy a kis mennyisg mrsi hiba
gyakran a legkevsb fontos a problmk kztt. Ugyanis a valdi rzkelk elromlanak, s amikor egy
rzkel elromlik, akkor nem kld szksgszeren egy jelet azzal, hogy , egybirnt az adat, amit kldk,
egy halom zagyvasg. Ehelyett egyszeren kldi a zagyvasgot. A meghibsods legegyszerbb formjt
tmeneti hibnak (transient failure) nevezik, amikor az rzkel alkalmanknt elhatrozza, hogy valami
zagyvasgot kld. Pldul az akkumultor szintrzkeljnek lehet olyan szoksa, hogy nullt kld, amikor
valaki meglki a robotot, mg akkor is, ha az akkumultor teljesen fel van tltve.
Lssuk, mi trtnik, amikor egy tmeneti hiba bekvetkezik egy Gauss-hibamodellnl, ami nem tudja kezelni az
ilyen hibkat. Ttelezzk fel pldul, hogy a robot csendesen ldgl, s 20 egymst kvet mrs az
akkumultoron 5-t ad. Ezutn az akkumultormr idleges kiesse miatt a kvetkez mrs eredmnye
AMr21 = 0. Mire kell kvetkeztetnnk egy egyszer Gauss-hibamodellbl az Akkumultor21-gyel kapcsolatban.
A Bayes-szably szerint a vlasz fgg mind a P(AMr21 = 0|Akkumultor21) rzkel modelltl, mind a
P(Akkumultor21|AMr1:20) elrejelzstl. Ha egy nagy rzkelsi hiba valsznsge szignifiknsan kisebb,
mint az Akkumultor21 = 0-ba val tmenet valsznsge, mg ha ez utbbi nagyon valszntlen is, akkor az a
posteriori eloszls nagy valsznsget fog rendelni a lemerlt akkumultorhoz. Egy msodik nulla rtk
mrsi eredmny t = 22-nl ezt a konklzit majdnem biztoss teszi. Ha az tmeneti hiba aztn eltnik, s a
jelzett rtk visszall 5-re t = 23-tl, akkor az akkumultorszint becslse gyorsan vissza fog llni 5-re, szinte
varzstsre. Ezt az esemnysort mutatja be a 15.12. (a) bra fels grbje, ami az Akkumultort vrhat rtkt
mutatja id szerint egy diszkrt Gauss-hibamodellt hasznlva.
Szigoran vve egy Gauss-eloszls problematikus, mivel pozitv valsznsget rendel nagy negatv tltsi szintekhez. A bta-eloszls
gyakran jobb vlaszts az olyan vltozkra, amelyeknek tartomnya korltos.
5
493
15.12. bra - (a) Fels grbe: az Akkumultort vrhat rtknek a plyagrbje egy
olyan megfigyelsi sorozatnl, ami csak 5-sket tartalmaz, kivve a 0-kat a t = 21 s a t
= 22 idpontokban, egy egyszer Gauss-hibamodell felhasznlsval. Als grbe: a
plyagrbe, amikor a megfigyelsek 0-val folytatdnak t = 21-tl. (b) Ugyanez a ksrlet
az tmenetihiba-modellel elvgezve. Vegyk szre, hogy az tmeneti hibt jl kezeli, de
a vgleges hiba tlzott pesszimizmust eredmnyez.
Fontos
A helyrells ellenre elfordul (t = 22-nl), hogy a robot meg van gyzdve, hogy az akkumultora
lemerlt; felteheten ekkor ki kell kldenie egy segtsg jelet, s le kell kapcsolnia. Sajnos a
tlegyszerstett rzkel modellje tvtra vezette. Hogyan lehet ezt kijavtani? Gondoljunk egy
ismers pldra az emberek mindennapos vezetsi gyakorlatbl: les kanyarokban vagy meredek
hegyeken nha felvillan az zemanyagtartly res figyelmeztet lmpa. A seglykr telefon
keresse helyett inkbb az szokott az ember eszbe jutni, hogy az zemanyagmr gyakran igen nagy
hibkat ad, amikor az zemanyag ltyg a tartlyban. A trtnet tanulsga a kvetkez: az rzkel
hibjnak helyes kezelshez a rendszer rzkel modelljnek tartalmaznia kell a meghibsods
lehetsgt.
Egy rzkel legegyszerbb hibamodellje egy bizonyos valsznsggel megengedi, hogy az rzkel teljesen
helytelen rtket adjon vissza, fggetlenl a vilg valdi llapottl. Pldul ha az akkumultormr 0-t
visszaadva hibzik, azt mondhatjuk, hogy
P(AMrt = 0|Akkumultort = 5) = 0,03
ami felttelezheten sokkal nagyobb, mint az a valsznsg, amit az egyszer Gauss-hibamodell rendelne
hozz. Hvjuk ezt az tmenetihiba-modellnek (transient failure model). Hogyan segt ez, amikor a 0 jelzssel
kerlnk szembe? Felttelezve, hogy az az elre jelzett valsznsg, hogy az akkumultor lemerlt, az eddigi
jelzsek alapjn sokkal kisebb, mint 0,03, akkor az AMr21 = 0 megfigyels legjobb magyarzata az, hogy az
rzkel idlegesen meghibsodott. Szemlletesen gy kpzelhetjk el a bizonyossgot az akkumultor
feltltttsgrl, mint aminek van egy bizonyos mennyisg tehetetlensge, ami segt rr lenni a mrjelzs
idleges zavarain. A 15.12. (b) bra fels grbjn lthat, hogy az tmenetihiba-modell kpes tmeneti hibkat
kezelni a bizonyossg katasztroflis vltozsai nlkl.
Ennyit ht az idleges zavarokrl. Mi a helyzet az rzkel lland meghibsodsval? Sajnos, az ilyenfajta
meghibsodsok tlsgosan is gyakoriak. Ha az rzkel hsz 5-s jelzst ad, amit hsz 0-s jelzs kvet, akkor
az elz bekezdsben lert tmenetihiba-modell azt fogja eredmnyezni, hogy a robot fokozatosan azt kezdi
hinni, hogy az akkumultora lemerlt, amikor valjban az is lehet, hogy az rzkel hibsodott meg. A 15.12.
(b) brn lthat als grbe mutatja a bizonyossg plyagrbt erre az esetre. A t = 25 idpontra 5 darab 0
jelzsre a robot meg van gyzdve, hogy az akkumultora res. Nyilvnval, hogy jobban szeretnnk, ha a
robot azt hinn, hogy az akkumultor mrje romlott el ha valban ez a valsznbb esemny.
494
Nem meglep, hogy egy tarts hiba kezelshez szksgnk lesz egy tartshiba-modellre (persistent failure
model), ami lerja, hogyan mkdik az rzkel normlis krlmnyek kztt s meghibsods utn. Ennek
elrshez ki kell egsztennk a rendszer rejtett llapott egy tovbbi vltozval, mondjuk egy AMHibs-sal,
ami megadja az akkumultormr llapott. A hiba tarts megmaradst egy nyllal kell modellezni, ami az
AMHibs0-t az AMHibs1-hez kapcsolja. Ennek a megmaradsi nylnak (persistence arc) olyan FVT-je van,
ami minden idlpsben megengedi a meghibsodst egy kis valsznsggel, mondjuk 0,001-gyel, de lerja,
hogy ha egy rzkel elromlott, akkor az rossz is marad. Amikor az rzkel rendben van, akkor az AMr
rzkel modellje megegyezik az tmenetihiba-modellel; amikor az rzkel rossz, az AMr mindig 0,
fggetlenl az akkumultor aktulis tltttsgtl.
Az akkumultor rzkeljnek tartshiba-modellje a 15.13. (a) brn lthat. A teljestmnye kt adatsoron (az
idleges zavarjelnl s a tarts meghibsodson) a 15.13. (b) brn lthat. Szmos dolgot rdemes megfigyelni
ezeken a grbken. Elszr is, hogy az idleges zavarjelnl az rzkel hibjnak a valsznsge jelentsen
megemelkedik a msodik 0 jelzs utn, de azonnal visszaesik, ahogy egy 5-st megfigyelt. Msodszor, hogy
tarts hibnl az rzkel hibjnak a valsznsge gyorsan megemelkedik 1 kzelbe, s ott marad. Vgl,
hogy amikortl az rzkelt hibsnak hiszi, a robot csak azt ttelezheti fel, hogy az akkumultor normlis
sebessggel veszti el tltst, ahogy az E(Akkumultort|...) fokozatosan cskken szintje ezt mutatja.
15.13. bra - (a) Az rzkel llapotvltozjt bemutat DBH-rszlet. Ez a vltoz

szksges az akkumultormr vgleges hibjnak a modellezsre. (b) Fels grbk:
az Akkumultort vrhat rtknek a plyagrbje az tmeneti hibj s a tarts
hibj megfigyelsi sorozatoknl. Als grbk: az AMHibs valsznsgnek
plyagrbi a kt megfigyelsi sorozatnl.
Eddig csupn felletesen rintettk a komplex folyamatok reprezentlsnak problmjt. Az llapottmenetmodellek vltozatossga risi, magban foglalva egymstl olyan tvol es tmkat, mint pldul az emberi
endokrin rendszer (hormonlis mkds) s az autplykon kzleked jrmvek modellezst. Az rzkel
modellezs egymagban is hatalmas terlet, de mg az olyan nehezen megfoghat jelensgek, mint pldul az
rzkel ellltdsa, hirtelen dekalibrlsa s a kls krlmnyeknek (mint az idjrsnak) a hatsai az
rzkel jelzsein is kezelhetk explicit reprezentcikkal a dinamikus Bayes-hlknl.
5.2. Egzakt kvetkeztets DBH-kban

Miutn felvzoltunk nhny tletet komplex folyamatok DBH-kkal trtn reprezentlsrl, most a
kvetkeztets krdst vizsgljuk meg. Bizonyos rtelemben ezt a krdst mr megvlaszoltuk: a dinamikus
Bayes-hlk Bayes-hlk, s neknk mr vannak algoritmusaink Bayes-hlban trtn kvetkeztetsre. Adott
megfigyelssorozat esetn a teljes Bayes-hls reprezentci felpthet a szeletek megismtlsvel, ameddig a
hl elg nagy nem lesz a megfigyelsek befogadshoz, ahogy a 15.14. brn lthat. Ezt a technikt
kibontsnak (unrolling) nevezik. (Technikailag a DBH ekvivalens egy egy irnyban vgtelen hlval, amit
vgtelen szm kibontssal kapunk. Az utols megfigyels utn hozzadott szeleteknek nincs hatsa a
kvetkeztetsre a megfigyelsi peridusban, ezrt elhagyhatk.) Ha a DBH-t mr kibontottuk, alkalmazhatk a
kvetkeztet algoritmusok: vltoz eliminls, egyestsi fa mdszere stb. (lsd 14. fejezet).
495
Sajnos a kibonts naiv alkalmazsa nem volna valami hatkony. Ha szrst vagy simtst szeretnnk elvgezni
megfigyelsek e1:t hossz sorozatn, akkor a kibontott hl trignye O(t) lenne, s korlt nlkl nne, amint
mg tbb megfigyelst adnnk hozz. Radsul ha egyszeren jra lefuttatjuk a kvetkeztet algoritmust
minden idpontban, amikor megfigyels rkezik, a kvetkeztetsi ideje frisstsenknt szintn O(t) szerint fog
nvekedni.
15.14. bra - Egy dinamikus Bayes-hl kibontsa: a szeletek ismtldnek befogadva a

megfigyelsi sorozatot (a halvny csompontok). Tovbbi szeleteknek mr nincs hatsa
a megfigyelsi periduson belli kvetkeztetsre. Ha a DBH-t kibontottuk, brmely
kvetkeztetsi algoritmus hasznlhat vltoz eliminls, egyestsi fa mdszerek s
gy tovbb , ami a 14. fejezetben szerepel.
A 15.2. alfejezetre visszatekintve ltjuk, hogy lland id- s trigny elrhet a szrsi frisstsnl, ha a
szmtsok rekurzv mdon vgezhetk. Lnyegben a szrsi frissts (15.3) egyenlete az elz idponthoz
tartoz llapotvltozk kisszegzst (summing out) vgzi el, hogy megkapja az j idponthoz tartoz eloszlst.
Vltozk kisszegzse pedig pontosan az, amit a vltozeliminls (variable elimination) algoritmusa elvgez
(lsd 14.10. bra), s megmutathat, hogy a vltoz eliminls idrendi vltozkon futva pontosan a szrs
rekurzv frisstsnek (15.3) egyenlet szerinti mkdst utnozza. A mdostott algoritmus egyszerre legfeljebb
kt szeletet tart a memriban: kezdve a 0. szelettel, hozzadjuk az 1. szeletet, kisszegezzk a 0. szeletet, aztn
hozzadjuk a 2. szeletet, aztn kisszegezzk az 1. szeletet s gy tovbb. Ezzel a mdszerrel elrhet az lland
id- s trigny a szrsi frisstsnl. (Ugyanez a teljestmny elrhet az egyestsi fa algoritmusnak
megfelel mdostsaival.) A 15.10. feladat kri ennek a tnynek az ellenrzst az esernys hlra.
Eddig tartottak a j hrek, most kvetkeznek a rosszak: megmutathat, hogy egy frissts id- s
trkomplexitsnak az llandja majdnem minden esetben exponencilis az llapotvltozk szmban. Az
trtnik ugyanis, hogy amint a vltoz eliminls halad, a tnyezk megnnek, magukban foglalva az sszes
llapotvltozt (vagy pontosabban azokat az llapotvltozkat, amelyeknek van szljk az elz idszeletben).
A maximlis tnyezmret O(dn+1), a frissts kltsge pedig O(dn+2).
Fontos
Termszetesen ez sokkal kevesebb, mint az RMM frisstsnek kltsge, ami O(d2n), de nagyszm
vltoznl mg mindig kivitelezhetetlenl nagy. Ezt a slyos tnyt nehz elfogadni. Ugyanis a
kvetkezt jelenti: annak ellenre, hogy a DBH-k felhasznlhatk olyan nagyon komplex idbeli
folyamatok reprezentlsra, amelyek szmos, ritkn sszekapcsolt vltozval rendelkeznek, nem
vagyunk kpesek hatkonyan s pontosan kvetkeztetni ezekrl a folyamatokrl. A DBH-modell, ami
az sszes vltoz feletti a priori egyttes eloszlst reprezentlja, faktorizlhat az t alkot FVT-kre, de
az a posteriori egyttes eloszls a megfigyelsi szekvencin vett felttellel azaz az elre zenet
ltalban mr nem faktorizlhat. Eddig senki sem tallt megoldst erre a problmra, annak ellenre,
hogy megoldst a tudomny s mrnki tervezs fontos terletei tudnk nagyon jl hasznostani. gy
kzelt mdszerekre kell szortkoznunk.
5.3. Kzelt kvetkeztets DBH-kban

A 14. fejezet kt kvetkeztet mdszert rt le: a valsznsgi slyozst (lsd 14.14. bra) s a Markov lnc
Monte Carlo mdszert (MCMC, lsd 14.15. bra). A kett kzl az els igazthat legknnyebben a DBHkeretbe. Ltni fogjuk azonban, hogy egy gyakorlati mdszer kialakulshoz a standard valsznsgi slyoz
algoritmuson szmos javtsra van szksg.
496
Fontos
Emlkezznk vissza, hogy a valsznsgi slyozs a mkdse sorn a nem bizonytkvltozkat
mintavtelezi azok topolgiai sorrendjben, minden mintt azzal a valsznsggel slyozva,
amennyire egyezik a megfigyelt bizonytkvltozkkal. Ahogyan az egzakt kzelt algoritmusok
esetben is, a valsznsgi slyozst kzvetlenl alkalmazhatnnk egy kibontott DBH-ra, de
ugyanazok a problmk jelentkeznnek, nevezetesen, hogy a megfigyelssorozat nvekedsvel a
frisstsenknti id- s trigny nvekedne. A problma az, hogy az alapalgoritmus az egyes mintkat
egyms utn sorban vgigfuttatja a hl teljes hosszban. Ehelyett egyszeren az sszes N mintt
egytt futtathatnnk a DBH-n keresztl, szeletenknt egyszerre haladva. (Azaz a mintavteleket az
jragenerls kltsgnek elkerlse miatt nyilvntartannk s fokozatosan frisstennk a ford.) A
mdostott algoritmus illeszkedik a szrsi algoritmus ltalnos mintjhoz, az N mintval mint
elrefel zenettel. Az els kulcsgondolat az, hogy ekkor a mintkat magukat hasznljuk az
llapoteloszls egy kzelt reprezentcijaknt. Ez eleget tesz a frisstsenknti lland
idignynek, br az lland rtke a mintk szmtl fgg, aminek elg nagynak kell lenni a valdi a
posteriori eloszls elfogadhat kzeltshez. Szintn nincs szksg a DBH kibontsra, mivel csak az
aktulis s a kvetkez szeletet kell memriban tartani.
A valsznsgi slyozs trgyalsakor a 14. fejezetben rmutattunk, hogy az algoritmus pontossga leromlik,
ha a bizonytkvltozk lentebbiek a mintavtelezett vltozknl, mivel ekkor a mintk generlsra nincsen
hatssal a bizonytk. Egy DBH tipikus struktrjt megnzve mondjuk az esernys DBH-t a 15.14. brn
ltjuk, hogy a korai llapotvltozk mintavtelezsnl valban nem hasznosulnak a ksbbi bizonytkok.
Valjban, mg tzetesebben megnzve azt lthatjuk, hogy az llapotvltozk egyiknek sincs egyetlen
bizonytkvltoz sem az sei kztt! gy, br az egyes mintk slya fggeni fog a bizonytkoktl, a generlt
mintk aktulis halmaza teljesen fggetlen lesz a bizonytkoktl. Pldul mg ha a fnk mindennap el is
hozza az esernyjt, a mintavteli folyamat ekkor is hallucinlhat vget nem r knikult. A gyakorlatban ez
azt jelenti, hogy a mintk azon arnya, ami elfogadhatan kzel marad az esemnyek valdi sorhoz,
exponencilisan cskken t-vel, a megfigyels sorozat hoszszval; mshogy fogalmazva egy adott pontossgi
szint fenntartshoz, a mintk szmt exponencilisan nvelni kell t fggvnyben. Mivel egy vals idben
mkd szr algoritmus csak rgztett szm mintt tud hasznlni, a gyakorlatban az trtnik, hogy igen kis
szm frisstsi lps utn a hiba hatrtalanul megn.
Fontos
Vilgos, hogy jobb megoldsra van szksgnk. A msodik kulcsgondolat az, hogy a mintk halmazt
az llapottr nagy valsznsg rszeire koncentrljuk. Ez megtehet a megfigyelsek szerint nagyon
alacsony sly mintk eldobsval, mikzben megsokszorozzuk a nagy slyakat. Ezen a mdon a
mintk populcija elfogadhatan kzel marad a valsghoz. Ha gy gondolunk a mintkra, mint egy
eszkzre az a posteriori eloszls modellezshez, akkor van rtelme tbb mintt hasznlni az llapottr
azon rszeiben, ahol az a posteriori valsznsg nagyobb.
Az algoritmusok egy csaldjt, a rszecskeszrst (particle filtering) pontosan ennek elvgzsre terveztk. A
rszecskeszrs a kvetkezkppen mkdik: elszr egy N mintj populcit alkotunk a 0. idpontbeli P(X0)
a priori eloszls mintavtelezsbl. Ezutn minden idpontban egy frisstsi ciklus ismtldik:
Minden mintt elreterjesztnk mintavtelezve az xt+1 kvetkez llapot rtket feltve, hogy a minta aktulis
rtke xt adott, s felhasznlva a P(Xt+1|xt) llapottmenet-modellt.
Minden mintt slyozunk azzal a P(et+1|xt+1) valsznsggel, amit az j bizonytkhoz rendel.
A populcit jra mintavtelezzk, hogy egy N mintj j populcit generljunk. Minden j mintt a
jelenlegi populcibl vlasztunk ki; egy konkrt minta kivlasztsnak a valsznsge arnyos a slyval.
Az j mintk slyozatlanok.
Az algoritmus rszletesen a 15.15. brn lthat, s mkdst az esernys DBH esetn a 15.16. bra
szemllteti.
15.15. bra - A rszecskeszrs algoritmus megvalstsa egy rekurzv frisstsi

mvelettel s llapottal (ami a mintk halmaza). A mintavtelez lpsek mindegyike az
aktulis szelet vltozinak a mintavtelezst jelenti egy topolgiai sorrendben,
497
hasonlan, mint a PRIOR-MINTA-ban. A

megvalsthat O(N) vrhat futsi idvel.
SLYOZOTT-MINTA-VISSZATTELLEL
mvelet
Megmutatjuk, hogy ez az algoritmus konzisztens gy helyes valsznsgeket ad, ahogy N a vgtelenbe tart
meggondolva, hogy mi trtnik egy frisstsi ciklus alatt. Feltesszk, hogy a mintapopulci a t idpontbeli f1:t
elre zenet egy helyes reprezentcijaknt indul. Az N(xt|e1:t) jellst hasznlva azon mintk szmra, amelyek
az e1:t megfigyelsek feldolgozsa utn az xt llapotban vannak, azt kapjuk, hogy
N(xt|e1:t) /N = P(xt|e1:t) (15.21)
nagy N-ekre. Most minden mintt elreterjesztnk mintavtelezve az llapotvltozkat a t + 1 idponban az

adott t idponthoz tartoz mintabeli rtkek mellett. Az egyes xt llapotokbl az xt+1 llapotot elr mintk
szma az tmenet-valsznsg s az xt populci szmnak a szorzata; gy az xt+1 llapotot elr mintk teljes
szma
15.16. bra - A rszecskeszrs frisstsi ciklusa az eserny DBH-nl N = 10 esetn,

bemutatva minden egyes llapot mintapopulcijt. (a) A t idpontban 8 minta jelez
Es-t s 2 Es-t. Mindegyiket tovbbterjesztjk a kvetkez llapottmenet-modell
szerinti mintavtelezsvel. A t + 1 idpontban 6 minta jelez Es-t s 4 Es-t. (b) A t + 1
idpontban Eserny a megfigyels rtke. Mindegyik mintt slyozzuk a mintnak a
megfigyelsre vett feltteles valsznsgvel, amit a krk nagysga jelez. (c) Egy j 10es mintahalmaz generldott az aktulis halmazbl trtn slyozott sorsolssal, 2
olyan mintt eredmnyezve, ami Es-t jelez, s 8 olyat, ami Es-t.
498
Most minden egyes mintt slyozunk a t + 1 idpontbeli bizonytk valsznsgvel. Egy xt+1 llapotban lv
minta P(et+1|xt+1) slyt kap. Az xt+1 llapotban lv mintk teljes slya az et+1 megfigyelse utn ezrt
W(xt+1|e1:t+1) = P(et+1|xt+1)N(xt+1|e1:t)
Most a mintavteli lps jn. Mivel minden egyes minta a slyval arnyos valsznsggel ismtldik, az
jramintavtelezs utn az xt+1 llapotban lv mintk szma arnyos az xt+1 llapotban lv mintk teljes
slyval az jramintavtelezs eltt:
Azaz a mintapopulci egy frisstsi ciklus utn helyesen reprezentlja a t + 1 idpontbeli elrefel zenetet.
A rszecskeszrs gy konzisztens, de hatkony-e? A gyakorlat azt mutatja, hogy a vlasz igen: a
rszecskeszrs, gy tnik, az igazi a posteriori eloszls egy j kzeltst tartja fenn lland szm mintt
hasznlva. Azonban jelenleg nincs elmleti garancia; a rszecskeszrs jelenleg aktvan kutatott terlet. Szmos
javtst s vltozatot javasoltak, s az alkalmazsok kre is egyre bvl. Mivel ez egy mintavtelez algoritmus,
a rszecskeszrs knnyen felhasznlhat hibrid s folytonos DBH-kban, lehetv tve az alkalmazst akr
olyan terleteken is, mint komplex mintzatok kvetse videofelvtelben (Isard s Blake, 1996) s tzsdei
elrejelzs (de Freitas s trsai, 2000).
6. Beszdfelismers
Ebben az alfejezetben az idbeli valsznsgi modellek egyik legfontosabb alkalmazst, a beszdfelismerst
(speech recognition) tekintjk t. A feladat egy beszl ltal elmondott szsorozat azonostsa az adott
akusztikus jelbl. A beszd az emberek kztti kommunikcinak a dominns modalitsa, s a megbzhat
szmtgpes beszdfelismers felmrhetetlenl fontos lenne. Mg ennl is hasznosabb volna a beszdmegrts
(speech understanding) az elhangzott beszd jelentsnek a meghatrozsa. Ennek trgyalsra a 22.
fejezetig kell vrnunk.
A beszd jelenti az els tallkozsunkat a valdi rzkelk szolgltatta adatok nyers, tiszttatlan vilgval. Ezek
az adatok zajosak, a sz szoros rtelmben: a zaj lehet httrzaj s lehet a digitalizlsi folyamat okozta
mellktermk; eltrsek lehetnek a szavak kiejtsi mdjban mg ugyanannl a beszlnl is; klnbz szavak
hangzsa ugyanaz lehet s gy tovbb. Ezen okok miatt a beszdfelismersre mint valsznsgi kvetkeztetsi
problmra kezdtek el tekinteni.
A legltalnosabb szinten a valsznsgi kvetkeztetsi problmt a kvetkezkppen definilhatjuk. Legyen a
Szavak egy valsznsgi vltoz az sszes lehetsges szszekvencia felett, ami elhangozhat, s legyen a jel a
megfigyelt akusztikusjel-szekvencia. Ekkor az elhangzottak legvalsznbb rtelmezse a Szavak azon rtke,
ami maximalizlja a P(szavak|jel) rtket. Amint az gyakori eset, a Bayes-szably alkalmazsa hasznos:
P(szavak|jel) = P(jel|szavak) P(szavak)
A P(jel|szavak) alkotjk az n. akusztikai modellt (acoustic model). Ez rja le a szavak hangzst a ceiling
(mennyezet)
egy
lgy
c-vel
kezddik
s
ugyangy
hangzik,
mint
a
sealing
(pecstels/tmts/fkavadszat). (Az azonos hangzs szavakat homofon (homophone) szavaknak
nevezzk.) A P(szavak) rtkei kpezik az n. nyelvi modellt (language model). Ez adja meg az a priori
valsznsgt minden egyes kijelentsnek pldul hogy a magas mennyezet (high ceiling) sokkal
valsznbb szkapcsolat, mint a magas pecstels (high sealing).
499
A beszdfelismer rendszerekben hasznlt nyelvi modellek gyakran igen egyszerek. A fejezetben ksbb lert
bigram (bigram) modell minden lehetsges esetre megadja annak a valsznsgt, hogy egy sz egy msik
szt kvet. Az akusztikai modell sokkal bonyolultabb. Az alapjait egy fontos felfedezs alkotja a fonolgia
(phonology) (a nyelvi hangok tanulmnyozsa) terletrl, nevezetesen, hogy az emberisg minden nyelve egy
4050 hangbl ll korltos vlasztkkal l, amelyeket beszdhangoknak (phones) hvunk. Egy beszdhang
nagyjbl az a hang, amely egy egyedi mssal- vagy magnhangznak felel meg. A helyzetet kompliklja
valamelyest, hogy az olyan betkombincik, mint th vagy ng egyedi beszdhangot eredmnyeznek,
viszont egyes betk tbbfle beszdhanghoz vezetnek, a krnyezetktl fggen (pldul az a bet a rat s
a rate szban). Az angol nyelv sszes beszdhangja, pldkkal egytt, a 15.17. brn lthat. A fonma
(phoneme) a legkisebb hangi egysg, ami nll jelentssel br egy adott nyelv hasznli szmra. Pldul az
angolban a t beszdhang a stick szban ugyanaz a fonma, mint a t beszdhang a tick szban, de a thai
nyelvben ezek megklnbztethetk, mint kt klnbz fonma.
A beszdhangok ltezse lehetv teszi az akusztikai modell kt rszre bontst. Az els rsz a kiejtst
(pronunciation) kezeli, s minden egyes szra megad egy valsznsg-eloszlst az sszes lehetsges
beszdhangsor felett. Pldul a ceiling sz kiejtse [s iy l ih ng], vagy nha [s iy l ix ng], vagy esetleg [s iy l
en]. A beszdhangok kzvetlenl nem megfigyelhetk, gy nagyjbl a beszd egy olyan rejtett Markovmodellel reprezentlhat, aminek Xt llapotvltozja a t idpontban kimondott beszdhang.
Az akusztikai modell msodik rsze a beszdhangok akusztikus jelknt val megvalsulsi mdjval
foglalkozik: azaz a rejtett Markov-modell Et bizonytkvltozja adja meg az akusztikus jel t idpontban
megfigyelt jellemzit, s az akusztikus modell adja meg az P(Et|Xt) feltteles valsznsget, ahol Xt az aktulis
beszdhang. A modellnek lehetsget kell adni eltrsekre a hangmagassgban, a sebessgben s a hangerben,
s jelfeldolgozsi (signal processing) technikkon alapul, hogy olyan jelreprezentcit biztostson, ami
megfelelen robusztus mdon kezeli ezeket a fajta eltrseket.
15.17. bra - A DARPA fonetikus bc, avagy ARPAbet, amely az amerikai angolban
hasznlt beszdhangokat sorolja fel. Szmos alternatv felrs ltezik, kztk az
International Phonetic Alphabet (IPA), mely az sszes ismert nyelv beszdhangjt
tartalmazza.
A fejezet htralev rsze a modelleket s az algoritmusokat rja le lentrl felfel haladva, az akusztikus jelekkel
s a beszdhangokkal kezdve, majd az egyedi szavakkal s vgl teljes sorozatokkal folytatva. Befejezsl
ttekintjk, hogy ezek a modellek hogyan tanthatk, s mennyire mkdik jl a kapott rendszer.
6.1. Beszdhangok
500
A hanghullmok olyan periodikus nyomsvltozsok, amelyek a levegben terjednek. A hang egy mikrofonnal
mrhet, aminek membrnjt elmozdtja a nyomsvltozs, s egy folytonosan vltoz ramot generl. Az
ramerssget ami a hanghullm amplitdjhoz tartozik egy analg-digitlis konverter mri diszkrt
idintervallumonknt a mintavteli frekvencia (sampling rate) szerint. Beszd esetn a tipikus mintavteli
frekvencia 8 s 16 kHz (azaz 8000-tl 16 000-ig msodpercenknt) kztt van. (J minsg zenei felvteleket
mintavteleznek 44 kHz vagy mg magasabb frekvencival.) A mrs pontossgt az egyes mintavteli
pontokban a kvantlsi tnyez (quantization factor) hatrozza meg; a beszdfelismerk tipikusan 812 bitet
hasznlnak. Ez azt jelenti, hogy a legkevsb ignyes rendszer, amely 8 kHz-es frekvencival mintavtelez, s 8
bites kvantlst hasznl, kzel fl megabjtot ignyel egy egyperces beszd trolshoz. Ilyen nagy mennyisg
jelinformci esetn kivitelezhetetlen ltrehozni s hasznlni a P(jel|beszdhang) eloszlsokat, gy az akusztikus
jelnek tmrebb lersait kell kifejlesztennk.
Elsknt azt vesszk figyelembe, hogy br a beszdben a hangfrekvencia akr tbb kHz-es is lehet, a jel
tartalmnak a megvltozsai sokkal ritkbban fordulnak el, taln nem tbb mint 100 Hz-cel. Ezrt a
beszdrendszerek a jel tulajdonsgait hosszabb idintervallumonknt, gynevezett keretenknt (frames)
sszegzik. Egy 10 ms-os (80 minta 8 kHz-es mintavtel mellett) keret elg rvidnek tnik ahhoz, hogy csak
nhny rvid idej jelensg mosdjon el az sszegzsi folyamat miatt. Az egyes kereteken belli folyamatot egy
jellemz (feature) vektorral brzoljuk. Pldul jellemezni akarjuk az energia szintjt szmos frekvenciasv
mindegyikben. Ms fontos jellemzk a keret globlis energiaszintje s a megelz kerettl szmtott
(energia)klnbsg. A jellemzk kiemelse a beszdjelbl hasonlt egy kicsit arra, ahogy a zenekar jtkt
figyelve megjegyezzk: Most a vadszkrtk hangosan s a hegedk halkan szlnak. A 15.18. brn lthatjuk
az talakts lpseit a nyers hangtl a keretek sorozatig. Figyeljk meg, hogy a keretek tlapoldnak; ez
megvd minket attl, hogy pont a keret hatrn fellp fontos akusztikus esemnyek informcijt elvesztsk.
A pldnkban csupn hrom jeggyel rendelkez keretet mutattunk. Vals rendszerek jellemzk tucatjaival vagy
akr szzaival dolgoznak. Pldul n darab jellemz esetn, amikor mindegyik 256 lehetsges rtket vehet fel,
egy keret egy ponttal adhat meg egy n-dimenzis trben, s 256n lehetsges keret ltezik. n > 2 esetn
kivitelezhetetlen volna a P(jellemzk|beszdhang) eloszlsnak egy explicit tblzatknt trtn brzolsa, gy
tovbbi tmrtsre van szksgnk. Kt lehetsges megkzelts ltezik:
A vektorkvantls (VK) (vector quantization, VQ) mdszere felosztja az n dimenzis teret mondjuk 256
partcira, C1-tl C256-ig cmkzve. Ekkor az egyes kereteket inkbb egy egyedi cmkvel, mint egy n
szmbl ll vektorral lehet jellemezni. gy a P(VQ|beszdhang) eloszls tblzatos formja 256
valsznsget tartalmaz minden egyes beszdhangra. Nagy rendszerekben a vektorkvantls mr nem
npszer.
A jellemzk ternek diszkretizlsa helyett parametrikus folytonos eloszlsokat hasznlhatunk a
P(jellemzk|beszdhang) lershoz. Pldul hasznlhatunk minden beszdhanghoz egy Gauss-eloszlst,
beszdhangonknt klnbz tlaggal s kovarianciamtrixszal. Ez jl mkdik, ha az egyes beszdhangok
akusztikus megvalsulsa a jellemzk terben egyetlen terleten csoportosul. A gyakorlatban egy hanghoz
tbb terleten val csoportosuls is tartozik, s Gauss-eloszlsok keverkt (mixture of Gaussians) kell
hasznlni. Egy keverk k egyedi eloszls slyozott sszege, gy a P(jellemzk|beszdhang) eloszlshoz k sly,
k n elem tlagvektor s k n2 mret kovarianciamtrix tartozik, ami O(kn2) paramter minden beszdhangra.
15.18. bra - Az akusztikus jel talaktsa keretek sorozatv; mindegyik keretet hrom
akusztikus jellemzvel runk le
501
Termszetesen bizonyos informci elvsz a feldolgozs sorn, ami a teljes beszdjeltl egy VK cmkig vagy a
keverkparamterek egy halmazig tart. A jelfeldolgozs mvszete abban rejlik, hogy gy vlasszuk meg a
jellemzket s a tartomnyokat (vagy a Gauss-eloszlsokat), hogy a hasznos informci vesztesge minimlis
legyen. Egy adott beszdhang szmos mdon kiejthet: hangosan vagy halkan, gyorsan vagy lassan, magasan
vagy mly hangon, csendben vagy httrzajban s beszlk sok millija ltal, mindegyikjk klnbz
kiejtsvel s eltr hangkpz szerveivel.6
Mg kt tovbbi finomtst kell elvgeznnk az eddig lert egyszer modellen. Az els a beszdhangok idbeli
szerkezetvel foglalkozik. Normlis beszdben a legtbb beszdhangnak a terjedelme 50100 ezredmsodperc
vagy 510 keret. A P(jellemzk|beszdhang) valsznsgi modell ugyanaz ezen keretek mindegyikre, pedig a
legtbb beszdhangnak jelents bels struktrja van. Pldul a [t] egyike a zrhangoknak (stop consonants),
amelyekben a leveg ramlsa megsznik egy rvid idre egy hatrozott kibocsts eltt. Az akusztikus jelet
megvizsglva azt ltjuk, hogy egy [t]-nek a kezdete hangtalan, kzepn egy kis kirobbanssal s (ltalban) egy
sziszegssel a vgn. A beszdhangoknak ez a bels struktrja egy hromllapot modellel ragadhat meg;
minden beszdhangnak van egy kezdeti, kzp- s vgllapota, s minden llapotnak megvan a sajt eloszlsa a
jegyek felett.
A msodik finomts azzal a krnyezettel foglalkozik, amelyben a beszdhang elhangzik. Egy adott beszdhang
hangzst megvltoztathatjk a krnyez beszdhangok.7 Emlkezznk arra, hogy a beszdhangok az ajkak, a
nyelv s az lkapocs mozgsa s a levegnek a hangkpz szerveken trtn knyszertett tramlsa rvn
keletkezik. Ezen komplex mozgsok koordinlsnl, amik msodpercenknt t vagy mg tbb beszdhangot
produklnak, az agy mr akkor elindt a msodik beszdhanghoz tartoz mveletet, mieltt az els befejezdtt
volna, gy megvltoztatva az egyik vagy mindkt beszdhangot. Pldul a sweet (des) kiejtsnl az ajkak
kerektettek az [s] ellltsa kzben szmtva a kvetkez [w]-re. Ezeket a koartikulcis hatsokat
(coarticulation effects) rszlegesen megragadja a hrmashangz (triphone) modell, amelyben az egyes
beszdhangok akusztikai modellje fgghet az elz s kvetkez beszdhangtl. gy a [w] a sweet-ben gy
rhat, hogy [w(s,iy)], azaz [w] egy [s] bal- s egy [iy] jobb-krnyezetben.
A hromllapot s hrmashangz modellek egyttes hatsa megnveli az idbeli folyamat lehetsges
llapotainak a szmt az eredeti beszdhang kszletbeli n beszdhangrl 3n3-ra (az ARPAbet-ben n 50). A
tapasztalatok azt mutatjk, hogy a megnvelt pontossg bven ellenslyozza a kvetkeztets s a tanuls
megnvekedett kltsgeit.
6.2. Szavak
Minden egyes szra gondolhatunk gy, mint ami meghatroz egy kln P(X1:t|sz) valsznsgi eloszlst, ahol
Xi megadja az i-edik keretben a beszdhang llapott. Tipikusan ezt az eloszlst kt rszre osztjuk. A kiejtsi
modell (pronunication model) egy eloszlst ad meg a beszdhangsorok felett (figyelmen kvl hagyva az
temet s a kereteket), majd a beszdhangmodell (phone model) lerja, ahogyan a beszdhangok lekpzdnek
a keretek szekvencijra.
A dulis problma a beszlazonosts (speaker identification) pontosan ennek fordtottja, a kzs elemeket hagyja el, s az egyni
klnbsgeket tartja meg, majd megprblja a klnbsgeket az egyni beszdmodellekhez illeszteni.
7
Ebben az rtelemben a beszd beszdhangmodelljt inkbb hasznos kzeltsnek kell tekinteni, s nem megvltoztathatatlan trvnynek.
6
502
Gondoljunk arra a szra, hogy tomato (paradicsom). Gershwin szerint ezt gy ejtik ki, hogy [t ow m ey t ow]
(Gershwin, 1937), n viszont gy ejtem, hogy [t ow m aa t ow]. A 15.19. bra fels rszn lthat egy olyan
llapottmenet-modell, ami gondoskodik errl a vltozatrl. A modellen keresztl csak kt t ltezik, egy, ami a
[t ow m ey t ow] beszdhang szekvencihoz tartozik, s a msik a [t ow m aa t ow] szekvencihoz. Egy t
valsznsge az tvonalat alkot nyilakon szerepl valsznsgek szorzata:
P([towmeytow]|tomato) = P([towmaatow]|tomato) = 0,5
A fonetikai vltozkonysg msodik forrsa a koartikulci (coarticulation). Pldul a [t] beszdhangnl a

nyelv a szjpadlsnl helyezkedik el, az [ow]-nl viszont a szj aljn. Gyors beszdnl a nyelv sokszor kzbls
pozciba kerl, melynek eredmnye inkbb a [t ah], s nem a [t ow]. A 15.19. bra als rsze a tomato
kiejtsnek egy bonyolultabb modelljt mutatja, amely ezt a koartikulcis hatst figyelembe veszi. Ebben a
modellben ngy klnbz t van, s azt kapjuk, hogy:
P([towmeytow]|tomato) = P([towmaatow]|tomato) = 0,1
P([tahmeytow]|tomato) = P([tahmaatow]|tomato) = 0,4
Hasonl modelleket lehetne konstrulni minden felismerni kvnt szhoz.

A hromllapot beszdhangmodell llapottmenet-diagramja a 15.20. brn lthat. A modell egy konkrt
beszdhanghoz tartozik, az [m]-hez, de az sszes beszdhangnak hasonl topolgij modellje van. Az brn
lthatk az egyes beszdhang llapotokhoz kapcsold akusztikai modellek is, felttelezve, hogy a jelet egy VK
cmke reprezentlja. Pldul a modell szerint P(Et = C1|Xt = [m]Kezdet) = 0,5. Vegyk szre a hurkokat az brn;
pldul az [m]Kzp llapot 0,9 valsznsggel fennmarad, ami azt jelenti, hogy az [m] Kzp llapot vrhat
idtartama 10 keret. A modellnkben az egyes beszdhangok hossza fggetlen a tbbi beszdhang hossztl;
egy kifinomultabb modell kpes lenne a gyors s lass beszdet megklnbztetni.
Hasonl modelleket hozhatunk ltre minden egyes beszdhangra, akr a hrmashangz krnyezet hatst is
figyelembe vve. Minden szmodell, amikor a beszdhangmodellekkel kombinljuk, egy RMM teljes
specifikcijt adja. A modell megadja a beszdhang llapotok kztti, keretrl keretre trtn tmeneteknek a
valsznsgeit csakgy, mint az akusztikus jegyek valsznsgeit minden egyes beszdhang llapothoz.
Ha egyedlll szavakat (isolated words) szeretnnk felismerni azaz egyrtelm hatrokkal rendelkez s
mindennem krnyezeti sszefggs nlkl kiejtett szavakat , akkor azt a szt kell megkeresnnk, amelyik
maximalizlja azt, hogy
P(sz|e1:t) = P(e1:t|sz)P(sz)
15.19. bra - A tomato sz kt kiejtsi modellje. Mindegyik modellt egy

tmenetdiagramknt brzoljuk, amiben az llapotokat krrel jelljk, a megengedett
tmeneteket pedig nyilakkal, rajtuk a kapcsold valsznsgekkel. (a) Egy
nyelvjrsbeli klnbsgeket is tekintetbe vev modell. A 0,5-s rtkek a kt szerz
preferlt kiejtsein alapul becslsek. (b) Egy olyan modell, ami az els magnhangzn
egy koartikulcis hatst is figyelembe vesz, megengedve az [ow] vagy az [ah]
beszdhangokat.
503
15. bra - Az [m] hromllapot beszdhang egy RMM-je. Mindegyik llapotnak

szmos lehetsges kimenetele lehet, klnll valsznsgekkel. A C1, , C7 VK-cmkk
nknyesen lettek megvlasztva.
P(sz|e1:t) = P(e1:t|sz)P(sz)
A P(sz) a priori valsznsg valdi szveges adatbl kaphat meg. A P(e1:t|sz) pedig az akusztikus jegyek
sorozatnak a valsznsge a szmodell szerint. Ilyen valsznsgek kiszmtst a 15.2. alfejezet trgyalta;
nevezetesen a (15.15) egyenlet egy egyszer rekurzv szmtst definil, lineris kltsggel t-ben s a Markovlnc llapotainak szmban. A legvalsznbb sz megtallsnl ezt a szmtst minden lehetsges szra
elvgezhetjk, megszorozzuk az a priori valsznsggel, s e szerint vlasztjuk ki a legjobb szt.
6.3. Mondatok
Az emberi kommunikciban val rszvtelhez egy gpnek a folytonos beszdet (continuous speech) kell
felismernie, s nem pusztn egyedlll szavakat. Azt gondolhatnnk, hogy a folytonos beszd nem tbb, mint
szavak sorozata, amelyek mindegyikre alkalmazhatjuk az algoritmust az elz fejezetbl. Ez a megkzelts
kt ok miatt is buksra van tlve. Elszr is, mr lttuk (a 2.3. szakasz - A legvalsznbb sorozat megtallsa
rszben), hogy a legvalsznbb szavak sorozata nem a legvalsznbb egyttes szsorozat. Pldul a Take the
504
Money and Run (Fogd a pnzt s fuss) c. filmben a banki alkalmazott flrerti Woody Allen irkafirka
bankrablsi zenett, s azt I have a gub (Nlam van a slukker)-nak olvassa (az I have a gun, vagyis Nlam
van a stukker helyett a ford.). Egy jobb nyelvi modell az I have a gun-t javasoln, mint aminek sokkal
nagyobb a valsznsge, mg ha a legutols sz inkbb gub-nak s nem gun-nak olvashat. A msodik
problma, amivel folytonos beszd esetn szembeslnnk kell, a szegmentls (segmentation) annak az
eldntse, hogy hol van egy sznak a vge, s hol kezddik a kvetkez. Mindenki, aki megksrelt egy idegen
nyelvet megtanulni, mltnyolni fogja a problma nehzsgt: elszr gy tnik, hogy a beszdben a szavak
egybefolynak, majd fokozatosan tanulunk meg egyedi szavakat kiemelni a hangok egyvelegbl. Ebben az
esetben az els benyoms korrekt: a spektrogrfiai elemzs azt mutatja, hogy a folyamatos beszdben a szavak
tnyleg sznetek nlkl kvetik egymst. A szavak hatrait annak ellenre tanuljuk meg megklnbztetni, hogy
a szavakat nem vlasztjk szt csendszakaszok.
Kezdjk a nyelvi modellel, aminek a beszdfelismersben az a feladata, hogy valsznsget rendeljen minden
egyes szsorozathoz. Legyen w1 wn az n szbl ll szsorozat, s legyen wi a szsorozat i-edik szava, akkor a
szsorozat-valsznsget az albbi mdon rhatjuk:8
Ezen kifejezsek tbbsge igen bonyolult s nehezen becslhet vagy szmthat. Szerencsre a kpletet
egyszerbb kifejezssel is kzelthetjk, mikzben a nyelvi modell zmt mgis megragadjuk. Az egyik
egyszer, kzkedvelt s hatkony eljrs a bigram (bigram) modell. Ez a modell a P(wi|w1... w 1)-et a P(wi|w 1)gyel kzelti. Ms szval, felttelezi, hogy a szsorozatokra teljesl az elsrend Markov-felttel.
i
A bigram modell nagy elnye, hogy a modell egyszeren tanthat az egyes szprok megszmolsval
szsorozatok egy reprezentatv korpuszban s a valsznsgek ezen szmok alapjn trtn megbecslsvel.
gy pldul, ha az a a mintakorpuszban 10 000-szer fordul el, s a gun azt 37-szer kveti, akkor P(guni|ai1)
= 3710 000, ahol a a becslt valsznsg. Az ilyen tants befejeztvel elvrnnk, hogy az I have s az a
gun valsznsge relatve magas legyen, az I has s az an gun valsznsge viszont alacsony. A 15.21.
bra a jelen knyv (eredeti angol nyelv kiadsnak) szavaibl szmtott nhny bigram gyakorisgt mutatja.
15.21. bra - Az unigram s bigram szmllknak egy rszleges tblzata a jelen knyv
(eredeti angol nyelv kiadsnak) szavai alapjn. A the a leggyakoribb egyedlll
sz 33 508 elfordulssal (513
893 sszes szbl). A leggyakoribb bigram
az of the, 3833 elfordulssal. Nhny szm nagyobb, mint vrhat (pldul 4-szer
fordul el az on is), mivel a bigram szmlls figyelmen kvl hagyja az elvlasztst:
egy mondat vgzdhet on-ra s a kvetkez kezddhet is-zel.
A modellt ki lehet bvteni trigramm (trigram), amely a P(wi|w 1w 2) mennyisgeket hasznlja. Ez egy
hatkonyabb nyelvi modell, kpes megadni, hogy az ate a banana (bannt ettem) valsznbb, mint az ate a
bandana (kendt ettem). A trigram modellben s kisebb mrtkben a bigram s unigram modellekben is
i
Valban jobb lenne, ha minden valsznsget egy adott helyzetre vonatkoz felttel mellett lehetne figyelembe venni. Kevs
beszdfelismer rendszer l ezzel a lehetsggel, mert nehz formlisan meghatrozni, hogy mi szmt adott helyzetnek.
8
505
problmt jelentenek a nulla rtk szmllk: nem szeretnnk egy szkombincit lehetetlennek minsteni
pusztn azrt, mert nem fordulnak el a tant korpuszban. A simts (smoothing) folyamata ilyen
kombincikhoz egy kis, pozitv valsznsget rendel. Ezt a 1. szakasz - Valsznsgi nyelvi modellek
rszben trgyaljuk.
A bigram s trigram modellek nem annyira kifinomultak, mint a 22. s 23. fejezetben szerepl nyelvi modellek
nmelyike, de jobban tekintetbe veszik a helyi sszefggsek hatsait, s bizonyos helyi szintaxist sikeresen
kifejeznek. Pldul az a tny, hogy az I has s a man have szprok alacsony pontszmokat kapnak, az
alany-lltmny egyeztetst fejezi ki. A problma az, hogy ezeket a kapcsolatokat csak helyileg lehet szlelni:
the man have alacsony pontszmot kap, de a the man with yellow hat have nincs bntetve.
Most gondoljuk meg a nyelvi modell s a szmodellek egyestst, hogy minden szsorozatot megfelelen
tudjunk kezelni. Az egyszersg kedvrt egy bigram nyelvi modellt fogunk felttelezni. Egy ilyen modellel az
sszes szmodell (ami viszont kiejtsi s beszdhangmodellekbl ll) egyetlen nagy RMM-modellbe llthat
ssze. Az egy-szavas RMM-modell egy llapota egy keret, felcmkzve az aktulis beszdhanggal s
beszdhangllapottal (pldul [m]Kezdet); egy folytonos beszd RMM-ben egy llapot a szval is fel van
cmkzve, mint pldul
. Ha minden sznak tlagban p hromllapot beszdhang szerepel a kiejtsi
modelljben, akkor W sz esetn a folytonos beszd RMM-nek 3pW llapota van. tmenetek
bekvetkezhetnek egy adott beszdhangon bell a beszdhang llapotai kztt, egy adott sz beszdhangjai
kztt, illetve egy sz utols llapota s egy msik sz kezd llapota kztt. A szavak kzti tmenetek a
bigram modell szerinti valsznsggel kvetkeznek be.
Ha ellltottuk az egyestett RMM-modellt, akkor a felhasznlsval elemezhetjk a folytonos beszdjelet.
Klnsen a (15.9) egyenletben megadott Viterbi-algoritmusnak vehetjk hasznt a legvalsznbb
llapotsorozat megtallsban. Ebbl az llapotsorozatbl mr kinyerhet a szsorozat egyszeren az llapotok
szcmkinek kigyjtsvel. gy a Viterbi-algoritmus a szszegmentls problmjt gy oldja meg, hogy
dinamikus programozst felhasznlva (valjban) egyszerre figyelembe veszi az sszes lehetsges szsorozatot
s szhatrt.
Vegyk szre, hogy nem azt mondtuk, hogy kinyerhet a legvalsznbb szsorozat. A legvalsznbb
szsorozat nem szksgkppen az, ami a legvalsznbb llapotsorozatot tartalmazza. Ez amiatt van gy, mert
egy szsorozat valsznsge az sszes olyan llapotszekvencia valsznsgnek sszege, amely konzisztens
ezzel a szsorozattal. Kt szsorozatot sszehasonltva, mondjuk a back s aback szsorozatokat,
elfordulhat, hogy tz alternatv llapotsorozat van az a back-hez, ezek mindegyike 0,03 valsznsggel, de
csak egyetlen llapotsorozat az aback-hez, viszont 0,20 valsznsggel. A Viterbi-algoritmus az aback-t
vlasztja, pedig az a back valjban valsznbb.
A gyakorlatban ez a nehzsg nem letveszlyes, de elg komoly ahhoz, hogy ms mdszereket is
kiprbljanak. A legltalnosabb vlaszts az A* dekdol (A* decoder), ami lelemnyesen hasznlja fel az
A* keresst (lsd 4. fejezet) a legvalsznbb szsorozat megtallsban. Az tlet az, hogy minden szsorozatot
egy olyan grfon tvezet tnak fogunk fel, aminek a csompontjai a szavakkal vannak felcmkzve. Egy
csompont gyermekei az sszes olyan sz, amelyek utna kvetkezhetnek; gy az szszes n hosszsg vagy
rvidebb mondathoz tartoz grfnak n szintje van, mindegyik W szlessg, ahol W a lehetsges szavak szma.
A bigram modellnl a w1 s w2 cmkj csompontok kzti nylhoz rendelt g(w1,w2) kltsget a logP(w2|w1)
definilja. Ekkor egy sorozat teljes tkltsge
Az tkltsg ezen defincija mellett, a legrvidebb t megtallsa pontosan megegyezik a legvalsznbb

szsorozat megtallsval. A keress hatkonysghoz egy j h(wi) heurisztika is szksges a szsorozat
befejezshez szksges kltsg megbecslsre. Nyilvnvalan ennek fknt a beszdjelnek ahhoz a rszhez
kell kapcsoldnia, amit a jelenlegi ton fekv szavak mg nem fedtek le. Eddig mg nem szletett klnsebben
rdekes heurisztika erre a problmra.
6.4. Egy beszdfelismer ptse

Egy beszdfelismer rendszer minsge az sszes rsznek a minsgtl fgg a nyelvi modelltl, a
szkiejtsi modelltl, a beszdhangmodelltl s a jelfeldolgoz algoritmusoktl, amelyek a spektrlis jegyeket
506
kinyerik az akusztikus jelbl. Megtrgyaltuk, hogyan hozhatunk ltre egy nyelvi modellt, s a jelfeldolgozs
rszletei ms knyvekben is megtallhatk. gy mr csak a kiejtsi s a beszdhangmodellek maradnak. A
kiejtsi modellek struktrja mint a paradicsom modelljei a 15.19. brn ltalban kzi fejleszts. Nagy
fonetikai sztrak most mr elrhetk angol s ms nyelvekhez, br a pontossguk nagymrtkben vltozik. A
hromllapot beszdhangmodell struktrja minden beszdhangra ugyanaz, mint a 15.20. brn lthat. gy
mr csak a valsznsgek maradnak. Honnan szerezhetk be ezek, klnsen hogy a modellek paramterek
szzezreit vagy akr milliit is ignyelhetik?
Az egyetlen elfogadhat mdszer a modellek tanulsa valdi beszdadatbl, amibl bizonyosan nincsen hiny.
A kvetkez krds a tanuls mikntje. A teljes vlaszt a 20. fejezetben adjuk meg, de a f elkpzelseket itt is
bemutathatjuk. Gondoljuk t a bigram nyelvi modellt; ennek megtanulst mr elmagyarztuk, ami a szprok
gyakorisgnak a vizsglatn alapult valdi szvegben. Megtehet ugyanez mondjuk a beszdhangok tmenetvalsznsgeire is a kiejtsi modellben? A vlasz igen, de csak akkor, ha valaki veszi a fradsgot, s
vgigjegyzeteli az sszes elfordul szt a helyes beszdhangsorozattal. Ez egy bonyolult s szmos
hibalehetsget magban rejt feladat, de nhny standard adathalmazra elvgeztk, amelyek tbb rs beszdet
tartalmaznak. Ha ismerjk a beszdhang-szekvencit, akkor a kiejtsi modell tmenet-valsznsgeit
megbecslhetjk a beszdhangprokbl. Hasonlan, ha minden keretre ismert a beszdhangllapot egy mg
gytrelmesebb kzi felcmkzs eredmnyekppen akkor megbecslhetjk a beszdhangmodell tmenetvalsznsgeit is. Ha minden keretben ismerjk a beszdhangllapotot s az akusztikus jegyeket, akkor pedig
megbecslhetjk az akusztikai modellt, akr kzvetlenl a gyakorisgokbl (a VK modellek esetben) vagy
statisztikai illesztsi mdszerekkel (a Gauss-modellek keverke esetben; lsd 20. fejezet).
Fontos
A kzi cmkzs adatnak a kltsge s a ritkasga, illetve az a tny, hogy az elrhet kzi cmkzs
adathalmazok nem felttlenl reprezentljk a beszlk s az akusztikus felttelek azon tpusait,
amelyek egy j beszdfelismersi feladatban fellpnek, ezt a megkzeltst buksra tlik. Szerencsre
a vrhatrtk-maximalizls vagy EM algoritmus (expectation-maximization, EM) anlkl is
megtanulja az RMM tmenetvalsznsgeit s rzkel modelljeit, hogy cmkzett adatot hasznlna.
Kzi cmkzs adatokbl szrmaz becslseket felhasznlhatunk a modell kezdeti belltsra; ezutn
az EM kvetkezik, s betantja a modellt az ppen aktulis feladatra. Az tlet egyszer: egy adott
RMM s egy megfigyelssorozat esetn, felhasznlhatjuk a 15.2. s a 15.3. alfejezet simt
algoritmusait az egyes llapot-valsznsgek kiszmtsra minden idpontban, illetve egy egyszer
kiterjesztssel az llapot-llapot prok valsznsgt is az egymst kvet idpontokban. Ezeket a
valsznsgeket felfoghatjuk bizonytalan cmkknek. A bizonytalan cmkkbl megbecslhetnk j
tmenet- s rzkelsi valsznsgeket, majd az EM eljrs megismtldik. A mdszer minden
iterciban bizonytottan nveli a modell adathoz val illeszkedst, s ltalban a kezdetben belltott
kzi cmkzs becslsek rtkeinl, a paramterrtkek egy sokkal jobb halmazhoz konvergl.
A legkorszerbb beszdfelismer rendszerek risi adathalmazokat s hatalmas szmtsi erforrsokat
hasznlnak fel a modelljeik tantshoz. Egyedlll szfelismersnl, j akusztikus felttelekkel (httrzaj s
visszhang nlkl), egy nhny ezres sztrnl s egy beszl esetn, a pontossg 99% feletti lehet. Folytonos
beszdfelismersnl s tbb klnfle beszl esetn, a 6080%-os pontossg az ltalnos, mg j akusztikus
krlmnyek esetn is. Httrzajnl s telefonos tvitelnl a pontossg tovbb romlik. Br az zembe helyezett
rendszerek vtizedek ta javulnak, szmos tlet mg kidolgozsra vr.
7. sszefoglals
Ez a fejezet az brzols s a kvetkeztets ltalnos problmjt trgyalta idbeli valsznsgi folyamatok
esetben. A legfbb pontok a kvetkezk:
A vilg vltoz llapott valsznsgi vltozk halmaznak a felhasznlsval kezeljk, amelyek az
llapotot brzoljk minden idpontban.
Kidolgozhatk olyan reprezentcik, amelyek eleget tesznek a Markov-tulajdonsgnak (Markov property),
nevezetesen, hogy a jv fggetlen a mlttl a jelen ismeretben. Ez egyttesen a folyamat stacionaritsnak
(stationary) feltevsvel azaz azzal, hogy a dinamika az idvel nem vltozik nagyban egyszersti a
reprenzentcit.
507
Egy idbeli valsznsgi modellt felfoghatunk egy llapottmenet-modell (transition model) s egy
rzkel modell (sensor model) egyttesnek, ahol az els az llapot alakulst, a msodik pedig a
megfigyels folyamatt rja le.
Idbeli modellekben az alapvet kvetkeztetsi feladatok a szrs (filtering), az elrejelzs (prediction), a
simts (smoothing) s a legvalsznbb magyarzat kiszmtsa (most likely explanation). Ezek
mindegyike elvgezhet egyszer, rekurzv algoritmusokkal, melyek futsi ideje a szekvencia hosszban
lineris.
Idbeli modellek hrom csaldjt tanulmnyoztuk rszletesebben: a rejtett Markov-modelleket (hidden
Markov modell), a Kalman-szrket (Kalman filters), s a dinamikus Bayes-hlkat (dynamic Bayesian
networks) (ami magban foglalja a msik kettt, mint specilis esetet).
A beszdfelismers (speech recognition) s a kvets (tracking) az idbeli valsznsgi modellek kt
fontos alkalmazsi terlete.
Hacsak nincsenek specilis felttelezseink, mint a Kalman-szrknl, egzakt kvetkeztets tbb
llapotvltoz esetn nem kivitelezhet. A gyakorlatban a rszecskeszr (particle filtering) algoritmus
tnik egy hatkony kzelt algoritmusnak.

Szmos alaptlet dinamikus rendszerek llapotnak a becslsre a matematikus C. F. Gausstl szrmazik, aki
egy determinisztikus legkisebb-ngyzeteken alapul algoritmust alkotott meg az gitestek plyjnak a
megbecslsre csillagszati megfigyelsekbl (Gauss, 1809). Az orosz matematikus A. A. Markov fejlesztette ki
a ksbb rla elnevezett Markov-felttelezst a sztochasztikus folyamatokat vizsglva; az elsrend Markovlncot maga Markov alkalmazta elszr a Jevgenyij Anyegin szvegnek betszekvencia-elemzsnl (Markov,
1913). Jelents titkostott munka folyt a szrs problmjn a msodik vilghbor alatt folytonos idej
folyamatok esetben (Wiener, 1942) s diszkrt idej folyamatoknl is (Kolmogorov, 1941). Br ez a munka
fontos technikai fejldst eredmnyezett a kvetkez 20 vben, a felhasznlt frekvenciatartomnybeli
reprezentci tbb szmtst is elg nehzkess tett. A sztochasztikus folyamatok kzvetlen llapottrbeli
modellezse egyszerbbnek bizonyult, ahogy azt Swerling s Kalman munki megmutattk (Swerling, 1959;
Kalman, 1960). Az utbbi munka vezette be a most Kalman-szrsnek nevezett technikt elrefel
kvetkeztets elvgzsre lineris rendszerekben Gauss-zaj mellett. Rauch s trsai fontos eredmnyeket rtek
el a simtshoz kapcsoldan, a megkapan elnevezett RauchTungStriebel-simts mg ma is
szabvnytechnika (Rauch s trsai, 1965). Szmos korai eredmnyt gyjtttek ssze a (Gelb, 1974)
kiadvnyban. Bar-Shalom s Fortmann egy modernebb trgyalst knl bayesi vonsokkal, mikzben szmos
hivatkozst is ad a hatalmas mennyisg szakirodalomra (Bar-Shalom s Fortmann, 1988). Chatfield az idsor
analzis klasszikus megkzeltst fedi le (Chatfield, 1989).
A Kalman-szrs szmos alkalmazsban nem csak a bizonytalan rzkelssel s a dinamikval kell
foglalkozni, hanem bizonytalan azonostssal is; azaz ha tbb objektumot kell megfigyelni, a rendszernek meg
kell hatrozni, hogy melyik megfigyelst melyik objektum generlta, mieltt az llapotbecslseket
felfrissthetn. Ez az adattrsts (data association) problmja (Bar-Shalom s Fortmann, 1988; Bar-Shalom,
1992). Azon esetben, amikor n megfigyels s n kvets van (ami egy igen szeld eset), a megfigyelsek n!
lehetsges mdon rendelhetk a kvetsekhez; a helyes valsznsgi kezels mindet figyelembe venn, ami
megmutathatan NP-teljes (Cox, 1993; Cox s Hingorani, 1994). Az MCMC-alap polinom idej kzelt
mdszerek gy tnik, jl mkdnek a gyakorlatban (Pasula s trsai, 1999). rdekes, hogy az adattrsts
problmja egy elsrend nyelvben vgzett valsznsgi kvetkeztets egy esete; a legtbb valsznsgi
kvetkeztetsi problmtl eltren, amelyek tisztn tletlogikai szinten vannak, az adattrsts objektumokat
s azonossgi relcit foglal magban. Ezrt kzvetlenl kapcsoldik a 14. fejezetben emltett elsrend
valsznsgi nyelvekhez. j kutatsok megmutattk, hogy ltalban az azonossg feletti rvels s konkrtan
az adattrsts elvgezhet az elsrend valsznsgi keretben (Pasula s Russell, 2001).
A rejtett Markov-modellt s a kapcsold kvetkeztet s tanul algoritmusokat, belertve az elre-htra
algoritmust, Baum s Petrie fejlesztettk ki (Baum s Petrie, 1966). Ettl fggetlenl hasonl tletek
megjelentek a Kalman-szrssel foglalkoz kutatsnl is (Rauch s trsai, 1965). Az elre-htra algoritmus volt
az egyik f elzmnye az EM algoritmus ltalnos megfogalmazsnak (Dempster s trsai, 1977); lsd mg 20.
fejezet. Az lland idej simts Bindernek s munkatrsainak a munkjban jelenik meg, csakgy mint az
oszd meg s uralkodj algoritmus, amit a 15.3. feladatban mutatunk be (Binder s trsai, 1997b).
508
A dinamikus Bayes-hlkra tekinthetnk gy, mint a Markov-folyamatok egy ritka kdolsra, s az MI-n bell
elsknt a kvetkez munkkban hasznltk fel: (Dean s Kanazawa, 1989b; Nicholson, 1992; Kjaerulff, 1992).
A legutbbi munkk egyike a Hugin Bayes-hls rendszer ltalnos kiterjesztse, ami dinamikus Bayes-hlk
generlshoz s szerkesztshez biztostja a szksges eszkzket. A dinamikus Bayes-hlk npszerv
vltak klnbz komplex mozgsi folyamatok modellezsre a szmtgpes lts terletn (Huang s trsai,
1994; Intille s Bobick, 1999). A kapcsolatot az RMM-k s a DBH-k kztt, illetve az elre-htra algoritmus s
a Bayes-hls terjeszts kztt Smyth s trsai tisztztk (Smyth s trsai, 1997). Egy tovbbi egyesgests a
Kalman-szrkkel (s ms statisztikai modellekkel) Roweis s Ghahramani munkjban jelenik meg (Roweis s
Ghahramani, 1999).
A 15.5. fejezetben lert rszecskeszr algoritmusnak klnsen rdekes trtnete van. Az els szrsre
szolgl mintavteli algoritmus a szablyozselmlet terletn szletett (Handschin s Mayne, 1969), s az
jramintavtelezs tlete, ami a rszecskeszrs kzponti eleme egy szablyozstechnikval foglalkoz orosz
folyiratban jelent meg (Zaritskii s trsai, 1975). Ksbb tbbszr jra felfedeztk: a statisztika terletn mint
szekvencilis fontossgi mintavtelezs jramintavtelezs (SUFM) (sequential importance-sampling
resampling, SIR) (Rubin, 1988; Liu s Chen, 1998), a szablyozselmlet terletn mint rszecskeszrs
(Gordon s trsai, 1993; Gordon, 1994), a mestersges intelligencia terletn mint a legjobb tllse (survival
of the fittest) (Kanazawa s trsai, 1995) s a szmtgpes ltsban mint srts (condensation) (Isard s
Blake, 1996). Kanazawa munkja egy javtst is tartalmazott, az gynevezett bizonytkmegfordtst (evidence
reversal), ami ltal a t + 1 idpontban az llapot mintavtelezse a t idpontbeli llapot s a t + 1 idpontbeli
bizonytk felttelek mellett trtnik (Kanazawa s trsai, 1995). Ez lehetv teszi, hogy a bizonytk
kzvetlenl befolysolja a mintk generlst s bizonytottan cskkenti a kzeltsi hibt (Doucet, 1997).
A kzelt szrsre szolgl mdszerek kztt talljuk a lecseng MCMC (decayed MCMC) algoritmust
(Marthi s trsai, 2002) s a faktorizlt kzelts mdszert Boyen s trsaitl (Boyen s trsai, 1999). Mindkt
mdszer rendelkezik azzal a fontos tulajdonsggal, hogy a kzeltsi hiba nem n az idvel. Varicis
technikkat (lsd 14. fejezet) szintn fejlesztettek ki idbeli modellekre. Ghahramani s Jordan egy kzelt
algoritmust ismertet faktorilis RMM-kre, gy olyan DBH-ra, amiben kt vagy tbb fggetlenl fejld Markovlnc egy kzs megfigyelsi folyammal van sszekapcsolva (Ghahramani s Jordan, 1997). Jordan s trsai
szmos ms alkalmazst is trgyalnak (Jordan s trsai, 1998). A keversi idk tulajdonsgait Pak, valamint
Luby s Vigoda trgyalja (Pak, 2001; Luby s Vigoda, 1999).
A beszdfelismers strtnete az 1920-as vekben kezddtt Radio Rexszel, a hangvezrls jtk kutyval.
Rex ugrlt az 500 Hz krli hangfrekvencikra vlaszul, ami az [eh] magnhangzhoz tartozik a Rex!-ben.
Kiss komolyabb munka a msodik vilghbor utn kezddtt. Az AT&T Bell Labsnl egy rendszert ptettek
egyedlll szmjegyek felismersre akusztikus jellemzk egyszer mintaillesztsvel (Davis s trsai, 1952).
A beszdhang tmenet-valsznsgeket elszr egy, a londoni University College-ban ptett rendszerben
hasznltak (Fry, 1959; Denes, 1959). 1971-ben az Egyeslt llamok Vdelmi Minisztriumnak Kutatsi
gynksge (Defense Advanced Research Project Agency, DARPA) ngy tves kutatsi tervet kezdett el
finanszrozni, hogy nagy teljestmny beszdfelismer rendszereket fejlesszenek ki. A gyztes, s egyben az
egyetlen rendszer, ami az 1000 szavas sztron a kitztt 90%-os pontossgot elrte, a HARPY rendszer volt a
CMU-rl (Lowerre, 1976; Lowerre s Reddy, 1980). 9 A HARPY vgs vltozatt egy DRAGON nev rendszerbl
szrmaztattk, amit egy CMU-s dik, James Baker ptett (Baker, 1975). A DRAGON volt az els rendszer, ami
RMM-eket hasznlt beszdre. Majdnem egy idben Jelinek az IBM-nl kifejlesztett egy msik RMM-alap
rendszert (Jelinek, 1976). Ettl az idponttl kezdve, a valsznsgi mdszerek ltalban is, de az RMM-ek
klnsen egyre inkbb dominltk a beszdfelismers kutatst s fejlesztseit. Az utbbi veket a gyarapod
fejlds, a nagyobb adathalmazok s modellek, s a szigorbb verseny realisztikusabb beszdhelyzeteken
jellemzi. Egyes kutatk megvizsgltk a DBH-k felhasznlsnak lehetsgt az RMM-ek helyett, azzal a cllal,
hogy a DBH-k nagyobb kifejezerejt kihasznlva a beszdkpz szervek komplex rejtett llapotbl tbbet
tudjanak megragadni (Zweig s Russell, 1998; Richardson s trsai, 2000).
A beszdfelismershez j bevezet irodalom (Rabiner s Juang, 1993; Jelinek, 1997; Gold s Morgan, 2000;
Huang s trsai, 2001). A tmhoz tartoz fontos cikkek gyjtemnye (nhny ttekint cikket is belertve)
(Waibel s Lee, 1990). Jelen fejezet anyagt Kay, Gawron s Norvig ttekint munkjra (Kay s trsai, 1994),
valamint Jurafsky s Martin egyik knyvre alapoztuk (Jurafsky s Martin, 2000). A beszdfelismersrl
kutatsi eredmnyeket kzlnek a Computer Speech and Language, a Speech Communication s az IEEE
A versenyben msodikknt vgz rendszernek, a HEARSAYII-nek az MI ms gaira volt nagy hatsa, mert a tblaarchitektrt
(blackboard architecture) hasznlta (Erman s trsai, 1980). Ez egy szablyalap szakrti rendszer volt, tbb tbb-kevsb fggetlen
modulris tudsforrssal (knowledge source) rendelkezett, amelyek egy kzs tbla (blackboard) rvn kommunikltak egymssal,
olvashattak a tblrl s rhattak r. A tblaarchitektrt hasznl rendszerek a modern felhasznli felletek architektrinak az alapjai.
9
509
Transactions on Acoustics, Speech, and Signal Processing folyiratok, valamint a DARPA Workshops on
Speech and Natural Language Processing kiadvnyok, tovbb a Eurospeech, az ICSLP s az ASRU
konferencik kiadvnyai.
7.2. Feladatok
15.1.
Mutassa meg, hogy brmely msodrend Markov-folyamatot t lehet rni elsrend Markov-folyamatt az
llapotvltozknak egy megnvelt halmazt hasznlva. Megtehet-e ez mindig takarkosan, azaz az
llapottmenet-modellt megad paramterek szmnak a nvelse nlkl?
15.2.
Ebben a feladatban azt vizsgljuk, hogy mi trtnik a valsznsgekkel az esernys vilgban, ha az idsorok
hossza a vgtelenbe tart.
a. Ttelezzk fel, hogy a napok olyan vgtelen sort figyeljk meg, amikor az eserny mindig feltnik. Mutassa
meg, hogy a napok mlsval az es valsznsge az aktulis napon monoton nvekszik egy hatrrtkhez.
Szmtsa ki ezt a hatrrtket.
b. Most gondolja t az elrejelzs-t az egyre tvolabbi jvben, csupn a kt els eserny megfigyels
ismeretben. Elszr szmolja ki a P(R2+k |U1, U2) valsznsget k = 120 esetn, s brzolja az
eredmnyeket. A valsznsgnek lthatan konverglnia kell egy hatrrtkhez. Szmtsa ki a hatrrtk
pontos rtkt.
15.3.
Ez a feladat a 15.4. brn lert elre-htra algoritmus egy trtakarkos vltozatt fejleszti ki. A P(Xk|e1:t)
valsznsget szeretnnk kiszmtani k = 1, , t-re. Ezt egy oszd meg s uralkodj sma szerint vgezzk el.
a. Ttelezzk fel az egyszersg kedvrt, hogy t pratlan, s legyen a felezpont h = (t + 1) /2. Mutassa meg,
hogy P(Xk|e1:t) kiszmthat k = 1, , h esetn csupn az f1:0 kezd elrefel zenetet, a bh+1:t visszafel
zenetet s az e1:h bizonytkokat ismerve.
b. Mutassa meg, hogy a sorozat msodik felre is fennll egy hasonl eredmny.
c. Az (a) s (b) eredmnyek ismeretben egy rekurzv oszd meg s uralkodj algoritmust lehet ltrehozni,
elszr elrefel haladva a sorozaton s aztn visszafel a vgtl, csak a szksges zeneteket trolva
kzpen s a vgeken. Aztn az algoritmus lefut mindkt flre. rja le az algoritmust rszletesen.
d. Szmtsa ki az algoritmus tr- s idkomplexitst a sorozat hossznak, t-nek a fggvnyben. Hogyan
vltozik ez, ha felosztjuk a bemenetet kt rszre?
15.4.
A 2.3. szakasz - A legvalsznbb sorozat megtallsa rszben vzoltunk egy hibs eljrst a legvalsznbb
llapotszekvencia megtallsra egy adott megfigyelsi szekvencia esetn. Az eljrs azon alapul, hogy
megkeresi a legvalsznbb llapotokat minden egyes idpontra, s visszaad egy ezen llapotokbl ll
sorozatot. Mutassa meg, hogy bizonyos idbeli valsznsgi modellekre s megfigyelsi sorozatokra, ez az
eljrs egy lehetetlen llapotsorozatot ad vissza (azaz amely sorozatnak az a posteriori valsznsge nulla).
15.5.
Gyakran szeretnnk megfigyelni egy olyan folytonos llapot rendszert, aminek a viselkedse
megjsolhatatlanul vlt k klnbz md kztt. Pldul egy replgp egy rakta elkerlse kzben
klnbz manvereket hajthat vgre, melyeket a rakta megprblhat kvetni. Egy ilyen vlt Kalman-szr
Bayes-hl reprezentcija a 15.22. brn lthat.
a. Ttelezzk fel, hogy az St diszkrt llapotnak k lehetsges rtke van, illetve, hogy a P(X0) a priori folytonos
llapotbecsls egy tbbvltozs Gauss-eloszls. Mutassa meg, hogy a P(X1) elrejelzs Gauss-eloszlsok
510
keverke (mixture of Gaussians) azaz Gauss-eloszlsok slyozott sszege, ahol a slyok 1-re
sszegzdnek.
b. Mutassa meg, hogy ha a jelenlegi folytonos llapot becslse, P(Xt|e1:t), m Gauss-eloszls keverke, akkor
ltalnos esetben a P(Xt+1|e1:t+1) frisstett llapotbecsls km Gauss-eloszls keverke lesz.
c. Az idbeli folyamatnak milyen jellegt reprezentljk a slyok a Gauss-keverkben?
Az (a) s (b) eredmnyek egytt azt mutatjk, hogy az a posteriori eloszls reprezentcija korltozs nlkl n,
mg a vlt Kalman-szrk esetben is, amelyek a legegyszerbb hibrid dinamikus modellek.
15.6.
Ptolja a hinyz lpst a (15.17) egyenlet levezetsben, az els frisstsi lpst az egydimenzis Kalmanszrnl.
15.7.
Vizsgljuk meg a szrsngyzet-frissts alakulst a (15.18) egyenletben.
a. brzolja a t2 rtkt a t fggvnyben, adott x2 s z2 rtkek mellett.
b. Mutassa meg, hogy a frisstsnek ltezik egy 2 hatrrtke gy, hogy t esetn t2 2, s szmtsa ki
ezt a 2 rtket.
c. Adjon kvalitatv magyarzatot arra, hogy mi trtnik, ha x2 0 s z2 0.
15.8.
Mutassa meg, hogyan reprezentlna egy RMM-et egy rekurzv relcis valsznsgi modellknt, amint azt a
14.6. fejezetben javasoltuk.
15.22. bra - Egy vlt Kalman-szr Bayes-hl reprezentcija. Az St vlt vltoz

egy diszkrt llapotvltoz, aminek az rtke meghatrozza az Xt folytonos
llapotvltozk tmeneti modelljt. Minden i diszkrt llapotra a P(Xt+1|Xt, St = i)
llapottmenet-modell egy lineris Gauss-modell, pontosan gy, mint egy szablyos
Kalman-szrben. A diszkrt llapotok kzti P(St+1|St) llapottmenet-modellt egy
mtrixnak tekinthetjk, ahogyan egy rejtett Markov-modellben.
511
15.9.
Ebben a feladatban rszletesebben elemezzk az akkumultorrzkel tartshiba-modellt (lsd 15.13. (a) bra).
a. A 15.13. (b) bra vget r t = 32-nl. rja le kvalitatvan, mi trtnik t esetn, ha az rzkel tovbbra is
0-t mutat.
b. Tegyk fel, hogy a kls hmrsklet befolysolja az akkumultor rzkeljt, mghozz olyan mdon, hogy
a hmrsklet emelkedsvel az tmeneti hibk valsznbbekk vlnak. Mutassa meg, hogyan egszten ki
a 15.13. (a) bra DBH-struktrjt, s magyarzza el az esetlegesen szksges vltoztatsokat az FVT-kben.
c. Az j hlstruktra esetn felhasznlhatja-e a robot az akkumultormrseket az aktulis hmrsklet
kikvetkeztetsre?
15.10.
Gondoljuk meg a vltoz eliminls algoritmusnak az alkalmazst az esernys DBH hrom szeletre trtn
kibontsa esetn a P(R3|U1, U2, U3) krds megvlaszolsra. Mutassa meg, hogy az algoritmus komplexitsa a
legnagyobb tnyez mrete ugyanaz, fggetlenl attl, hogy az es vltozkat elrefel vagy visszafel
sorrendben eliminljuk.
15.11.
A 15.19. bra tomato modellje megengedi a koartikulcit az els magnhangzn kt lehetsges beszdhangot
knlva fel. Egy alternatv megkzelts a hromllapot modell hasznlata, amelyben az [ow(t,m)] beszdhang
automatikusan magban foglalja a magnhangz vltozst. Rajzoljon egy teljes hromllapot modellt a
tomato-ra, idertve a tjszlsos vltozatokat.
15.12.
Szmolja ki a legvalsznbb utat a 15.20. bra RMM-n keresztl a [C1, C2, C3, C4, C5, C6, C7] kibocstsi
sorozat esetn. Adja meg ennek valsznsgt is.
512
16. fejezet - Egyszer dntsek

meghozatala
Ebben a fejezetben lthatjuk, hogyan kell egy gensnek dntseket gy meghoznia, hogy elrje, amit akar az
esetek nagy rszben legalbbis.
Ebben a fejezetben visszatrnk a hasznossgelmlet gondolathoz, amit a 13. fejezetben vezettnk be.
Megmutatjuk a hasznossgelmletnek a valsznsg-szmtssal val sszekapcsolst egy dntselmleti
gens ltrehozshoz, amely a meggyzdseinek s clkitzseinek megfelel racionlis dntseket kpes
hozni. Az ilyen gensek kpesek dntseket hozni olyan esetekben is, amikor a bizonytalansg s az ellenttes
clok egy logikai gens szmra nem tennk lehetv a dntst. Egy clorientlt gens valjban az llapotokat
kt csoportba, egy j (cl) s egy rossz (nem cl) csoportba sorolja be, mg egy dntselmleti gens az
llapotok jsgt egy folytonos mrtkkel fejezi ki.
A 16.1. alfejezet a dntselmlet alapvet elveit vezeti be: a vrhat hasznossg maximlst. A 16.2. alfejezet
megmutatja, hogy brmely racionlis gens viselkedse lerhat egy hasznossgfggvny felttelezsvel s egy
azon alapul maximlssal. A 16.3. alfejezet rszletesebben megvizsglja a hasznossgfggvny tulajdonsgait,
klnsen ezek kapcsolatt olyan egyedi mennyisgekhez, mint a pnz. A 16.4. alfejezet ismerteti, hogyan lehet
a tbb mennyisgtl fgg hasznossgfggvnyeket kezelni. A 16.5. alfejezet lerja a dntshoz rendszerek
megvalstst. Nevezetesen, bevezetjk a dntsi hlzatok (decision networks) formalizmust ms nven
hatsdiagramot, (influence diagram) , ami kiterjeszti a valsznsgi hlzatokat, hogy a cselekvseket s
a hasznossgokat is tudjk kezelni. A fejezet tbbi rsze azokat a krdseket vizsglja, amelyek a
dntselmletnek a szakrti rendszerekkel kapcsolatos alkalmazsakor lpnek fel.
1. Meggyzdsek s kvnsgok sszekapcsolsa

bizonytalansg esetn
Arnauld francia filozfus az 1662-ben rt Port-Royal Logic c. mvben azt rta, hogy
Annak megtlshez, hogy valaki elrje a jt, s elkerlje a gonoszt, nemcsak a jt s a gonoszt kell nmagban
megfontolni, hanem annak valsznsgt is, hogy ezek megtrtnnek-e vagy sem; s azt az arnyt kell
megnzni, amely ezek egytteshez tartozik.
A kortrs tudomnyos szvegek inkbb hasznossgrl beszlnek, mint jrl s gonoszrl, de az elvek
ugyanazok. Az gens preferenciit a vilg llapotai kztt egy hasznossgfggvny (utility function) adja
meg, ami az egyes llapotok kvnatossgnak kifejezsre minden llapothoz egyetlen szmot rendel. A
hasznossgokat a cselekedetek kvetkezmnyeinek a valsznsgvel kombinlva kapjuk az egyes
cselekedetekhez tartoz vrhat hasznossgot.
Egy S llapotnak a dntst meghoz gens szempontja szerinti hasznossgra az U(S) jellst fogjuk hasznlni.
Mostani vizsgldsunknl az llapotokat a vilg teljes pillanatfelvteleinek fogjuk tekinteni, hasonlan a 10.
fejezetben szerepl szitucikhoz (situations). Br ez egyszersti a kezdeti fejtegetsnket, a hasznossg
definilsa minden egyes llapotra kln-kln elg nehzkess vlhat. A 16.4. alfejezetben ltni fogjuk, hogy
az llapotok hogyan bonthatk fel bizonyos krlmnyek kztt a hasznossg hozzrendelse rdekben.
Egy nemdeterminisztikus A cselekvsnek az Eredmnyi(A) llapotok a lehetsges kvetkezmnyei, ahol az i
index a klnbz kvetkezmnyeken fut vgig. Az A vgrehajtsa eltt az gens egy P(Eredmnyi(A)|Tesz(A),
E) valsznsget rendel minden egyes kvetkezmnyhez, ahol az E az gens ltal a vilgrl elrhet tnyeket
jelli, s a Tesz(A) egy llts, hogy az A cselekvs vgrehajtdik a jelenlegi llapotban. Ekkor a kvetkez
formulval kiszmthatjuk a cselekvs EU(A|E) vrhat hasznossgt (expected utility) adott tnyek esetn:
A maximlis vrhat hasznossg (MVH) (maximum expected utility, MEU) elve azt mondja ki, hogy egy
racionlis gensnek azt a cselekvst kell vlasztania, ami maximalizlja az gens vrhat hasznossgt. Ha
cselekvsek egy legjobb sorozatt szeretnnk kivlasztani ennek az egyenletnek a felhasznlsval, akkor az
513
Egyszer dntsek meghozatala
sszes lehetsges cselekvssorozatot szmba kellene venni, s a legjobbat kivlasztani, ami hossz sorozatok
esetn nyilvnvalan nem lehetsges. Ezrt ez a fejezet egyszer dntsekre (ltalban egyetlen cselekvsre
vonatkoz dntsekre) koncentrl, s a kvetkez fejezet mutat be j technikkat cselekvssorozatok hatkony
kezelsre.
Bizonyos rtelemben az MVH-elv felfoghat a teljes MI meghatrozsnak. Hiszen egy intelligens gensnek
mindssze annyit kell tennie, hogy kiszmtja a klnfle mennyisgeket, maximalizlja a hasznossgot a
cselekvsei felett, s ksz. m ez nem jelenti, hogy ezzel a defincival az MI problmakre meg lenne oldva!
mbr az MVH-elv brmely dntsi helyzet esetn meghatrozza a helyes cselekvst, a szksges szmtsok
lehetnek kivitelezhetetlenek, s nha maga a problma megfogalmazsa is bonyolult. A vilg kezdeti
llapotnak ismerete rzkelst, tanulst, tudsreprezentcit s kvetkeztetst ignyel. A
P(Eredmnyi(A)|Tesz(A), E) kiszmtsa a vilg teljes okozati modelljt ignyli, s ahogyan azt a 14.
fejezetben lttuk NP-teljes szmtst a valsznsgi hlzatokban. Az egyes llapotok U(Eredmnyi(A))
hasznossgnak a kiszmtsa gyakran keresst vagy tervezst ignyel, mivel az gens nem tudja, hogy egy
llapot mennyire j addig, ameddig nem tudja, hogy hova is kerlhet ebbl az llapotbl. gy a dntselmlet
nem csodaszer, ami megoldja az MI-problmt. Msrszrl azonban, ez egy olyan keretet ad, amelyben
ttekinthet egy MI-rendszer sszes rsznek a beilleszkedse.
Fontos
Az MVH-elv egyrtelmen kapcsoldik a 2. fejezetben felvetett teljestmnymrtkek elkpzelshez.
Az alaptlet nagyon egyszer. Tekintsk azokat a lehetsges krnyezeteket, amelyek rzkelssel s
memrival rendelkez genseket tesznek lehetv, s gondoljuk t azt, hogy milyen lehetsges
genseket tudnnk tervezni. Ha egy gens maximalizlja a hasznossgfggvnyt, s az helyesen
tkrzi a teljestmny mrtkt, amivel a viselkedst megtlik, akkor ez a lehet legmagasabb
teljestmnypontszmot ri el, ha a hasznossgot azon lehetsges krnyezetek felett tlagoljuk,
amelyekbe az gens kerlhet. Ez az alapvet igazolsa az MVH-elvnek. Br az llts tautolginak
tnhet, valjban nagyon fontos tmenetet jelent a racionalits globlis, kls kritriumaitl a
mltbeli krnyezetek felett vett teljestmnytl egy loklis, bels kritriumig, ami a kvetkez
llapotra vonatkoz hasznossgfggvny maximalizlst jelenti.
Ebben a fejezetben csak az egyszeri vagy egylpses dntsekkel (one-shot decisions) foglalkozunk, br a 2.
fejezet a teljestmnymrtkeket a mltbeli krnyezetek felett definilja, amelyek ltalban szmos dntst
tartalmaznak. A kvetkez fejezetben, ami a szekvencilis dntsekkel (sequential decisions) foglalkozik,
megmutatjuk, hogy ez a kt nzet hogyan bkthet ssze.
2. A hasznossgelmlet alapjai
Rnzsre az MVH-elv sszer mdszernek ltszik dntsek meghozatalra, de az nem vilgos, hogy vajon ez-e
az egyetlen lehetsg. Vgl is, a hasznossg tlagnak maximlsa mirt is lenne olyan klnleges? Mirt nem
maximalizljuk a lehetsges hasznossgok kbeinek sszegt, vagy mirt nem minimalizljuk a lehetsges
vesztesgek maximumt? Hasonlan, mirt nem cselekedhet az gens racionlisan, ha csupn az llapotok
kztti preferenciit rgzten, s nem rendelne hozzjuk numerikus rtket? Vgl, egyltaln mirt kell
lteznie egy megkvetelt tulajdonsgokkal rendelkez hasznossgfggvnynek? Taln egy racionlis gensnek
olyan bonyolult a preferenciarendszere, hogy azt nem lehet ilyen egyszeren az egyes llapotokhoz rendelt vals
szmokkal kifejezni.
2.1. Megktsek a racionlis preferencikra

Ezek a krdsek megvlaszolhatk, ha lerjuk a preferencikra vonatkoz azon megktseket, amelyekkel egy
racionlis gensnek rendelkeznie kell, majd ezutn megmutatjuk, hogy az MVH-elv ezekbl a megktsekbl
levezethet. Az gens preferenciit a kvetkez jellssel rjuk le:
A B A preferlt B-hez kpest
A B az gens egyformn preferlja A-t s B-t
A B az gens A-t preferlja B-hez kpest, vagy egyformn preferlja A-t s B-t
514
Termszetesen tisztzni kell, hogy mit is jellhet A s B. Ha az gens cselekvsei determinisztikusak, akkor A s
B tipikusan a cselekvsek konkrt, teljesen specifiklt eredmnyllapotai. Az ltalnosabb, nemdeterminisztikus
esetben A s B szerencsejtkok (lotteries). Egy szerencsejtk alapveten egy valsznsgi eloszls az
aktulis kvetkezmnyek halmaza felett (melyek a szerencsejtk djai). Az L szerencsejtkot a C1, , Cn
kvetkezmnyekkel, amelyek p1, , pn valsznsgekkel kvetkezhetnek be, a kvetkezkppen jelljk:
L = [p1, C1; p2, C2; pn, Cn]
16.1. bra - (a) A cserk egy teljes ciklusa, bemutatva, hogy a nemtranzitv A B C
A preferencik irracionlis viselkedst eredmnyeznek. (b) A felbonthatsgi axima.
(Az egyetlen kvetkezmnnyel rendelkez szerencsejtk A-val vagy [1, A]-val jellhet.) ltalban egy
szerencsejtk brmely kvetkezmnye lehet egy atomi llapot vagy egy msik szerencsejtk. Az elsdleges
krds a hasznossgelmlet szmra annak megrtse, ahogyan az sszetett szerencsejtkok kztti
preferencik viszonyulnak ezen szerencsejtkokat meghatroz llapotok kztti preferencikhoz.
Ennek elrshez sszer megktseket runk el a preferenciarelcikra, hasonlan ahhoz, ahogyan racionlis
knyszereket vrtunk el a meggyzds mrtkeivel kapcsolatban a valsznsg aximinak a szrmaztatsnl
a 13. fejezetben. Egy sszer megkts, hogy a preferencik tranzitvak (transitive) legyenek: azaz ha A B
s B C, akkor elvrhatjuk, hogy A C. A tranzitivits indoklsaknt megmutatjuk, hogy egy gens, amelynek
a preferencii nem tranzitvak, irracionlisan viselkedne. Ttelezzk pldul fel, hogy egy gens preferencii
nem tranzitvak: A B C A, ahol A, B s C ruk, amik szabadon cserlhetk. Ha az gensnl jelenleg A
van, akkor felknlhatjuk C-t cserbe A-rt s egy kis pnzrt. Ha az gens jobban szereti C-t, akkor hajland
lesz pnzt is ldozni C megszerzsre. Ezutn felknlhatjuk B-t C-rt, mg tbb pnzt begyjtve, s vgl
elcserljk B-t A-rt. Ezzel visszartnk a kezdeti llapotba, azt leszmtva, hogy az gensnek kevesebb a pnze
(16.1. (a) bra). Ezt a ciklust addig folytathatjuk, ameddig az gens sszes pnze el nem fogy. Indokoltnak
ltszik azt lltani, hogy az gens ebben a helyzetben nem cselekedett racionlisan.
A kvetkez hat megktst a hasznossgelmlet aximinak szoks tekinteni. Ezek a preferencikra s a
szerencsejtkokra vonatkoz legnyilvnvalbb szemantikai megktseket hatrozzk meg.
Sorrendezhetsg (orderability). Brmely kt llapot esetn az gensnek vagy preferlnia kell az egyiket a
msikkal szemben, vagy egyformn preferltnak kell minstenie mindkettt. Azaz az gens nem kerlheti el
a dntst. Ahogyan az 3.1. szakasz - A valsznsgi aximk hasznlata rszben trgyaltuk, egy fogads
visszautastsa az id folysnak a felfggesztshez hasonl.
515

(A B) (B A) (A B)
Tranzitivits (transitivity). Brmely hrom llapot esetn, ha az gens preferlja A-t B-vel szemben, s B-t
C-vel szemben, akkor az gensnek preferlnia kell A-t is C-vel szemben.
(A B) (B C) (A C)
Folytonossg (continuity). Ha valamely B llapot A s C kztt helyezkedik el a preferencik

szempontjbl, akkor ltezik egy p valsznsg, amely mellett a racionlis gens szmra kzmbss vlik,
hogy a biztos B-t kapja, vagy egy olyan szerencsejtkot, amiben p valsznsggel A, 1 p valsznsggel
pedig C nyerhet.
A B C p [p, A; 1 p, C] B
Helyettesthetsg (substitutability). Ha egy gens az A s B szerencsejtkot egyformn preferlja, akkor

az gens kt sszetettebb szerencsejtkot is egyformn preferl, amelyek csak abban klnbznek, hogy az
egyikben A B-re van cserlve. Ez a szerencsejtkokbeli valsznsgektl s ms kimenetektl fggetlenl
igaz.
A B [p, A; 1 p, C] [p, B; 1 p, C]
Monotonits (monotonicity). Ttelezzk fel, hogy kt szerencsejtknak ugyanaz a kt kimenetele van, A s

B. Ha az gens A-t preferlja B-vel szemben, akkor az gensnek azt a szerencsejtkot kell preferlnia, ami
nagyobb valsznsggel eredmnyezi A-t (s fordtva is).
A B (p q [p, A; 1 p, B] [q, A; 1 q, B]
Felbonthatsg (Decomposability): sszetett szerencsejtkok egyszerbbekre bonthatk a valsznsgszmts szablyai szerint. Ezt a hazrdjtk unalmas szablynak neveztk el, mivel ez azt mondja ki, hogy
kt egymst kvet szerencsejtkot ssze lehet olvasztani egyetlen ekvivalens szerencsejtkba, ahogyan azt
a 16.1. bra mutatja.1
[p, A; 1 p, [q, B; 1 q, C]] [p, A; (1 p)q, B; (1 p)(1 q), C]
2.2. s aztn jtt a hasznossg

Vegyk szre, hogy a hasznossgelmlet aximi nem mondanak semmit a hasznossgrl. Kizrlag a
preferencikrl szlnak. Azaz a racionlis gens alapvet tulajdonsgainak a preferencikat ttelezzk fel. A
hasznossgfggvny ltezse a hasznossg- aximkbl kvetkezik:
1. A hasznossg elv (utility principle)
Ha az gens preferencii eleget tesznek a hasznossg aximinak, akkor ltezik egy, az llapotokon rtelmezett
U vals rtk fggvny, mellyel U(A) > U(B) akkor s csak akkor, ha A preferlt B-vel szemben, s U(A) =
U(B) akkor s csak akkor, ha az gens szmra A s B egyformn preferlt.
U(A) > U(B) A B
U(A) = U(B) A B
2. A maximlis vrhat hasznossg elve (maximum Expected Utility principle)

Egy szerencsejtk hasznossga az egyes kimenetelek valsznsgeivel szorzott kimenetelhasznossgok
sszege.
Ms szval, amint a lehetsges kimeneteli llapotoknak a valsznsgei s hasznossgai specifikltak, az

ezeket tartalmaz sszetett szerencsejtk hasznossga teljesen meghatrozott. Mivel egy nemdeterminisztikus
cselekmny kimenetele egy szerencsejtk, ez egy MVH-alap dntsi szablyt jelent a (16.1) egyenlet szerint.
A hazrdjtk lvezett ekkor gy modellezhetjk, hogy belefoglalhatjuk a hazrdjtkjtszs esemnyeit az llapotlersokba; pldul a
10 dollr s hazrdjtkjtszs preferlt lehet a 10 dollr hazrdjtkjtszs nlkl-lel szemben.
1
516
Fontos megjegyezni, hogy a hasznossgfggvny lte, ami lerja az gens preferenciit, nem jelenti azt
szksgszeren, hogy az gens explicit mdon maximalizl egy hasznossgfggvnyt a mrlegelsei sorn.
Amint azt a 2. fejezetben megmutattuk, racionlis viselkeds szmos mdon elllthat, nmelyik sokkal
hatkonyabb, mint a hasznossg maximalizlsnak explicit elvgzse. Az gens preferenciinak
megfigyelsvel azonban lehetsgess vlik a hasznossgfggvny megkonstrulsa, ami az gens elrni
szndkozott cljait reprezentlja.
3. Hasznossgfggvnyek
A hasznossg egy fggvny, ami vals szmokat rendel az llapotokhoz. Vajon ez minden, amit a
hasznossgfggvnyrl el lehet mondani? Szigoran nzve, igen, ennyi. A korbban felsorolt megktseknek
eleget tve az gensnek tetszleges preferencii lehetnek. Pldul az gens preferlhatja, hogy a bankbettjein
elhelyezett dollrok szma prmszm legyen; ekkor, ha 16 dollrja volna, 3-at elajndkozna. Lehet, hogy egy
1973-as ttt-kopott Ford Pintt jobban szeret, mint egy csillog j Mercedest. A preferencik kapcsolatban
llhatnak egymssal; pldul lehet, hogy csak akkor preferl prmszm dollrt, ha Pintja van, de amikor
Mercedese van, akkor a tbb dollrt jobban szereti, mint a kevesebbet.
Ha az sszes hasznossgfggvny ilyen tetszleges volna, mint ez, akkor viszont a hasznossgelmletnek nem
lenne sok haszna, mivel meg kellene figyelnnk az gens preferenciit minden lehetsges krlmny esetn,
mieltt a viselkedsvel kapcsolatban brmilyen elrejelzsre is kpesek lennnk. Szerencsre az igazi gensek
preferencii sokkal rendszerezettebbek. Ennek megfelelen szisztematikus mdszerek lteznek a
hasznossgfggvnyek megtervezsre, amelyeket aztn egy mestersges gensbe beptve az gens a helyes,
ltalunk elvrt viselkedst fogja produklni.
3.1. A pnz hasznossga

A hasznossgelmlet a kzgazdasgtanbl szrmazik, a kzgazdasgtan pedig egy nyilvnval jelltet knl a
hasznossg mrsre: a pnzt (vagy pontosabban az gens teljes nett vagyont). A pnz majdnem univerzlis
felcserlhetsge brmely rura s szolgltatsra azt mutatja, hogy a pnz jelents szerepet jtszik az emberi
hasznossgfggvnyekben. (Valjban, a legtbb ember a kzgazdasgtant a pnz tanulmnyozshoz kti,
pedig a kzgazdasg sz gykere a gazdlkodsra vonatkozik, mg jelenleg a hangsly a vlasztsok kezelsn
van.)
Ha csak azokat a cselekvseket vesszk figyelembe, amelyek az gens pnzmennyisgt befolysoljk, akkor
ltalban az lesz a tapasztalat, hogy az gens a tbb pnzt elnyben rszesti a kevesebbel szemben, ha egyb
dolgok egyenlk. Azt mondjuk, hogy az gens monoton preferencit (monotonic preference) mutat egy adott
sszeg pnz esetn. Azonban ez nem elegend annak garantlsra, hogy a pnzt egy hasznossgfggvnynek
tekinthessk, mivel ez semmit sem mond azon szerencsejtkok kztti preferencikrl, amelyek kimenetele
pnz.
Ttelezzk fel, hogy n gyzedelmeskedett a versenytrsak felett egy televzis jtkban. A hzigazda most
vlasztsra kri fel: elviheti az 1 000 000 dollros djat, vagy felteheti egy pnzfeldobsos hazrdjtkon. Ha fej,
nem kap semmit, ha rs, akkor kap 3 000 000 dollrt. Ha hasonl a tbbi emberhez, akkor vonakodna jtszani,
s zsebre vgn a millit. Ez irracionlis volna?
Feltve, hogy hisz az rme szablyos voltban, a jtk vrhat pnzgyi rtke (VP) (expected monetary
value)
, s az eredeti dj, a VP-je termszetesen 1 000
000 dollr, ami kisebb. De ez nem jelenti szksgszeren, hogy a hazrdjtk elfogadsa a jobb dnts.
Ttelezzk fel, hogy Sn jelli az n dollrt birtokl llapotot, s a jelenlegi vagyon k dollr. Ekkor a kt
cselekedetnek, a hazrdjtk elfogadsnak vagy visszautastsnak a vrhat hasznossga:
Annak eldntshez, hogy mit is tegynk, az egyes kimeneteli llapotokhoz hasznossgot kell rendelnnk. A
hasznossg nem kzvetlenl arnyos a pnzgyi rtkkel, mivel a hasznossg az okozott pozitv vltozs az
letstlusban az els milli dollr esetn nagyon nagy (vagy legalbbis azt mondjk), ezzel szemben a tovbbi
517
millik hasznossga sokkal kisebb. Ttelezzk fel, hogy 5-s hasznossgot rendel a jelenlegi (Sk) pnzgyi
helyzethez, 10-et az Sk+3 000 000 llapothoz, 8-at az Sk+1 500 000 llapothoz. Ekkor a racionlis dnts az elutasts lenne,
mivel az elfogads vrhat hasznossga 7,5 (kisebb, mint az elutastshoz tartoz 8). Most ttelezze fel, hogy
mr van a szmljn 500 000 000 dollr (s a jtkban val rszvtel csak a mka kedvrt trtnik). Ebben az
esetben a hazrdjtk valsznleg elfogadhat, feltve, hogy a tbb pnzt preferlja a kevesebbel szemben,
mivel az 503-adik milli haszna valsznleg ugyanakkora, mint az 501-edik milli.
A valsgos hasznossgi fggvnyekrl szl ttr jelentsg tanulmnyban Grayson azt tallta, hogy a pnz
hasznossga majdnem teljesen arnyos a mennyisgnek logaritmusval (Grayson, 1960). (Ezt elszr
Bernoulli vetette fel [Bernoulli, 1783]; lsd 16.3. feladat.) Egy ilyen grbe, egy bizonyos Beard r, a 16.2. (a)
brn lthat. A Beard rtl kapott preferencik konzisztensek a kvetkez hasznossgi fggvnnyel:
U(Sk+n) = 263,31 + 22,09 log(n + 150 000)
az n = 150 000 dollr s n = 800 000 dollr kztti tartomnyban.

Azt nem ttelezhetjk fel, hogy ez egy univerzlis hasznossgfggvnye a vagyoni rtknek, de valszn, hogy
a legtbb embernek olyan hasznossgfggvnye van, ami konkv a pozitv tartomnyban. Adssgba keveredni
ltalban vszesnek tartott dolog, de a preferencik a klnbz adssgszintek kztt a pozitv tartomnybeli
konkvits megfordulst is mutathatjk. Pldul ha valakinek mr van 10 000 000 dollr adsga, akkor lehet,
hogy igencsak rszt vesz egy olyan pnzfeldobsos hazrdjtkban, ahol 10 000 000 dollr a nyeremny, ha fej,
s 20 000 000 dollr a vesztesg, ha rs.2 Ez egy S alak grbt eredmnyez, amit a 16.2. (b) bra mutat.
16.2. bra - A pnz hasznossga. (a) Empirikus adat Beard rtl egy korltos
tartomnyban. (b) Egy tipikus grbe a teljes tartomnyban.
Ha csak a grbe pozitv rszt vizsgljuk, ahol a meredeksg cskken, akkor itt brmely L szerencsejtk esetn
a vrhat hasznossg kisebb, mint annak a biztos esemnynek a hasznossga, amikor az tadott pnzgyi rtk a
vrhat pnzgyi rtkkel egyezik meg.
U(L) < U(SVP(L))
Azaz az ilyen alak grbvel rendelkez gens kockzatkerl (risk-averse): elnyben rszest egy biztos
esemnyt egy szerencsejtkkal szemben, mg akkor is, ha a biztos sszeg kisebb, mint a szerencsejtk vrhat
pnzgyi rtke. Msfell, a 16.2. (b) brn a nagy adsgokhoz tartoz elkeseredett rgiban a viselkeds
kockzatkeres (risk-seeking). Azt az rtket, amit az gens a szerencsejtk helyett elfogad, a jtk
determinisztikus ekvivalensnek (certainty equivalent) nevezzk. A tanulmnyok azt mutatjk, hogy a
legtbb ember elfogad krlbell 400 dollrt egy olyan szerencsejtkrt cserbe, ami
valsznsggel
eredmnyez 1000 dollrt s 0 dollrt azaz ennek a szerencsejtknak a determinisztikus ekvivalense 400
dollr. A szerencsejtk vrhat pnzgyi rtke s a determinisztikus ekvivalense kztti rtket biztostsi
prmiumnak (insurance premium) hvjuk. A kockzatkerls az alapja a biztostsi zletgnak, mivel ez azt
jelenti, hogy a biztostsi prmium pozitv. Az emberek inkbb fizetnek egy alacsonyabb biztostsi djat,
2
Az ilyen viselkedst elkeseredettnek nevezhetjk, mindazonltal teljesen racionlis, ha valaki kiltstalan helyzetben van.
518
mintsem hogy kockra tegyk a hzuk teljes rt egy lehetsges tzeset miatt. Viszont a biztostsi trsasgok
szemszgbl a hz teljes ra igen kicsi a cg sszes vagyonhoz kpest. Emiatt a biztost hasznossgi grbje
megkzelten lineris ebben a kicsiny rgiban, s a biztosts a trsasgnak alig kerl valamibe.
Vegyk szre, hogy a kis vagyoni vltozsok az aktulis vagyoni helyzethez kpest kzel linerisak a grbe
brmely szakaszn. A lineris grbvel rendelkez genst kockzatsemlegesnek (risk-neutral) nevezzk. Ezrt
kis sszeg hazrdjtkok esetn kockzatsemlegessget vrhatunk el. Egy bizonyos rtelemben ez igazolja azt
az egyszerstett eljrst, ami kis sszeg szerencsejtkokkal segtette valsznsgek megbecslst, s
igazolta a valsznsg-szmts aximit a 13. fejezetben.
3.2. Hasznossgsklk s a hasznossg megbecslse

A hasznossgaximk, ha az gens viselkedsi preferencii rgztettek, nem hatroznak meg egy kitntetett
hasznossgfggvnyt. Pldul az U(S) hasznossgfggvnyt a kvetkez alakra transzformlhatjuk:
U(S) = k1 + k2 U(S)
ahol k1 egy lland s k2 egy tetszleges pozitv lland. Nyilvnval, hogy ez a lineris transzformci nem
befolysolja az gens viselkedst.
Determinisztikus krnyezetekben, ahol llapotok vannak, s nincsenek szerencsejtkok, a viselkeds nem fog
megvltozni semmilyen monoton transzformcira. Pldul vehetjk a kbt az sszes hasznossgnak anlkl,
hogy ez a cselekmnyek preferenciarendezst befolysoln. Egy determinisztikus krnyezetben lv gens
esetn azt mondjuk, hogy az gensnek rtkfggvnye (value function) vagy sorrendezett
hasznossgfggvnye (ordinal utility function) van; a fggvny valjban csak az llapotok sorrendezst
biztostja, s nem ad rtelmezhet numerikus rtkeket. Ezt a klnbsgttelt lttuk a 6. fejezetben a jtkok
esetn: determinisztikus jtkokban, mint a sakk, a kirtkel fggvnyek rtkfggvnyek, mg
nemdeterminisztikus jtkokban, mint az ostbla, ezek valdi hasznossgfggvnyek.
Fontos
Emberi tlethozatal s a hibzs lehetsge
A dntselmlet egy normatv elmlet (normative theory): azt rja el, hogy az gensnek hogyan kell
cselekednie. A kzgazdasgtan elmletnek alkalmazst nagyban javtan, ha ez egyben egy ler
(descriptive) elmlet is volna az aktulis emberi dntshozatalrl. Azonban ksrleti bizonytkok
vannak arra, hogy az emberek szisztematikusan megsrtik a hasznossgelmlet aximit. Egy pldt a
pszicholgus Tversky s Kahneman adnak a kzgazdsz Allais pldja alapjn (Tversky s Kahneman,
1982; Allais, 1953). A ksrleti szemlyeknek ktszer kell vlasztaniuk, az A s a B szerencsejtk,
majd a C s a D szerencsejtk kztt.
A: 4000 dollr 80% esllyel C: 4000 dollr 20% esllyel
B: 3000 dollr 100% esllyel D: 3000 dollr 25% esllyel
A tbbsg B-t vlasztja A-val szemben, s C-t D-vel szemben. De ha elfogadjuk, hogy U(0 dollr) = 0,
akkor az els vlaszts arra utal, hogy 0,8U(4000 dollr) < U(3000 dollr), mg a msodik vlaszts
pontosan a fordtottjra. Mskppen fogalmazva, nincs olyan hasznossgfggvny, ami ezekkel a
vlasztsokkal konzisztens lenne. Az egyik lehetsges kvetkeztets, hogy az emberek egyszeren
irracionlisak a hasznossgelmlet aximi alapjn. Egy alternatv nzet, hogy az elemzs nem veszi
figyelembe a megbnst (regret) azt az rzst, amirl az emberek tudjk, hogy rezni fognak, ha egy
biztos nyeremny (B) helyett egy 80%-os valsznsg nagyobb nyeremnyt vlasztanak, majd
vesztenek. Ms szavakkal, ha A-t vlasztja, 20% eslye van, hogy nem lesz pnze, s gy rzi magt,
mint egy komplett idita.
Kahneman s Tversky tovbbment, s kifejlesztett egy ler elmletet, ami megmagyarzza, hogy az
emberek mirt kerlik a kockzatot nagy valsznsg esemnyeknl, viszont mirt hajlandk
nagyobb kockzatot vllalni valszntlen jutalmakkal. A kapcsolat az MI s ezen tapasztalat kztt az,
hogy az gensnk dntsei csak annyira jk, amennyire jk a preferencik, amin alapulnak. Ha az
emberi informtoraink ellentmondsos preferencikhoz ragaszkodnak, akkor az gensnk semmit sem
tud tenni, hogy konzisztens legyen velk.
519
Szerencsre, az emberek ltal hozott preferenciatletek gyakran knnyen fellbrlhatk ksbbi

megfontolsok alapjn. Keeney s Raiffa egy korai munkjukban a Harvard Business Schoolon a pnz
hasznossgnak a megbecslse kapcsn a kvetkezt rta (Keeney s Raiffa, 1976, 210. o):
Ksrleti vizsglatok nagy rsze mutatta ki, hogy slyos hinyossgok vannak a becslsi protokollban.
A ksrleti szemlyek kicsiben hajlamosak tlsgosan kockzatkerlv vlni s ezrt az illesztett
hasznossgfggvnyek elfogadhatatlanul nagy kockzati prmiumot mutatnak a nagy tartomny
szerencsejtkokra. A ksrleti szemlyek azonban rendezni tudjk az inkonzisztencijukat, s gy
rzik, hogy valami fontosat tanultak arrl, hogyan akarnak viselkedni. Eredmnykppen nhnyan
lemondtk a gpjrm baleseti biztostsukat s tbb idszakos letbiztostst ktttek meg.
Az emberi (ir)racionalits mg ma is intenzv vizsglatok trgya.
A hasznossgok megbecslsre egy megolds, hogy vlasztunk egy sklt a lehet legnagyobb dj U(S) = u
s a lehet legnagyobb katasztrfa U(S) = u alapjn. Normlt hasznossgok (normalized utilities) esetn a
skla u = 0 s u = 1. A kzbees kimenetelek hasznossgnak a megbecslse gy trtnik, hogy az genst
megkrik, jelezze a preferencijt az S kimeneteli llapot s egy [p, u; (1 p), u ] standard szerencsejtk
(standard lottery) kztt. A p valsznsget addig mdostjk, amg az gens nem preferlja egyformn S-et
s a standard szerencsejtkot. Normalizlt hasznossgokat felttelezve S hasznossga p.
Fontos
Orvosi, szlltsi s krnyezetvdelmi problmknl, egyebek kztt, emberek lete forog kockn.
Ezekben az esetekben u a kzvetlen hallesethez (esetleg hallesetekhez) hozzrendelt rtk. mbr
senkinek sem knny rtkeket rendelni emberi letekhez, az tny, hogy sznet nlkl
kompromisszumokat ktnk. A replgpeket csak adott idkznknt vetik al ellenrzseknek, amit
az utazsok s megtett kilomterek hatroznak meg, nem pedig minden utazs utn. A
kltsgcskkentsek miatt a gpkocsik karoszszrija viszonylag vkony fmbl kszl, a balesetek
tllsi arnynak cskkense ellenre. Az lmozott zemanyag mg mindig igen elterjedt, mbr jl
ismert, hogy az egszsgre kros. gy paradox mdon az az ellenkezs, hogy az let pnzben nem
kifejezhet, azt eredmnyezi, hogy az let alulrtkelt. Ross Shachter egy kormnyhivatallal
kapcsolatos lmnyrl szmol be, amely hivatal megrendelt egy tanulmnyt az azbeszt iskolkbl
trtn eltvoltsrl. A tanulmny egy adott pnzsszeget rendelt az iskolskor gyerekek lethez,
s gy rvelt, hogy ezen feltevs mellett a racionlis dnts az azbeszt eltvoltsa. A kormnyhivatal,
morlisan felhborodva teljes mrtkben elutastotta a jelentst. Ezzel egyben az azbeszt eltvoltsa
ellen is dntttek.
Trtntek prblkozsok arra nzve, hogy kidertsk, mennyi rtket tulajdontanak az emberek az letknek.
Az orvosi s biztonsgi elemzsekben kt elterjedt pnznemet hasznlnak, a mikrohallt (micromort) (az
egymilliomod eslyt az elhallozsnak) s a QALY-t, vagy szabvnyos minsg letvet (ami ekvivalens egy
vvel, j vagyoni helyzetben, betegsgektl mentesen). Szmos, szemlyek igen szles krt vizsgl
tanulmny azt mutatta, hogy a mikrohall 20 dollrt r (1980-ban). Azt mr lttuk, hogy a hasznossgfggvny
nemlineris, ezrt ez nem jelenti azt, hogy a dntshoz megln magt 20 milli dollrrt. jra
hangslyozand, hogy a hasznossggrbe loklis linearitsa azt jelenti, hogy a mikrohall s a QALY rtkei kis
relatv kockzatok s jutalmak esetn hasznosak.
4. Tbbvltozs hasznossgfggvnyek
A kzrdek gyeknl trtn dntshozatal mind dollrmillikhoz, mind emberek lethez s hallhoz is
kapcsoldik. Pldul annak eldntsekor, hogy rkkelt anyagok milyen koncentrcii engedhetk meg a
krnyezetben, a dntshozknak mrlegelnik kell a hall megelzst s azokat a kzgazdasgi nehzsgeket,
amelyek bizonyos termkek s folyamatok megszntetse miatt jelentkezhetnek. Egy j repltr elhelyezse
esetn meg kell fontolni az ptkezs okozta felfordulst; a telkek rtkt; a npesebb kzpontoktl val
tvolsgot; a reptr zajt; a biztonsgi krdseket a helyi fldrajzi s az idjrsi viszonyok tekintetben s gy
tovbb. Az ehhez hasonl problmkat, ahol a kimenetelt kt vagy tbb attribtum jellemez a tbbattribtum
hasznossgelmlet (multiattribute utility theory) kezeli.
Jellje X = X1, X2, , Xn az attribtumokat, az attribtumrtkek vektort pedig x = x1, x2, , xn . ltalban
minden attribtumrl felttelezzk, hogy diszkrt vagy folytonos rtkekkel rendelkezik. Az egyszersg
kedvrt felttelezzk, hogy az attribtumokat gy hatroztuk meg, hogy a nagyobb attribtumrtkek nagyobb
520
hasznossgrtkkhez tartoznak, ha minden ms vltozatlan. Pldul a repltr problma esetn minl nagyobb
a ZajMentessg rtke, annl jobb a megolds. Bizonyos esetekben szksges lehet az rtktartomny
felosztsa, ahol a hasznossgrtkek az egyes tartomnyokban monoton mdon vltoznak.
Elsknt azokat az eseteket vizsgljuk meg, amikor dntseket anlkl hozhatunk, hogy az attribtumrtkeket
egyetlen hasznossgrtkk egyestennk. Majd azokat az eseteket vizsgljuk, ahol az egyes
attribtumkombincik hasznossgt nagyon tmren lehet megadni.
4.1. Dominancia
Ttelezzk fel, hogy az S1 reptr kevesebbe kerl, kisebb zajjal jr s biztonsgosabb is, mint S2. Ekkor az
mondjuk, hogy S1 szigoran dominlja (strict dominance) S2-t. ltalban, ha egy lehetsg minden
attribtumnak kisebb az rtke, mint egy msik lehetsg, akkor nem szksges tovbb vizsgldni. A szigor
dominancia gyakran nagyon hasznos, mert leszkti a vlasztsi lehetsgeket a valdi jelltekre, br ritkn
eredmnyez egyetlen vlasztsi lehetsget. A 16.3. (a) bra egy sematikus helyzetet mutat egy ktattribtumos
esetben.
16.3. bra - Szigor dominancia. (a) Determinisztikus: A-t szigoran dominlja B, de

sem C, sem D nem. (b) Bizonytalan: A-t szigoran dominlja B, de C nem.
Mindez remekl hasznlhat determinisztikus esetekben, ahol a tulajdonsgrtkek biztosan ismertek. De mi

trtnik abban az ltalnos esetben, ahol a cselekvsek kimenetele bizonytalan? A szigor dominancia kzvetlen
analgija knnyen megalkothat, ha a bizonytalansg ellenre, S1 minden lehetsges kimenetele szigoran
dominlja S2 minden lehetsges kimenetelt. (Ezt mutatja a 16.3. (b) bra sematikus brzolsa.) Termszetesen
ez valsznleg sokkal ritkbban fordul el, mint a determinisztikus esetben.
Szerencsre ltezik egy hasznlhatbb ltalnosts, az gynevezett sztochasztikus dominancia (stochastic
dominance), ami vals problmknl is gyakran elfordul. A sztochasztikus dominancit knnyebb megrteni
egyetlen vltoz esetben. Ttelezzk fel, hogy a reptr kltsge az S1 helyen egyenletes eloszls 2,8 s 4,8
millird dollr kztt, s az S2 helysznen a kltsg egyenletes eloszls 3,0 s 5,2 millird dollr kztt. A 16.4.
(a) bra ezen kltsgek eloszlsait mutatja, ahol a kltsgek negatv rtkknt szerepelnek. Ekkor csupn azt az
informcit ismerve, hogy a hasznossg cskken a kltsgekkel, azt mondhatjuk, hogy S1 sztochasztikusan
dominlja S2-t azaz S2 elhagyhat. Fontos felismerni, hogy ez nem kvetkezik a vrhat kltsgek
sszehasonltsbl. Pldul ha tudnnk, hogy S1 kltsge pontosan 3,8 millird dollr, akkor a pnz
hasznossgra vonatkoz tovbbi informcik nlkl nem tudnnk dntst hozni.3
16.4. bra - Sztochasztikus dominancia. (a) S1 sztochasztikusan dominlja S2-t a

kltsgek vonatkozsban. (b) S1 s S2 negatv kltsgeinek eloszlsfggvnyei.
Furcsnak tnhet, hogy az S1 kltsgrl lv tbb informci az gens dntskpessgt cskkenti. A paradoxonra magyarzatot kapunk,
ha figyelembe vesszk, hogy az egzakt kltsginformci hinyban meghozott dnts kisebb valsznsggel a legnagyobb hasznossg.
3
521
Az attribtumok eloszlsai kztti pontos kapcsolat, amely a sztochasztikus dominancia megllaptshoz

szksges, legknnyebben az eloszlsfggvny megvizsglsval lthat, ahogy azt a 16.3. (b) bra is
illusztrlja. Az eloszlsfggvny annak a valsznsgt mri, hogy a kltsg kisebb-e egy adott sszegnl, vagy
egyenl vele azaz az eloszlsfggvny az eredeti eloszlst integrlja. Ha S1 eloszlsfggvnye mindig jobbra
esik S2 eloszlsfggvnytl, akkor sztochasztikus szemszgbl S1 olcsbb, mint S2. Formlisan, ha az A1 s az
A2 cselekvsek a p1(x) s a p2(x) valsznsg-eloszlsokra vezetnek az X attribtumon rtelmezve, akkor A1
sztochasztikusan dominlja A2-t az X-en, ha
Fontos
A definci fontossgt az optimlis dnts megvlasztsban a kvetkez tulajdonsg adja: ha A1
sztochasztikusan dominlja A2-t, akkor brmely U(x) monoton nem cskken hasznossgfggvny
esetn, A1 vrhat hasznossga legalbb olyan nagy, mint A2 vrhat hasznossga. Azaz, ha egy
cselekvst egy msik cselekvs minden attribtum esetn sztochasztikusan dominl, akkor az els
cselekvs figyelmen kvl hagyhat.
gy tnhet, hogy a sztochasztikus dominancia meglehetsen matematikai megkzeltst ignyel, meghatrozsa
pedig nagy mennyisg, valsznsggel kapcsolatos szmtst. Valjban azonban szmos esetben igen
knnyen eldnthet. Ttelezzk fel pldul, hogy az ptsi kltsg a npesebb kzpontoktl val tvolsgtl
fgg. A kltsg maga bizonytalan, de a nagyobb tvolsg nagyobb kltsget jelent. Ha S1 kzelebbi, mint S2,
akkor S1 dominlni fogja S2-t a kltsg tekintetben. Br ismertetsktl eltekintnk, de lteznek algoritmusok,
amelyek kpesek kezelni az ilyen kvalitatv informcikat is a bizonytalan vltozk kztti kapcsolatokrl a
kvalitatv valsznsgi hlk (qualitative probabilistic networks) felhasznlsval, lehetv tve, hogy egy
rendszer a sztochasztikus dominancia alapjn hozzon racionlis dntseket anlkl, hogy brmilyen numerikus
rtket hasznlna.
4.2. A preferencik rendszere s a tbbattribtumos hasznossg

Ttelezzk fel, hogy n attribtumunk van, ahol mindegyiknek d klnbz rtke lehet. A teljes U(x1, , xn)
hasznossgfggvny megadshoz legrosszabb esetben dn rtk szksges. Ez a legrosszabb eset abban a
helyzetben ll fent, amikor az gens preferenciiban nincs semmilyen szablyszersg. A tbbattribtumos
hasznossgelmlet azon a felttelezsen alapul, hogy a legtbb hasznossgfggvny sokkal nagyobb
strukturltsggal rendelkezik. Az elfogadott alapvet megkzelts az, hogy a viselkeds preferenciiban
vrhat szablyszersgeket azonostunk, s az gynevezett reprezentcis tteleket (representation
theorems) felhasznlva megmutatjuk, hogy az adott preferenciarendszerrel rendelkez gens lerhat a
kvetkez hasznossgfggvnnyel:
U(x1, , xn) = f[f1(x1), , fn(xn)]
522
ahol f remlhetleg olyan egyszer fggvny, mint az sszeads. Lthat, hogy ez ahhoz hasonl, ahogy a
valsznsgi hlkat hasznltuk az egyttes valsznsgeloszls-fggvny felbontsra.
Preferencik bizonytalansg nlkl
Kezdjk a determinisztikus esettel. Emlkezznk vissza, hogy determinisztikus krnyezetben az gensnek egy
rtkfggvnye van, : a cl ennek a tmr reprezentlsa. A determinisztikus preferenciastruktrban
megtallhat alapvet szablyszersget preferenciafggetlensgnek (preference independence) nevezzk.
Kt attribtum, X1 s X2 preferencilisan fggetlen X3-tl, ha a preferencia x1, x2, x3 s
fgg X3 konkrt rtktl.
kztt nem
Visszatrve a replteres problmra, ha egyebek mellett a Zaj, a Kltsg s a Hallesetek figyelembe veend
attribtumok voltak, felvethet, hogy a Zaj s a Kltsg preferencilisan fggetlen a Hallesetek-tl. Ekkor
pldul, ha elnyben rszestjk azt az llapotot, ahol 20 000 ember lakik a replsi tvonal kzelben, s az
ptsi kltsg 4 millird dollr, azzal az llapottal szemben, ahol 70 000 ember lakik a replsi tvonalon, s az
ptsi kltsg 3,7 millird dollr, ha a biztonsgi szint mindkt esetben 0,06 halleset milli utas
kilomterenknt, akkor a preferencink a biztonsgi szint 0,13 vagy 0,01 rtke esetben is ugyanaz lenne; s
ugyanaz a fggetlensg llna fenn brmely ms Zaj, Kltsg rtkprra. Az is nyilvnval, hogy a Kltsg s a
Hallesetek preferencilisan fggetlenek a Zaj-tl, s a Zaj s a Hallesetek preferencilisan fggetlenek a
Kltsg-tl. Ekkor azt mondjuk, hogy a {Zaj, Kltsg, Hallesetek} klcsnsen preferencilisan fggetlenek
(KPF) (mutual preferential independence, MPI). A KPF azt lltja, hogy br lehet, hogy mindegyik
attribtum fontos, ez nem befolysolja a tbbi attribtum kztti kompromisszumktst.
A klcsns preferencilis fggetlensg olyasvalami, mint egy hosszra sikeredett szkapcsolat, de a
kzgazdsz Debreu egy figyelemre mlt ttelnek ksznheten ez alapjn az gens rtkfggvnyt nagyon
egyszer formban felrhatjuk (Debreu, 1960):
Fontos
Ha az X1, , Xn tulajdonsgok klcsnsen preferencilisan fggetlenek, akkor az gens viselkedsi
preferencija lerhat a kvetkez fggvny maximalizlsval:
ahol minden egyes Vi egy rtkfggvny, amely csak az Xi attribtumnak a fggvnye. Pldul igen
valszn, hogy a repltri dnts meghozhat a kvetkez rtkfggvny alapjn:
V(Zaj, Kltsg, Hallesetek) = Zaj 104 Kltsg Hallesetek 1012
Az ilyen tpus rtkfggvnyt additv rtkfggvnynek (additive value function) nevezzk. Az

additv rtkfggvnyek egy teljesen illeszked mdszert adnak az gens rtkfggvnynek a
lersra, s szmos valsvilg-beli helyzetben rvnyesek. Mg ha a KPF nem is teljesl teljes
mrtkben, ahogy ez az attribtumok szls rtkei esetn megtrtnhet, egy additv rtkfggvny
mg mindig j kzeltst adhatja az gens preferenciinak. Ez klnsen igaz, ha a KPF csupn azon
attribtumtartomnyokban srl, amelyek a gyakorlatban csak kis valsznsggel fordulnak el.
Preferencik bizonytalansggal
Ha a trgytartomnyban bizonytalansg is jelen van, a szerencsejtkok kztti preferencikat is t kell
gondolni, s a hasznossgfggvny kiadd tulajdonsgait is meg kell rteni, nem csak az rtkfggvnyekt.
Ennek a problmnak a matematikja igen bonyolultt vlik, ezrt a fbb eredmnyek kzl csak egyet
mutatunk be, hogy rzkeltessk az elrhet eredmnyeket. Az olvasnak a (Keeney s Raiffa, 1976) irodalmat
ajnljuk, ami a terlet igen alapos ttekintse.
A hasznossgfggetlensg (utility independence) alapvet fogalma a preferencik fggetlensgt terjeszti ki
szerencsejtkokra: az attribtumok X halmaza hasznossgfggetlen az attribtumok Y halmaztl, ha az X
attribtumokon alapul szerencsejtkok kztti preferencik fggetlenek az Y-beli attribtumokhoz rendelt
rtkektl. Egy tulajdonsghalmaz klcsnsen hasznossgfggetlen (KHF) (mutually utility-independent,
MUI), ha minden rszhalmaz hasznossgfggetlen a tbbi attribtumtl. Ismtelten rtelmesnek tnik
felttelezni, hogy a repltri ptkezs attribtumai KHF-ek.
523
A KHF-bl kvetkezik, hogy az gens viselkedse lerhat egy multiplikatv hasznossgfggvnnyel

(multiplicative utility function) (Keeney, 1974). A szorzatalak hasznossgfggvny ltalnos alakjt egy
pldn mutatjuk be hrom attribtum esetn. Az egyszersg kedvrt, az Ui(Xi) jellsre az Ui-t hasznljuk:
U =k1U1 + k2U2 + k3U3 + k1k2U1U2 + k2k3U2U3 + k3k1U3U1 + k1k2k3U1U2U3
Br ez nem tnik egyszernek, hrom, egyenknt egyetlen attribtumhoz kapcsold hasznossgfggvnyt

tartalmaz, s csupn hrom llandt. ltalban az n attribtumot tartalmaz KHF-et kielgt problmt n
szm, egyetlen attribtum hasznossggal s n szm llandval lehet modellezni. Minden egyes, egyetlen
attribtumot ler hasznossgfggvnyt a tbbi attribtumtl fggetlenl lehet megtervezni, s ez a kombinci
garantltan ellltja a teljes preferenciarendszert. Hogy tisztn additv fggvnyt kaphassunk, tovbbi felttelek
szksgesek.
5. Dntsi hlk
Ebben az alfejezetben egy ltalnos mechanizmust fogunk megvizsglni a racionlis dntsek meghozatalra. A
felhasznlt eszkzt gyakran hatsdiagramnak (influence diagram) hvjk (Howard s Matheson, 1984), de mi
a tbbet sugall dntsi hlk (decision networks) elnevezst fogjuk hasznlni. A dntsi hlk a
cselekvsekhez s a hasznossgokhoz szksges jabb csomponttpusok hozzadsval tovbbfejlesztett
valsznsgi hlk. A repltri elhelyezsi problmt fogjuk hasznlni pldnak.
5.1. Dntsi problmk reprezentlsa dntsi hlkkal

Egy dntsi hl a legltalnosabb formjban az gens jelenlegi llapotrl tartalmaz informcikat, megadja
az gens lehetsges cselekvseit, azt az llapotot, amit az gens cselekvse eredmnyez, s ennek az llapotnak
a hasznossgt. Teht alapot szolgltat az olyan hasznossgelv gensek megptshez, amilyeneket a 2.4.
alfejezetben vezettnk be elszr. A 16.5. bra egy dntsi hlt mutat a repltr helyszne megvlasztsnak
problmjhoz. Ez bemutatja a hrom felhasznlsra kerl csomponttpust:
A vletlen csompontok (chance nodes) (ovlis) valsznsgi vltozkat jellnek, pont gy, ahogy a
valsznsgi hlkban. Az gens lehet bizonytalan az ptsi kltsgekben, a lgi forgalom szintjben s a
pereskeds lehetsge miatt, valamint a Hallesetek, a Zaj s a teljes Kltsg vltozkban, amelyek
mindegyike szintn fgg a kivlasztott helyszntl. Minden egyes vletlen csompontnak van egy feltteles
valsznsgi tblja (FVT), ami a szlcsompontok llapotaival indexelt. A dntsi hlkban a
szlcsompontok lehetnek dntsi csompontok s vletlen csompontok. Kiemelend, hogy a jelenlegillapot vletlen csompontok brmelyike rsze lehet egy nagyobb valsznsgi hlnak, ami az ptkezs
kltsgt, a lgi forgalom nagysgt vagy a perek lehetsgt becsli meg.
A dntsi csompontok (decision nodes) (ngyszgek) azokat a beavatkozsi pontokat reprezentljk, ahol a
dntshoznak lehetsge van a cselekvsre. Ebben az esetben a ReptrHelyszne klnbz rtkeket vehet
fel a megfontols alatt ll helyszneknek megfelelen. A vlaszts befolysolni fogja a kiadd kltsget, a
biztonsgot s a repltr ltal keltett zajt. Ebben a fejezetben felttelezzk, hogy egyetlen dntssel
foglalkozunk (azaz egyetlen ilyen csompont ltezik). A 17. fejezet trgyalja azokat az eseteket, ahol tbb
mint egy dntst kell meghozni.
A hasznossgcsompontok (utility nodes) (rombusz) az gens hasznossgfggvnyt reprezentljk.4 A
hasznossgcsompontnak szlje az sszes olyan vltoz, amelyek ltal lert kimeneteli llapotok kzvetlenl
befolysoljk a hasznossgot. A hasznossgcsomponthoz tartozik egy lers, ami az gens hasznossgt adja
meg egy szli attribtumokon definilt fggvnnyel. A lers lehet a fggvny egy tblzatos megadsa,
vagy lehet egy parametrikus additv vagy lineris fggvny.
16.5. bra - Egy egyszer dntsi hlzat a repltr-elhelyezsi problmra
Ezeket a csompontokat gyakran rtkcsompontoknak (value nodes) nevezik az irodalomban. Mi jobbnak lttuk megtartani a
klnbsget a hasznossg- s az rtkfggvnyek kztt, ahogyan ezt korbban indokoltuk, ezrt lehet, hogy a kimeneti llapot egy
szerencsejtkot reprezentl.
4
524
Sok esetben csupn egy egyszerstett formt hasznlunk. A jells ugyanaz marad, de az a vletlen csompont,
ami a kimeneti llapotot jelli, elmarad. Ehelyett, a hasznossgcsompontot kzvetlenl a jelenlegi llapot
csompontokhoz s a dntsi csomponthoz ktik. Ebben az esetben a hasznossgcsompont ahelyett, hogy az
llapotokon definilt hasznossgfggvnyt reprezentln, az egyes cselekvsekre vonatkoz vrhat
hasznossgokat reprezentlja, ahogy azt a (16.1) egyenlet definilja. Ezrt az ilyen tblkat
cselekvshasznossg tblknak (action-utility tables) nevezzk. A 16.6. bra a repltr problma
cselekvshasznossg-reprezentcijt mutatja.
Lthatjuk, hogy mivel a Zaj, a Hallesetek s a Kltsg vletlen csompontok a 16.5. brn a jvbeli
llapotokra vonatkoznak, ezek soha nem kaphatnak rtket, mint tnyvltozk. gy az egyszerstett verzi,
amibl elhagytuk ezeket a csompontokat, minden olyan esetben hasznlhat, amikor az ltalnosabb forma
hasznlhat. Br az egyszerstett forma kevesebb csompontot tartalmaz, az elhelyezs kimeneteleihez
kapcsold kzvetlen lersok elhagysa azt eredmnyezi, hogy kevsb rugalmas a krlmnyek esetleges
vltozsaira. Pldul a 16.5. brn a replgp zajszintjben bekvetkez vltozst a Zaj csompont feltteles
valsznsgi tbljnak megfelel megvltoztatsval lehet modellezni, ezzel szemben a zajszennyezs
fontossgnak a megvltozst a hasznossgfggvnyben a hasznossgtbla megvltoztatsval modellezhetjk.
Msfell a cselekvshasznossg diagramban 16.6. bra ltrejv minden ilyenfajta vltoztatst a
cselekvshasznossg tblzat megvltoztatsnak kell tkrznie. Lnyegben a cselekvshasznossg forma az
eredeti forma egy szerkesztett verzija.
5.2. Dntsi hlk kirtkelse

A cselekvseket gy vlasztjuk ki, hogy a dntsi hlt kirtkeljk a dntsi csompont minden lehetsges
belltsra. Ha egyszer a dntsi csompontot belltottuk, gy fog viselkedni, mint egy vletlen csompont,
amit egy tnyvltoznak lltottunk be. A dntsi hl kirtkelst a kvetkez algoritmus vgzi:
1. lltsa be a tnyvltozkat a jelenlegi llapotra.
2. A dntsi csompont minden egyes rtkre:
525
a. lltsa be a dntsi csompontot erre az rtkre.

b. Szmtsa ki az a posteriori valsznsgeket a hasznossgcsompont szleire, egy szabvnyos
valsznsgi kvetkeztet algoritmust hasznlva.
c. Szmtsa ki a cselekvs hasznossgt.
3. Trjen vissza a legnagyobb hasznossgrtkkel.
16.6. bra - A repltr-elhelyezsi problma egy egyszerstett reprezentcija. A

kimeneti llapotokhoz tartoz vletlen csompontok hatst kiszmtottuk, majd a
csompontokat elhagytuk.
Ez a valsznsgi hlk kvetkeztet algoritmusnak egy nyilvnval kiterjesztse, s kzvetlenl beilleszthet

az gens 13.1. brn megadott tervezsbe. A 17. fejezetben ltni fogjuk, hogy tbb egymst kvet cselekvs
lehetsge a problmt sokkal rdekesebb teszi.
6. Az informci rtke
Fontos
Az elz elemzsben feltteleztk, hogy minden lnyeges informci, de legalbbis minden elrhet
informci az gens rendelkezsre ll. Gyakorlatban ez aligha trtnhet meg. A dntshozatal egyik
legfontosabb rsze, hogy tudjuk, milyen krdst kell feltenni. Pldul az orvos nem vrhatja el, hogy
rendelkezsre lljon minden lehetsges diagnosztikai teszt s krds eredmnye, amikor a pciens
elszr belp a rendelbe.5 A tesztek gyakran kltsgesek s nha veszlyesek (mind kzvetlenl, mind
az ltaluk okozott ksedelmek miatt). A fontossguk kt tnyezn mlik: egyrszt azon, hogy
Az Egyeslt llamokban az egyetlen krds, amit ez eltt mindig megkrdeznek, hogy a pciensnek van-e biztostsa.
526
jelentsen jobb kezels vlik-e lehetv a teszteredmnyek alapjn, msrszt a klnbz

teszteredmnyek valsznsgn.
Ez az alfejezet az informcirtk-elmlettel (information value theory) foglalkozik, ami lehetv teszi az
gens szmra annak kivlasztst, hogy milyen informcit szerezzen meg. Az informci megszerzse
rzkelsi cselekvsekkel (sensing action) trtnik, ahogy a 12. fejezetben lertuk. Mivel az gens
hasznossgfggvnye ritkn vonatkozik az gens bels llapotaira, jllehet az rzkelsi cselekvs clja a bels
llapot megvltoztatsa, ezrt az rzkelsi cselekvseket az gens ezt kvet mveleteire gyakorolt hatsa
alapjn kell kirtkelnnk. Az informcirtk-elmlet ezrt a tbblpcss dntshozatal egy specilis fajtja.
6.1. Egy egyszer plda

Ttelezzk fel, hogy egy olajtrsasg egy tengeri frhely ltestsre szeretne jogokat vsrolni, n darab
megklnbztethetetlen terlet kzl vlasztva. Ttelezzk tovbb fel, hogy kizrlag csak az egyik terlet
tartalmaz olajat C dollr rtkben, s hogy a terletek ra C/n dollr. Ha a trsasg kockzatsemleges, akkor
kzmbs lesz szmra, hogy vsrol-e terletet, vagy sem.
Most ttelezzk fel, hogy a szeizmolgusok felknljk a 3-as szm terletre vonatkoz kutatsaik eredmnyt
a trsasgnak, ami vilgosan megmutatja, hogy a terlet tartalmaz-e olajat, vagy sem. Mennyit legyen hajland
fizetni a trsasg ezrt az informcirt? E krds megvlaszolsnak az a mdja, hogy megvizsgljuk, hogy mit
tenne a trsasg, ha meglenne az informcija:
1/n valsznsggel a 3-as terlet felmrse azt fogja mutatni, hogy a terlet tartalmaz olajat. Ebben az
esetben a trsasg megvsrolja a 3-as terletet C/n dollrrt, s nyeresge C C/n = (n 1)C/n dollr lesz.
(n 1) /n valsznsggel a felmrs azt fogja mutatni, hogy a terlet nem tartalmaz olajat, amely esetben a
trsasg egy msik terletet vsrol meg. Ekkor az olajterlet eltallsnak a valsznsge a tbbi mez
kztt 1/n-rl 1/ (n 1)-re vltozik, gy a trsasg vrhat nyeresge C/ (n 1) C/n = C/n(n 1) dollr lesz.
Most mr kiszmthatjuk a vrhat nyeresget, ha ismerjk a kutats eredmnyt:
Teht a trsasgnak hajlandnak kell lennie, hogy akr C/n dollrt fizessen a szeizmolgusnak az informcirt:
az informci annyit r, mint maga a terlet.
Az informci rtke abbl a tnybl szrmazik, hogy az informcival valaki az aktulis helyzetben sokkal
alkalmasabb cselekedeteket tud megvlasztani. Az informcival lehetsgess vlik a helyzetek
megklnbztetse, ezzel szemben az informci nlkl a lehetsges helyzetek feletti tlagot nzve kell
cselekedni. ltalnosan fogalmazva, az informci rtkt a vrhat rtkek klnbsge definilja az
informci megszerzse eltt s utn.
6.2. Egy ltalnos kplet

Az informci rtkre egyszer ltalnos formult adni. Rendszerint feltesszk, hogy pontos bizonytkaink
vannak egyes Ej valsznsgi vltozk rtkeirl, gy a teljes informci rtke (value of perfect
information) (TI) elnevezst hasznljuk.6 Legyen az gens jelenlegi tudsa E. Ekkor az pillanatnyi legjobb
cselekvs rtkt a kvetkez definilja:
s a legjobb cselekvs rtke (az Ej j bizonytk megszerzse utn)
Egy X vltozra vonatkoz nem teljes informcit modellezhetnk egy Y vltozrl szl teljes informcival, ahol az Y vltoz
valsznsgi kapcsolatban van X-szel. Erre ad pldt a 16.11. feladat.
6
527
De Ej egy valsznsgi vltoz, aminek az rtke jelenleg nem ismert, gy tlagolnunk kell az sszes lehetsges
ejk rtkre, amelyeket Ej rtkeknt az Ej-re vonatkoz jelenlegi hiedelmnket felhasznlva megkaphatunk. Az Ej
megszerzsnek rtkt a kvetkezkppen definiljuk:
A formula megrtse rdekben gondoljuk t azt az egyszer esetet, mikor csak kt cselekvs, A1 s A2 kzl
lehet vlasztani. A cselekvsek jelenleg vrhat hasznossgai U1 s U2. Az Ej informci j vrhat
hasznossgokat,
-et s
fggetlennek felttelezett
-t fog eredmnyezni a cselekvsekre, de Ej megszerzse eltt mr ismerjk a

s
lehetsges rtkeinek valsznsg-eloszlsait.
Tegyk fel, hogy A1 s A2 kt klnbz utat jelent a hegyeken keresztl, tli idben. A1 egy knyelmes, egyenes
autplya egy alacsony hgn t, mg A2 egy tekervnyes fldt a cscson keresztl. Csak ezt az informcit
ismerve A1 egyrtelmen elnyben rszesthet, mivel elg valszn, hogy a msodik utat lavink zrjk le,
mikzben az els ton valsznleg nincsenek torldsok. U1 ezrt egyrtelmen nagyobb, mint U2. Az utak
aktulis llapotrl Ej mholdjelentseket kaphatunk, melyek
s
j vrhat rtkeket adnak az tkelkre
vonatkozan. A vrhat hasznossgrtkek eloszlst a 16.7. (a) bra mutatja. Nyilvnvalan ebben az esetben a
kltsgek miatt nem ri meg a mholdas jelentseket kikrni, mivel nagyon valszntlen, hogy ezek a
jelentsek a terv megvltozst eredmnyeznk. A tervek vltozatlansga mellett azonban az informcinak
nincs rtke.
Most ttelezzk fel, hogy kt, kiss eltr hosszsg kanyargs fldt kzl vlasztunk, s slyosan srlt
utasokat visznk. Ekkor br lehet, hogy U1 s U2 elg kzel esnek egymshoz, az
s
szles tartomnyon
bell vehetnek fel rtkeket. Jelents eslye van annak, hogy a msodik t tiszta lesz, mg az els le lesz zrva,
s ebben az esetben a hasznossgok klnbsge nagyon nagy lesz. A TI formula azt jelzi, hogy a
mholdjelentseket megri kikrni. Ezt a helyzetet a 16.7. (b) bra mutatja.
16.7. bra - Hrom ltalnos eset az informci rtkre. Az (a) esetben A1 majdnem
teljes bizonyossggal jobb marad A2-hz kpest, gy az informci nem szksges. A (b)
esetben a vlaszts nem egyrtelm, s az informci dnt fontossg. A (c) esetben a
vlaszts bizonytalan, de igazbl nem szmt, gy az informci is kevsb rtkes.
Ttelezzk most azt fel, hogy nyri idben vlasztunk a kt fldt kzl, amikor a lavink igen valszntlenek.
Ebben az esetben a mholdjelentsek azt mutathatjk, hogy az egyik tvonal ltvnyosabb, mint a msik, a
virgz hegyi rtek miatt, vagy taln csak nedvesebb az arra kanyarg patakok miatt. Ekkor igen valszn,
hogy ha megkapjuk ezt az informcit, megvltoztatjuk a tervnket. Azonban ebben az esetben, a klnbsg a
kt t kztt mg mindig igen kicsi, gy nem foglalkozunk a jelentsek megszerzsvel. Ezt a helyzetet a 16.7.
(c) bra mutatja.
Fontos
sszegzsl azt mondhatjuk, hogy az informcinak annyiban van rtke, amennyire valszn, hogy a
terv megvltozst okozza, s amennyire az j terv jelentsen jobb lesz, mint a rgi.
528
6.3. Az informci rtknek tulajdonsgai

rdekes krds, hogy lehetsges-e az, hogy az informci kros lehet-e az informcinak negatv vrhat
rtke? Az a megrzsnk, hogy ez lehetetlen. Vgl is legrosszabb esetben az informci egyszeren
figyelmen kvl hagyhat, s gy tehetnk, mintha soha nem kaptuk volna meg. Ezt igazolja a kvetkez ttel,
ami brmely dntselmleti gensre alkalmazhat. Az informci rtke nem negatv:
j, E
TIE(Ej) 0
A ttel kzvetlenl kvetkezik a TI defincijbl, a bizonytst gyakorl feladatknt az olvasra bzzuk

(16.12. feladat). Fontos emlkezni arra, hogy a TI a jelenlegi informcis llapottl fgg, ezrt szerepel ez az
als indexben. Ez megvltozhat, amint tbb informcit szerznk. Szlssges esetben nulla is lehet, ha a
krdses vltoz rtke mr ismert. gy a TI nem additv. Azaz
TIE(Ej, Ek) TIE(Ej) + TIE(Ek) (ltalnossgban)
Azonban a TI sorrendfggetlen, aminek intuitve nyilvnvalnak kell lennie. Azaz,
A sorrendfggetlensg megklnbzteti az rzkelsi s a hagyomnyos cselekvseket, s egyszersti egy

rzkelsi cselekvssorozat rtknek a kiszmtst.
6.4. Egy informcigyjt gens megvalstsa

Egy rtelmes gensnek a felhasznlhoz sszer sorrendben kell krdseket intznie, nem szabad lnyegtelen
krdseket feltennie, az informci fontossgt a kltsghez kell viszonytania, s a megfelel ponton abba kell
hagynia a krdezskdst. Mindezen kpessgek elrhetk az informcirtk hasznlatnak a segtsgvel.
A 16.8. bra egy olyan gens teljes vzt mutatja, ami mieltt cselekedne, kpes intelligensen informcikat
gyjteni. Idlegesen ttelezzk fel, hogy minden megfigyelhet Ej tnyvltozhoz ltezik egy hozzrendelt
kltsg, Kltsg(Ej), ami a bizonytk tesztek, tancsadk, krdsek s brmi egyb mdszer segtsgvel
trtn megszerzsnek a kltsge. Az gens a legrtkesebb informcit kri el, a kltsgeket is figyelembe
vve. Felttelezzk, hogy a Krs(Ej) cselekvs eredmnye az, hogy a kvetkez rzkels az Ej rtket
szolgltatja. Ha nincs olyan megfigyels, ami megrn a kltsgt, az gens egy nem informcigyjt
cselekvst vlaszt ki.
16.8. bra - Egy egyszer informcigyjt gens vza. Az gens folyamatosan a

legnagyobb informcirtk megfigyelst vlasztja, mindaddig, amg a kvetkez
megfigyels kltsge kisebb, mint a vrhat haszna.
Az itt megadott gens az informcigyjts gynevezett rvidlt (myopic) formjt valstja meg. Ez azrt
van, mert az gens a TI formult rvidlt mdon hasznlja, azaz gy szmtja ki az informci rtkt, mintha
csak egyetlen tnyvltozt szerezne meg. Ha nincsen olyan tnyvltoz, ami sokat segtene, lehet, hogy a
rvidlt gens kapkod mdon belekezd egy cselekvsbe, pedig jobb lett volna elbb lekrdezni kt vagy
hrom vltozt, s csak aztn cselekedni. A rvidlt szablyozs ugyanazon a heurisztikn alapul, mint a moh
keress, s a gyakorlatban gyakran jl mkdik. (Pldul kimutattk, hogy diagnosztikai tesztek kivlasztsban
jobb a teljestmnye, mint az orvosszakrtknek.) Azonban egy teljesen racionlis informcigyjt gensnek
vgig kell gondolnia az sszes lehetsges informcikrs-szekvencit, ami egy kls akciban vgzdik, s
529
ezeknek a krseknek az sszes lehetsges kimenetelt. Mivel a msodik krs rtke fgg az els krs
kimeneteltl, az gensnek fel kell dertenie a feltteles tervek tert, amint azt a 12. fejezetben lertuk.
7. Dntselmleti szakrt rendszerek

Az 1950-es s az 1960-as vekben kifejldtt dntselemzs (decision analysis) a dntselmlet alkalmazst
tanulmnyozza konkrt dntsi problmkon. F alkalmazsi terlete a kiemelt fontossg terleteken
meghozand dntsek segtse, ahol a ttek igen nagyok, ilyen terletek pldul az zleti let, a kormnyzati
munka, a trvnyhozs, a katonai stratgia, az orvosi diagnosztika s a kzegszsggy, a mrnki tervezs s
az erforrs-gazdlkods. A folyamat magban foglalja a lehetsges cselekvsek s kimenetelek gondos
tanulmnyozst csakgy, mint a kimenetelek kztti preferencikt. A dntselemzsben hagyomnyosan kt
szerepet tteleznek fel: a dntshoz (decision maker) a kimenetelek kztti preferencikat hatrozza meg, a
dntselemz (decision analyst) pedig a lehetsges cselekvseket, kimeneteleket veszi szmba, s kikrdezi a
preferencikat a dntshoztl, hogy meghatrozza a legjobb cselekvst. Az 1980-as vek elejig a
dntselemzs cljt abban lttk, hogy az embereket segtsk olyan dntsek meghozatalban, amik a tnyleges
preferenciiknak felelnek meg. Manapsg egyre tbb s tbb dntsi folyamat automatizlt, s a dntselemzst
annak biztostsra hasznljk, hogy az automatizlt folyamatok megfelelen alakuljanak.
Ahogy errl a 14. fejezetben szltunk, a korai szakrti rendszerekkel kapcsolatos kutats inkbb krdsek
megvlaszolsra irnyult, mint dntsek meghozatalra. Azok a rendszerek, amelyek cselekvseket javasoltak
a vlemnynyilvnts helyett, valjban ha-akkor szablyokkal rtk ezt el, nem pedig a kimenetelek s
preferencik kzvetlen reprezentcijval. A valsznsgi hlk megjelense az 1980-as vek vge krl
azonban lehetv tette olyan nagy rendszerek megptst, amelyek helyes valsznsgi kvetkeztetseket
szrmaztattak a tnyekbl. A dntsi hlk megjelense azt jelentette, hogy olyan szakrti rendszereket lehet
kifejleszteni, amelyek optimlis dntseket javasolnak a felhasznl preferenciinak s az elrhet tnyeknek
megfelelen.
Egy rendszer, ami a hasznossgokat kzvetlenl tartalmazza, elkerlheti a tancsadi folyamatok egy gyakori
csapdjt: a valsznsg s a fontossg sszekeverst. Megszokott mdszer volt pldul a korai orvosszakrti
rendszerekben, hogy a lehetsges diagnzisokat a valsznsgk alapjn sorba lltottk, s a legvalsznbbet
jelentettk. Sajnos ez vgzetes lehet! ltalban a pciensek tbbsgnl a kt legvalsznbb diagnzis
tbbnyire az, hogy semmi baj sincs s megfzott, ha azonban a harmadik legvalsznbb diagnzis egy
pciensnl a tdrk, az mr aggodalomra ad okot. Nyilvnval, hogy a teszteknek s a kezelseknek mind a
valsznsgektl, mind a hasznossgoktl kell fggenik.
A kvetkezkben lerunk egy dntselmleti szakrti rendszerhez tartoz tudsmrnki folyamatot. Pldaknt
egy orvosi problmt ismertetnk, amiben kezelseket kell megvlasztani bizonyos veleszletett
szvrendellenessgek esetn (Lucas, 1996).
A gyermekek 0,8 szzalka szvrendellenessggel szletik, ami tbbnyire aortaszklet (aortic coarctation).
Ez a rendellenessg sebszi beavatkozssal, rmtttel (kitgtjk az aortt egy ballont helyezve az artriba)
vagy gygyszerrel kezelhet. A feladat a kezels megvlasztsa s annak eldntse, hogy mikor vgezzk el:
minl fiatalabb egy gyermek, annl nagyobb a kockzata bizonyos kezelseknek, de tl sokig sem szabad
vrni. A problmhoz egy dntselmleti szakrti rendszer kszthet egy olyan csapattal, amelynek legalbb
egy orvosszakrt (egy gyermekkardiolgus) s egy tudsmrnk tagja van. A folyamat a kvetkez lpsekre
bonthat (amelyek sszehasonlthatk a logikai rendszerek tervezsnek lpseivel a 8.4. alfejezetben).
Alkosson meg egy oksgi modellt. Hatrozza meg a lehetsges tneteket, rendellenessgeket, kezelseket s
kimeneteleket. Aztn jelezze kzttk halad nyilakkal, hogy melyik rendellenessg milyen tneteket okozhat,
s melyik kezels milyen rendellenessgekre hatsos. Ezek egy rsze a trgyterleti szakrt szmra ismert
lesz, ms rszk a szakirodalombl szrmazhatnak. Gyakran a modell jl fog illeszkedni a szakknyvek
lersaiban szerepl informlis diagramokhoz.
Egyszerstse a kvalitatv dntsi modellt. Mivel a modellt kezelsek kztti vlasztsra tervezzk hasznlni,
s nem ms clokra (mint pldul bizonyos rendellenessgek/tnetek kombinciihoz rendelhet egyttes
valsznsgek kiszmtsra), gy gyakran elhagyhatunk vltozkat, amelyek nem befolysoljk a kezelsek
megvlasztst. Gyakran a vltozkat fel kell bontani vagy ssze kell olvasztani, hogy megfeleljen a szakrt
gondolkodsmdjnak. Pldul az eredeti aortaszkleti modellben szerepelt egy Kezels vltoz mtt,
rsebszet vagy gygyszeres kezels rtkekkel, s egy nll vltoz a kezels Idzts-re. Azonban a
530
szakrtnek nehz volt ezeket kln kezelni, ezrt ssze kellett olvasztani, gy a Kezels olyan rtkeket vehet
fel, mint mtt egy hnapon bell. Ezt a modellt mutatja be a 16.9. bra.
Rgztse a valsznsgeket. A valsznsgek betegek adatbzisbl, szakirodalmi tanulmnyokbl vagy
szakrtk szubjektv becslseibl szrmazhatnak. Azokban az esetekben, amikor nem megfelel formban
rhetk el a szakirodalomban a valsznsgek, akkor Bayes-szabllyal s vettssel szmthatjuk ki a kvnt
rtkeket. Bebizonyosodott, hogy a szakrtk leginkbb egy ok hatsnak a valsznsgt tudjk megbecslni
(pldul P(nehzlgzs|szvelgtelensg)) sokkal inkbb, mint a msik irnyban.
Rgztse a hasznossgokat. Kevs szm kimenetel esetn ezek felsorolhatk s egyenknt kirtkelhetk.
Meghatrozhatunk egy sklt a legrosszabbtl a legjobb kimenetelig, mindegyikhez egy numerikus rtket
rendelve, pldul 1000-et az elhallozshoz s 0-t a teljes felplshez. Ekkor a tbbi kimenetel mr ezen a
skln elhelyezhet. Ezt elvgezheti egy szakrt, de jobb, ha a betegek (vagy gyermekek esetn a szleik) is
rszt vesznek ebben, mivel a klnbz embereknek klnbz preferenciik vannak. Exponencilisan sok
kimenetel esetn szksgnk van olyan mdszerekre, hogy tbbattribtum hasznossgfggvnyekkel
kombinlhassuk ket. Pldul feltehetjk, hogy a klnbz komplikcik negatv hasznossga additv.
Ellenrizze s finomtsa a modellt. A rendszer kirtkelshez szksgnk van helyes (bemenet, kimenet)
prokra; az gynevezett referencikra (gold standard), amihez lehet hasonltani. Ez orvosszakrt rendszerek
esetn azt jelenti, hogy sszehvjuk az elrhet legjobb orvosszakrtket, nhny beteg esett megmutatjuk
nekik, diagnzis fellltsra s kezelsi javaslat meghatrozsra krjk ket. Majd megnzzk, hogy a
rendszer mennyire illeszkedik a javaslataikhoz. Ha csak kevss, akkor megprbljuk a rosszul teljest rszeket
azonostani s megjavtani. Hasznos lehet a rendszert visszafel tesztelni. Ahelyett hogy a rendszerbe a
tneteket vinnnk be, s diagnzist krnk, vigyk be a diagnzist, mint pldul szvelgtelensg, s vizsgljuk
meg a tnetek, mint pldul szapora szvvers, jsolt valsznsgeit, s hasonltsuk ezt ssze szakirodalmi
adatokkal.
16.9. bra - Az aortaszklet hatsdiagramja (Peter Lucas hozzjrulsval)
531
Vgezzen rzkenysgvizsglatot. Ez a fontos lps azt ellenrzi, hogy a legjobb dnts rzkeny-e a megadott
valsznsgek s hasznossgok kis vltozsra, ehhez szisztematikusan vltoztassuk meg ezeket a
paramtereket, s futtassuk le a kirtkelst jra. Ha kis vltozsok jelentsen eltr dntst eredmnyeznek,
akkor lehet, hogy megri tbb energit rsznni, hogy pontosabb adatokat gyjtsnk. Ha minden vltoztats
ugyanahhoz a dntshez vezet, akkor a felhasznl biztos lehet, hogy ez a helyes dnts. Az
rzkenysgvizsglat klnsen fontos lehet, mivel az egyik f kritikja a szakrti rendszerek valsznsgi
megkzeltsnek, hogy nagyon nehz a szksges numerikus valsznsgek megbecslse. Az
rzkenysgvizsglat gyakran kimutatja, hogy sok numerikus rtket elg kzeltleg meghatrozni. Pldul
bizonytalanok lehetnk a P(tachycardia) a priori valsznsgben, de ha kiprblunk klnbz rtkeket erre a
valsznsgre, s minden egyes esetben a javasolt cselekmny a hatsdiagram alapjn ugyanaz, akkor kevsb
kell foglalkoznunk ezzel az ismerethinnyal.
8. sszefoglals
Ez a fejezet megmutatta, hogy hogyan kombinlhatjuk ssze a hasznossgelmletet a valsznsgekkel,
lehetv tve az gensnek olyan cselekvsek kivlasztst, amelyek maximalizlni fogjk a vrhat
teljestmnyt.
A valsznsg-elmlet (probability theory) elrja, hogy az gens a tnyei alapjn milyen hiedelmekkel
rendelkezzen, a hasznossgelmlet (utility theory) azt rja el, hogy az gens mit akar, a dntselmlet
(decision theory) pedig sszeilleszti a kettt, s elrja, hogy az gens mit tegyen.
532
A dntselmlet felhasznlsval pthetnk egy olyan rendszert, ami a dntsek meghozatalakor figyelembe
veszi az sszes lehetsges cselekvst, s azt vlasztja ki, ami a legjobb vrhat kimenetelt adja. Egy ilyen
rendszert racionlis gensnek (rational agent) nevezhetnk.
A hasznossgelmlet megmutatja, hogy az gens, amelynek szerencsejtkok kztti preferencii eleget
tesznek bizonyos egyszer aximknak, lerhat egy hasznossgfggvnnyel; tovbb az gens a cselekvseit
gy vlasztja meg, mintha a vrhat hasznossgt maximalizln.
A tbbattribtum hasznossgelmlet (multiattribute utility theory) olyan hasznossgokkal foglalkozik,
amelyek az llapotok tbb, klnbz attribtumtl fggnek. A sztochasztikus dominancia (stochastic
dominance) egy klnsen hasznos technika egyrtelm dntsek meghozatalra mg az attribtumok
pontos hasznossgrtkei nlkl is.
A dntsi hlk (decision networks) egy egyszer formalizmust biztostanak a dntsi problmk lersra
s megoldsra. Ezek a valsznsgi hlk magtl rtetd kiterjesztsei dntsi s hasznossgi
csompontokkal a vletlen csompontokon tl.
Bizonyos esetekben a problma megoldshoz hozztartozik a tbbletinformci megszerzse a dnts
meghozatala eltt. Az informci rtkt (value of information) gy definiljuk, mint a vrhat hasznossg
javulst az informci nlkli helyzethez hasonltva.
Azok a szakrt rendszerek (expert systems), amelyek hasznossginformcikat is tartalmaznak,
tbbletkpessggel rendelkeznek a tisztn kvetkeztet rendszerekhez kpest. Azon tl, hogy dntseket
tudnak hozni, dnthetnek az informci megszerzsrl annak rtke alapjn, s kiszmthatjk dntseiknek
a valsznsgek s hasznossgok kis megvltozsra vonatkoz rzkenysgt.

A maximlis vrhat hasznossg elvnek az egyik legkorbbi, br vgtelen hasznossgokat is tartalmaz
szokatlan alkalmazsa Pascal fogadsa volt, melyet elszr mint a Port-Royal Logic egy rszt Arnauld kzlt
(Arnauld, 1662). Daniel Bernoulli volt az els, a szentptervri paradoxont vizsglva, aki felismerte a
szerencsejtkokra vonatkoz preferencik felmrsnek a fontossgt, megllaptva, hogy egy dolog rtkt
nem az rnak kell meghatroznia, hanem a hasznossgnak, amit eredmnyez (Daniel Bernoulli, 1738,
eredeti kiemels). Jeremy Bentham javasolta a hedonisztikus kalkulust (hedonistic calculus) az rmk s
bnatok sszehasonltsra, amellett rvelve, hogy minden dntsnek (nem csak a pnzgyieknek)
reduklhatnak kell lennie hasznossgok sszehasonltsra (Bentham, 1823).
A numerikus hasznossgok szrmaztatsa a preferencikbl Ramseynl jelent meg elszr (Ramsey, 1931); a
jelenlegi szvegben a preferencikra megadott aximk megfogalmazsukban kzelebb llnak azokhoz az
aximkhoz, amelyek egy jrafelfedezs sorn a Theory of Games and Economic Behaviorben (Neumann s
Morgenstern, 1944) jelentek meg. Ezeknek az aximknak kivl bemutatst adja Howard a
kockzatpreferencik trgyalsa sorn (Howard, 1977). Ramsey szubjektv valsznsgeket (nem pontosan
hasznossgokat) vezetett le az gens preferenciibl; mostanban Savage s Jeffrey vitt vgbe hasonl
konstrukcit (Savage, 1954; Jeffrey, 1983). Von Winterfeldt s Edwards modernebb szempontbl ismerteti a
dntselemzst s annak az emberi preferenciastruktrkkal val kapcsolatt (Von Winterfeldt s Edwards,
1986). A mikrohall hasznossgmrtket Howard elemzi (Howard, 1989). Az Economist egy 1994-es felmrse
egy emberi let rtkt 750 000 s 2,6 milli dollr kzz teszi. Azonban Richard Thaler irracionlis varinsokat
tallt arra nzve, hogy mennyit hajland valaki fizetni, hogy elkerljn egy hallos kockzatot, ahhoz kpest,
hogy mennyirt hajland felvllalni ugyanazt a kockzatot. 1/1000 esly esetn a vlaszad maximum 200
dollrt fizetne, hogy elkerlje a kockzatot, mg 50,000 dollrrt sem hajland felvllalni ezt a kockzatot
(Thaler, 1992).
A QALY-t sokkal szlesebb krben hasznltk orvosi s trsadalmi dntsek meghozatalnl, mint a
mikrohallt, lsd (Russell, 1990), ami jellemz pldja azoknak az rvelseknek, hogy a QALY-t hasznl
vrhat hasznossg nvekedsnek alapjn a kzegszsggyben alapos vltoztatsokra van szksg.
A Decisions with Multiple Objectives: Preferences and Value Tradeoffs (Keeney s Raiffa, 1976) c. knyv
rszletes bevezetst ad a tbbattribtum hasznossgelmletbe. Ez olyan mdszerek korai szmtgpes
megvalstst rja le, amelyekkel a tbbattribtum hasznossgfggvnyhez a szksges paramterek
kikrdezhetk, s hosszasan trgyalja az elmlet vals alkalmazsait. Az MI-n bell a legels hivatkozs az
MVH elvre Wellman cikke volt (Wellman, 1985), amely egy URP-nek (Utility Reasoning Package) nevezett
533
rendszert tartalmaz, ami kpes kezelni a preferencik fggetlensgrl s feltteles fggetlensgrl szl
lltsokat, hogy elemezze a dntsi problma struktrjt. A sztochasztikus dominancit a kvalitatv
valsznsgi modellel Wellman vizsglta alaposan (Wellman, 1988; 1990a). Wellman s Doyle egy elzetes
vzlatt adja annak, hogy hogyan lehet felhasznlni hasznossg-fggetlensg relcik komplex halmazt a
hasznossgfggvny strukturlt modelljnek megalkotshoz, hasonlan ahhoz, ahogyan a valsznsgi hl az
egyttes valsznsgeloszls-fggvny strukturlt modelljt adja (Wellman s Doyle, 1992). Bacchus s
Grove, valamint La Mura s Shoham tovbbi eredmnyeket kzl ezzel kapcsolatban (Bacchus s Grove, 1995;
1996; La Mura s Shoham, 1999).
A dntselmlet mr az 1950-es vek ta szabvnyos eszkz a kzgazdasgtanban, a pnzgyben s a
menedzsment tudomnyban. Az 1980-as vekig az egyszer dntsi szitucik reprezentlsra a dntsi fk
voltak a f eszkzk. A dntsi hlkat vagy hatsdiagramokat Howard s Matheson vezette be (Howard s
Matheson, 1984), br a szksges fogalmakat mr korbban kifejlesztette egy csoport (benne Howard s
Matheson) az SRI-nl (Miller s trsai, 1976). Howard s Matheson eljrsa azonban egy kzbens lpst, a
dntsi hlnak egy dntsi fra trtn trst tartalmazta, ahol ltalnos esetben a fa exponencilis mret
volt. Shachter kifejlesztett egy eljrst, ami kzvetlenl a dntsi hlkon alapult anlkl, hogy egy kzbees
dntsi ft hozna ltre (Shachter, 1986). Ez az algoritmus volt az els, amely teljes kvetkeztetst tudott
elvgezni tbbszrsen sszekttt Bayes-hlkban. Egy mostani munkban Nilsson s Lauritzen
sszekapcsolta a dntsi hlkhoz tartoz algoritmusokat a Bayes-hlknl kifejlesztett klaszterezsi
algoritmusokkal (Nilsson s Lauritzen, 2000). Oliver s Smith gyjtemnye szmos hasznos cikket tartalmaz a
dntsi hlkrl, mint ahogy a Networks folyirat 1990-es klnkiadsa is hasznos cikkekbl ll (Oliver s
Smith, 1990). Dntsi hlkrl s hasznossgmodellezsrl szl cikkek a Management Science-ben is
rendszeresen megjelennek.
Az informcirtk-elmletet Ron Howard elemezte elszr (Howard, 1966). Ez a cikke a kvetkez
megjegyzssel r vget: Ha az informcirtk-elmlet s a hozz kapcsold dntselmleti struktrk a
jvben nem kpezik igen nagy rszt a mrnkk kpzsnek, akkor a mrnki szakma azt fogja ltni, hogy
hagyomnyos szerept, a tudomnyos s kzgazdasgi erforrsoknak az emberisg elnyre trtn kezelst,
egy msik szakma elorozta. A hivatkozott forradalom a vezetsi mdszerekben a mai napig nem kvetkezett
be, br ez vltozhat amint az informcirtk-elmlet felhasznlsa a bayesi szakrt rendszerekben
elterjedtebb vlik.
Az orvosi dntseknl trtn korai alkalmazsoktl eltekintve meglepen kevs MI-kutat alkalmazta a 13.
fejezetben trgyalt dntselmleti eszkzket. A kevs kivtelek egyike Jerry Feldman volt, aki a
dntselmletet a lts problmjra (Feldman s Yakimovsky, 1974) s a tervkszts problmjra (Feldman
s Sproull, 1977) alkalmazta. Az 1980-as vekben aztn hirtelen jra megntt az rdeklds az MI rszrl a
valsznsgi mdszerek irnt, a dntselmleti szakrt rendszerek szles krben elterjedtekk vltak (Horvitz
s trsai, 1988) valjban 1991-tl mg az Artificial Intelligence fedlapja is egy dntsi hlt brzolt, br
lve mvszi szabadsgukkal egyes nyilak irnyt megvltoztattk.
8.2. Feladatok
16.1.
(David Heckerman alapjn, de a magyar kiads Guinness Rekordok Knyvre alapozva [Guinness Rekordok
Knyve 1991, Solaris Kft., Budapest].) Ez a feladat az Almanac Game-hez kapcsoldik, amit dntselemzk
hasznlnak a numerikus becslsek kalibrlsra. Adjon becslst az albbi problmkra, azaz azt a szmot adja
meg, amirl gy gondolja, hogy ugyanolyan valsznsggel lehet tl nagy is, mint tl kicsi. Prblja meg
eltallni a 25 percentilises becslst is, azaz azt a szmot, amirl gy gondolja, hogy 25% eslye van, hogy tl
nagy lesz, s 75% eslye, hogy tl kicsi. Ugyangy tippelje meg a 75 percentilisest is. (gy minden egyes
krdsre hrom becslst kell megadnia sszesen egy kisebbet, a medint s egy nagyobb rtket.)
a. Melyik vben szlettek meg az els (nvad) szimi ikrek?
b. Hny helyi rtkig kpes valaki emlkezetbl visszaidzni a szmot?
c. Hny rk volt az eddig megfigyelt legnagyobb krill rajban?
d. A kkorszak ta a hborktl s a katasztrfktl eltekintve az elhallozsok hny szzalkrt felels a
malriasznyog?
534
e. Az llatkertekben vgzett mrsek szerint egy kifejlett csimpnz hnyszor ersebb egy tlagos normlis
frfinl?
f. Az eddigi legmagasabb fellltott karcsonyfa magassga?
g. Milyen hossz a Csendes-cent tszel legrvidebb hajt hossza?
h. A Fld tlagos srsge hnyszorosa a vznek?
i. Egy vben tlagosan hny esetben szlelnek szeizmikus tevkenysget, ebbl mennyi rezheto, s mennyi
okoz krt?
j. Milyen magas a hmrsklet a Holdon a legjobban napsttte helyen (Egyenltre merlegesen)?
A helyes vlaszok a fejezet utols feladata utn tallhatk meg. A dntselemzs szempontjbl nem az az
rdekes, hogy az n medintippjei milyen kzel vannak a valdi vlaszokhoz, hanem inkbb az, hogy milyen
gyakran van a valdi rtk az n ltal tippelt 25%-os s 75%-os hatr kztt. Ha ez az esetek felnl gy van,
akkor a hatrai pontosak. De ha n az emberek tbbsghez hasonl, akkor a kelletnl magabiztosabb, s az
esetek felnl kevesebbszer lesz az igazi rtk az n ltal tippelt hatrokon bell. Ezen gyakorlssal javthat,
s gy hasznosabb informcit nyjthat a dntshozshoz. Prblja ki ezt a msodik krdssort, hogy lssa,
bekvetkezett-e valamilyen javuls:
a. Becslsek szerint Picasso hny kpet, illetve vzlatot festett az lete sorn?
b. Hny statiszta szerepel Sir Richard Attenborough Ghandi c., 1982-ben kszlt filmjnek temetsi
jelenetben?
c. Milyen magas a vilg legmagasabb ptmnye (varsi rditorony)?
d. Milyen hossz a transzszibriai vastplya?
e. Hny utas fordult meg az OHara chicagi repltren 1988-ban?
f. A vilg leglassabban mozg mechanikus szerkezete (ra) hny v alatt tesz meg egy fordulatot?
g. A dobozos sr piacra dobsnak ve?
h. A vilg legnagyobb tojsgyrban, a Croton Egg Farmon Amerikban a cg tykjai hny tojst tojnak
naponta?
i. Milyen volt a npsrsg 1968-ban Maca portugl tartomnyban, a vilg legsrbben lakott helyn?
j. A Man-szigeten lsezik a megszakts nlkl leghosszabb ideje fennll trvnyhozs. Az idn hny ves?
k. Mikor helyeztk zembe az els forgalomirnyt jelzlmpkat (Londonban)?
l. Mikor alakult a Nemzetkzi Labdarg Szvetsg (a FIFA)?
16.2.
Az llami szerencsejtk 1 dollrba kerl. Kt lehetsges dj van: 10 dollr 1/50 valsznsggel s 1 000 000
dollr 1/2 000 000 valsznsggel. Mennyi a szerencsejtkjegy vrhat pnzgyi rtke? Mikor racionlis (ha
van ilyen helyzet egyltaln) jegyet vsrolni? Pontosabban mutassa ezt be egy hasznossgokat tartalmaz
egyenlettel. Azt felttelezheti, hogy U(10 dollr) = 10 U(1 dollr), de U(1 000 000 dollr)-ra hasonlt nem
lehet felttelezni. Szociolgiai tanulmnyok mutatjk, hogy az alacsonyabb jvedelm emberek arnytalan
szm sorsjegyet vsrolnak. Mit gondol, ez azrt van, mert rosszabb dntshozk, vagy mert eltr
hasznossgfggvnyk van?
16.3.
J. Bernoulli 1738-ban vizsglta a szentptervri paradoxont, ami a kvetkez. Lehetsge nylik rszt venni egy
szerencsejtkban, amelyben egy szablyos rmt dobnak fel ismtelten az els fej elfordulsig. Ha az els fej
az n-edik dobsnl kvetkezik be, akkor a nyeremnye 2n dollr.
535
a. Mutassa meg, hogy ennek a jtknak a vrhat pnzgyi rtke vgtelen.

b. Mennyit fizetne n, szemly szerint a rszvtelrt?
c. Ezt a nyilvnval paradoxont Bernoulli azzal a javaslattal oldotta meg, hogy a pnz hasznossga logaritmikus
sklt kvet (azaz U(Sn) = a + log2n + b, ahol Sn azt az llapotot jelli, hogy n dollrunk van). Mi a jtk
vrhat hasznossga ezzel a feltevssel?
d. Mi az a maximum sszeg, amit racionlis lenne kifizetni a rszvtelrt, feltve, hogy a kezdeti vagyona k
dollr?
16.4.
Becslje meg a sajt hasznossgfggvnyt klnbz pnznvekmnyekre. Ezt gy teheti meg, hogy egy sor
preferenciatesztet futtat egy meghatrozott M1 sszeg s egy [p, M2; (1 p), 0] szerencsejtk kztt. Vlasszon
klnbz M1 s M2 rtkeket, s vltozassa addig p-t, ameddig nem lesz n szmra kzmbs, hogy melyiket
vlasztja a kett kzl. brzolja a hasznossgfggvnyt.
16.5.
rjon szmtgpes programot, ami automatizlja a 16.4. feladat folyamatt. Prblja ki a programot klnbz
htter s politikai irnyultsg embereken. Elemezze eredmnyei konzisztencijt az sszes szemly esetn s
egyetlen szemly esetn is.
16.6.
Mennyit r egy mikrohall nnek? Fejlesszen ki protokollt ennek meghatrozsra. Fogalmazzon meg
krdseket abbl a szempontbl, hogy mennyit r a kockzat elkerlse, s abbl a szempontbl is, hogy
mennyirt vllalja a kockzatot.
16.7.
Mutassa meg, hogyha X1 s X2 preferencilisan fggetlen X3-tl, s X3 s X2 preferencilisan fggetlen X1-tl,
akkor szksgszeren X1 s X3 is preferencilisan fggetlen X2-tl.
16.8.
Ez a feladat a 16.5. brn bemutatott repltri elhelyezsi problma elemzst fejezi be.
a. Adjon meg sszer, a tmakrhz kapcsold vltozkat, valsznsgeket s hasznossgokat a hl
szmra, felttelezve, hogy hrom helyszn van.
b. Oldja meg a dntsi problmt.
c. Mi trtnik, ha a mszaki fejlds kvetkeztben a replgpek csak fele akkora zajt okoznak?
d. s ha a zaj elkerlse hromszor fontosabb vlik?
e. Szmolja ki a TI mennyisget a LgiForgalom, a Pereskeds s az ptkezs esetn a modellben.
16.9.
Ismtelje meg a 16.8. feladatot, felhasznlva a 16.6. brn lthat cselekvshasznossg-reprezentcit.
16.10.
Melyik feltteles valsznsgi tbla bejegyzsre a legrzkenyebb a hasznossg a 16.8. s a 16.9. feladatban
konstrult repltri elhelyezsi diagramok esetn, ha az elrhet tnyeket ismerjk.
16.11.
(Judea Pearltl tvett feladat [Pearl, 1988].) Egy hasznlt autt vsrl eltr kltsgek mellett klnbz
teszteket vgeztethet (pldul megrugdossa a gumikat, autszerelhz viszi a kocsit), majd a tesztek eredmnye
536
alapjn eldnti, hogy melyik autt vegye meg. Felttelezzk, hogy a vsrl akkor veszi meg a c1 autt, ha elg
id van legalbb egy teszt elvgzsre, tovbb, hogy c1-nek t1 a tesztje, s ez 50 dollrba kerl.
A kocsi j llapotban (q+ minsg) vagy rossz llapotban (q minsg) lehet, s a tesztek segthetnek a kocsi
llapotnak meghatrozsban. A c1 kocsi 1500 dollrba kerl, piaci rtke azonban 2000 dollr, ha j
llapotban van; ha nem, akkor 700 dollr szksges a j llapotba hozshoz. A vsrl gy becsli, hogy 70%
eslye van, hogy a kocsi j llapotban van.
a. Rajzolja fel a dntsi hlt, ami ezt a problmt reprezentlja.
b. Szmtsa ki a vrhat nett nyeresget c1 megvsrlsa esetn, ha nincsenek tesztek.
c. A tesztek azzal a valsznsggel jellemezhetk, hogy a kocsi tmegy-e a teszten vagy elbukik, attl
fggen, hogy j vagy rossz llapotban van. A kvetkez informcikkal rendelkeznk:
P(tmegy(c1, t1)|q+(c1)) = 0,8
P(tmegy(c1, t1)|q(c1)) = 0,35
Felhasznlva a Bayes-ttelt, szmtsa ki annak valsznsgt, hogy a kocsi tmegy (vagy elbukik) a teszten, s
gy azt a valsznsget, hogy j vagy rossz llapotban van adott tesztkimenetel esetn.
d. Szmtsa ki az optimlis dntst, ha tmegy, illetve ha elbukik, s szmtsa ki a vrhat hasznossgukat.
e. Szmtsa ki a teszt informcirtkt, s vezesse le a vsrl optimlis tervt.
16.12.
Bizonytsa be, hogy az informci rtke nem negatv s sorrendfggetlen, amint azt a 16.6. alfejezetben
lltottuk. Magyarzza el, hogyan lehetsges, hogy valaki rosszabb dntst hoz az informci megkapsa utn,
mint amit a megkapsa eltt hozott volna.
16.13.
Mdostsa s egsztse ki a Bayes-hls kdot a kdtrban, hogy kpes legyen dntsi hlkat ltrehozni s
kirtkelni, illetve kiszmtani az informci rtkt.
A 16.1. feladat vlaszai: Els sorozat: 1811, 40 ezer, 10 milli, 50%, 5-6, 67,36 m, 17 550 km, 5,515, 500 000,
100 000, 1000, 117,2 C. Msodik sorozat: 13 500, 300 000, 646,28 m, 9438 km, 56 281 000, 25 753, 1935, 3,7
milli, 28 343 f/km2, 1020, 1868, 1904.
537
17. fejezet - Komplex dntsek

meghozatala
Ebben a fejezetben olyan mdszereket vizsglunk meg, amelyekkel eldnthetjk, hogy mit tegynk a mai napon,
felttelezve, hogy holnap is lehetsgnk lesz a cselekvsre.
Ebben a fejezetben a dntshozatalhoz kapcsold szmtsi krdseket trgyaljuk meg. Mg a 16. fejezetben
egyszeri vagy epizodikus dntsi problmkkal foglalkoztunk, ahol az egyes cselekvsek kimeneteleinek a
hasznossga jl ismert volt, a 17. fejezetben szekvencilis dntsi problmkkal (sequential decision
problems) fogunk foglalkozni, ahol az gens hasznossga a dntsek sorozattl fgg. A szekvencilis dntsi
problmk, amelyek hasznossgot, bizonytalansgot s rzkelst is magukban foglalnak, a keress s tervezs
problmjt ltalnostjk, melyeket a II., illetve a IV. rszben rtunk le. A 17.1. alfejezet kifejti, hogyan
definilhatunk szekvencilis dntsi problmkat, a 17.2. s a 17.3. alfejezet elmagyarzza ezek megoldst,
hogy optimlis viselkedst eredmnyezzenek, amely kiegyenslyozza a bizonytalan krnyezetben meghozott
cselekvsek kockzatt s jutalmt. A 17.4. alfejezet kiterjeszti ezeket az tleteket a rszlegesen megfigyelhet
krnyezetekre, s a 17.5. alfejezet egy teljes tervezsi mdot fejleszt ki rszlegesen megfigyelhet krnyezetben
lv dntselmleti gensek tervezsre, sszekapcsolva a dinamikus Bayes-hlkat a 15. fejezetbl a 16.
fejezetbeli dntsi hlkkal.
A fejezet msodik rsze tbbgenses krnyezeteket trgyal. Ilyen krnyezetekben az optimlis viselkeds
fogalma sokkal bonyolultabb vlik az gensek kztti interakci miatt. A 17.6. alfejezet ismerteti a
jtkelmlet (game theory) alaptleteit, idertve azt az elkpzelst is, hogy egy racionlis gensnek lehet, hogy
vletlenszeren kell viselkednie. A 17.7. alfejezet azt vizsglja meg, hogyan tervezhetk olyan tbbgenses
rendszerek, amelyekben az gensek egy kzs clt tudnak megvalstani.
1. Szekvencilis dntsi problmk

1.1. Egy plda
Ttelezzk fel, hogy egy gens a 17.1. (a) brn lthat 4 3-as krnyezetben helyezkedik el. A kezd
llapotbl indulva minden idpontban vlasztania kell egy cselekvst. A krnyezettel val interakci lell, ha az
gens elri a +1-gyel vagy a 1-gyel jellt llapotot. Az egyes helyzetekben az elrhet cselekvsek nevei: Fel,
Le, Balra, Jobbra. Egyelre felttelezzk, hogy a krnyezet teljesen megfigyelhet (fully observable), azaz az
gens mindig ismeri a helyzett.
17.1. bra - (a) Egy egyszer 4 3-as krnyezet, ami az gens szmra szekvencilis
dntsi problma. (b) A krnyezet llapottmenet-modelljnek illusztrlsa: a
szndkolt kimenetel 0,8 valsznsggel kvetkezik be, de 0,2 valsznsggel az
gens oldalra mozdul a szndkolt irnyhoz kpest. A fallal val tkzskor nincsen
mozgs. A kt vgllapot jutalma a jelzett +1 s 1, az sszes tbbi llapot jutalma
0,04.
538
Komplex dntsek meghozatala
Ha a problma determinisztikus volna, a megolds knny lenne: [Fel, Fel, Jobbra, Jobbra, Jobbra]. Sajnos a
krnyezet nem maradna mindig szinkronban ezzel a megoldssal, mivel a cselekvsek megbzhatatlanok. A
vletlenszer mozgs egy ltalunk elfogadott modelljt a 17.1. (b) bra mutatja be. Minden cselekvs 0,8
valsznsggel ri el a kvnt hatst, de a maradk esetben a cselekvsek az genst a kvnt irnytl jobbra
mozgatjk. Tovbb, ha az gens falba tkzik, akkor ugyanazon a mezn marad. Pldul ha az (1, 1) kezd
ngyzeten ll, a Fel cselekvs az genst az (1, 2)-re mozgatja 0,8 valsznsggel, de 0,1 valsznsggel a (2,
1)-re kerl, s 0,1 valsznsggel balra megy, ahol is falnak tkzik s (1, 1)-en marad. Egy ilyen krnyezetben
a [Fel, Fel, Jobbra, Jobbra, Jobbra] sorozat 0,85 = 0,32768 valsznsggel kerli meg az akadlyokat, s ri el
a (4, 3) clllapotot. Igen kis esllyel az is megtrtnhet, hogy a clt a msik ton keresztl ri el, 0,1 4 0,8, ami
sszessgben 0,32776 valsznsget jelent (lsd 17.1. feladat).
Az egyes llapotokban vgrehajtott egyes akciknak a kimeneti valsznsgeit llapottmenet-modellnek
(transition model) nevezzk, (vagy csak modell-nek, ha nem rtelemzavar). A T(s, a, s) jellst fogjuk
hasznlni annak a valsznsgnek a jellsre, hogy az s llapotban az a cselekvs vgrehajtsa s llapotot
eredmnyez. Feltesszk, hogy az tmenetek teljestik a 15. fejezetben megfogalmazott Markov-tulajdonsgot,
azaz, hogy s elrse s-bl csak s-tl fgg, ms korbbi llapotoktl mr nem. Egyelre a T(s, a, s)-t
tekinthetjk a valsznsgek egy nagy hromdimenzis tblzatnak. Ksbb, a 17.5. alfejezetben ltni fogjuk,
hogy az llapottmenet-modell reprezentlhat dinamikus Bayes-hlkkal (dynamic Bayesian network),
csakgy mint a 15. fejezetben.
Hogy teljess tegyk a feladat krnyezetnek a definilst, meg kell adnunk az gens hasznossgfggvnyt.
Mivel a dntsi problma szekvencilis, a hasznossgfggvny az llapotok sorozattl a krnyezeti
trtnettl (environment history) fog fggni, nem pedig egyetlen llapottl. A fejezetben ksbb
megvizsgljuk az ilyen hasznossgfggvnyek ltalnos megadst; egyelre egyszeren kiktjk, hogy az
gens minden s llapotban egy R(s) jutalmat (reward) kap, ami lehet pozitv vagy negatv, de mindenkppen
korltos. A konkrt pldnkban a jutalom minden llapotban 0,04, kivve a vgllapotokat (ahol +1 vagy 1).
Egy krnyezeti trtnet hasznossga (egyelre) egyszeren a kapott jutalmak sszege. Pldul ha az gens a +1
llapotot 10 lps utn ri el, akkor az sszhasznossga 0,6 lesz. A 0,04 negatv jutalom arra sztnzi az
genst, hogy minl gyorsabban rje el a (4, 3)-at, gy ez a problma a 3. fejezetbeli keressi problmk egy
sztochasztikus ltalnostsa. Ez ms megfogalmazsban gy hangzik, hogy az gens nem lvezi az letet ebben
a krnyezetben, s olyan gyorsan ki akar kerlni, amilyen gyorsan csak lehet.
Egy teljesen megfigyelhet krnyezetben megadott szekvencilis dntsi problmt Markov-llapottmenetmodelljvel s additv jutalmakkal Markov dntsi folyamatnak neveznek (MDF) (Markov decision
process). Egy MDF-et a kvetkez hrom sszetev hatroz meg:
Kezdllapot: S0
llapottmenet-modell: T(s, a, s)
539
Jutalomfggvny:1 R(s)
A kvetkez krds az, hogyan nz ki egy megolds a problmra? Azt mr lttuk, hogy egy rgztett
cselekvssorozat nem oldja meg a problmt, mivel az gens vgl ms llapotba jut a clllapot helyett. Ezrt
egy megoldsnak minden, az gens ltal elrhet llapotra el kell rnia, hogy az gens mit tegyen. Egy
ilyenfajta megolds az eljrsmd (policy). Egy eljrsmdot ltalban -vel jellnk, s a eljrsmd az s
llapotban a (s) cselekvst javasolja. Ha az gens egy teljes eljrsmddal rendelkezik, akkor fggetlenl attl,
hogy egy cselekvsnek mi is a kimenetele, az gens mindig tudni fogja, mit tegyen a kvetkez alkalommal.
Egy adott eljrsmd kezdllapotbl indul vgrehajtsa minden alkalommal egy klnbz krnyezeti
trtnetet eredmnyez a krnyezet sztochasztikus volta miatt. Egy eljrsmd minsgt ezrt az adott
eljrsmd generlta lehetsges krnyezeti trtnetek vrhat hasznossgval mrik. Az optimlis eljrsmd
(optimal policy) az az eljrsmd, ami a legnagyobb vrhat hasznossgot eredmnyezi. Az optimlis
eljrsmdot *-gal jelljk. A * ismeretben az gens gy dnti el, hogy mit tegyen, hogy figyelembe veszi az
aktulis rzkelst, ami az aktulis s llapotot kzli vele, majd vgrehajtja a *(s) cselekvst. Az eljrsmd az
gens fggvnyt explicit mdon reprezentlja, s ezrt az voltakppen egy egyszer reflexgens lersa, amit
egy hasznossgalap gens ltal hasznlt informcikbl szmtunk ki.
A 17.1. brn mutatott vilg optimlis eljrst a 17.2. (a) bra mutatja. Lthat, hogy mivel egy lps kltsge
meglehetsen kicsi ahhoz a bntetshez viszonytva, hogy vletlenl a (4, 2) pozcira kerlnk, az optimlis
eljrsmd a (3, 1) llapot esetn vatos. Inkbb egy hossz kerl t megttelt javasolja, mint a rvid tvgst
a (4, 2) kockztatsval.
A kockzat s a jutalom egyenslynak megvltozsa fgg az R(s) rtktl a nem vgs llapotoknl. A 17.2.
(b) brn az R(s) rtknek ngy klnbz intervallumhoz tartoz optimlis eljrsmdot tallhatunk. Ha R(s)
1,6284, akkor az let anynyira elviselhetetlen, hogy az gens egyenesen a legkzelebbi kijrathoz tart, annak
ellenre, hogy ez 1 rtk. Amikor 0,4278 R(s) 0,0850, az let elg kellemetlen; az gens a +1
llapothoz vezet utat vlasztja, vllalva annak kockzatt, hogy esetleg a 1 llapotba kerl. Nevezetesen az
gens a (3, 1)-ben vlasztja az tvgst. Amikor az let csak kevss bnatos (0,0221 < R(s) < 0), az optimlis
eljrsmd nem vllal semmilyen kockzatot. A (4, 1) s (3, 2) llapotokban az gens teljesen elkerli a 1
llapotot, gy nem tud vletlenl beleesni, mg ha ez azt is jelenti, hogy elg sokszor beveri a fejt a falba.
Vgl, ha R(s) > 0, akkor az let kifejezetten lvezhet, s az gens mindkt kijratot elkerli. Mindaddig, amg
a (4, 1), (3, 2) s (3, 3) llapotokban a cselekvsek azok, amelyek az brn lthatk, minden eljrsmd
optimlis, s az gens vgtelen teljes jutalmat r el, mivel soha nem lp be a vgllapotba. Meglep mdon
megmutathat, hogy hat ms optimlis eljrsmd is ltezik az R(s) klnbz intervallumaira. A 17.7. feladat
kri majd ezek megkeresst.
17.2. bra - (a) Egy optimlis eljrsmd a sztochasztikus krnyezetre R(s) = 0,04
esetn nem vgllapotoknl. (b) Optimlis eljrsmdok R(s) ngy klnbz
rtktartomnya esetn.
Az MDF egyes defincii megengedik, hogy a jutalom fggjn a cselekvstl s a kimeneteltl is, gy a jutalomfggvny R(s, a, s) alak.
Ez nhny krnyezet lerst egyszersti, de a problmt alapveten nem vltoztatja meg.
1
540
A kockzat s a jutalom vatos egyenslyozsa az MDF-ek egy olyan meghatroz tulajdonsga, ami nem
jelentkezik determinisztikus keressi problmknl; msfell ez meghatroz tulajdonsga szmos valsvilgbeli dntsi problmnak. Emiatt az MDF-eket szmos tudomnyterleten tanulmnyozzk, idertve az MI-t, az
opercikutatst, a kzgazdasgtant s a szablyozselmletet. Algoritmusok tucatjait javasoltk optimlis
eljrsmdok kiszmtsra. A 17.2. s 17.3. alfejezetben lerunk a legfontosabb algoritmuscsaldok kzl
kettt. Elszr azonban be kell fejeznnk a hasznossgok s eljrsmdok vizsglatt a szekvencilis dntsi
problmk esetben.
1.2. Optimalits szekvencilis dntsi problmkban

A 17.1. brn lthat MDF-pldban az gens teljestmnyt a megltogatott llapotokban kapott jutalmak
sszege mrte. Ez a teljestmnymrtk nem nknyes, de nem is az egyetlen lehetsg. Ez az alfejezet a
lehetsges alternatv teljestmnymrtkeket vizsglja azaz alternatv hasznossgfggvnyeket a krnyezeti
trtnseken, amit gy jellnk, hogy Uh([s0, ..., sn]). Az alfejezet a 16. fejezetbl szrmaz tleteken alapul, s a
technikai rszleteket is bemutatja; a fbb pontokat a vgn sszegezzk.
Fontos
Az els megvlaszoland krds az, hogy vges horizont (finite horizon) vagy vgtelen horizont
(infinite horizon) van a dntshozatalnl. A vges horizont azt jelenti, hogy ltezik egy rgztett N id,
ami utn semmi nem rdekes a jtknak vge, mondhatni. gy Uh([s0, ..., sN+k]) = Uh([s0, ..., sN])
minden k > 0 esetn. Pldul tegyk fel, hogy az gens (3,
1)-bl indul a 17.1. bra 4 3-as
vilgban, s tegyk fel, hogy N = 3. Ekkor, hogy a +1 llapot elrsnek legalbb az eslye
meglegyen, az gensnek egyenesen fel kell tartani, s az optimlis cselekvs a Fel. Ezzel szemben, ha
N = 100, akkor bsgesen van id a biztonsgos utat kvetni Balra menve. Azaz, vges horizont
esetben az optimlis cselekvs egy adott llapotban idvel vltozhat. Azt mondjuk, hogy az optimlis
eljrsmd vges horizont esetben nem- stacionrius (nonstationary). Rgztett idkorlt hinyban
ezzel szemben nincs ok klnbz viselkedsre ugyanabban az llapotban ms s ms idpontokban.
gy az optimlis cselekvs csak az aktulis llapottl fgg, s az optimlis eljrsmd stacionrius
(stationary). A vgtelen horizont esethez tartoz eljrsmdok ezrt egyszerbbek, mint a vges
horizont esethez tartozk, s ebben a fejezetben mi fknt a vgtelen horizont esettel foglalkozunk. 2
Vegyk szre, hogy a vgtelen horizont nem jelenti szksgszeren azt, hogy az sszes
llapotsorozat vgtelen; mindssze annyit jelent, hogy nincs egy rgztett hatr. Nevezetesen, egy
vgtelen horizont MDF-ben lehetnek vgllapotot tartalmaz vges llapotsorozatok.
A kvetkez eldntend krds az llapotsorozatok hasznossgnak a kiszmtsa. Tekinthetjk ezt a krdst a
tbbattribtum hasznossgelmlet (multiattribute utility theory) egy krdsnek (lsd 16.4. alfejezet)
azzal, hogy minden si llapotot az [s0, s1, s2, ...] llapotsorozat egy attribtumnak vesznk. Egy egyszer
kifejezs elrshez, ami az attribtumokbl pl fel, fel kell tteleznnk valamilyen preferenciafggetlensget.
A legtermszetesebb feltevs az, hogy az gens preferencii az llapotsorozatok kztt stacionriusok
(stationary). A preferencikra vonatkoz stacionarits a kvetkezket jelenti: ha kt llapotsorozat, [s0, s1, s2,]
s
, ugyanazzal az llapottal kezddik (pldul
), akkor a kt sorozat a preferencia-
sorrendjnek ugyanannak kell lennie, mint az [s1, s2,] s az

sorozatoknak. Ez teht azt jelenti, hogy
ha egy holnaptl kezdd lehetsges jvbeli esemnysort egy msik esemnysorral szemben preferlunk,
akkor ez nem vltozhat, ha az esemnysor a mai naptl kezddne. A stacionarits egy meglehetsen
rtalmatlannak tn feltevs, nagyon ers kvetkezmnyekkel: bizonythat, hogy stacionarits esetn a
sorozatokhoz csak ktfle mdon rendelhetk hasznossgok:
1. Additv jutalmak (additive rewards): egy llapotsorozat hasznossga ekkor
Uh([s0, s1, s2,...]) = R(s0) + R(s1) + R(s2) +
A 17.1. bra 4 3-as vilga additv jutalmakat hasznl. Vegyk szre, hogy az additivitst hallgatlagosan
kihasznltuk az utak kltsgfggvnyeinek felhasznlsakor a heurisztikus keressi algoritmusokban (4.
fejezet).
2. Leszmtolt jutalmak (discounted rewards): egy llapotsorozat hasznossga ekkor
Ez a teljesen megfigyelhet krnyezetekre igaz. Ltni fogjuk, hogy a rszlegesen megfigyelhet krnyezetekben a vgtelen horizont esete
nem annyira egyszer.
2
541
Uh([s0, s1, s2,...]) = R(s0) + R(s1) + 2 R(s2) +
ahol a leszmtolsi tnyez (discount factor) egy 0 s 1 kztti szm. A leszmtolsi tnyez fejezi ki egy
gens preferencijt a jelenlegi s a jvbeli jutalmak kztt. Amikor kzel 0, akkor a tvoli jvbeli
jutalmakat jelentktelennek tekinti. Amikor rtke 1, akkor a leszmtolt jutalmak pontosan megegyeznek az
additv jutalmakkal, gy az additv jutalmak a leszmtolt jutalmak specilis esetei. A leszmtols j modellnek
tnik mind az llati, mind az emberi idbeli preferencikra. Egy leszmtolsi tnyez ekvivalens egy (1/ )
1 kamatlbbal.
A fejezet htralev rszben leszmtolt jutalmakat fogunk felttelezni, aminek okai hamarosan vilgosak
lesznek, br nha megengedjk a = 1 rtket.
A vgtelen horizont elfogadsa mgtt azonban rejlik egy problma: ha a krnyezet nem tartalmaz egy
vgllapotot, vagy ha az gens soha nem jut vgllapotba, akkor az sszes krnyezettrtnet vgtelen hossz
lesz, s a hasznossgok additv jutalmakkal ltalban vgtelenek lesznek. Abban egyetrthetnk, hogy a +
jobb, mint a , de kt + hasznossg llapotsorozat sszehasonltsa mr bonyolultabb. Hrom megolds
knlkozik, amelyek kzl kettt mr lttunk:
1. Leszmtolt jutalmakkal egy vgtelen sorozat hasznossga vges. Valjban, ha a jutalmakra ltezik egy Rmax
korlt s < 1, akkor azt kapjuk, hogy
felhasznlva a vgtelen mrtani sorozat sszegkplett.

2. Ha a krnyezet tartalmaz vgllapotokat, s ha garantlt, hogy az gens vgl bekerl az egyikbe, akkor soha
nem lesz szksgnk vgtelen sorozatok sszehasonltsra. Egy eljrsmdot, ami garantltan vgllapotba
juttat, vges eljrsmdnak (proper policy) neveznk. Vges eljrsmdoknl hasznlhatjuk a = 1-t (azaz
az additv jutalmakat). A 17.2. (b) brn lthat els hrom eljrsmd vges, a negyedik azonban nem. Egy
nem vges eljrsmd vgtelen teljes jutalmat r el a vgllapotoktl val tvolmaradssal, amikor a nem
vgllapotok jutalma pozitv. A nem vges eljrsmdokra additv jutalmaknl nem mindig mkdnek az
MDF-eket megold alapalgoritmusok, ami j ok a leszmtolt jutalmak hasznlatra.
3. Vgtelen sorozatok sszehasonltsra egy msik lehetsg az idegysgenknti tlagjutalom (average
reward) felhasznlsa. Tegyk fel, hogy a 4 3-as vilgban az (1, 1) mez jutalma 0,1, mg ms nem
vgllapotok 0,01. Ekkor egy olyan eljrsmdnak, ami minden tle telhett megtesz, hogy az (1, 1)-ben
maradjon, nagyobb lesz az tlagos jutalma, mint annak, amelyik mshol marad. Az tlagos jutalom hasznos
kritrium bizonyos problmkra, de az tlagjutalomra tervezett algoritmusok meghaladjk e knyv kereteit.
sszegezve, a leszmtolt jutalmak hasznlata jr a legkevesebb bonyodalommal az llapotsorozatok
kirtkelsben. A vgs lps annak megmutatsa, hogyan vlasszunk az eljrsmdok kztt, szben tartva
azt, hogy egy adott eljrsmd nem egyetlen llapotsorozatot generl, hanem a legklnflbb lehetsges
llapotsorozatokat, mindegyiket egy adott valsznsggel, amit a krnyezet llapottmenet-modellje hatroz
meg. gy egy eljrsmd rtke a (sorozatonknt) elrt leszmtolt jutalmak vrhat rtke, ahol a vrhat rtk
kpzse az sszes llapotsorozat felett trtnik, ami az eljrs vgrehajtsa esetn elfordulhat. Egy * optimlis
eljrsmd ekkor
A kvetkez kt alfejezet algoritmusokat r le az optimlis eljrsmdok megtallsra.
2. rtkiterci
Ebben az alfejezetben az optimlis eljrsmd kiszmtsra mutatunk be egy algoritmust, az gynevezett
rtkitercit (value iteration). Az alaptlet az, hogy kiszmtjuk minden egyes llapot hasznossgt, majd az
llapothasznossgokat felhasznljuk az egyes llapotoknl az optimlis cselekvs megvlasztshoz.
542
2.1. Az llapotok hasznossga

Az llapotok hasznossgt az llapotsorozatok hasznossgn keresztl definiljuk. Nagyjbl azt mondhatjuk,
hogy egy llapot hasznossga a belle kiindul llapotsorozatok vrhat hasznossgval egyenl.
Nyilvnvalan az llapotsorozatok fggnek a vgrehajtott eljrsmdtl, gy elsknt egy adott eljrsmdra
definiljuk a hasznossgot, U(s)-t. Jelljk st-vel az gens llapott a eljrsmd t lpsnyi vgrehajtsa utn,
ekkor azt kapjuk, hogy
Felhasznlva ezt a defincit, egy llapot valdi hasznossga az U (s), amit U(s)-sel jellnk. Ez a a leszmtolt
jutalmak vrhat rtke akkor, amikor az gens egy optimlis eljrsmdot hajt vgre. Vegyk szre, hogy az
U(s) s az R(s) igen eltr mennyisgek: az R(s) a rvid tv jutalom az s-ben tartzkodsrt, mg az U(s) a
hossz tv sszjutalom s-tl kezdve. A 17.3. brn lthatk a hasznossgok a 4 3-as vilgban. Lthat,
hogy a hasznossgok nagyobbak a +1-es kijrathoz kzeli llapotoknl, mivel kevesebb lps szksges a
kijrat elrshez.
Az U(s) hasznossgfggvny lehetv teszi az gensnek, hogy a cselekvseit a 16. fejezetben szerepl
maximlis vrhat hasznossg elve alapjn vlassza meg; azt a cselekvst vlasztja, amelyik maximalizlja a
bekvetkez llapot vrhat hasznossgt:
Fontos
Most azonban, ha egy llapot hasznossga a leszmtolt jutalmak vrhat rtknek sszege attl a
kiindulponttl kezdve, akkor kzvetlen kapcsolat ll fenn egy llapot hasznossga s a
szomszdjainak a hasznossga kztt: egy llapot hasznossga az llapotban tartzkods kzvetlen
jutalmnak s a kvetkez llapot vrhat leszmtolt hasznossgnak az sszege, feltve, hogy az
gens az optimlis cselekvst vlasztja. Azaz egy llapot hasznossga a kvetkez:
17.2. bra - Az llapotok hasznossgai a 4 3-as vilgban, = 1 s a nem

vgllapotoknl R(s) = 0,04 esetn
543
A (17.5) egyenletet Bellman-egyenletnek (Bellman equation) nevezik Richard Bellman tiszteletre (Bellman,
1957). Az llapotok hasznossgai mint a bekvetkez llapotsorozatok vrhat hasznossga a (17.3) egyenlet
szerint a Bellman-egyenletek egy rendszernek a megoldsai. Valjban ezek egyrtelm megoldsok,
ahogyan a kvetkez kt alfejezetben megmutatjuk.
Nzzk meg a 4 3-as vilg Bellman-egyenleteinek egyikt. Az (1, 1) llapothoz tartoz egyenlet:
U(1, 1) = 0,04 + max{0,8U(1, 2) + 0,1U(2, 1) + 0,1U(1, 1) (Fel)
0,9U(1, 1) + 0,1U(1, 2) (Balra)
0,9U(1, 1) + 0,1U(2,1) (Le)
0,8U(2, 1) + 0,1U(1, 2) + 0,1U(1, 1)} (Jobbra)
A 17.3. brn lthat szmok behelyettestsvel azt lthatjuk, hogy a Fel a legjobb cselekvs.
2.2. Az rtkiterci algoritmus

A Bellman-egyenletek kpezik az alapjt az MDF-ek megoldsra szolgl rtkiterci algoritmusnak. Ha n
lehetsges llapot van, akkor n Bellman-egyenlet ltezik, mindegyik llapotra egy. Az n egyenlet n ismeretlent
tartalmaz az llapotok hasznossgt. gy a hasznossgok megllaptshoz ezen egyenletek egyttest
szeretnnk megoldani. Azonban van egy problma: az egyenletek nemlinerisak, mivel a max opertor
nemlineris opertor. Mg a lineris egyenletrendszerek hatkonyan megoldhatk lineris algebrai eszkzkkel,
a nemlineris egyenletrendszerek mr problematikusabbak. Ekkor iteratv mdszerrel prblkozhatunk.
Kezdskor tetszleges kezdeti rtkeket vlasztunk a hasznossgoknak, kiszmtjuk az egyenletek jobb oldalt,
majd behelyettestjk a bal oldalra gy frisstve az egyes llapotok hasznossgt a szomszdjainak a
hasznossgval. Ezt addig ismteljk, ameddig el nem rnk egy egyenslyi helyzetet. Jellje Ui(s) az s llapot
hasznossgrtkt az i-edik iterciban. A Bellman-frisstsnek (Bellman update) nevezett itercis lps a
kvetkezkppen nz ki:
544
Ha a Bellman-frisstst vgtelen sokszor alkalmazzuk, garantlt, hogy egyenslyi helyzetet rnk el (lsd
kvetkez alfejezet), s ekkor a vgs hasznossgrtkeknek a Bellman-egyenletek megoldst kell adniuk.
Valjban ezek egyrtelm megoldsok is, s a hozzjuk tartoz eljrsmd optimlis (amit a (17.4) egyenlettel
nyerhetnk). Az algoritmus, amit RTKITERCI-nak neveznk, a 17.4. brn lthat.
17.4. bra - Az rtkiterci algoritmus az llapotok hasznossgnak kiszmtsra. A

lellsi felttel a (17.8) egyenletbl szrmazik.
17.5. bra - (a) A grafikonokon kivlasztott llapotok hasznossgainak a fejldse

lthat az rtkiterci felhasznlsnl. (b) A szksges rtkitercik szma (k), hogy
a hiba garantltan legfeljebb = cRmax legyen, c klnbz rtkeinl, mint a
leszmtolsi tnyez fggvnye.
Az rtkitercit alkalmazhatjuk a 17.1. (a) bra 4 3-as vilgra. Nulla kezdeti rtkekrl indulva, a
hasznossgok alakulsa a 17.5. (a) brn lthat. Vegyk szre, ahogy a (4, 3) llapottl klnbz tvolsgra
lv llapotok negatv jutalmakat halmoznak fel egszen addig, amg egy bizonyos ponton utat tallnak a (4, 3)hoz, amikortl is a hasznossgok elkezdenek nvekedni. Az rtkiterci algoritmusra gondolhatunk gy, mint
loklis frisstsek ltali informciterjesztsre az llapottrben.
2.3. Az rtkiterci konvergencija
545
Azt lltottuk, hogy az rtkiterci vgl a Bellman-egyenletek egy egyrtelm megoldshoz konvergl.
Ebben az alfejezetben kifejtjk, mirt is trtnik ez. Ennek sorn bevezetnk nhny hasznos matematikai
fogalmat, s olyan mdszereket kapunk, amelyek megbecslik a hasznossgfggvny hibjt , ha az algoritmust
hamar lltottuk le; ennek hasznossgt az adja, hogy nem kell vgtelen hosszan futtatnunk az algoritmust. Az
alfejezet a technikai rszleteket is bemutatja.
Az rtkiterci konvergencijnak megmutatsban hasznlt alapfogalom az sszehzs (contraction). Az
sszehzs nagyjbl egy olyan egyvltozs fggvny, ami kt klnbz bemeneti rtkre alkalmazva, kt
olyan kimeneti rtket ad, amelyek egymshoz kzelebbiek, mint az eredeti rtkek, legalbb egy bizonyos
lland mennyisggel. Pldul a kettvel val oszts egy sszehzs, mivel brmely kt szm elosztsa utn a
klnbsgk megfelezdik. Vegyk szre, hogy a kettvel val osztsnak van egy fix pontja, nevezetesen a
nulla, ami a fggvny alkalmazsval nem vltozik. Ebbl a pldbl az sszehzs kt fontos tulajdonsgt
vehetjk szre:
Egy sszehzsnak egyetlen fix pontja van: ha kt fix pontja lenne, nem kerlnnek egymshoz kzel a
fggvny alkalmazsakor, gy nem is volna sszehzs.
A fggvny tetszleges argumentumra trtn alkalmazsakor a fggvnyrtknek kzelebb kell kerlnik a
fix ponthoz (mivel a fix pont nem mozdul el), gy egy szszehzs ismtelt alkalmazsa a fix pontot adja
hatrrtkben.
Most tegyk fel, hogy a Bellman-frisstst (a (17.6) egyenletet) egy B opertornak tekintjk, aminek egyszeri
alkalmazsa az sszes llapot hasznossgt frissti. Jellje Ui az sszes llapot i-edik itercibeli
hasznossgnak a vektort. Ekkor a Bellman-frisstsi egyenletet felrhatjuk gy, hogy
Ui+1 BUi
Most egy olyan mdszerre van szksgnk, amellyel a hasznossgvektorok tvolsgt mrhetjk. A maximum
normt (max norm) fogjuk hasznlni, ami egy vektor hoszszt a legnagyobb komponensnek hosszval mri:
Fontos
Ezzel a defincival, a kt vektor kztti tvolsg ||U U|| az sszetartoz elemek kztti
klnbsgek maximuma. Az alfejezet f eredmnye a kvetkez: Legyen Ui s kt tetszleges
hasznossgvektor. Ekkor
||BUi BUi|| ||Ui Ui|| (17.7)
Azaz, a Bellman-frissts egy sszehzs egy tnyezvel a hasznossgvektorok terben. gy az

rtkiterci mindig a Bellman-egyenletek egy egyrtelm megoldshoz konvergl.
Nevezetesen, a (17.7) egyenletben lecserlhetjk Ui -t a valdi U hasznossgokkal, amire BU = U. Ekkor a
kvetkez egyenltlensget kapjuk
||BUi U|| ||Ui U||
Ezrt, ha ||Ui U||-ra mint az Ui becsls hibjra tekintnk, ltjuk, hogy a hiba minden iterciban legalbb egy
tnyezvel cskken. Ez azt jelenti, hogy az rtkiterci exponencilisan gyorsan konvergl. A szksges
itercik szmt egy adott e hibahatr elrshez a kvetkezkppen szmthatjuk ki: elszr, a (17.1) egyenlet
szerint, az sszes llapot hasznossga korltos Rmax/(1 ) rtkkel. Ez azt jelenti, hogy a maximlis kezdeti
hiba ||U0 U|| 2Rmax/(1 ). Tegyk fel, hogy N itercit vgznk ahhoz, hogy a hiba legfeljebb rtk
legyen. Mivel a hiba minden egyes alkalommal legalbb -szorosra cskken, annak kell teljeslnie, hogy N 2
Rmax/(1 ) . Ha vesszk a kt oldal logaritmust, az addik, hogy
szm iterci elegend. A 17.5. (b) brn lthat, hogyan vltozik fggvnyben az N klnbz rtk
/Rmax hnyadosok esetben. A j hr az, hogy az exponencilis gyorsasg konvergencia miatt N nem fgg
tlsgosan az /Rmax hnyadostl. A rossz hr az, hogy N gyorsan n, ahogy kzel kerl 1-hez. gy gyors
546
konvergencit gy rhetnk el, ha -t kicsiv tesszk, de ez valjban az gensnek rvid tv horizontot

biztost, s az gens cselekvseinek hossz tv hatsait figyelmen kvl hagyhatja.
Az elz bekezds hibakorltja ad bizonyos tjkozdst az algoritmus futsi idejt befolysol tnyezkrl, de
gyakran tlsgosan vatos mdszert jelent annak eldntsre, hogy mikor lljon le az iterci. Az utbbi clra
felhasznlhatunk egy korltot, ami a hibt az egyes itercikban a Bellman-frissts nagysghoz kapcsolja. Az
sszehzsi tulajdonsgbl ((17.7) egyenlet) meg lehet mutatni, hogy ha a frissts kicsi (azaz egyetlen llapot
hasznossga sem vltozik nagyon), akkor a hiba a valdi hasznossgfggvnyhez kpest szintn kicsi.
Pontosabban,
ha ||Ui+1 Ui|| < (1 )/ , akkor ||Ui+1 U|| < (17.8)
Ez a lellsi felttel szerepel az RTKITERCI algoritmusban a 17.4. brn.
Fontos
Eddig az rtkiterci algoritmusa ltal visszaadott hasznossgfggvny hibjt elemeztk. Az genst
azonban igazn az rdekli, hogyan fog boldogulni, ha egy ilyen dntsfggvny alapjn hoz dntseket.
Tegyk fel, hogy az rtkiterci i-edik itercija utn az gens a valdi U hasznossgra egy Ui
becslst kap, s az Ui-n alapul egylpses elrenzs felhasznlsval (ahogy a (17.4) egyenletben)
megkapja a i MVH-eljrsmdot. Vajon a kiadd viselkeds megkzeltleg lesz-e olyan j, mint az
optimlis viselkeds? Ez dnt krds minden vals gens szmra, s bizonythat, hogy a vlasz
igen. Jellje
azt a hasznossgot, ami a i vgrehajtsakor addik s-bl kiindulva. Ekkor az
az eljrsmd vesztesge (policy loss) annak a maximlis rtke, amit az gens veszthet
-t vgrehajtva az optimlis * eljrsmd helyett. A i eljrsmd vesztesgt az Ui-beli hibhoz a
kvetkez egyenltlensg kapcsolja:
i
A gyakorlatban sokszor elfordul, hogy i jval hamarabb optimliss vlik, mieltt Ui konverglt
volna. A 17.6. brn lthat, ahogy a 4 3-as krnyezetben a maximlis Ui-beli hiba s az eljrsmd
vesztesge az rtkiterci folyamatnak elrehaladtval nullhoz kzelt, = 0,9 rtknl. A i
eljrsmd mr i = 4-nl optimlis, pedig az Ui-beli maximlis hiba mg 0,46.
17.6. bra - A hasznossgbecsls maximlis hibja ||Ui U|| s az eljrsmd vesztesge

az optimlis eljrsmdhoz viszonytva az rtkiterci iterciszmnak
fggvnyben
547
Most mr minden rendelkezsnkre ll, hogy az rtkitercit a gyakorlatban is felhasznljuk. Tudjuk, hogy a
helyes hasznossgokhoz konvergl, a hasznossg becslsnek hibjra korltokat tudunk adni, ha vges szm
iterci utn lellunk, s korltokat tudunk adni az eljrsmd vesztesgre, ami a becslt hasznossgrtkekhez
tartoz MVH-eljrsmd vgrehajtsa miatt lp fel. A vgs megjegyzs, hogy az sszes eredmny felttele
ebben az alfejezetben a < 1-gyel val leszmtols. Ha = 1 s a krnyezet tartalmaz vgllapotokat, akkor
bizonyos technikai felttelek teljeslse esetn konvergenciaeredmnyek s hibakorltok hasonl halmaza
szrmaztathat.
3. Eljrsmd-iterci
Az elz alfejezetben megfigyeltk, hogy optimlis eljrsmdot akkor is kaphatunk, amikor a
hasznossgfggvny becslse pontatlan. Ha egy cselekvs egyrtelmen jobb, mint a tbbi, akkor a relevns
llapotok hasznossgainak a pontos nagysgt nem szksges preczen tudnunk. Ez a megrzs egy alternatv
mdot javasol az optimlis eljrsmd megkeressre. Az eljrsmd-itercis (policy iteration) algoritmus
egy 0 kezdeti eljrsmdtl indulva a kvetkez kt lpst vltogatja:
Eljrsmd-rtkels (policy evaluation): Egy adott i eljrsmdnl szmtsuk ki
llapotok hasznossgt mintha i volna vgrehajtva.
-t, az egyes
Eljrsmd-javts (policy improvement): Szmtsunk ki egy j i+1 MVH-eljrsmdot, felhasznlva az

Ui-n alapul egylpses elrenzst (mint a (17.4) egyenletben).
Az algoritmus lell, amikor az eljrsmd-javts lpse nem eredmnyez vltozst a hasznossgokban. Ennl a
pontnl tudjuk, hogy az Ui hasznossgfggvny a Bellman-frissts egy fix pontja, gy a Bellman-egyenletek egy
megoldsa, s i-nek egy optimlis eljrsmdnak kell lennie. Mivel csak vges sok eljrsmd ltezik a vges
llapottrben, s megmutathat, hogy minden iterci jobb eljrsmdot eredmnyez, az eljrsmd-itercinak
le kell llnia. Az algoritmus a 17.7. brn lthat.
548
Az eljrsmd-javts lpse nyilvnvalan egyrtelm, de hogyan valstsuk meg az eljrsmd-rtkelst.

Kiderl, hogy ennek elvgzse sokkal egyszerbb, mint a szabvnyos Bellman-egyenletek megoldsa (amit az
rtkiterci vgez el), mivel az eljrsmd egy cselekvst minden llapotban rgzt. Az i-edik iterciban a i
eljrsmd a i(s) cselekvst rja el. Ez azt jelenti, hogy a (17.5) Bellman-egyenlet egy egyszerstett
vltozatval llunk szemben, ami az s hasznossgt (i mellett) a kvetkezkppen kapcsolja a szomszdai
hasznossghoz:
Pldul tegyk fel, hogy i a 17.2. (a) brn lthat eljrsmd. Ekkor azt kapjuk, hogy i(1, 1) = Fel, i(1, 2) =
Fel s gy tovbb, illetve az egyszerstett Bellman-egyenletek:
Ui(1, 1) = 0,04 + 0,8Ui(1, 2) + 0,1Ui(1, 1) + 0,1Ui(2, 1)
Ui(1, 2) = 0,04 + 0,8Ui(1, 3) + 0,2Ui(1, 2)
A lnyeges az, hogy ezek az egyenletek linerisak, mivel a max opertort eltvoltottuk. Ha az llapotok
szma n, n lineris egyenlet addik n ismeretlennel, ami egzakt mdon megoldhat O(n3) idben standard
lineris algebrai mdszerekkel.
17.7. bra - Az eljrsmd-itercis algoritmus egy optimlis eljrsmd kiszmtsra
Kis llapotterekre az eljrsmd-kirtkels egzakt megoldmdszerekkel gyakran a leghatkonyabb

megkzelts. Nagy llapotterekre az O(n3) id megengedhetetlen lehet. Szerencsre nem szksges egzakt
eljrsmd-kirtkelst vgezni. Ehelyett elvgezhetnk bizonyos szm egyszerstett rtkitercis lpst
(egyszerstett, mivel az eljrsmd rgztett), hogy a hasznossgok elfogadhatan j becslshez jussunk. Az
egyszerstett Bellman-frissts ehhez a folyamathoz a kvetkez
amit k-szor ismtlnk, hogy a kvetkez hasznossgbecsls ellljon. Az add algoritmust mdostott
eljrsmd-itercinak (modified policy iteration) nevezzk. Ez gyakran sokkal hatkonyabb, mint a
szabvnyos eljrsmd-iterci vagy rtkiterci.
549
Az eddig lert algoritmusok megkvetelik a hasznossgok vagy eljrsmdok sszes llapotbeli egyszerre
trtn frisstst. Megmutathat, hogy ez nem szigoran szksges. Valjban minden itercinl
kivlaszthatjuk az llapotok egy tetszleges rszhalmazt, s alkalmazhatjuk r brmelyik fajta frisstst
(eljrsmd-javtst vagy egyszerstett rtkitercit). Ezt az ltalnostott algoritmust aszinkron eljrsmditercinak (asynchronous policy iteration) nevezzk. A kezdeti eljrsmd s a hasznossgfggvny adott
felttelek melletti megvlasztsnl az aszinkron eljrsmd-iterci garantltan konvergl az optimlis
eljrsmdhoz. A feldolgozand llapotok megvlasztsnak szabadsga azt jelenti, hogy hatkonyabb
heurisztikus algoritmusokat tervezhetnk pldul olyan algoritmusokat, amelyek azon llapotok rtknek
frisstsre koncentrlnak, amelyeket egy j eljrsmd valsznleg elr. A vals letben ez nagyon
hasznosnak tnik: ha valakinek nincs szndkban a mlybe vetni magt egy sziklrl, akkor nem kell
aggdssal tltenie az idt a bekvetkez llapotok pontos rtkrl.
4. Rszlegesen megfigyelhet Markov dntsi

folyamatok
A Markov dntsi folyamatok lersa a 17.1. alfejezetben felttelezte, hogy a krnyezet teljesen megfigyelhet
(fully observable). E mellett a felttelezs mellett az gens mindig tudja, hogy melyik llapotban van. Ez
egyttesen az llapottmenet-modell Markov-tulajdonsgnak a feltevsvel azt eredmnyezi, hogy az optimlis
eljrsmd csak az aktulis llapottl fgg. Amikor a krnyezet csak rszlegesen megfigyelhet (partially
observable), a helyzet nem ennyire tlthat. Az gens nem tudja felttlenl, hogy melyik llapotban is van, gy
nem hajthatja vgre az adott llapothoz javasolt (s) cselekvst. Tovbb, egy s llapot hasznossga s az s-beli
optimlis cselekvs nemcsak s-tl fgg, hanem attl is, hogy az gens mennyit tud, amikor s-ben van. Ebbl
kifolylag a rszlegesen megfigyelhet MDF-eket (RMMDF) (partially observable MDPs, POMDPs)
ltalban sokkal nehezebb dolgoknak tartjk, mint a hagyomnyos MDF-eket. Az RMMDF-ek azonban nem
megkerlhetk, mivel a valdi vilg is egy RMMDF.
Pldaknt gondoljuk t jra a 17.1. bra 4 3-as vilgt, de most tegyk fel, hogy az gensnek egyltaln
nincsenek rzkeli, s elkpzelse sincs arrl, hogy hol lehet. Pontosabban, tegyk fel, hogy az gens kezdeti
llapota egyenl valsznsggel valamelyike a kilenc nem vgllapotnak (17.8. (a) bra). Vilgos, hogz ha az
gens tudn, hogy (3, 3)-ban van, akkor Jobbra mozgst hajtana vgre; ha tudn, hogy (1, 1)-ben van, akkor Fel
mozogna; de mivel brhol lehet, mit is kellene tennie? Egy lehetsges vlasz, hogy az gensnek elszr olyan
cselekvseket kell vgrehajtani, amelyek cskkentik a bizonytalansgt, s csak ezutn kell megprblni a +1
kijrat fel tartani. Pldul ha az gens t alkalommal Balra mozgst hajt vgre, akkor igen valszn, hogy a
bal oldali falnl van (17.8. (b) bra). Ezutn t alkalommal Fel mozgst hajt vgre, akkor igen valszn, hogy a
fels falnl van, valsznleg a bal fels sarokban (17.8. (c) bra). Vgl t Jobbra mozgst hajt vgre, ekkor j
esllyel krlbell 77,5%-kal elri a +1 kijratot (17.8. (d) bra). A Jobbra mozgs ezt kvet folytatsa az
eslyt 81,8%-ra nveli. Ez az eljrsmd gy meglepen biztonsgos, de ebben az esetben az gens igen lassan
ri el a kijratot, s a vrhat hasznossga csupn 0,08 krl van. Az optimlis eljrsmd, amit hamarosan
lerunk, sokkal jobban teljest.
17.8. bra - (a) Az gens elhelyezkedsnek kezdeti valsznsgi eloszlsa. (b) tszri
Balra mozgs utn. (c) tszri Fel mozgs utn. (d) tszri Jobbra mozgs utn.
Az RMMDF-ek kezelshez elszr is megfelelen kell ket definilni. Egy RMMDF-nek az elemei
ugyanazok, mint egy MDF-nek egy T(s, a, s) llapottmenet-modell s egy R(s) jutalomfggvny , de van
egy O(s, o) megfigyelsi modellje (observational model) is, ami az s llapotban az o megfigyels
550
rzkelsnek a valsznsgt adja meg.3 Pldul az rzkel nlkli gensnknek csak egyetlen megfigyelse
van (az res megfigyels), ami minden llapotban 1 valsznsggel bekvetkezik.
A 3. s 12. fejezetben nemdeterminisztikus s rszlegesen megfigyelhet tervksztsi problmkat
tanulmnyoztunk, s megllaptottuk, hogy a hiedelmi llapot (belief state) az aktulis llapotok halmaza,
amelyekben az gens lehet kulcsfogalom a megoldsok lersra s kiszmtsra.
Az RMMDF-ekben a fogalmat kiss finomtjuk. Egy b hiedelmi llapot most egy valsznsg-eloszls lesz az
sszes lehetsges llapot felett. Pldul a 17.8. (a) bra kezdeti hiedelmi llapota gy rhat, hogy
. A b hiedelmi llapot ltal az aktulis i llapothoz rendelt valsznsget b(s)-sel
jelljk. Az gens gy szmthatja ki a jelenlegi hiedelmi llapott, mint egy feltteles eloszlst az aktulis
llapotok felett, az eddigi megfigyelsek s cselekvsek sorozatnak ismeretben. Ez lnyegben a szrsi
(filtering) feladat (lsd 15. fejezet). A rekurzv szrsi alapegyenlet (lsd (15.3) egyenlet a 2.1. szakasz - Szrs
s elrejelzs rszben) megmutatja, hogy hogyan szmolhatjuk ki az j hiedelmi llapotot az elz hiedelmi
llapotbl s az j megfigyelsbl. Az RMMDF-eknl a jells eltr, s meg kell gondolni mg a cselekvst is,
de az eredmny lnyegben ugyanaz. Ha b(s) volt az elz hiedelmi llapot, s az gens az a cselekvst hajtja
vgre s az o megfigyelst rzkeli, akkor az j hiedelmi llapot a kvetkez:
ahol a egy normalizcis konstans, ami a hiedelmi llapot 1-re sszegzst biztostja. Ezt az egyenletet gy
rvidthetjk, hogy b = ELRE(b, a, o).
Fontos
A RMMDF-ek megrtshez szksges lnyegi meglts pedig ez: az optimlis cselekvs csak az
gens aktulis hiedelmi llapottl fgg. gy az optimlis eljrsmd lerhat a hiedelmi llapotok
cselekvsekre trtn *(b) lekpzsvel. Ez nem fgg az gens aktulis llapottl, amiben
tartzkodik. Ez hasznos tulajdonsg, mivel az gens nem ismeri az aktulis llapott; csupn a hiedelmi
llapott. Ekkor egy RMMDF gens dntsi ciklusa a kvetkez:
1. Adott jelenlegi b hiedelmi llapot esetn hajtsuk vgre az a = * (b) cselekvst.
2. Fogadjuk az o megfigyelst.
3. lltsuk a jelenlegi llapothiedelmet ELRE(b, a, o)-ra, s ismteljk meg a ciklust.
Most gy gondolhatunk az RMMDF-ekre, mint amelyek keresst ignyelnek a hiedelmi llapotok
terben, pontosan gy, ahogy az rzkel nlkli s az eshetsgi problmkra vonatkoz mdszerek a
3. fejezetben. A f klnbsg az, hogy az RMMDF hiedelmi llapot tere folytonos, mivel egy RMMDF
hiedelmi llapot egy valsznsgi eloszls. Pldul a hiedelmi llapot a 4 3-as vilg esetben egy
pont a 11 dimenzis folytonos trben. Egy cselekvs megvltoztatja a hiedelmi llapotot is, nemcsak a
fizikai llapotot, gy kirtkelse aszerint az informci szerint trtnik, amit a cselekvs
eredmnyeknt az gens megszerez. Az RMMDF-ekbe ezrt beletartozik az informci rtke is (16.6.
alfejezet) mint a dntsi problma egy komponense.
Nzzk meg tzetesebben a cselekvsek kimenetelt. Nevezetesen, szmtsuk ki annak valsznsgt, hogy az
gens a b hiedelmi llapotbl a b hiedelmi llapotba jut az a cselekvs vgrehajtsa utn. Ekkor, ha ismernnk a
cselekvst s a bekvetkez megfigyelst, akkor a (17.11) egyenlet a hiedelmi llapot egy determinisztikus
frisstst adn: b = ELRE(b, a, o). Termszetesen a bekvetkez megfigyels mg nem ismert, gy az gens a
szmos lehetsges hiedelmi llapot egyikbe, b-be kerlhet az elfordul megfigyels fggvnyben. Az o
rzkelsnek valsznsge, feltve hogy a b hiedelmi llapotban az a cselekvs kerlt vgrehajtsra, az sszes
olyan s aktulis llapot feletti sszegzssel addik, amelyeket az gens elrhet:
A megfigyelsi modell alapveten azonos az idbeli folyamatok rzkel modelljvel (sensor model) a 15. fejezetbl. Ahogyan az MDFek jutalomfggvnynl, a megfigyelsi modell szintn fgghet a cselekvstl s a kimeneteli llapottl, de ez most sem egy alapvet
vltozs.
3
551
Jellje (b, a, b) annak a valsznsgt, hogy b-bl b-be jutunk egy a cselekvssel. Ennek felhasznlsval
ekkor
ahol P(b|o, a, b) 1, ha b = ELRE(b, a, o), egybknt pedig 0.
Fontos
A (17.2.) egyenletet felfoghatjuk egy llapottmenet-modellnek a hiedelmi llapot trben.
Definilhatunk egy jutalomfggvnyt is a hiedelmi llapotokra (azaz azon aktulis llapotok vrhat
jutalmt, amelyekben az gens lehet):
gy lthatan (b, a, b) s (b) egytt egy megfigyelhet MDF-et definil a hiedelmi llapotok tern.
Tovbb megmutathat, hogy egy *(b) optimlis eljrsmd erre az MDF-re, szintn optimlis
eljrsmd az eredeti RMMDF-re. Mshogy fogalmazva, egy RMMDF megoldsa a fizikai
llapottrben reduklhat egy MDF megoldsra a hozz tartoz hiedelmi llapot trben. Ez a tny
taln kevsb meglep, arra gondolva, hogy a hiedelmi llapot definci szerint az gens szmra
mindig megfigyelhet.
Vegyk szre, hogy br az RMMDF-eket sikeresen redukltuk az MDF-ekre, a kapott MDF-eknek folytonos (s
ltalban sokdimenzis) llapotterk van. A 17.2. s 17.3. alfejezetekben lert algoritmusok egyike sem
alkalmazhat kzvetlenl ilyen MDF-ekre. Kiderlt, hogy az rtk- s eljrsmd-itercinak kifejleszthetk
olyan vltozatai, amelyek folytonos llapot MDF-ekre is alkalmazhatk. Az alaptlet az, hogy egy (b)
eljrsmd reprezentlhat a hiedelmi llapot tr olyan rszeinek egy halmazaknt, amelyek mindegyikhez egy
adott optimlis cselekvs tartozik.4 Az rtkfggvny b klnbz lineris fggvnyt rendeli az egyes
trrszekhez. Minden rtk- s eljrsmd-itercis lps finomt a trrszek hatrain, s j trrszeket vezethet
be.
Az algoritmus rszletei meghaladjk a knyv kereteit, de megadjuk a megoldst az rzkelmentes 4 3-as
vilgra. Az optimlis eljrsmd a kvetkez:
[Balra, Fel, Fel, Jobbra, Fel, Fel, Jobbra, Fel, Fel, Jobbra, Fel, Jobbra, Fel, ]
Az eljrsmd egy sorozat, mivel ez a problma determinisztikus a hiedelmi llapotok terben nincsenek
megfigyelsek. Azt a trkkt alkalmaztuk, hogy az gens egyetlen Balra mozgssal biztostja, hogy nincs (4,
1)-ben, azrt, hogy aztn meglehets biztonsggal mozoghasson Fel s Jobbra a +1 kijrat elrshez. Az gens
a +1 kijratot 86,6% gyakorisggal ri el, s sokkal gyorsabban, mint az alfejezet elejn megadott eljrsmd
esetn, gy a vrhat hasznossga 0,38, szemben az elz 0,08-as rtkvel.
Bonyolultabb RMMDF-eknl, amikor megfigyelsek is vannak, nagyon nehz (valjban PSPACE-beli azaz
valban nagyon nehz) kzeltleg optimlis eljrsmdokat tallni. A problmk nhny tucat vltozval
gyakran kivitelezhetetlenek. A kvetkez alfejezet egy eltr kzelt mdszert r le RMMDF-ek megoldsra,
ami az elrenz keressen alapul.
Bizonyos RMMDF-ekre az optimlis eljrsmdhoz vgtelen szm trrsz tartozik, gy az egyszer trrszek listja megkzelts nem
mkdik, s tletesebb mdszerek szksgesek mg egy kzelts megtallshoz is.
4
552
5. Dntselmleti gensek
Ebben a fejezetben egy tfog szemlletmdot vzolunk fel az gensek megtervezsre rszlegesen
megfigyelhet, sztochasztikus krnyezetek esetn. A tervezs alapelemei mr ismertek:
Az llapottmenet- s megfigyelsi modelleket egy dinamikus Bayes-hlval (dynamic Bayesian network)
brzoljuk (a 15. fejezetben lertak szerint).
A dinamikus Bayes-hl kiegszlt dntsi s hasznossgi csompontokkal, amelyek megegyeznek a 16.
fejezetben szerepl dntsi hlkban hasznlatosakkal. A kirajzold modellt dinamikus dntsi hlnak
vagy DDH-nak (dynamic decision network, DDN) nevezzk.
Egy szrsi algoritmust hasznlunk az j rzkelsek s cselekvsek befogadsra s a hiedelmi llapot
reprezentcijnak a frisstsre.
Dntseket hozunk lehetsges cselekvssorozatok elgondolsval s a legjobb kivlasztsval.
Egy dinamikus Bayes-hl felhasznlsnak elsdleges haszna az llapottmenet- s rzkel modellek
brzolsnl az, hogy felbontja az llapotlerst valsznsgi vltozk egy halmazra, hasonlan ahhoz, ahogy
a tervksztsi algoritmusok logikai brzolst vesznek ignybe az llapottr felbontsra, amit a keressi
algoritmusok hasznlnak. Az gensterv ezrt a 2. fejezetben vzolt hasznossgalap gens egy gyakorlati
megvalstsa.
Mivel dinamikus Bayes-hlkat hasznlunk, visszatrnk a 15. fejezetbeli jellshez, ahol Xt az llapotvltozk
egy halmazt jellte egy t idpillanatban, Et pedig a bizonytkvltozkat. gy ahol ebben a fejezetben eddig st-t
hasznltunk (a t-beli llapotra), mostantl Xt-t fogunk hasznlni. A t-beli cselekvst At-vel fogjuk jellni, gy a
T(s, a, s) llapottmenet-modell ugyanaz, mint a P(Xt+1|Xt, At), s az O(s, o) megfigyelsi modell ugyanaz, mint
a P(Et|Xt). A t idpontban kapott jutalmat jelljk Rt-vel, s Ut-vel az llapot hasznossgt a t idpontban. E
szerint a jells szerint egy dinamikus dntsi hl a 17.9. brn lthat mdon nz ki.
17.9. bra - Egy dinamikus dntsi hl ltalnos struktrja. Az ismert rtk

vltozk rnykoltak. A jelenlegi idpont t, s az gensnek el kell dntenie, hogy mit
tegyen azaz vlasztania kell egy rtket At szmra. A hl hrom jvbeli lpsre van
kibontva, s a jvbeli jutalmakat, valamint az elrelt horizonton lv llapot
hasznossgt brzolja.
A dinamikus dntsi hlk tmr lerst biztostanak nagy RMMDF-ekre, gy brmely RMMDF algoritmus
bemenetl szolglhatnak, idertve az rtk- s eljrsmd-itercira val mdszereket is. Ebben az alfejezetben
az elrenz mdszerekre sszpontostunk, amelyek cselekvssorozatokat kpzelnek el a jelenlegi hiedelmi
llapottl kiindulva, nagyon hasonlan a 6. fejezetbeli jtkok algoritmusaihoz. A 17.9. brn a hl hrom
jvbeli lpsig elkpzelve szerepel; a jelenlegi s a jvbeli dntsek s a jvbeli megfigyelsek s jutalmak
mind ismeretlenek. Figyeljk meg, hogy a hl csompontokat tartalmaz az Xt+1 s Xt+2-beli jutalmakra, de
hasznossgot az Xt+3 esetben. Ez azrt van gy, mert az gensnek maximalizlnia kell az sszes jvbeli
jutalom (leszmtolt) sszegt, s U(Xt+3) reprezentlja az Xt+3-hoz tartoz s az sszes ezt kvet jutalmat.
Ahogyan a 6. fejezetben, most is feltesszk, hogy U-nak csak egy kzelt alakja rhet el: ha elrhetk
lennnek pontos hasznossgrtkek, akkor nem lenne szksg 1 lpsnl hosszabb elretekintsre.
553
A 17.9. brn lthat DDH-hoz tartoz hromlpses elrenz keressi fa egy rszt a 17.10. bra mutatja.
Mindegyik hromszg alak csompont egy olyan hiedelmi llapot, amiben az gens egy At+i dntst hoz i = 0,
1, 2, ... esetn. A kerek csompontok a krnyezet vlaszaihoz tartoznak, nevezetesen hogy milyen Et+i
megfigyels fog felbukkanni. Lthat, hogy nincsen vletlen csompont, ami a cselekvsek kimenetelhez
tartozna. Ez azrt van gy, mert egy cselekvsnl a hiedelmi llapot frisstse a konkrt kimeneteltl fggetlenl
determinisztikus.
A hiedelmi llapot az egyes hromszg csompontoknl kiszmthat egy szrsi algoritmusnak a hozzvezet
megfigyelsek s cselekvsek sorozatn val alkalmazsval. Ezzel a mdszerrel, az algoritmus figyelembe
veszi azt a tnyt, hogy egy At+i dntsnl az gens szmra elrhetk lesznek az Et+1, ..., Et+i rzkelsek, mg ha
a t idpontban nem is tudja, hogy ezek az rzkelsek mi is lesznek. Ezen a mdon a dntselmleti gens
automatikusan figyelembe veszi az informci rtkt s informcigyjt cselekvseket hajt vgre, ha
szksges.
Egy dnts a keressi fbl a levelek hasznossgrtknek htrafel terjesztsvel nyerhet ki, a vletlen
csompontoknl tlagot, a dntsi csompontokban pedig maximumot szmtva. Ez hasonl a vletlen
csompontokkal rendelkez jtkfkra vonatkoz VRHATMINIMAX algoritmushoz, kivve, hogy (1) nem csak
levlllapotokban lehet jutalom, s (2) a dntsi csompontok hiedelmi llapotokhoz, s nem aktulis
llapotokhoz tartoznak. A d mlysg kimert keress idkomplexitsa O(|D|d |E|d), ahol |D| az elrhet
cselekvsek szma, |E| pedig a lehetsges megfigyelsek szma. Olyan problmknl, ahol a leszmtolsi
tnyez nincs kzel 1-hez, gyakran elegend sekly keress az optimlishoz kzeli dnts megtallshoz. Az is
lehetsges, hogy az tlagszmts lpst a lehetsges megfigyelsek mintavtelezsvel kzeltjk, az sszes
lehetsges megfigyels feletti sszegzs helyett. Szmos ms mdja van j kzelt megoldsok gyors
megtallsnak, de ezeket a 21. fejezetre hagyjuk.
A dinamikus dntsi hl alap dntselmleti genseknek szmos elnye van ms, egyszerbb, a korbbi
fejezetekben bemutatott gensfelptsekhez kpest. Nevezetesen, rszlegesen megfigyelhet s sztochasztikus
krnyezeteket kezelnek, s knnyen fellbrljk a terveiket a vratlan esemnyek kezelshez. Megfelel
rzkel modellekkel kpesek kezelni az rzkelmeghibsodst, s kpesek megtervezni az informci
begyjtst. Az id szortsban s komplex krnyezetekben teljestmnyromlsuk fokozatos, klnbz
kzelt technikk kihasznlsval. gy jogos a krds, hogy mi is hinyzik mg? A DDH-alap
algoritmusunknak a legkomolyabb hinyossga az elrefel keresstl val fggs, ahogyan a II. rszbeli
llapottr-keressi algoritmusoknak is. A IV. rszben elmagyarztuk, hogy rszlegesen rendezett, absztrakt
tervek mrlegelsnek kpessge clirnyos keresssel hogyan biztostotta a problmamegold kpessg lnyegi
nvekedst, klnsen a tervknyvtrakkal sszeillesztve. Ezeket a mdszereket megksreltk a valsznsgi
terletre is kiterjeszteni, de ez eddig nem bizonyult hatkonynak. Egy msodik, kapcsold problma a DDH
nyelv alapvet kijelentslogikai termszete. Szeretnnk, ha az elsrend valsznsgi nyelvek elkpzelseit
(lsd 14.6. alfejezet) ki tudnnk terjeszteni a dntshozatal problmjra. A jelenlegi kutatsok azt mutatjk,
hogy ez a kiterjeszts lehetsges, s jelents elnyket rejt magban, ahogy ezt a fejezet vgi megjegyzseknl
megtrgyaljuk.
17.10. bra - A 17.9. brn lthat DDH elrenz megoldsnak egy rsze
554
6. Tbbgenses dntsek: a jtkelmlet

Ez a fejezet a bizonytalan krnyezetbeli dntshozatalra sszpontostott. De mi a helyzet akkor, ha a
bizonytalansg ms genseknek s azok dntseinek ksznhet? s ha ezeknek az genseknek a dntseit a mi
dntseink befolysoljk? Ezzel a krdssel egyszer mr foglalkoztunk, amikor a 6. fejezetben a jtkokat
tanulmnyoztuk. Ott azonban tbbforduls, teljes informcis jtkokkal foglalkoztunk, amelyekre a minimax
keresssel optimlis lpsek tallhatk. Ebben az alfejezetben a jtkelmlet (game theory) azon vonatkozsait
tanulmnyozzuk, amelyek felhasznlhatk szimultn jtkok elemzsre. Egyszersts cljbl elsknt olyan
jtkokat nznk meg, amelyek csak egy lps hosszak. A jtk sz s az egyetlen lpsre val korltozs
ezt trivilisnak tntetheti fel, de valjban a jtkelmletet nagyon komoly dntshozatali helyzetekben
hasznljk idertve a bankcsdeljrsokat, a tvkzlsi frekvenciasvok aukcijt, a termkfejlesztsi s
rmegllaptsi dntseket, illetve a honvdelmi krdseket olyan helyzetekben, amelyek dollrmillirdok s
letek szzezreinek a sorst rintik. A jtkelmlet legalbb ktfle mdon hasznlhat fel:
1. genstervezs (agent design): A jtkelmlet kpes elemezni az gensek dntseit, s kiszmtani az egyes
dntsek vrhat hasznossgt (azon feltevs mellett, hogy ms gensek a jtkelmlet szerint optimlisan
cselekednek). Pldul a ktujjas snblijtkban (two-finger Morra) kt jtkos, O s E egyidejleg
felmutatja egy vagy kt ujjt. Legyen az ujjak sszes szma f. Ha f pratlan, akkor O kap f dollrt E-tl, s ha
f pros, akkor E kap f dollrt O-tl. A jtkelmlet kpes meghatrozni a legjobb stratgit egy racionlis
ellenfllel szemben, s az egyes jtkosok vrhat hasznt.5
2. Mkdsi md tervezs (mechanism design): Amikor a krnyezetet szmos gens npesti be,
elfordulhat, hogy a krnyezet szablyait (azaz a jtkot, amit az genseknek jtszaniuk kell) olyannak
hatrozhatjuk meg, hogy az sszes gens egyttes haszna akkor maximlis, amikor mindegyik gens egy
sajt hasznt maximl jtkelmleti megoldst kvet. Pldul a jtkelmlet segthet olyan protokollok
tervezsben az internetes forgalomirnytk szmra, hogy minden irnytnak olyan sztnzi legyenek,
hogy a globlis tvitel maximlis legyen. A mkdsi md tervezs arra is felhasznlhat, hogy olyan
intelligens tbbgenses rendszereket (multiagent systems) hozzunk ltre, amelyek komplex problmkat
elosztott mdon oldanak meg, anlkl, hogy az egyes genseknek ismernik kellene a megoldand teljes
problmt.
A snblijtk az ellenrzsi jtk (inspection game) egy szabadids vltozata. Ilyen jtkokban az ellenr megvlaszt egy napot egy
ltestmny (mint pldul egy vendgl vagy egy biolgiai fegyvergyr) ellenrzsre, s a ltestmny mkdtetje szintn megvlaszt egy
napot, amikor az sszes kellemetlen dolgot elrejti. Az ellenr gyz, ha a napok klnbznek, s a ltestmny fenntartja, ha ugyanazok.
5
555
Egy jtkot a jtkelmletben a kvetkez alkotelemek definilnak:

Jtkosok (player) vagy gensek, akik dntseket hoznak. A legnagyobb figyelem a ktszemlyes jtkokra
irnyult, br az n szemlyes jtkok n > 2-re szintn gyakoriak. A jtkosokra nagybets neveket hasznlunk,
mint Aliz s Bendegz vagy O s E.
Cselekvsek (actions), amiket a jtkosok vlaszthatnak. A cselekvseknek kisbets neveket vlasztunk,
mint az egy vagy a tanskodik. Lehet, hogy a jtkosok a cselekvseknek ugyanazt a halmazt rik el, de az is
lehet, hogy klnbzt.
Jutalommtrix (payoff matrix), ami az sszes jtkos cselekvseinek mindegyik kombincijra,
mindegyik jtkos szmra megadja a hasznossgot. A jutalommtrix a ktujjas snblijtkhoz a kvetkez:
Pldul a jobb als sarokban az lthat, amikor O a kett cselekvst s E szintn a kett cselekvst vlasztja, a
jutalom E-nek 4, O-nak pedig 4.
Minden jtkosnak a jtkban vlasztania kell, s aztn vgrehajtani egy stratgit (strategy) (ami a 16.
fejezetben szerepl eljrsmd elnevezse a jtkelmletben). A tiszta stratgia (pure strategy) egy
determinisztikus eljrsmd, ami mindegyik helyzethez elr egy vgrehajtand konkrt cselekvst; az
egylpses jtkokban a tiszta stratgia csupn egyetlen cselekvs. A jtkok elemzse vezetett el a kevert
stratgik (mixed strategy) gondolathoz, amely eljrsmdban egy konkrt cselekvs vletlenszeren kerl
kivlasztsra egy adott eloszlsbl a cselekvsek felett. Azt a kevert stratgit, ami p valsznsggel az a
cselekvst, egybknt pedig a b-t vlasztja, gy jelljk, hogy [p: a; (1 p): b]. Pldul a ktujjas snblijtkban
egy lehetsges kevert stratgia a [0,5: egy; 0,5: kett]. A stratgiaprofil (strategy profil) egy hozzrendels,
ami mindegyik jtkoshoz egy stratgit rendel; adott stratgiaprofilnl a jtk kimenetele (outcome) egy
numerikus rtk mindegyik jtkoshoz.
Egy jtk megoldsa (solution) egy olyan stratgiaprofil, amiben minden jtkos egy racionlis stratgit fogad
el. Ltni fogjuk, hogy a jtkelmletben a legfontosabb krds a racionlis jelentsnek a definilsa akkor,
amikor mindegyik gens csak egy rszt vlasztja meg a kimenetelt meghatroz stratgiaprofilnak. Fontos azt
felismerni, hogy a kimenetelek a jtk egyes meneteinek a konkrt eredmnyei, mg a megoldsok a jtk
elemzshez hasznlt elmleti konstrukcik. Megmutatjuk, hogy bizonyos jtkoknak csak a kevert stratgik
kztt van megoldsa. Ez azonban nem jelenti azt, hogy egy jtkosnak sz szerint egy kevert stratgit kell
elfogadnia a racionlis viselkedshez.
Gondoljuk t a kvetkez trtnetet: kt lltlagos betrt, Alizt s Bendegzt tetten rik egy betrs
helysznhez kzel, s a rendrsg kln-kln kihallgatja ket. Mindketten tudjk, hogy ha mindketten
beismerik a bncselekmnyt, akkor 5 v brtnt kapnak betrsrt, de ha mindketten tagadnak, akkor csak 1
vet kapnak lopott holmik birtoklsnak enyhbb vdjval. Azonban a rendrsg kln-kln alkut ajnl
mindkettnek: ha a partneredrl tanstod, hogy egy betrbanda vezetje, akkor szabadon engednek, mg a
partnered 10 vet kap. Ekkor Aliz s Bendegz az gynevezett fogolydilemmval (prisoners dilemma)
szembeslnek: tanskodniuk kell vagy tagadniuk? Racionlis gensknt Aliz s Bendegz is a sajt vrhat
hasznossgt akarja maximlni. Tegyk fel, hogy Alizt teljessggel hidegen hagyja partnernek a sorsa, gy az
hasznossga a sajt brtnben tlttt veinek szmval arnyosan cskken, fggetlenl attl, hogy mi trtnik
Bendegzzal. Bendegz teljesen hasonlan rez. A racionlis dnts meghozatalhoz mindketten megalkotjk a
kvetkez jutalommtrixot:
556
Aliz a kvetkezkppen elemzi a jutalommtrixot: Tegyk fel, hogy Bendegz tanskodik. Ha tanskodom, 5
vet kapok, s 10 vet, ha nem, ebben az esetben a tanskods jobb. Msrszrl, ha Bendegz tagad, akkor 0
vet kapok, ha tanskodom, s 1 vet, ha tagadok, gy a tanskods ebben az esetben is jobb. gy mindkt
esetben szmomra jobb tanskodni, gy ez az, amit tennem kell.
Aliz felfedezte, hogy a tanskods a jtk dominns stratgija (dominant strategy). Azt mondjuk, hogy egy
p jtkos egy s stratgija ersen dominlja (strongly dominate) az s stratgit, ha az s kimenetele p szmra
jobb, mint az s kimenetele, a tbbi jtkos minden stratgiavlasztsa esetn. Egy s stratgia gyengn
dominlja (weakly dominates) s-t, ha s jobb, mint s legalbb egy stratgiaprofilnl, s nem rosszabb a
tbbiben. Egy dominns stratgia olyan stratgia, ami az sszes tbbit dominlja. Egy ersen dominlt stratgit
irracionlis kvetni, s ha ltezik, irracionlis eltrni a dominns stratgitl. Racionlis volta miatt Aliz a
dominns stratgit vlasztja. Mr csak egy kevs terminolgira van szksgnk a tovbbhaladshoz: egy
kimenetelt Pareto-optimlisnak (Pareto optimal) neveznk,6 ha nincs msik kimenetel, amit az sszes jtkos
preferlna. Egy kimenetel Pareto-dominlt (Pareto dominated) egy msik kimenetel ltal, ha az sszes jtkos
a msik kimenetelt preferln.
Ha Aliz okos s racionlis, folytatni fogja az rvelst a kvetkezkppen: Bendegz dominns stratgija
szintn a tanskods. gy is tanskodni fog, s mindketten 5 vet kapunk. Amikor mindegyik jtkosnak van
dominns stratgija, ezek kombincijt dominns stratgiai egyenslynak (dominant strategy equilibrium)
nevezzk. ltalban egy stratgiaprofil akkor van egyenslyi helyzetben (equilibrium), ha egyik jtkos sem
nyer stratgija vltsval, az sszes tbbi jtkos stratgijnak vltozatlansga mellett. Egy egyenslyi helyzet
lnyegben egy loklis optimum (local optimum) az eljrsmdok terben: egy cscs teteje lejtkkel minden
dimenziban, ahol a dimenzik egy jtkos stratgiai vlasztsaihoz tartoznak.
A dilemma a fogolydilemmban az, hogy az egyenslyi helyzet kimenetele mindkt jtkosnak rosszabb, mint
az a kimenetel, amit akkor rnnek el, ha mindketten megtagadnk a tanskodst. Mskppen fogalmazva, az
egyenslyi megolds kimenete Pareto-dominlt a (tagad, tagad)-nak a (1, 1)-es kimenetelvel.
Van-e mdja Aliznak s Bendegznak a (1, 1)-es kimenetelt elrni? Az bizonyosan megengedett lehetsg
mindkettjknek, hogy megtagadjk a tanskodst, de valszntlen lehetsg. Akrmelyik jtkos is kezdene
elmlkedni azon, hogy a tagadst vlasztja, felismeri, hogy jobban teszi, ha a tanskodik. Az egyenslyi
helyzetnek ez a vonzereje.
Fontos
A matematikus John Nash (1928) bebizonytotta, hogy minden jtknak van egy itt definilt tpus
egyenslyi helyzete. Ezt a tiszteletre most mr Nash-egyenslynak nevezik. Nyilvnval, hogy egy
dominns stratgiai egyensly Nash-egyensly (Nash equilibrium) (lsd 17.9. feladat), de nem
minden jtknak vannak dominns stratgii. Nash ttele azt mondja ki, hogy egyenslyi stratgik
akkor is lteznek, ha nincs dominns stratgia.
A fogolydilemmnl csak a (tanskodik, tanskodik) stratgiaprofil Nash-egyensly. Nehezen lthat, hogy
racionlis jtkosok hogyan tudjk elkerlni ennek a kimenetelt, mivel brmely javasolt nem egyenslyi
megoldsnl legalbb egy jtkos ksrtsben lenne, hogy vltoztasson a stratgijn. Jtkelmleti kutatk
egyetrtenek, hogy a Nash-egyensly fennllsa szksges felttel egy megolds fennllshoz br abban mr
nem rtenek egyet, hogy ez elgsges felttel-e.
A (tanskodik, tanskodik) megolds knnyszerrel elkerlhet, ha valamilyen mdon megvltoztatjuk a jtkot
(vagy a jtkosokat). Mdosthatjuk pldul egy olyan iterlt jtkra, amiben a jtkosok tudjk, hogy jra
tallkozni fognak (de az dnt, hogy bizonytalanok legyenek abban, hogy hnyszor fognak mg jra tallkozni).
Vagy ha az gensek morlis meggyzdse ersti az egyttmkdst s az igazsgossgot, megvltoztathatjuk
a jutalommtrixot gy, hogy tkrzze az egyes gensek tbbiekkel val egyttmkdsnek a hasznossgt.
Ksbb ltni fogjuk, hogy az gens olyan megvltoztatsa, hogy a szmtsi kapacitsa korltos, ahelyett hogy
teljesen racionlis kvetkeztetsre lenne kpes, szintn befolysolja a kimenetelt, mivel azt rulhatja el az egyik
gensnek, hogy a msik racionalitsa korltos.
Most nzznk meg egy jtkot, aminek nincs dominns stratgija. Az Acme nev videojtk-hardver
gyrtjnak dntenie kell, hogy a kvetkez jtkgp DVD-ket vagy CD-ket hasznljon. Ekzben a videojtkszoftver gyrtjnak, Bestnek is dntenie kell, hogy DVD-n vagy CD-n adja ki a kvetkez jtkt. A nyeresg
6
A Pareto-optimalits a kzgazdsz Vilfredo Paretrl (18481923) kapta nevt.
557
mindkettjknek pozitv, ha egyetrtenek, s negatv, ha eltrnek, ahogy a kvetkez jutalommtrixbl ez

lthat:
Fontos
Erre a jtkra nincs dominns stratgiai egyensly, de ltezik kt Nash-egyensly: (dvd, dvd) s (cd,
cd). Tudjuk, hogy ezek Nash-egyenslyok, mivel akrmelyik jtkos is vlt egyoldalan egy klnbz
stratgira, az rosszabbul fog llni. Most az genseknek a problmja a kvetkez: tbb elfogadhat
megolds is ltezik, de ha az egyes gensek klnbz megoldst vlasztanak, akkor a kiadd
stratgiaprofil egyltaln nem lesz megolds, s mindkt gens vesztesget fog elszenvedni. Hogyan
egyezhetnek meg egy megoldsban? Egy vlasz erre, hogy mindkettnek a Pareto-optimlis megoldst
kell vlasztania (dvd, dvd); azaz leszkthetjk a megolds defincijt az egyrtelm Paretooptimlis Nash-egyenslyokra, feltve, hogy ltezik ilyen. Minden jtknak van legalbb egy Paretooptimlis megoldsa, de egy jtknak lehet tbb egyenslyi pontja, de lehet, hogy ezek nem egyenslyi
pontok. Pldul bellthatjuk a jutalmakat a (dvd, dvd)-nl 5-re 9 helyett. Ebben az esetben kt egyenl
Pareto-optimlis egyenslyi pont ltezik. A kzttk val vlasztshoz az gensek vagy tallgatnak,
vagy kommuniklnak, ami vagy egy megllapods kimondst jelenti, ami sorrendezi a megoldsokat a
jtk megkezddse eltt, vagy trgyalst jelent, hogy egy klcsnsen elnys megolds alakuljon ki
a jtk folyamn (ami egy tbblpses jtk rszeknt megjelen kommunikcis cselekvsek ltt
jelenten). A kommunikci gy pontosan ugyanazokbl az okokbl jelenik meg, mint a tbbgenses
tervezsnl a 12. fejezetben. Az ilyen jtkokat, ahol a jtkosoknak szksges kommuniklniuk,
koordincis jtkoknak (coordination games) nevezzk.
Lttuk, hogy egy jtknak lehet tbb mint egy Nash-egyenslya: honnan tudjuk, hogy minden jtknak van
legalbb egy? Az lehetsges, hogy egy jtknak nincs tiszta stratgij Nash-egyenslya. Gondoljunk t pldul
egy tetszleges tiszta stratgij profilt a ktujjas snblijtkhoz (6. szakasz - Tbbgenses dntsek: a
jtkelmlet rsz). Ha az ujjak sszrtke pros, akkor O szeretne vltani; ha pratlan, akkor pedig E szeretne
vltani. gy egy tiszta stratgij profil nem lehet egyenslyi, s kevert stratgikat kell megnznnk.
De melyik kevert stratgit? 1928-ban Neumann kifejlesztett egy mdszert az optimlis kevert stratgia
megkeressre ktszemlyes zrussszeg jtkokra. A zrussszeg jtk7 (zero-sum game) olyan jtk,
amiben a jutalmak a jutalommtrix elemeiben nullra sszegzdnek. Vilgos, hogy a snblijtk ilyen jtk. A
ktszemlyes zrussszeg jtkoknl tudjuk, hogy a jutalmak egyenlk s ellenttesek, gy csak az egyik
jtkos jutalmait kell figyelembe vennnk, aki a maximl lesz (ahogy a 6. fejezetben is). A snblijtknl az E
pros jtkost vlasztjuk maximlnak, gy a jutalommtrixot az UE(e, o) rtkekkel definilhatjuk a jutalom
E-nek, ha E e-t hajt vgre s O o-t.
Neumann mdszert maximin techniknak nevezik, s a kvetkez mdon mkdik:
Tegyk fel, hogy gy vltoztatjuk meg a szablyokat, hogy elsknt E-nek ktelez felfedni a stratgijt,
majd O kvetkezik. gy egy fordulkon alapul jtkot kapunk, amire a standard minimax algoritmust
alkalmazhatjuk a 6. fejezetbl. Tegyk fel, hogy ez egy UE,O kimenetelt ad. Nyilvnval, hogy ez a jtk Onak kedvez, gy a jtk igazi hasznossga (E szempontjbl) legalbb UE,O. Pldul ha csak tiszta stratgikat
nznk, a minimax jtkfnak a gykrbeli rtke 3 (lsd 17.11. (a) bra), gy tudjuk, hogy U 3.
Most tegyk fel, hogy a szablyokat gy vltoztatjuk meg, hogy elsknt O-nak ktelez felfednie a
stratgijt, majd E kvetkezik. Ennek a jtknak a minimax rtke UE,O, s mivel ez a jtk E-nek kedvez,
tudjuk, hogy U legfeljebb UE,O. Tiszta stratgiknl az rtk +2 (lsd 17.11. (b) bra), gy tudjuk, hogy U
+2.
ltalnosabb az lland sszeg jtkok (constant-sum games) fogalma, amelyekben a jtkbeli minden elemnl az sszeg egy c
llandt ad. Egy n szemlyes lland sszeg jtk egy zrussszeg jtkk konvertlhat c/n kivonsval minden jutalombl. gy a sakk,
a tradicionlis jutalmakkal, mint 1 a gyzelemrt, a dntetlenrt s 0 a vesztesgrt, technikailag egy lland sszeg jtk c = 1-gyel, de
knnyen egy zrussszeg jtkk konvertlhat, ha minden jutalombl kivonunk -et.
7
558
Ezt a kt rvelst sszekapcsolva lthatjuk, hogy a megolds valdi hasznossga (U) eleget fog tenni annak,
hogy
UE,O U UO,E
vagy ebben az esetben 3 U 2
Fontos
Az U rtknek pontos megllaptshoz az elemzsnkben t kell trni a kevert stratgikra. Elsknt
vegyk szre a kvetkezt: ha az els jtkos felfedte a stratgijt, a msodik nem veszthet azzal,
hogy tiszta stratgit kvet. Az ok egyszer: ha a msodik jtkos egy [p: egy; (1 p): kett] kevert
stratgit jtszik, akkor a vrhat hasznossga a tiszta stratgik hasznossgainak, uegy-nek s ukett-nek
egy lineris kombincija, (p uegy + (1 p) ukett). Ez a lineris kombinci nem haladhatja meg az uegy
s az ukett kzl a nagyobbat, gy a msodik jtkos is jtszhat egy tiszta stratgit.
Ezt az szrevtelt emlkezetnkben tartva, a minimax fknl kpzelhetjk azt, hogy a gykrnl vgtelen sok g
van, amelyek az els jtkos ltal vlaszthat vgtelen sok kevert stratgihoz tartoznak. Ezek mindegyike egy
ketts elgazs csomponthoz vezet, amelyek a msodik jtkos tiszta stratgiihoz tartoznak. Ezeket a
vgtelen fkat gy brzoljuk vges mdon, hogy a gykrnl egy parametrizlt vlaszts van:
Ha E lp elszr, a helyzet a 17.11. (c) brn lthat. E a gykrnl [p: egy; (1 p): kett] szerint jtszik, s O
p rtke alapjn vlaszt egy lpst. Ha O egy-et vlaszt, a vrhat jutalom (E-nek) 2p 3(1 p) = 5p 3; ha
O kett-t vlaszt, a vrhat jutalom 3p + 4(1 p) = 4 7p. Ezeket a jutalmakat mint egyeneseket
tntethetjk fel a grafikonon, ahol p 0 s 1 kztt lehet az x tengelyen, ahogyan az a 17.11. (e) brn lthat.
O, a minimalizl, mindig az alst fogja vlasztani a kt egyenes kzl, amit az brn a vastag egyenes jelez.
gy a legjobb, amit E tehet a gykrnl, hogy p-t a metszspontnl vlasztja meg, aminek rtke:
5p 3 = 4 7p p = 7/12
A hasznossg E szmra ebben a pontban UE,O = 1/12.

Ha O lp elszr, a helyzet a 17.11. (d) brn lthat. O a gykrnl [q: egy; (1 q): kett] szerint jtszik, s
E a q rtke alapjn vlaszt egy lpst. A jutalmak 2q 3(1 q) = 5q 3 s 3q + 4(1 q) = 4 7q.8 Ismt
lthat a 17.11. (f) brn, hogy a legjobb, amit O a gykrnl tehet, hogy a metszspontot vlasztja:
5q 3 = 4 7q q = 7/12
A hasznossg E szmra ebben a pontban UO,E = 1/12.

Most mr tudjuk, hogy a jtk valdi hasznossga 1/12 s 1/12 kztt helyezkedik el, azaz pontosan 1/12!
(A tanulsg az, hogy ebben a jtkban jobb O-nak lenni, mint E-nek.) Tovbb, a valdi hasznossgot a [7/12:
egy; 5/12: kett] kevert stratgival lehet elrni, amit mindkt jtkosnak rdemes kvetnie. Ezt a stratgit a
jtk maximin egyenslynak nevezik (maximin equilibrium), s ez egy Nash-egyensly. Vegyk szre, hogy
az egyenslyi kevert stratgia minden komponensnek ugyanaz a vrhat hasznossga. Ebben az esetben mind
az egy-nek, mind a kett-nek ugyanaz a vrhat hasznossga, 1/12, mint magnak a kevert stratginak.
Fontos
A snblijtkra vonatkoz eredmnynk Neumann ltalnos eredmnynek egy pldja: minden
ktszemlyes, zrussszeg jtknak van egy maximin egyenslya, amikor kevert stratgik
lehetsgesek. Tovbb, egy zrussszeg jtkban minden Nash-egyensly mindkt jtkos szmra
egy maximin. A maximin egyensly megtallsnak ltalnos algoritmusa zrussszeg jtkokban
kiss bonyolultabb, mint amit a 17.11. (e) s 17.11. (f) bra sugallhatna. Ha n cselekvs lehetsges,
akkor egy kevert stratgia egy pont az n dimenzis trben, s az egyenesek hiperskok lesznek. Az is
lehetsges, hogy a msodik jtkos szmra bizonyos tiszta stratgik msokkal dominltak, gy ezek
nem optimlisak az els jtkos egyetlen stratgija ellen sem. Az sszes ilyen stratgia eltvoltsa
utn (amit lehet, hogy ismtlden kell elvgezni), az optimlis vlaszts a gykrnl a legmagasabb
(vagy a legalacsonyabb) metszspontja a megmaradt hiperskoknak. Ennek a vlasztsnak a
megtallsa lineris programozsi feladat (linear programming): egy clfggvny maximlsa
lineris knyszerek mellett. Ilyen problmk szabvnyos technikkkal megoldhatk polinomilis
Az egy egybeess, hogy ezek az egyenletek ugyanazok, mint a p-re vonatkozk; az egybeess amiatt lp fel, mert UE(egy, kett) = UE(kett,
egy) = 3. Ez azt is megmagyarzza, hogy az optimlis stratgia mirt ugyanaz mindkt jtkosnl.
8
559
idkomplexitssal a cselekvsek szmban (s a jutalomfggvny megadshoz hasznlt bitek

szmban, ha preczek akarunk lenni).
A krds tovbbra is megvlaszolatlan, mit kell egy racionlis gensnek konkrtan tennie ha a snblijtk egy
menett jtssza? A racionlis gens le fogja vezetni azt a tnyt, hogy a [7/12: egy; 5/12: kett] egy maximin
egyenslyi stratgia, azt fogja felttelezni, hogy egy racionlis ellenflnl ez a tuds klcsns. Az gens
hasznlhat egy 12 oldal kockt vagy egy vletlenszm genertort, hogy e szerint a kevert stratgia szerint
sorsoljon, amely esetben a vrhat jutalom E szmra 1/12. Vagy az gens egyszeren dnthet gy, hogy
mindig egy-et vagy kett-t jtszik. A vrhat jutalom brmely esetben 1/12 marad E szmra. rdekes, hogy
egy konkrt cselekvs egyoldal megvlasztsa nem veszlyezteti a vrhat jutalmat, de ha a msik gnes
szmra ismertt vlik egy ilyen egyoldal dnts, az mr befolysolja a vrhat jutalmat, hiszen az ellenfl
ennek megfelelen igazthatja a stratgijt.
17.11. bra - (a) s (b): Minimax jtkfk a ktujjas snblijtkhoz, ha a jtkosok a

fordulkban tiszta stratgit jtszanak. (c) s (d): Parametrizlt jtkfk, ahol az els
jtkos kevert stratgit jtszik. A jutalmak fggnek a kevert stratgia (p s q)
valsznsgi paramtereitl. (e) s (f): A valsznsgi paramter brmely konkrt
rtknl a msodik jtkos a kt cselekvs kzl a jobbikat fogja vlasztani, gy az
els jtkos kevert stratgijnak az rtkt a vastag vonal jelli. Az els jtkos a
kevert stratgia valsznsgi paramtert a metszspontnl fogja megvlasztani.
560
A megoldsok (azaz Nash-egyenslyok) megtallsa nem zr sszeg vges jtkokra kiss bonyolultabb. Az
ltalnos megkzelts ktlpses: (1) Soroljuk fel a cselekvsek sszes lehetsges rszhalmazt, amelyek kevert
stratgikat alkothatnak. Pldul elsknt prblkozzunk az sszes olyan stratgiaprofillal, amelyekben
mindegyik jtkos egyetlen cselekvst hasznl, aztn azokkal, amelyekben mindegyik jtkos egy vagy kt
cselekvst hasznl s gy tovbb. Ez a cselekvsek szmban exponencilis, s gy csak viszonylag kis
jtkoknl alkalmazhat. (2) Minden (1)-ben felsorolt stratgiaprofilnl ellenrizzk, hogy az egyenslyi-e. Ez
olyan egyenletek s egyenltlensgek egy rendszernek a megoldsval rhet el, amelyek hasonlk a
zrussszeg jtkban hasznltakhoz. Kt jtkosra ezek az egyenletek linerisak, s alapvet lineris
programozsi technikkkal megoldhatk, de hrom vagy tbb jtkosnl mr nem-linerisak, s esetleg nagyon
nehezen oldhatk meg.
Eddig csak egylpses jtkokat vizsgltunk. A legegyszerbb tbblpses jtk az ismtld jtk (repeated
game), amelyben a jtkosok jra s jra ugyanazzal a vlasztssal szembeslnek, de az egyes alkalmakkor mr
ismert az sszes jtkos korbbi vlasztsainak a trtnete. Az ismtld jtknl egy stratgiaprofil egy
561
cselekvsvlasztst ad meg mindegyik jtkos szmra, minden idpontban s a korbbi vlasztsok minden
lehetsges trtnetre. Ahogyan az MDF-eknl, a jutalmak az idben additvak.
Gondoljuk t a fogolydilemma ismtld vltozatt. Egytt fog-e mkdni Aliz s Bendegz, visszautastva a
tanskodst, azt tudva, hogy jra fognak tallkozni? A vlasz a tallkozs rszleteitl fgg. Tegyk fel, hogy
Aliz s Bendegz tudja, hogy pontosan 100 menetben jtszanak fogolydilemmsat. Ekkor mindketten tudjk,
hogy a 100. menet nem lesz ismtelt jtk azaz, a kimenetelnek nincs hatsa jvbeli menetekre , s ezrt
ebben a menetben mindketten a dominns stratgit, a tanskods-t vlasztjk. De a 100. menet
meghatrozsval a 99. menetnek nem lehet hatsa kvetkez menetekre, gy ennek szintn lesz egy dominns
stratgiai egyenslya a (tanskodik, tanskodik)-nl. Indukcival mindkt jtkos a tanskodst fogja vlasztani
minden menetben, fejenknt sszesen 500 v brtnt kapva. Eltr megoldsokat nyerhetnk az interakci
szablyainak a megvltoztatsval. Tegyk fel, hogy minden menet utn 99% eslye van, hogy a jtkosok jra
tallkoznak.
Ekkor a menetek vrhat szma mg mindig 100, de egyik jtkos sem tudja biztosan, hogy melyik menet lesz
az utols. Ezen felttelek mellett egyttmkdbb viselkeds lehetsges. Pldul a tagads mindegyik
jtkosnak egyenslyi stratgia mindaddig, amg a msik jtkos nem vlaszt tanskods-t. Ezt a stratgit
rks bntetsnek (perpetual punishment) nevezik. Tegyk fel, hogy mindkt jtkos ezt a stratgit
fogadta el, s ez klcsnsen ismert. Ekkor mindaddig, amg egyik jtkos sem vlasztotta a tanskods-t,
brmely idpontban a vrhat jvbeli teljes jutalom mindegyik jtkosnak
Az a jtkos, aki a tanskods-t vlasztja, egy 0 pontszmot nyer 1 helyett a soron kvetkez lpsben, de a
teljes vrhat jvbeli jutalma a kvetkezre vltozik:
Ezrt egyik lpsnl sincs indtk eltrni a (tagad, tagad)-tl. Az rks bntets a fogolydilemma egy
klcsnsen biztostott megsemmistsi stratgija: alighogy az egyik jtkos a tanskods mellett dnt, ez
biztostja, hogy mindkt jtkos nagy vesztesget fog elszenvedni. De ez csak akkor elrettent, ha a msik
jtkos elhiszi, hogy ezt a stratgit fogadtuk el vagy legalbbis hogy elfogadhattuk.
Vannak ms stratgik, amelyek megbocstbbak. A leghresebb a szemet szemrt (tit-for-tat), ami szerint
tagads-sal kell kezdeni, majd megismtelni a msik jtkos elz lpst az sszes elkvetkez lpsben. gy
Aliz tagadna, ameddig Bendegz tagadna, s a Bendegz tanskodsa utni lpsben is tanskodna, de
visszatrne a tagadshoz, ha Bendegz visszatrt. Br nagyon egyszer, ez a stratgia igen robusztusnak s
hatkonynak bizonyult stratgik szles kre ellen.
Klnbz megoldsokat az gensek megvltoztatsval is kaphatunk, a tallkozs szablyainak vltoztatsa
helyett. Tegyk fel, hogy az gensek vges llapot gpek n llapottal, s egy m > n lpses jtkot jtszanak.
Az gensek gy nem kpesek reprezentlni a htramarad lpsek szmt, gy azt ismeretlenknt kell kezelni.
gy k nem kpesek az indukcis levezetsre, s lehetsgk van a kedvezbb (tagad, tagad) esetet elrni.
Ebben az esetben a tudatlansg lds vagy inkbb az, hogy elhitessk az ellenfllel, hogy tudatlanok vagyunk.
Ezekben az ismtld jtkokban a sikernk a msik jtkos benyomsn mlik, hogy nyomulsok vagy
mamlaszok vagyunk, s nem a valdi tulajdonsgunkon.
Az ismtld jtkok teljesen ltalnos trgyalsa meghaladja a knyv kereteit, de szmos helyzetben
megjelennek. Pldul konstrulhatunk egy szekvencilis jtkot, ha a 17.1. bra 4 3-as vilgba kt genst
behelyeznk. Ha kiktjk, hogy nem kvetkezik be mozgs, amikor a kt gens ugyanarra a mezre prbl lpni
(ugyanaz a problma szmos forgalmi tkeresztezdsben), akkor bizonyos tiszta stratgik rkre
beragadhatnak. Megolds, ha mindegyik gens vletlenszeren vlaszt az elrefel lps s a helyben marads
kztt; a holtpont gyorsan felolddik, s mindkt gens boldog lesz. Pontosan ezt teszik az Ethernethlzatokban a csomagtkzs feloldsra.
Az ismtld jtkok jelenleg ismert megoldsi mdszerei a 6. fejezetbl ismert tbbforduls jtkok megoldsi
mdszereihez hasonltanak abban, hogy egy jtkfa pthet a gykrtl lefel, s megoldhat a levelektl
felfel. A f klnbsg az, hogy egy gyerekcsompont rtkei feletti egyszer maximum- vagy minimumkpzs
562
helyett az algoritmusnak minden szinten meg kell oldania egy kevert stratgij jtkot, felttelezve, hogy a
gyerekcsompontok mr megoldottak, s jl definilt rtkk felhasznlhat.
Az ismtld jtkokat rszlegesen megfigyelhet krnyezetekben rszleges informcij (partial
information) jtkoknak nevezik. A pldk kztt tallhatunk olyan krtyajtkokat, mint a pker s a bridzs,
amelyekben mindegyik jtkos a krtyknak csak egy rszt lthatja, de olyan komolyabb jtkokat is, mint a
nukleris hbors modellek, ahol egyik fl sem ismeri az ellenfl sszes fegyvernek a helyzett. Rszleges
informcij jtkokat a hiedelmi llapotok fjnak a vizsglatval oldanak meg gy, mint az RMMDF-ekben
(lsd 17.4. alfejezet). Fontos klnbsg az, hogy mg a sajt hiedelmi llapotok megfigyelhetk, addig az
ellenfl hiedelmi llapotai nem. Ilyen jtkokra csak mostanban fejlesztettek ki a gyakorlatban hasznlhat
algoritmusokat. Megoldsok szlettek a pker bizonyos egyszerbb vltozataira, bebizonytva, hogy a blffls
valban racionlis vlaszts egy jl kiegyenslyozott kevert stratgia rszeknt. Az ilyen tanulmnyokbl
alakult ki az a lnyeges meglts, hogy a kevert stratgik nemcsak azrt hasznosak, mert valakinek a
cselekvst megjsolhatatlann teszik, hanem azrt is, mert minimalizljk annak az informcinak a
mennyisgt, amit az ellenfl a cselekvsek megfigyelsvel tanulni kpes. rdekes, hogy annak ellenre, hogy
a bridzs jtszshoz val programok tervezi nagyon is tisztban vannak az informci gyjtsnek s
elrejtsnek a fontossgval, senki sem javasolta vletlenszer stratgik hasznlatt.
A jtkelmlet felhasznlsnak az genstervezs szlesebb terletn eddig szmos akadlya volt. Elsknt
vegyk szre, hogy egy Nash-egyenslyban egy jtkos teljes mrtkben felttelezi azt, hogy az ellenfl
egyenslyi stratgit jtszik. Ez azt jelenti, hogy a jtkos semmilyen elvrst sem kpes felhasznlni a tbbi
jtkos valszn cselekvsvel kapcsolatban, s gy lehet, hogy olyan fenyegetsek ellen val vdekezsre
vesztegeti el az rtkeit, amelyek soha nem is lpnek fel. A BayesNash-egyensly (BayesNash equilibrium)
fogalma rszben ezt a hinyossgot ptolja: ez egy olyan egyensly, ami megfelel egy jtkos a priori
valsznsg-eloszlsnak a tbbi jtkos stratgii felett mskppen fogalmazva, kifejezi egy jtkos
elvrsait a tbbi jtkos valszn stratgijrl. Msodszor, jelenleg nincs j mdszer a jtkelmleti s az
RMMDF irnytsi stratgik sszekapcsolsra. Ezek s ms problmk miatt a jtkelmletet elsdlegesen
inkbb olyan krnyezetek elemzsre hasznljk, amelyek egyenslyban vannak, a krnyezetben lv gensek
irnytsa helyett. Hamarosan ltni fogjuk, hogy a jtkelmlet hogyan segtheti a krnyezetek tervezst.
7. Mkdsi md tervezs
Az elz alfejezetben azt a krdst prbltuk megvlaszolni, hogy Ha adott egy jtk, mi a racionlis
stratgia? Ebben az alfejezetben azt krdezzk, hogy Ha az gensek racionlisak, milyen jtkot tervezznk?
Pontosabban, egy olyan jtkot szeretnnk tervezni, aminek a megoldsa az egyes gensek ltal kvetett sajt
racionlis stratgiik egyttese, s ez egy globlis hasznossgfggvny maximlst eredmnyezi. Ezt a
problmt mkdsi md tervezsnek (mechanism design) nevezik, vagy nha inverz jtkelmletnek
(inverse game theory). A mkdsi md tervezs a kzgazdasg-tudomnyok s a politikai tudomnyok a
lnyege. gensek egyttesnl ez annak lehetsgt hordozza magban, hogy jtkelmleti mkdsi mdokat
hasznlva gyes rendszereket hozunk ltre korltoltabb rendszerek egyttesbl mg nem egyttmkd
rendszerekbl is , nagyon hasonlan ahhoz, ahogy emberek csoportjai olyan clokat tudnak elrni, amik
messze tl vannak az egyni lehetsgeken.
A mkdsi md tervezs pldi kztt olcs repljegyek elrverezse, TCP-csomagok szmtgpek kztti
tovbbtshoz megfelel tvonal keresse, szigorl orvosok krhzakhoz rendelse, illetve annak eldntse
szerepel, hogy robotfocistk hogyan mkdjenek egytt a csapattrsaikkal. A mkdsi md tervezs az 1990es vektl lpett ki az egyetemek falai kzl, amikor szmos orszg, a msorszr frekvenciasvok
elrverezsnek a problmjval szembeslve, dollrszzmillikat vesztett a lehetsges bevteleibl a gyenge
mkdsi md tervezs eredmnyekppen. Formlisan a mkdsi md (mechanism) tartalmaz (1) egy
nyelvet az gensek ltal vlaszthat megengedett stratgik (potencilisan vgtelen) halmaznak a lersra s
(2) egy G kimeneteli szablyt, ami a jutalmakat hatrozza meg az genseknek megengedett stratgik egy adott
stratgiaprofilja esetn.
Els rnzsre a mkdsi md tervezs problmja trivilisnak tnik. Tegyk fel, hogy az U globlis
hasznossgfggvny dekomponldik egyni Ui gens hasznossgfggvnyek valamely halmazra gy, hogy U
= iUi. Ekkor mondhatnnk azt, hogy ha mindegyik gens maximlja a sajt hasznossgt, ez biztosan a globlis
hasznossg automatikusan maximlshoz fog vezetni. (Pldul a kapitalizmus egyszeregye szerint, ha egy
trsadalomban mindenki megprbl gazdagodni, a trsadalom sszgazdagsga nvekedni fog.) Sajnos ez nem
mkdik. Az egyes gensek cselekvsei befolysolhatjk a tbbi gens jltt oly mdon, hogy a globlis
hasznossg cskken. Erre plda a kzlegel tragdija (tragedy of commons), amely helyzetben az egyni
563
gazdlkodk az sszes lbasjszgukat ingyen legeltetik a vros kzlegeljn, ezrt a kzlegel tnkremegy, s
az sszes gazdlkod nagy vesztesget szenved el. Mindegyik gazdlkod egynileg racionlisan cselekedett,
azzal rvelve, hogy a kzlegel ingyenes, s azzal, hogy br a kzlegel hasznlata a tnkremenetelhez vezet, a
hasznlatnak a mellzse ezt nem befolysolja (hiszen msok gyis hasznlnk). Hasonl rvelsek
alkalmazhatk a szennyez anyagok kibocstsa esetn a lgkr s az cenok hasznlatra is.
Az ilyen problmk szabvnyos megkzeltse a mkdsi md tervezsben az, hogy a kztulajdon
hasznlatrt mindegyik gensnl kltsget szmtunk fel. ltalnosabban, azt kell biztostanunk, hogy minden
klssg (externalities) olyan globlis hasznossgot befolysol tnyez, amely az egyni gensek
tranzakciiban nincsenek elismerve klnllan nevestve megjelenjen. Ebben a nehz a helyes rak
megllaptsa. Ennek a megkzeltsnek a vgletes formja egy olyan mkdsi md megalkotst jelenti,
amelyben mindegyik genstl valjban a globlis hasznossg maximlst kveteljk meg. Ez
megoldhatatlanul nehz feladat az gens szmra, aki sem megbecslni nem tudja a vilg jelenlegi llapott,
sem megfigyelni a cselekvseinek az sszes tbbi gensre gyakorolt hatst. A mkdsi md tervezs ezrt
olyan mkdsmdok megtallsra sszpontost, amelyeknl az egyes gensek dntsi problmja knnyen
megoldhat.
Gondoljuk t elszr az rverseket. Az rvers a legltalnosabb formjban egy mkdsmd bizonyos
ruknak egy ajnlattev csoport tagjai szmra trtn eladsra. Az rajnlatok, a stratgik s a kimenetel
meghatrozza, hogy ki kapja az rukat s mennyit fizet. A mestersges intelligenciban pldul az rversek
akkor jelennek meg, amikor gensek egy csoportja eldnti, hogy egyttmkdjenek-e egy kzs terven.
Hunsberger s Grosz megmutatta, hogy ez hatkonyan elrhet rverssel, amiben az gensek ajnlatokat
tesznek a kzs tervbeli szerepkre (Hunsberger s Grosz, 2000). Egyelre olyan rverseket tekintnk t,
amelyekben (1) egyetlen ru van, (2) mindegyik ajnlattevnek van egy vi hasznossgrtke az rura, s (3) ezek
az rtkek csak az ajnlattev szmra ismertek. Az ajnlattevk megteszik a bi ajnlataikat, s a legmagasabb
ajnlat nyeri el az rukat, de a mkdsmd hatrozza meg, hogyan tehetk meg az ajnlatok, s mi a gyztes
ltal fizetend r (ami nem szksgszeren bi). Az rversek legismertebb tpusa az angol rvers (English
auction), amelyben az rverez mindaddig nveli az ruk rt, amg csak egyetlen ajnlattev marad,
ellenrizve kzben, hogy vajon az ajnlattevk rdekeltek-e mg. Ennek a mkdsmdnak az a tulajdonsga,
hogy a legnagyobb vi rtkkel br ajnlattev nyeri el az rukat bm + d ron, ahol bm a legmagasabb ajnlat az
sszes tbbi jtkos kztt, s d az rverez nvekmnye az ajnlatok kztt.9 Az angol rversnl az
ajnlattevknek egyszer dominns stratgijuk van: addig tegynk rajnlatokat, ameddig a jelenlegi kltsg a
szemlyes rtk alatt van. Emlkezznk arra, hogy a dominns azt jelenti, hogy a stratgia minden ms
stratgia ellen mkdik. Ez viszont azt jelenti, hogy egy jtkos a tbbi stratgitl fggetlenl vlaszthatja ezt.
Ezrt a jtkosoknak nem kell idt s energit vesztegetnik a tbbi jtkos stratgijn val elmlkedssel. Egy
mkdsmdot stratgiamentesnek (strategy-proof) neveznk, ha a jtkosoknak van dominns stratgija,
ami magban foglalja a valdi indtkok felfedst is.
Az angol rvers htrnyos tulajdonsga a nagy kommunikcis kltsg, gy vagy egy szobban kell az
rversnek lezajlania, vagy az sszes ajnlattevnek nagysebessg, biztonsgos kommunikcis csatornval
kell rendelkeznie. Egy kevesebb kommunikcit ignyl alternatv mkdsmd a zrt ajnlat rvers
(sealed bid auction). Ebben minden ajnlattev egyetlen ajnlatot tesz, s ezt kzli az rverezvel, s a
legnagyobb ajnlat gyz. Ennek a mkdsmdnak az esetben az a stratgia, aminek az rajnlata a valdi
rtk, mr nem dominns. Ha valakinek az rtke vi, s az elvrsa szerint az sszes tbbi jtkos maximlis
ajnlata bm lesz, akkor az rajnlatnak a vi s bm + kzl az alacsonyabbnak kell lennie. A zrt ajnlat rvers
kt htrnya, hogy elfordulhat, hogy a legnagyobb vi rtkkel br jtkos nem kapja meg az rukat, illetve az,
hogy a jtkosoknak fradozniuk kell a tbbi jtkos stratgijn val elmlkedssel.
A zrt ajnlat rvers szablyainak kis vltoztatsval addik a zrt ajnlat msodik ras rvers (sealed
bid second-price auction), ami Vickrey-rvers (Vickrey auction) nven is ismert.10 Az ilyen rverseknl a
gyztes a msodik legmagasabb ajnlati rat fizeti a sajt rajnlatnak a kifizetse helyett. Ez az egyszer
mdosts teljesen kikszbli a szabvnyos (avagy els ras, first-price) zrt ajnlat rversnl szksges
sszetett mrlegelseket, mivel ekkor a dominns stratgia sajt rtk rajnlat. Ennek beltshoz vegyk
szre, hogy brmely jtkos tekintheti az rverst egy ktszemlyes jtknak, figyelmen kvl hagyva az sszes
jtkost, kivve nmagt s a tbbi jtkos kzl a legmagasabb rajnlatot tevt. Az i. jtkos hasznossga a
sajt bi ajnlata, a vi rtke s a tbbi jtkos legjobb bm ajnlata szempontjbl
Valjban van egy kis eslye, hogy a legnagyobb vi rtkkel br jtkosnak nem sikerl megszereznie az rukat abban az esetben, amikor
bm < vi < bm + d. Annak az eslyt, hogy ez megtrtnjen, tetszlegesen kicsiv lehet tenni a d nvekmny cskkentsvel.
10
William Vickreyrl elnevezve, aki az 1996-os kzgazdasgi Nobel-dj kitntetettje.
9
564
Annak beltshoz, hogy a bi = vi dominns stratgia, vegyk szre, hogy amikor (vi bm) pozitv, akkor
brmelyik ajnlat optimlis, ami megnyeri az rverst, s vi megttele nevezetesen megnyeri az rverst.
Msrszt, amikor (vi bm) negatv, akkor brmelyik ajnlat optimlis, ami elveszti az rverst, s vi megttele
nevezetesen elveszti az rverst. gy a vi rajnlat optimlis az sszes lehetsges bm rtkre, s valjban ez csak
a vi rajnlatra teljesl. Az egyszersge miatt, tovbb mind az rverez, mind az ajnlattev szmra
jelentkez minimlis szmtsi ignye miatt a Vickrey-rverst szles krben hasznljk elosztott MI-rendszerek
ltrehozsban.
Most gondoljuk t az internet forgalomirnytsi problmjt. A jtkosok a kapcsoldsi hl grfjban az
lekhez tartoznak. Minden jtkos ismeri egy zenet kldsnek a kltsgt a sajt ln t; ha nincs kldend
zenet, akkor a kltsg 0. A cl az, hogy egy zenet szmra megtalljuk a legolcsbb utat a kiindulstl a clig,
ahol a teljes t kltsge az egyes lek kltsgnek az sszege. A 4. fejezet szmos algoritmust ad az lkltsgek
ismeretben a legrvidebb t kiszmtsra, gy minden, amit tennnk kell, az, hogy az egyes genseket
rvegyk, hogy jelentsk a valdi ci kltsgket. Sajnos, ha csupn megkrdezzk az genseket, akkor magas
kltsget fog jelenteni, hogy arra btortson, kldjk t az zenetet mshol. Ki kell fejlesztennk egy
stratgiamentes mkdsi mdot. Egy ilyen mkdsi md, ha minden jtkosnak fizetnk egy pi jutalmat, ami a
legrvidebb, az i-edik let nem tartalmaz t hossza mnusz a legrvidebb t (keressi algoritmus ltal
kiszmolt) hossza, ahol az i-edik l kltsgt 0-nak ttelezzk fel.
pi = Hossz(t ci = -nl) Hossz(t ci = 0-nl)
Megmutathat, hogy e mellett a mkdsi md mellett a dominns stratgia mindegyik jtkosnak a ci szinte
jelentse, illetve, hogy ennek megttele a legolcsbb utat fogja eredmnyezni. E kvnatos tulajdonsg ellenre
az itt vzolt mkdsmdot a gyakorlatban nem hasznljk a nagy kommunikcis s kzponti szmtsi
kltsg miatt. A mkdsi md terveznek kommuniklnia kell az sszes n jtkossal, s aztn egy
optimalizcis problmt kell megoldania. Ez megrheti, ha a kltsgek eloszlannak sok zenet felett, de vals
hlzatokban a ci kltsgek folyamatosan vltoznnak a forgalom torldsa, a gpek zemkptelenn vlsa s
belpse miatt. Eddig teljesen kielgt megoldst mg nem fejlesztettek ki.
8. sszefoglals
A fejezet megmutatta, hogyan hasznljuk a vilgrl meglv tudsunkat dntsek meghozatalra, mg akkor is,
amikor egy cselekvs kimenetelei bizonytalanok, s a cselekvsrt jr jutalmat nem arathatjuk le csak tbb
cselekvs utn. A legfbb pontok:
A szekvencilis dntsi problmkat bizonytalan krnyezet esetn, ms nven Markov dntsi folyamatokat
vagy MDF-ket (Markov decision process, MDP), teljesen definilja egy cselekvsek valsznsgi
kimenetelt meghatroz llapottmenet-modell (transition model) s az egyes llapotokbeli jutalmakat
meghatroz jutalomfggvny (reward function).
Egy llapotsorozat hasznossga a sorozathoz tartoz sszes jutalom sszege, ami lehet az idvel leszmtolt.
Egy MDF megoldsa egy eljrs (policy), ami mindegyik gens ltal elrhet llapothoz hozzrendel egy
dntst. Egy optimlis eljrs maximlja a vgrehajtsa sorn fellp llapotsorozatok hasznossgt.
Egy llapot hasznossga az azon llapotsorozatok vrhat hasznossga, amelyek ebbl az llapotbl
kezddnek, s egy optimlis eljrs vgrehajtsa esetn lpnek fel. Az MDF-k megoldsra szolgl
rtkiterci (value iteration) algoritmusa a mkdse sorn az egyenleteket iteratvan oldja meg, az egyes
llapotok hasznossgait a szomszdai hasznossghoz kapcsolva.
Az eljrsmd-iterci (policy iteration) felvltva kiszmolja az llapotoknak az aktulis eljrshoz tartoz
hasznossgt, majd az aktulis hasznossgokhoz kpest javt az aktulis eljrson.
A rszlegesen megfigyelhet MDF-ek vagy RMMDF-ek sokkal nehezebben oldhatk meg, mint az MDF-ek.
Megoldsuk sorn konvertljuk ket egy olyan MDF-be, amit hiedelmi llapotok folytonos terben
definilunk. Az optimlis viselkeds az RMMDF-ekben magban foglalja az informcigyjtst a
bizonytalansg cskkentse cljbl, s gy a jvbeli jobb dntsek meghozatala miatt is.
565
Az RMMDF-krnyezetekre egy dntselmleti gens hozhat ltre. Az gens egy dinamikus dntsi hlt
(dynamic decision network) hasznl az llapottmenet-modell s megfigyelsi modell brzolsra, a
hiedelmi llapotnak frisstsre, illetve lehetsges cselekvsi sorozatok elre elgondolshoz.
A jtkelmlet (game theory) olyan szitucikban rja le az gensek racionlis viselkedst, amelyekben
tbb gens egyidej interakcija van jelen. A jtkok megoldsai Nash-egyenslyok olyan stratgiaprofilok,
amelyekben egyik gensnek sincs indtka a megadott stratgitl eltrni.
A mkdsi md tervezs (mechanism design) hasznlhat fel az gensek interakcijt megad olyan
szablyok megllaptsra, amelyek egy globlis hasznossgot az egyni racionlis gensek tevkenysgn
keresztl maximlnak. Nha lteznek olyan mkdsmdok, amelyek ezt a clt gy rik el, hogy az egyes
genseknek nem kell meggondolniuk a tbbi gens ltal hozott dntseket.
Az MDF-ek s az RMMDF-ek vilgra vissza fogunk trni a 21. fejezetben, amikor a megerstses tanuls
mdszert tanulmnyozzuk, ami lehetv teszi az gens szmra, hogy a tapasztalatai alapjn javtsa a
viselkedst szekvencilis, bizonytalan krnyezetekben.

Richard Bellman kezdemnyezte a szekvencilis dntsi problmk modern megkzeltsi mdjt, s javasolta a
dinamikus programozs mdszert ltalban s kln az rtkitercival kapcsolatban is (Bellman, 1957). Egy
PhD-disszertciban Ron Howard vezette be az eljrsmd-itercit s az tlagjutalom fogalmt vgtelen
horizont problmk megoldsra (Howard, 1960). Szmos tovbbi eredmnyt Bellman s Dreyfus vezettek be
(Bellman s Dreyfus, 1962). A mdostott eljrsmd-iterci van Nunentl, illetve Putermantl s Shintl
szrmazik (van Nunen, 1976; Puterman s Shin, 1978). Az aszinkron eljrsmd-itercit Williams s Baird
elemeztk, tlk szrmazik a (17.9) egyenletbeli korlt is az eljrsmd-vesztesgre (Williams s Baird, 1993).
A leszmtols technikjt stacionrius preferencik segtsgvel megfogalmazva Koopmans dolgozta ki
(Koopmans, 1972). A (Bertsekas, 1987; Puterman, 1994; Bertsekas s Tsitsiklis, 1996) knyvek precz
bevezetst adnak a szekvencilis dntsi problmkhoz. Papadimitriou s Tsitsiklis az MDF-k szmtsi
komplexitsrl kzlnek eredmnyeket (Papadimitriou s Tsitsiklis, 1987).
Sutton s Watkins nagy hats munki, amelyek az MDF-ek megoldsra szolgl megerstses tanulsi
mdszerekre irnyultak, jelents szerepet jtszottak az MDF-ek megismertetsben az MI-kutats terletn
(Sutton s Watkins, 1988), hasonlan Barto s trsainak ksbbi ttekintshez (Barto s trsai, 1995). (Werbos
[1977] korbbi munkja szmos hasonl tletet tartalmazott, de nem vlt ilyen szles krben elfogadott.) Az
els kapcsolatot az MDF-ek s a mestersges intelligencia tervezsi problmi kztt Sven Koenig teremtette
meg (Koenig, 1991), aki megmutatta hogyan nyjtanak a valsznsgi Strips opertorok egy tmr brzolst
az llapottmenet-modellek szmra. (Lsd mg Wellman, 1990b.) Dean s munkatrsai, illetve Tash s Russell
munkikban a nagy llapotterek miatti kombinatorikus problmkon ksreltek meg rr lenni korltozott
keressi horizont s absztrakt llapotok felhasznlsval (Dean s trsai, 1993); Tash s Russell, 1994). Az
informci rtkn alapul heurisztikk felhasznlhatk olyan llapottrrszek kivlasztsra, ahol a horizont
loklis kiterjesztse a dnts minsgnek jelents javulst eredmnyezi. Ezt a megkzeltst hasznlva az
gensek az idknyszerekhez igazthatjk az erfesztseiket, s rdekes viselkedst alakthatnak ki, mint
pldul a jl ismert kitaposott utak hasznlatt az llapottrben val gyors tkeressnl, elkerlve az optimlis
dntsek jbli kiszmtst az egyes pontokban. Boutilier s munkatrsai mostani munki propozicionlis s
elsrend kifejezseken alapul szimbolikus reprezentcik dinamikus programozsbeli felhasznlsra
sszpontosultak, mind az llapottmenet-modellek, mind az rtkfggvnyek esetben (Boutilier s trsai, 2000;
2001).
Azt a megfigyelst, hogy a rszlegesen megfigyelhet Markov dntsi folyamatok talakthatk hagyomnyos
Markov dntsi folyamatokk hiedelmi llapotok felhasznlsval, Astrom kzli (Astrom, 1965). Az els teljes
algoritmust a rszlegesen megfigyelhet Markov dntsi folyamatok egzakt megoldsra Edward Sondik
javasolta a PhD-disszertcijban (Sondik, 1971). (Egy ksbbi folyiratcikk [Smallwood s Sondik, 1973]
tartalmaz nhny hibt, de jobban elrhet.) Az RMMDF-el kapcsolatos aktulis eredmnyek ttekintst adja
Lovejoy (Lovejoy, 1991). Az els jelents eredmny az MI terletn a Witness-algoritmus volt (Cassandra s
trsai, 1994; Kaelbling s trsai, 1998), ami egy javtott vltozata az RMMDF rtkitercijnak. Hamarosan
kvetkeztek ms algoritmusok, kztk egy Hansentl szrmaz megkzelts, ami egy eljrsmdot
fokozatosan hoz ltre egy vgesllapot automata formjban (Hansen, 1998). Az eljrsmd ezen
brzolsban a hiedelmi llapotok kzvetlenl az automata konkrt llapotaihoz tartoznak. Kzeltleg
optimlis eljrsmdok az RMMDF-ekhez olyan eljrssal hozhatk ltre, ahol az elrefel keresst a
566
lehetsges megfigyelsek s cselekvsek kimeneteleinek mintavtelezsvel kombinljuk (Kearns s trsai,

2000; Ng s Jordan, 2000). Tovbbi, az RMMDF-ekre vonatkoz munkkat a 21. fejezetben trgyalunk.
A dinamikus dntsi hlkat hasznl gensarchitektra alaptleteit Dean s Kanazawa javasoltk (Dean s
Kanazawa, 1989a). Dean s Wellman knyve, a Planning and Control, sokkal rszletesebb kapcsolatot teremt a
DBH/DDH-modellek s a szrs klasszikus szablyozselmletbeli szakirodalma kztt (Dean s Wellman,
1991). Tatman s Shachter mutatta meg, hogy hogyan alkalmazhatk dinamikus programozsi algoritmusok
DDH-modellekre (Tatman s Shachter, 1990). Russell klnbz mdszereket kzl ilyen gensek
felsklzsra, s szmos nyitott kutatsi krdst fogalmaz meg (Russell, 1998).
A jtkelmlet kezdetei a 17. szzadra nylnak vissza, Christiaan Huygens s Gottfried Leibniz javaslataihoz, a
verseng s egyttmkd emberi interakcik tudomnyos s matematikai vizsglatra. A 19. szzad folyamn
szmos vezet kzgazdsz alkotott egyszer matematikai pldkat, hogy a versengsi helyzetek konkrt eseteit
elemezze. Az els formlis eredmnyek a jtkelmletben Zermeltl szrmaznak (Zermelo, 1913) (aki egy
vvel korbban a minimax keress egy br hibs vltozatt javasolta jtkokra). Emil Borel vezette be a
kevert stratgia fogalmt (Borel, 1921). Neumann Jnos bizonytotta be, hogy minden ktszemlyes,
zrussszeg jtknak van egy maximin egyenslya a kevert stratgik krben s egy jl definilt rtke
(Neumann, 1928). Neumann egyttmkdse a kzgazdsz Oskar Morgensternnel vezetett a Theory of Games
and Economic Behavior c. knyv megjelenshez 1944-ben, ami a jtkelmlet meghatroz knyve. A knyv
megjelense a hbor miatti paprhiny miatt ksett, mg vgl a Rockefeller csald egy tagja szemlyesen
tmogatta a knyv kiadst.
John Nash, 1950-ben, 21 vesen jelentette meg elgondolsait az ltalnos jtkbeli egyenslyi helyzetekkel
kapcsolatban. Az egyenslyi megolds ltala megadott defincija, br Cournot munkjn alapult (Cournot,
1838), gy vlt ismertt, mint Nash-egyensly. Az 1959-tl fellp skizofrnija miatti hossz sznet utn Nash
1994-ben kzgazdasgi Nobel-djat kapott (megosztva Reinhart Seltennel s Harsnyi Jnossal).
A BayesNash-egyenslyt Harsnyi kzli (Harsnyi, 1967) s Kadane s Larkey elemzi (Kadane s Larkey,
1982). A jtkelmlet gensek vezrlsben trtn felhasznlsnak bizonyos krdseit Binmore trgyalja
(Binmore, 1982).
A fogolydilemmt mint tantermi pldt Albert W. Tucker alkotta meg s Axelrod trgyalja rszletesen (Axelrod,
1985). Az ismtld jtkokat Luce s Raiffa vezette be (Luce s Raiffa, 1957) mint rszleges informcij
jtkokat (Kuhn, 1953).
Az els gyakorlati algoritmust rszleges informcij jtkokra az MI terletn Koller s munkatrsai
fejlesztettk ki (Koller s trsai, 1996); Koller s Pfeffer cikke olvasmnyos bevezetst ad a terlet ltalnos
rszeihez s egy mkd rendszert r le szekvencilis jtkok brzolsra s megoldsra (Koller s Pfeffer,
1997). A jtkelmletet s az MDF-eket a Markov-jtkok elmletben egysgesti Littman (Littman, 1994).
Shapley valjban mr Bellman eltt kzlte az rtkiterci algoritmust (Shapley, 1953), de az eredmnyei
nem vltak ismertt, taln amiatt, hogy nem a Markov-jtkok keretei kztt voltak megfogalmazva. A
jtkelmlet ltalnos trgyalst tartalmazzk a (Myerson, 1991; Fudenberg s Tirole, 1991; Osborne s
Rubinstein, 1994) mvek.
A kztulajdon tragdijt, ami mkdsi md tervezs egy motivl problmja, Hardin mutatta be (Hardin,
1968). Hurwicz alkotta meg a mkdsi md tervezs matematikai alapjait (Hurwicz, 1973). Milgrom egy ltala
tervezett, akr tbb millird dollros ttelekre is sznt rvers mkdsmdot kzl (Milgrom, 1997). Az
rversek a tervezsben (Hunsberger s Grosz, 2000) s az temezsben is felhasznlhatk (Rassenti s trsai,
1982). Varian rvid ttekintst ad a szmtselmleti szakirodalomhoz kapcsold hivatkozsokkal egytt
(Varian, 1995), a Rosenschein s Zlotkin szerzprostl pedig egy knyv terjedelm trgyals jelent meg
elosztott MI-alkalmazsokrl (Rosenschein s Zlotkin, 1994). Az elosztott MI-ben ms nevek alatt folynak
kapcsold munkk, idertve az egyttes intelligencit (Collective Intelligence), (Tumer s Wolpert, 2000) s a
piacalap szablyozst (market-based control) (Clearwater, 1996). Az rversek szmtsi vonatkozsairl
gyakran az ACM Conferences on Electronic Commerce-en jelennek meg cikkek.
8.2. Feladatok
17.1.
567
A 17.1. bra ltal mutatott 4 3-as vilg esetn szmtsa ki mely ngyzetek s milyen valsznsggel rhetk
el az [1, 1]-bl a [Fel, Fel, Jobbra, Jobbra, Jobbra] cselekvssorozattal. Magyarzza el, hogyan kapcsoldik ez
a szmts egy rejtett Markov-modell elre elgondolshoz (projecting).
17.2.
Tegyk fel, hogy egy llapotsorozat hasznossgt a sorozat llapotaiban kapott jutalmak maximumaknt
definiljuk. Mutassuk meg, hogy ez a hasznossgfggvny nem eredmnyez stacionrius preferencikat az
llapotszekvencik kztt. Lehetsges-e mgis olyan hasznossgfggvnyt definilni az llapotokon, hogy a
MVH-dntshozatal optimlis viselkedst adjon?
17.3.
Pontosan konvertlhat-e egy vges keressi problma Markov dntsi problmv gy, hogy az utbbi
optimlis megoldsa az elznek is optimlis megoldsa legyen? Ha igen, magyarzza el pontosan, hogyan
konvertlja a problmt, s hogyan konvertlja a megoldst visszafel; ha nem, akkor magyarzza el, hogy mirt
nem (azaz adjon ellenpldt).
17.4.
Kpzeljnk el egy leszmtolatlan MDF-et hrom llapottal, (1, 2, 3) s sorrendben a kvetkez jutalmakkal 1,
2, 0. A 3-as llapot egy vgllapot. Az 1-es s 2-es llapotokban kt lehetsges cselekvs van: a s b. Az
llapottmenet-modell a kvetkez:
Az 1-es llapotban az a cselekvs az genst a 2-es llapotba mozgatja 0,8 valsznsggel, mg 0,2
valsznsggel helyben hagyja.
Az 2-es llapotban az a cselekvs az genst az 1-es llapotba mozgatja 0,8 valsznsggel, s 0,2
valsznsggel helyben hagyja.
Mind az 1-es, mind a 2-es llapotban a b cselekvs az genst a 3-as llapotba mozgatja 0,1 valsznsggel,
s 0,9 valsznsggel helyben hagyja.
Vlaszolja meg a kvetkez krdseket:
a. Mi hatrozhat meg kvalitatvan az optimlis eljrsmdrl az 1-es s a 2-es llapotokban?
b. Alkalmazzon eljrsmd-itercit az optimlis eljrsmd, illetve az 1-es s a 2-es llapotok rtknek a
meghatrozsra. Minden lpst teljesen illusztrljon. Tegyk fel, hogy a kezdeti eljrsmd mindkt
llapotban a b cselekvs.
c. Mi trtnik az eljrsmd-itercival, ha a kezdeti eljrsmd mindkt llapotban az a cselekvs? Segt a
leszmtols? Fgg-e az optimlis eljrsmd a leszmtolsi tnyeztl?
17.5.
Alkalmanknt az MDF-ek megadsa tartalmaz egy R(s, a) jutalomfggvnyt, ami a vghezvitt cselekvstl
fgg, vagy egy R(s, a, s) jutalomfggvnyt, ami mg a kimeneteli llapottl is fgg.
a. rja fel a Bellman-egyenleteket ezt a formalizmust hasznlva.
b. Mutassa meg, hogyan lehet egy R(s, a, s) jutalomfggvnyt tartalmaz MDF-et talaktani egy msik, R(s, a)
jutalomfggvnyt tartalmaz MDF-be gy, hogy az optimlis eljrsmdok az j MDF-ben pontosan
megfeleljenek az eredeti MDF-beli optimlis eljrsmdoknak.
c. Most ugyangy konvertlja az R(s, a)-t tartalmaz MDF-eket R(s)-t tartalmaz MDF-ekbe.
17.6.
Tekintsk a 17.1. brn lthat 4 3-as vilgot.
568
a. Valstson meg egy olyan krnyezetszimultort erre a krnyezetre, amelyben a krnyezet fldrajzi
sajtossgai knnyen megvltoztathatk. Ehhez egy bizonyos forrskd mr elrhet a knyv
forrskdtrban a vilghln.
b. Hozzon ltre egy eljrsmd-itercit hasznl genst, s mrje meg a teljestmnyt a
krnyezetszimultorban klnbz kiindulsi llapotokbl. Vgezzen nagyszm ksrletet mindegyik
kiindulsi llapotbl, s hasonltsa ssze a futsonknt kapott sszjutalmak tlagt az llapot hasznossgval
(amit a ltrehozott algoritmus hatrozott meg).
c. Ksrletezzen a krnyezet mretnek a megnvelsvel. Hogyan vltozik az eljrsmd-iterci futsi ideje a
krnyezet mretnek a vltozsval?
17.7.
A 17.1. brn mutatott krnyezetre keresse meg az R(s) fggvnyre az sszes kszbrtket, azaz azokat az
rtkeket, amelyek tlpsekor az optimlis eljrsmd megvltozik. Ehhez egy mdszer szksges az optimlis
eljrsmd meghatrozshoz s egy rgztett R(s) esetn az rtknek a kiszmtshoz. (Segtsg: bizonytsa
be, hogy az rtk minden rgztett eljrsmdnl R(s)-sel linerisan vltozik.)
17.8.
Ebben a feladatban ktszerepls MDF-ekkel foglalkozunk, amelyek a zrussszeg, tbbforduls jtkokhoz
tartoznak, mint amilyenek a 6. fejezetben szerepelnek. Legyen a kt jtkos A s B, s legyen R(s) az A jtkos
jutalma az s llapotban. (B jutalma mindig egyenl s ellenttes eljel.)
a. Legyen UA(s) az s llapot hasznossga, amikor A lpse kvetkezik s-ben, s legyen UB(s) az s llapot
hasznossga, amikor B kvetkezik s-ben. Az sszes jutalom s hasznossg A szempontjbl van
megfogalmazva (pontosan gy, ahogyan a minimax jtkfban). rja fel az UA(s)-t s az UB(s)-t definil
Bellman-egyenleteket.
b. Magyarzza el, hogyan vgezhet ktszemlyes rtkitercit ezekkel az egyenletekkel, s adjon meg egy
alkalmas lellsi kritriumot.
c. Tekintsk a 6.14. brn lthat jtkot a 8.2. szakasz - Feladatok rszben. Rajzolja fel az llapotteret (a
jtkfa helyett), folytonos vonallal mutatva A mozgsait s szaggatott vonallal B mozgsait. Jegyezze fel
minden llapothoz az R(s) rtkt. Hasznos lehet az (sA, sB) llapotok elrendezse egy ktdimenzis rcson,
sA-t s sB-t koordintaknt hasznlva.
d. Most alkalmazza a ktszemlyes rtkitercit a jtk megoldsra, s szrmaztassa az optimlis
eljrsmdot.
17.9.
Mutassuk meg, hogy egy dominns stratgiai egyensly egy Nash-egyensly, de ez visszafel nem igaz.
17.10.
A k-papr-oll gyerekjtkban mindegyik jtkos egyszerre felmutatja a vlasztst, ami k, papr vagy oll. A
papr becsomagolja a kvet, a k kicsorbtja az ollt, az oll elvgja a paprt. A kiterjesztett k-papr-oll-tzvz vltozatban a tz ti a kvet, paprt s ollt, a k, papr s oll ti a vizet, s a vz ti a tzet. rja fel a
jutalmazsi mtrixot, s keressen egy kevert stratgij megoldst a jtkhoz.
17.11.
Oldja meg a hromujjas snblijtkot.
17.12.
A Nemzeti Jgkorong Szvetsgben (National Hockey League) 1999 eltt a csapatok 2 pontot kaptak a
gyzelemrt, 1-et a dntetlenrt s 0-t, ha vesztettek. Ez zrussszeg jtk? 1999-ben a szablyokat gy
mdostottk, hogy egy csapat 1 pontot kap, ha hosszabbtsban kap ki. A gyztes csapat tovbbra is 2 pontot
kap. Hogyan vltoztatja meg ez a mdosts a fenti krdsekre a vlaszokat? Ha trvnyes lenne, mikor volna
racionlis a kt csapatnak titokban megegyezni, hogy a rendes jtkidben dntetlent rnek el, s majd a
569
hosszabbtsban dntik el a kzdelmet? Tegyk fel, hogy mindegyik csapat szmra a kapott pontszmok
jelentik a hasznossgot, s hogy ltezik egy klcsnsen ismert p a priori valsznsg, hogy az els csapat
hosszabbtsban fog nyerni. Milyen p rtkekre rtene egyet mindkt csapat ezzel az egyezsggel?
17.13.
A kvetkez jutalommtrix Blindertl szrmazik, amit Bernstein kzl (Blinder, 1983; Bernstein, 1996), a
politikusok s a jegybank (Federal Reserve) kztti jtkot brzolja.
A politikusok lazthatjk vagy szigorthatjk a pnzgyi politikt, mg a jegybank lazthatja vagy szigorthatja a
monetris politikt. (s termszetesen mindkt oldal vlaszthatja azt, hogy nem tesz semmit.) Mindegyik
oldalnak vannak preferencii, hogy kinek mit kell tennie egyik oldal sem szeretne rossznak ltszani. A
mutatott jutalmak egyszeren sorrendi rangok: 9 az els vlasztsrt s vgl 1 az utolsrt. Keresse meg a jtk
Nash-egyenslyt a tiszta stratgik kztt. Ez Pareto-optimlis megolds? Az olvas esetleg rdemesnek tartja
elemezni a jelenlegi kormny politikjt ennek fnyben.
570
18. fejezet - Megfigyelsek alapjn

trtn tanuls
Ebben a fejezetben olyan gensekkel foglalkozunk, amelyek sajt tapasztalataik szorgos tanulmnyozsval
javtjk teljestmnyket.
A tanuls alapgondolata az, hogy a megfigyelseket ne csak az gens jelenlegi cselekvseinek kialaktsra
hasznljuk, hanem arra is, hogy javtsuk a cselekvsre val jvbeli kpessgeit. A tanuls akzben zajlik, mg
az gens megfigyeli a krnyezettel val klcsnhatsait s sajt dntshoz folyamatait. A tanuls szles skln
rtelmezhet: egyik vgn a tapasztalatok egyszer memorizlsa tallhat, amit a 10. fejezetben megismert
wumpus gens pldz, a skla msik vgn pedig a tapasztalatok alapjn kialaktott komplett tudomnyos
elmlet ll, mint pldul Albert Einstein elmlete. Ebben a fejezetben a megfigyelseken alapul induktv
tanulssal (inductive learning) foglalkozunk. Specilisan azzal, hogy hogyan tanulhatk meg a propozcis
logikban megfogalmazott egyszer elmletek. Annak elemzsre, elmleti magyarzatra is sor kerl, hogy
mirt mkdik az induktv tanuls.
1. Tanulsi formk
A msodik fejezetben lttuk, hogy a tanul gens felfoghat gy, mint aminek van egy cselekv komponense
(performance element), amellyel eldnti, hogy milyen cselekvst vlasszon, s egy tanul komponense
(learning element), amellyel mdostja ezt a cselekv elemet annak rdekben, hogy a ksbbiekben jobb
dntseket hozzon (lsd 2.15. bra). A gpi tanulssal foglalkoz kutatk a tanul komponensek szles
vlasztkval lltak el. Ezek megrtst segti, ha megnzzk, hogy a leend mkdsi terletk hogyan
befolysolja tervezsket. A tanul komponens tervezst hrom dolog befolysolja alapveten. Ezek:
A cselekv elem mely komponenseit akarjuk tantani.
Milyen visszacsatols ll rendelkezsre ezen komponensek tantsra.
Hogyan reprezentljuk a komponenseket.
Ezeket a szempontokat rendre elemezni fogjuk. Lttuk, hogy szmos lehetsg van a cselekv elemek ptsre,
a 2. fejezetben szmos genskialaktst megismertnk (lsd 2.9., 2.11., 2.13. s 2.14. bra). Ezeknek az
genseknek a komponensei a kvetkezket tartalmazzk:
1. Az aktulis llapot feltteleinek kzvetlen lekpezse cselekvsekre.
2. Olyan lehetsg, amely egy megfigyelsi szekvencibl a vilg relevns tulajdonsgaira kpes kvetkeztetni.
3. A vilg alakulsra vonatkoz, valamint az gens lehetsges cselekvseinek kvetkezmnyeit ler
informci.
4. A vilg lehetsges llapotainak szmunkra kvnatos voltt megad hasznossginformci.
5. Cselekvs-hasznossg informci, amely az egyes cselekvsek kvnatossgt jelzi szmunkra.
6. Clok: ezek olyan llapotosztlyokat adnak meg, amelyek elrse az gens hasznossgt maximlja.
Megfelel visszacsatols alkalmazsa esetn ezen komponensek mindegyike tanulhat. Vegynk pldul egy
genst, amely taxivezetst tanul. Minden egyes alkalommal, amikor a felgyel elkiltja magt: Fk!, az
gens megtanulhat egy felttel-cselekvs fkezsi szablyt (1. komponens). Amennyiben szmos olyan kpet
mutatunk az gensnek, amelyrl kzljk, hogy busz van rajta, akkor megtanulhatja felismerni azokat (2). Ha
egy cselekvst prblgat, s megfigyeli az eredmnyt pldul nedves ton ersen fkez , megtanulhatja
cselekvseinek hatst (3). Ha nem kap borravalt utastl, akit jl sszerzott az t, akkor rtkes elemekkel
gazdagthatja az ltalnos hasznossgfggvnyt (4).
Az gens eltt ll tanulsi folyamat meghatrozsban rendszerint a visszacsatols jellege a legfontosabb
faktor. A gpi tanuls terletn ltalban hrom esetet klnbztetnek meg: ellenrztt (supervised), nem
ellenrztt (unsupervised) s megerstses (reinforcement) tanulst.
571
Megfigyelsek alapjn trtn

tanuls
Az ellenrztt tanuls (supervised learning) egy lekpezsnek a bemeneti s kimeneti mintk alapjn trtn
megtanulst jelenti. Az (1), (2) s (3) esetek mindegyike az ellenrztt tanuls pldja. Az (1) esetben az gens
a fkezs felttel-cselekvs szablyt tanulja ez az llapottrrl egy Boole-tpus kimenetre val lekpezs
(fkezzen vagy ne fkezzen). A (2) esetben az gens kpekrl egy Boole-tpus kimenetre val lekpezst tanul
meg (tartalmaz-e a kp buszt, vagy sem). A (3) esetben a tanult fkezsi elmlet egy, az llapotok s a fkezsi
cselekvsek terrl a mondjuk mterben mrt megllsi tra trtn lekpezs. Vegyk szre, hogy az (1) s
(2) esetekben a tant szolgltatta a mintkhoz tartoz helyes vlaszt; a harmadikban a kimeneti rtkeket
kzvetlenl az gens szlelsei szolgltattk. Teljesen megfigyelhet krnyezet esetn mindig fennll a
lehetsg, hogy az gens megfigyeli a cselekvsnek kvetkezmnyeit, gy hasznlhat ellenrztt tanulsi
mdszereket annak rdekben, hogy megjsolja azokat. Rszlegesen megfigyelhet krnyezetben nehezebb a
problma, mert a kzvetlen hatsok lthatatlanok maradhatnak.
Nem ellenrztt tanulsi (unsupervised learning) problma esetn bemeneti mintk tanulsa trtnik, de a
kimeneti kvnt mintk nem biztostottak. Pldul egy taxivezet gens aprnknt kialakthatja a j kzlekedsi
napok s a rossz kzlekedsi napok koncepcijt, anlkl hogy brmikor cmkzett pldkat kapott volna
brmelyikrl. Egy tisztn nem ellenrztt tanulst vgz gens nem kpes megtanulni, hogy mit cselekedjk,
mivel nincs olyan informcija, amely egy cselekvst helyesnek vagy egy llapotot kvnatosnak minstene. A
nem ellenrztt tanulst elssorban a valsznsgi kvetkeztet rendszerek kapcsn fogjuk trgyalni (lsd 20.
fejezet).
A megerstses tanuls (reinforcement learning) problmja, amelyet a 21. fejezetben trgyalunk, a
legltalnosabb a hrom kzl. Ahelyett hogy egy tant tmutatst kvethetn, egy megerstses tanulst
vgz gensnek megerstsi informci alapjn kell tanulnia.1 Pldul a borraval hinya az t vgn (vagy
egy hatalmas szmla, ha beleszll az eltte halad kocsiba) nmi informcit nyjt az gensnek arrl, hogy
viselkedse nem volt megfelel. A megerstses tanuls tipikusan magban foglalja azt a rszproblmt, hogy
az gensnek meg kell tanulnia azt is, hogyan mkdik a vilg.
A megtanult informci reprezentcija szintn nagyon fontos szerepet jtszik abban, hogy meghatrozhassuk
azt, hogyan is kell mkdnie a tanulsi algoritmusnak. Egy gens brmelyik komponense reprezentlhat az
ebben a knyvben tallhat smk brmelyikvel. Szmos pldt lttunk: slyozott polinomokat, amelyeket a
jtkot jtsz gensek hasznltak hasznossgfggvnyknt; tletkalkulus-beli s elsrend logikai lltsokat,
amelyeket logikai gensek hasznltak; valamint valsznsgi lersokat, mint pldul a Bayes-hlkat,
amelyeket dntselmleti gensek hasznltak kvetkeztet komponensknt. Ezek mindegyikre alkottak
hatkony tanulsi eljrsokat. Ebben a fejezetben a propozcis logikt alkalmaz mdszereket trgyaljuk. A 19.
fejezet az elsrend logikt alkalmaz mdszereket mutatja be, mg a 20. fejezet a Bayes-hlkat s a neurlis
hlkat trgyalja (amelyek specilis esetknt tartalmazzk a lineris polinomokat).
A tanul rendszerek tervezsnek utols fontos tnyezje az a priori informci rendelkezsre llsnak
krdse. Az MI, a szmtstudomny s a pszicholgia terletn a tanulssal foglalkoz kutats nagy rsze azzal
az esettel foglalkozott, amikor kezdetben az gensnek semmi informcija nincs arrl, amit megprbl
megtanulni. Br ez egy fontos specilis eset, de egyltaln nem ez az ltalnos. A legtbb emberi tanuls egy j
adag kiindul httrtudsra pl. Nhny pszicholgus s nyelvsz szerint mg az jszltteknek is van
ismeretk a vilgrl. Brmi is legyen az igazsg ezt illeten, az ktsgtelen, hogy a kiindul tuds rengeteget
segthet a tanulsban. Bubork-kamra fnykpek alapjn egy fizikus egy j meghatrozott tmeg s tlts
rszecske ltezsre mutat elmletre kvetkeztethet. Ugyanakkor egy kritikus ugyanazon kphalmaz vizsglata
alapjn csupn arra kvetkeztethet, hogy a mvsz bizonyra valamilyen absztrakt vagy expresszionista
irnyzat kvetje. A 19. fejezet szmos mdszert mutat be arra, hogy a tanulst hogyan segti a meglv tuds;
azt is megmutatjuk ebben a fejezetben, hogy a tudst hogyan lehet gy sszelltani, hogy felgyorstsuk a
dntshozatalt. A 20. fejezet azt mutatja be, hogy a kiindul tuds hogyan segt a valsznsgi elmletek
tanulsban.
2. Induktv tanuls
Egy determinisztikus, felgyelt tanulst vgz algoritmus bemenetknt megkapja az ismeretlen fggvny
bizonyos bemeneti rtkekhez tartoz vlaszait, feladata az ismeretlen fggvny vagy ahhoz nagyon kzel ll
lekpezs ellltsa. Formlisan azt mondjuk, hogy egy minta (example) nem ms, mint egy (x, f(x))
rtkpr, ahol x a bemeneti rtk, mg f(x) az x-re alkalmazott fggvny kimeneti rtke. A tisztn induktv
kvetkeztets (pure inductive inference) (vagy indukci [induction]) feladata a kvetkez:
1
A 17. fejezetben hasznlt jutalom (reward) kifejezs a megersts (reinforcement) szinonimja.
572

tanuls
Adott az f-re vonatkoz mintk egy halmaza, ennek alapjn hatrozzunk meg egy h fggvnyt, amely kzelti fet.
A h fggvnyt hipotzisnek (hypothesis) nevezzk. A tanuls nehzsge elvi szempontbl abban ll, hogy nem
knny egy adott h fggvnyrl megmondani, hogy jl approximlja-e f-et. Egy j hipotzis jl ltalnost
(generalize) azaz j becslst kapunk a mg nem ltott mintkra is. Ez az induktv kvetkeztets
alapproblmja (problem of induction). A problmt mr vszzadok ta kutatjk, a 18.5. alfejezet egy
rszmegoldst szolgltat.
18.1. bra - (a) Plda (x, f(x)) rtkprok s egy velk konzisztens lineris hipotzis. (b)
Egy ugyanazokkal az adatokkal konzisztens hetedfok polinom. (c) Egy msik
adathalmaz egy pontosan illeszked hatodfok polinommal, illetve egy kzelt lineris
illesztssel. (d) Egy egyszer szinuszos illeszts ugyanazokra az adatokra.
Fontos
A 18.1. bra ismert pldt mutat be: egy adathalmazra egyvltozs fggvnyt illesztnk. A mintk (x,
f(x)) rtkprok, ahol mind x, mind f(x) vals rtkek. Legyen a H hipotzistr (hypothesis space H)
azon hipotzisek halmaza, amelyeket meg fogunk vizsglni a legfeljebb k-ad fok polinomok tere.
(Pldul 3x2 + 2, x17 4x3 stb.) A 18.1. (a) bra valamilyen adatokat s egy az adatokra pontosan
illeszked egyenes vonalat (elsfok polinom) mutat. Ez a vonal itt egy konzisztens (consistent)
hipotzis, mivel valamennyi adatra illeszkedik. A 18.1. (b) bra egy nagy fokszm polinomot mutat,
amely szintn konzisztens ugyanazokra az adatokra nzve. Ez a kt plda illusztrlja az induktv
tanuls els komoly megoldand krdst: hogyan vlasszunk tbb konzisztens hipotzis kzl? Egy
lehetsges vlasz az n. Ockham borotvja2 (Ockhams razor) elv: rszestsk elnyben a
legegyszerbb olyan hipotzist, amely konzisztens az adatokkal. Ez jzan intucinak tnik, mivel azok
a hipotzisek, amelyek nem egyszerbbek, mint maguk az adatok, nem nyernek ki semmilyen
mintzatot az adatokbl. Az egyszersg defincija nem knny, de rtelmesnek tnik azt mondani,
hogy egy elsfok polinom egyszerbb, mint egy 12-ed fok.
Fontos
A 18.1. (c) bra egy msik adathalmazt mutat. Ezekre az adatokra nem lehet konzisztens mdon
egyenest illeszteni, valjban egy hatodfok polinomra (amely 7 szabad paramterrel rendelkezik) van
szksg a pontos illesztshez. A halmazban csak 7 adat van, gy a polinomnak pp annyi paramtere
van, ahny adatpont. Ennek megfelelen gy tnik, hogy nem sikerl valamilyen mintzatot tallnunk
az adathalmazban, gy nem vrunk j ltalnostkpessget. Jobban jrhatunk, ha inkbb egy egyszer
egyenest illesztnk, amely ugyan nem konzisztens, de sszer becslseket adhat. Ez azt valsznsti,
hogy a keresett fggvny nem determinisztikus (vagy ami ezzel kzeltleg ekvivalens: a valdi
bemeneti mintk nem figyelhetk meg teljes pontossggal). Nemdeterminisztikus fggvnyek esetn
elkerlhetetlen, hogy kompromisszumot kssnk a hipotzis komplexitsa s az adatokhoz val
illeszkeds pontossga kztt. A 20. fejezetben bemutatjuk, hogy ezt a kompromisszumot hogyan lehet
a valsznsg-szmts elmletnek felhasznlsval kialaktani.
A 14. szzadi angol filozfus, William of Ockham utn. Ockham nevt gyakran hibsan Occamnak rjk, ami taln a francia Guillaume
dOccam fordtsbl ered.
2
573

tanuls
szben kell tartanunk, hogy egy egyszer, konzisztens hipotzis megtallsnak eslye ersen fgg a vlasztott
hipotzistrtl. A 18.1. (d) bra bemutatja, hogy a (c) alatti adatokra pontosan illeszthet egy egyszer ax + b +
c sin(x) alak fggvny. Ez a plda jl mutatja a hipotzistr j megvlasztsnak fontossgt. Ha olyan
hipotzisteret vlasztunk, amely vges fokszm polinomokat tartalmaz, akkor szinuszos fggvnyeket nem
tudunk pontosan reprezentlni. gy egy olyan tanul, amelyik ezt a hipotzisteret hasznlja, nem fog tudni
szinuszos adatokbl tanulni. Egy tanulsi problmt realizlhatnak (realizable) neveznk, ha a
hipotzistrnek eleme az igazi fggvny, klnben a problmt nem realizlhatnak (unrealizable) nevezzk.
Sajnos nem mindig tudjuk megmondani, hogy egy tanulsi problma realizlhat-e, mivel nem ismerjk a
valdi fggvnyt. Egy lehetsg e korlt tllpsre az a priori tuds felhasznlsa. Ennek segtsgvel olyan
hipotzisteret alkotunk, amelyrl tudjuk, hogy tartalmazza az igazi fggvnyt. Ezt a tmt a 19. fejezetben
trgyaljuk.
Fontos
Egy msik lehetsges megkzelts, hogy a lehet legnagyobb hipotzisteret hasznljuk. Pldul mirt
ne legyen a H hipotzisternk az sszes Turing-gpek osztlya? Vgl is minden kiszmthat
fggvny reprezentlhat valamilyen Turing-gppel, teht ez a legjobb, amit tehetnk. Ennek a
megkzeltsnek az a problmja, hogy nem veszi figyelembe a tanuls szmtsi komplexitst.
Kompromisszumot kell ktnnk a hipotzistr kifejezkpessge s egyszer konzisztens hipotzisek
megtallsnak komplexitsa kztt. Pldul: egyenesek illesztse az adatokra knnyen megoldhat,
nagy fokszm polinomok illesztse nehezebb, Turing-gpek illesztse pedig nagyon nehz. Ugyanis
annak eldntse, hogy egy adott Turing-gp konzisztens-e az adatokkal, ltalnossgban mg csak nem
is lehetsges. Egy msik ok, ami miatt elnyben rszestjk az egyszer hipotzistereket, hogy az
eredmnykpp kapott hipotzisek hasznlata is egyszerbb lehet knnyebb kiszmtani h(x)-et, ha h
egy lineris fggvny, mint ha egy tetszleges Turing-gp programja lenne.
Ezen okokbl a legtbb tanulssal foglalkoz eddigi kutats a viszonylag egyszer hipotzisreprezentcikra
helyezte a f hangslyt. Ebben a fejezetben az tletlogikra s az ehhez kapcsold nyelvekre koncentrlunk.
Az elsrend logikai reprezentcit hasznl tanuls elmletvel a 19. fejezet foglalkozik. Ltni fogjuk, hogy a
kifejezkpessg-komplexits kompromisszum nem is olyan egyszer, mint elszr gondolnnk. Gyakran az a
helyzet mint azt a 8. fejezetben is lttuk , hogy egy kifejeznyelv lehetv teszi az adatokra illesztett
egyszer elmletet, mg a nyelv kifejezkpessgnek korltozsa azt is jelenti, hogy brmely konzisztens
elmlet szksgszeren bonyolult lesz. A sakk szablyait pldul egy-kt oldalon le tudjuk rni elsrend logika
segtsgvel, mg az tletlogikval trtn lers tbb ezer oldalt ignyelne. Ilyen esetekben kell arra
lehetsgnek lennie, hogy a kifejezbb nyelven sokkal gyorsabb legyen a tanuls.
3. Dntsi fk megalkotsa tanulssal

A dntsi fa tanuls egyike a legegyszerbb, mgis az eddigiekben az egyik legsikeresebbnek bizonyult tanulsi
algoritmusnak. J bevezetsknt szolgl az induktv tanuls terletn, s radsul knnyen implementlhat.
Elszr bemutatjuk a cselekv alrendszert, majd megmutatjuk, hogy mikppen lehet tantani. Mindekzben
olyan elveket mutatunk be, amelyek az induktv tanuls minden terletre jellemzk.
3.1. Cselekv komponensknt hasznlt dntsi fk

Egy dntsi fa (decision tree) bemenetknt egy attribtumokkal (attributes) lert objektumot vagy szitucit
kap, s egy dntst ad vissza eredmnyknt a bemenetre adott vlasz jsolt rtkt. A bemeneti
attribtumok lehetnek diszkrtek vagy folytonosak. Jelen trgyalsban diszkrt bemeneteket tteleznk fel. A
kimeneti rtk szintn lehet diszkrt vagy folytonos; egy diszkrt rtkkszlet fggvny tanulst osztlyozs
(classification) tanulsnak, mg a folytonos fggvny tanulst regresszinak (regression) nevezzk. Binris
(Boolean) osztlyozsra fogunk koncentrlni, ahol minden pldt vagy igaznak (pozitv), vagy hamisnak
(negatv) sorolunk be.
A dntsi fa egy tesztsorozat elvgzse sorn jut el a dntshez. A fa minden egyes bels csompontja valamely
tulajdonsg rtkre vonatkoz tesztnek felel meg, a csompontbl kilp gakat pedig a teszt lehetsges
kimeneteivel cmkzzk. Minden egyes levlcsompont megadja azt az rtket, amelyet vissza kell adnunk, ha
ezt a levelet elrtk. gy tnik, hogy a dntsi fa reprezentci az emberek szmra rendkvl termszetes;
valjban szmos Hogyan csinljuk? kziknyvet (pldul az autjavtsi kziknyveket) rtak meg egyetlen
hatalmas, tbb szz oldalra kiterjed dntsi faknt.
574

tanuls
Valamelyest egyszerbb plda lehet az a problma, hogy vrjunk-e egy tteremben egy asztal felszabadulsra.
Az a clunk, hogy tanulssal kialaktsuk a VrjunkE clprediktum (goal predicate) defincijt. Ahhoz, hogy
ezt tanulsi feladatknt kezelhessk, elszr meg kell hatrozzuk, hogy milyen attribtumok llnak
rendelkezsre ahhoz, hogy ezen a problmaterleten lerjuk a pldkat. A 19. fejezetben megmutatjuk, hogyan
lehet automatizlni ezt a feladatot; most egyszeren tegyk fel, hogy a kvetkez attribtumlista mellett
dntttnk:
1. Alternatva: van-e a kzelben megfelel alternatvaknt knlkoz tterem.
2. Br: van-e az tteremnek knyelmes br rsze, ahol vrakozhatunk.
3. Pntek/Szombat: igaz rtket vesz fel pnteken s szombaton.
4. hes: hesek vagyunk-e.
5. Vendgek: hny ember van az tteremben (rtkkszlet Senki, Nhny s Tele).
6. Drga: az tterem menyire drga ($, $$, $$$).
7. Es: esik-e odakint az es.
8. Foglals: foglaltunk-e asztalt.
9. Konyha: az tterem tpusa (francia, olasz, thai vagy burger).
10.
BecsltVrakozs: a pincr becslte vrakozsi id (010, 1030, 3060, >60 perc)
18.2. bra - Egy dntsi fa annak eldntsre, hogy vrjunk-e asztalra
A szerzk egyike (SR) ltal erre a problmra rendszerint hasznlt dntsi fa a 18.2. brn lthat. Vegyk
szre, hogy a fa nem hasznlja a Drga s a Konyha attribtumokat, valjban irrelevnsnak tekinti azokat. A
pldkat a dntsi fa a gykrnl kezdi feldolgozni, kveti a megfelel gakat, amg egy levlhez el nem r.
Pldul egy Vendgek = Tele s BecsltVrakozs = 010 attribtumokkal jellemezhet plda pozitv kimenetet
fog eredmnyezni (azaz vrni fogunk egy asztalra).
3.2. A dntsi fk kifejezkpessge

575

tanuls
Logikai felrst hasznlva minden egyes dntsi fa, amely a VrjunkE clprediktum egy hipotzise, a
kvetkez formban felrt lltsnak felel meg:
s VrjunkE(s) (P1(s) P2(s) Pn(s))
ahol mindegyik Pi(s) felttel azon tesztek konjunkcijnak felel meg, amelyeket a gykrtl egy pozitv
kimenetet jelent levlig megtett t sorn vgeztnk. Br ez egy elsrend logikban felrt mondatnak tnik,
valjban bizonyos rtelemben tletlogikai kifejezs, mivel csak egyetlen vltozt tartalmaz s az sszes
prediktum unris. Valjban a dntsi fa a VrjunkE s az attribtumrtkek bizonyos logikai kapcsolatt rja
le. A dntsi fa nem hasznlhat olyan tesztek reprezentlsra, amelyek kett vagy tbb klnbz objektumra
vonatkoznak pldul:
r2 Kzel(r2, r) Drga(r, p) Drga(r2, p2) Olcsbb(p2, p)
(van a kzelben egy olcsbb tterem?). Nyilvnvalan felvehetnnk egy OlcsbbtteremKzel nev logikai
attribtumot, de az sszes ilyen attribtum hozzadsa kezelhetetlenn teszi a problmt. A 19. fejezet
mlyebbre hatol az elsrend logikban trtn tanuls terletn.
Az tletlogikai nyelvek terletn a dntsi fk teljes kifejezkpessggel brnak, ami azt jelenti, hogy
tetszleges logikai (Boole) fggvny felrhat dntsi faknt. Ezt trivilisan megvalsthatjuk, ha a fggvny
igazsgtbljnak minden sort megfeleltetjk a dntsi fa egy tjnak. Ez exponencilisan nvekv dntsi
fra vezet, mivel az igazsgtbla exponencilisan nvekv szm sort tartalmaz. Nyilvnvalan a dntsi fk
sok fggvnyt jval kisebb fval kpesek reprezentlni.
Ugyanakkor nmely fggvnyfajtnl ez valban problmt jelent. Pldul ha a fggvnynk a
paritsfggvny (parity function), amely akkor s csak akkor ad 1-et, ha pros szm bemenet 1 rtk, akkor
egy exponencilisan nagy dntsi fra lesz szksg. Hasonlan nehz a tbbsgfggvny (majority function)
reprezentlsa dntsi fval, amely fggvny akkor ad 1-et, ha bemeneteinek tbb mint fele 1 rtk.
Ms szavakkal, a dntsi fk bizonyos fggvnyek esetn jk, msok esetn roszszak. Van brmilyen olyan
reprezentci, amely mindenfajta fggvny esetn hatkony? A vlasz sajnos az, hogy nincs. Ezt ltalnosan is
meg tudjuk mutatni. Vizsgljuk az sszes n bemeneti attribtummal rendelkez logikai (Boole) fggvnyt. Hny
klnbz fggvny van ebben a halmazban? Ez ppen a lehetsges felrhat igazsgtblk szmval egyezik
meg, hiszen egy fggvnyt az igazsgtblja ad meg. Az igazsgtblnak 2 n sora van, mivel minden bemeneti
esetet n attribtummal adunk meg. gy tekinthetjk a tbla vlasz oszlopt, mint egy 2n bites szmot, amely
definilja a fggvnyt. Mindegy, hogy a fggvnyek milyen reprezentcijt vlasztjuk, nhnynak (valjban
szinte mindegyiknek) a reprezentlshoz tnyleg szksg lesz ennyi bitre.
Ha 2n bitre van szksg a fggvny megadshoz, akkor n attribtum esetn
a lehetsges fggvnyek
szma.
Ez
megrzan
nagy
szm.
Pldul
csupn
hat
Boole-vltoz
esetn
is
klnbz logikai (Boole) fggvny llthat el. Szksgnk lesz nhny
szellemes algoritmusra, hogy egy ilyen hatalmas trben konzisztens hipotzist tudjunk tallni.
3.3. A dntsi fk pldk alapjn trtn felptse

Egy logikai dntsi fa ltal kezelhet plda a bemeneti attribtumok X vektorbl s egyetlen logikai kimeneti
rtkbl, y-bl ll. A 18.3. bra egy (X1, y1)...( X12, y12) pldahalmazt mutat. Azokat nevezzk pozitv pldknak
(X1, X3, ...), amelyekben a VrjunkE rtke igaz, s azok a negatv pldk, amelyekben az rtke hamis (X2, X5,
). A pldk teljes halmazt tant halmaznak (training set) nevezzk.
Az a problma, hogy a tant halmaznak megfelel dntsi ft talljunk, bonyolultnak tnik ugyan, de valjban
van egy trivilis megoldsa. Egyszeren egy olyan ft konstrulhatunk, amelyben minden pldhoz egy kln
sajt utat hozunk ltre egy a pldhoz tartoz levlcsomponthoz. A levlhez vezet t mentn sorra
teszteljk az attribtumokat, s a pldhoz tartoz tesztrtket kvetjk, a levl pedig a plda besorolst adja.
Ha ismt ugyanazt a pldt3 vesszk, akkor a dntsi fa a helyes osztlyozsi eredmnyt adja. Szerencstlen
mdon nemigen ad informcit egyetlen ms esetrl sem!
Nagyon fontos, hogy megklnbztessk az azonos pldt egy azonos lerssal rendelkez pldtl. Erre a fontos klnbsgre mg
visszatrnk a 19. fejezetben.
3
576

tanuls
18.3. bra - Pldk az tterem problmaterletre
Ezzel a trivilis megoldssal az a baj, hogy egyszeren memorizlja a pldkat. Mivel nem nyer ki semmilyen
mintzatot a pldkbl, ezrt nem vrhatjuk, hogy extrapollni tudjon azokra a mintkra, amelyeket mg
sohasem ltott. Az Ockham borotvja elvt alkalmazva neknk azt a legkisebb dntsi ft kell megtallnunk,
amely konzisztens a pldkkal. Sajnlatos mdon a legkisebb sszes rtelmes defincija esetn a legkisebb
dntsi fa megtallsa kezelhetetlen problmt jelent. Viszont nmi egyszer heurisztika bevetsvel j
eredmnyt rhetnk el egy kicsike fa megtallsban. A DNTSI-FA-TANULS algoritmus alaptlete az, hogy
teszteljk elszr a legfontosabb attribtumot. A legfontosabb alatt azt az attribtumot rtjk, amelyik a
legnagyobb vltozst okozza a pldk besorolsban. Ezen a mdon remnynk szerint kisszm teszttel
helyes osztlyozshoz jutunk, ami azt jelenti, hogy a fban minden t rvid lesz, teht az egsz fa kicsi lesz.
A 18.4. brn lthat, hogy hogyan indul az algoritmus. 12 pldnk van, amelyeket pozitv s negatv
pldahalmazokba sorolunk. Ezek utn eldntjk, hogy melyik attribtumot teszteljk elszr a fban. A 18.4.
(a) brn megmutattuk, hogy a Konyha attribtum rossz vlaszts lenne, mert tesztjnek 4 kimenetele van, s
mindegyik esetn ugyannyi pozitv s negatv pldnk lesz az eredmnyl kapott halmazokban. Msrszt
viszont a 18.4. (b) brn lthat, hogy a Vendgek egy meglehetsen fontos attribtum, hiszen ha rtke Senki
vagy Nhny, akkor hatrozott vlaszt tudunk adni (az els esetben Nem, a msodikban Igen a vlaszunk). Ha az
attribtum rtke Tele, akkor a pldk vegyes halmazt kapjuk. ltalnossgban megllapthat, hogy miutn az
els attribtum tesztje csoportokra bontotta a pldkat, mindegyik teszteredmny egy jabb dntsi fa tanulsi
problmt eredmnyez, kevesebb pldval s egygyel kevesebb attribtummal. Ngy esetet kell ttekintennk
ezekben a rekurzv problmkban:
1. Ha van nhny pozitv s nhny negatv pldnk, akkor vlasszuk a legjobb attribtumot a sztosztsukra. A
18.4. (b) brn bemutattuk, hogy az hes attribtum alkalmas a megmarad pldk osztlyozsra.
2. Ha valamennyi megmaradt pldnk pozitv (vagy mind negatv), akkor kszen vagyunk: vlaszolhatunk
Igen-t vagy Nem-et. A 18.4. (b) bra bemutatja ezt a Senki, illetve a Nhny esetekben.
3. Ha nem marad plda a teszt egyik kimenetele esetn, akkor ez azt jelenti, hogy nem figyeltnk meg ilyen
esetet, s a szlcsompontban tbbsgben lev vlaszt adjuk.
4. Ha nem maradt attribtumunk, amelyet tesztelhetnnk, de mind pozitv, mind negatv pldink maradtak,
akkor bajban vagyunk. Ez azt jelenti, hogy ezeknek a pldknak pontosan azonos jellemzik vannak, de
klnbz osztlyokba tartoznak. Ez egyrszt akkor fordulhat el, ha nhny adat nem megfelel, azt
mondjuk, hogy zajosak (noise) az adatok. Msrszt akkor is elllhat ez a helyzet, ha az attribtumok nem
adnak elg informcit a szituci teljes lersra, vagy a problmatr valjban nemdeterminisztikus.
Egyszer megoldsa lehet ennek a problmnak a tbbsgi szavazs hasznlata.
18.4. bra - A pldahalmaz attribtumtesztelssel trtn sztosztsa. (a) A Konyha

alapjn trtn sztoszts nem visz kzelebb ahhoz, hogy a pozitv s negatv pldkat
577

tanuls
megklnbztessk. (b) A Vendgek attribtum tesztje jl szeparlja a pozitv s

negatv pldkat. Miutn a Vendgek tesztjt elvgeztk, az hes egy elgg j msodik
tesztlehetsget ad.
A DNTSI-FA-TANULS algoritmust a 18.5. brn mutatjuk be. Az ATTRIBTUM-VLASZTS mdszer

bemutatsa a kvetkez alfejezetben tallhat.
Az algoritmus ltal a 12 mintbl ll adathalmaz alapjn ltrehozott fa a 18.6. brn lthat. Az eredmnyknt
kapott fa nyilvnvalan klnbzik a 18.2. brn lthat eredetitl, annak ellenre, hogy az adatokat egy, az
eredeti ft hasznl gens generlta. Arra gondolhatnnk, hogy az algoritmus nem rt el klnsebben j
eredmnyt a helyes fggvny megtanulsban. Mindamellett ez tves kvetkeztets lenne. A tanul algoritmus a
pldkat ltja, nem az eredeti fggvnyt. Valjban a ltrehozott hipotzis (lsd 18.6. bra) nem csupn
megfelel az sszes pldnak, de lnyegesen egyszerbb is, mint az eredeti fa. A tanul algoritmusnak semmi
oka sincs az Es s Foglals attribtumokra vonatkoz teszteket felvenni, mivel ezek nlkl is tudja osztlyozni
az sszes pldt. Mellesleg, felfedett egy rdekes s vratlan viselkedst: az els szerz htvgeken vrni fog
thai telekre.
18.5. bra - A dntsi fa tanulsra szolgl algoritmus
Termszetesen ha tbb mintt gyjtttnk volna, akkor egy, az eredetihez hasonlbb ft hozhattunk volna ltre
az induktv tanulssal. A 18.6. brn lthat fa elkerlhetetlenl hibkat is el fog kvetni; pldul sohasem ltott
578

tanuls
olyan helyzetet, amelyben a vrakozsi id 010 perc, de az tterem tele van. Egy olyan esetben, amikor az
hes attribtum hamis rtk, a fa azt vlasztja, hogy ne vrjunk, pedig n (S. Russell) bizonyra vrnk.
Felmerl teht az a kzenfekv krds, hogy ha az algoritmus egy konzisztens, de inkorrekt ft indukl, akkor
mennyire lesz inkorrekt ez a fa? Ezt azutn fogjuk ksrletileg elemezni, hogy elszr elmagyarztuk az
attribtumteszt-vlasztsi lps rszleteit.
18.6. bra - A 12 plds tant minta halmazbl szrmaztatott dntsi fa
3.4. Attribtumteszt-vlaszts
A dntsi fa tanuls sorn az attribtumok kivlasztsra szolgl eljrs arra irnyul, hogy minimalizljuk az
eredmnyl kapott fa mlysgt. Az alaptlet az, hogy azt az attribtumot vlasszuk, amellyel a lehet
legmesszebbre jutunk a pldk pontos osztlyozsban. Egy tkletes attribtum a pldkat egy csupa pozitv s
egy csupa negatv pldt tartalmaz halmazra osztja. A Vendgek nem tkletes attribtum, de meglehetsen j.
Egy valjban haszontalan attribtum, mint pldul a Konyha, tesztjnek eredmnyeknt a kapott halmazokban
nagyjbl ugyanolyan arnyban lesz pozitv s negatv plda, mint az eredeti halmazban.
Mindssze arra van szksgnk, hogy formlis mrtket talljunk arra, hogy mit jelent a meglehetsen j s a
valjban haszontalan, ezek utn implementlni tudjuk a 18.5. brn lthat ATTRIBTUM-VLASZTS
fggvnyt. A mrtk akkor rje el maximumt, amikor az attribtum tkletes, s akkor legyen minimlis,
amikor az attribtumnak egyltaln nincs semmi haszna. Egy megfelel mrtk az attribtum ltal szolgltatott
informci (information) vrhat rtke, ahol az informcit abban a matematikai rtelmezsben hasznljuk,
ahogy elszr Shannon s Weaver definilta (Shannon s Weaver, 1949). Az informci defincijnak
megrtshez gondoljunk pldul annak a krdsnek a megvlaszolsra, hogy egy feldobott pnzrme fej
oldala lesz-e fell. Az, hogy a vlaszban mennyi informci rejlik, az az elzetes a priori tudstl fgg. Minl
kevesebbet tudunk, annl tbb a szolgltatott informci. Az informcielmlet bitekben mri az
informcitartalmat. Egy bit informci ahhoz elg, hogy egy olyan krdsre, amelyrl semmilyen elzetes
elkpzelsnk sem volt (pldul egy szablyos rme feldobsnak eredmnye) igen/nem vlaszt megadjunk.
ltalnossgban, ha a lehetsges vi vlaszok valsznsge P(vi), akkor a vlasz I informcitartalmt a
kvetkez sszefggs adja meg:
A pnzfeldobs esetre ellenrizve az sszefggst, a kvetkezt kapjuk:
579

tanuls
Ha az rme hamistott oly mdon, hogy a dobs 99%-ban fejre jn ki, akkor I(1/100, 99/100) = 0,08 bitre van
szksg, s ha a fej kimenetel valsznsge 1-hez tart, akkor az aktulis kimenetel megjslshoz szksges
informci 0-hoz tart.
Dntsi fa tanuls esetn a megvlaszolsra vr krds az, hogy egy adott pldnak mi a helyes besorolsa.
Egy j dntsi fa vlaszt ad erre a krdsre. Mg mieltt egyetlen attribtumot teszteltnk volna, a vlaszok
valsznsgt becslhetjk a tant halmazban tallhat pozitv s negatv mintk arnyval. Tegyk fel, hogy
a tant halmazban p pozitv s n negatv plda tallhat. Ez esetben a helyes vlasz informcitartalmnak
becslse:
A 18.3. brn bemutatott tterem tant halmaz p = n = 6 mintt tartalmaz, teht 1 bit informcira van
szksgnk.
Egyetlen A attribtum tesztje nem fogja megadni mindezt az informcit, de valamennyit megad belle.
Pontosan mrni tudjuk, hogy mennyit, ha megnzzk, hogy mennyi informcira van mg szksgnk az
attribtumteszt utn. Brmely A attribtum, amely v klnbz rtket vehet fel, E1, ..., Ev rszhalmazokra
bontja az E tant halmazt, az A lehetsges rtkei szerint. Mindegyik Ei rszhalmaz pi pozitv s ni negatv
pldt tartalmaz, gy ezen az gon tovbbhaladva I(pi/(pi + ni), ni/(pi + ni)) bit informcira van szksgnk a
vlasz megadshoz. A tant halmazbl vletlen mintavtellel nyert minta esetn annak valsznsge, hogy az
A attribtum ezen a mintn az i-edik rtket veszi fel: (pi + ni)/(p + n). Ennek megfelelen az A attribtum
tesztje utn az tlagos informciszksglet, amely a plda osztlyozshoz kell:
Az attribtum tesztjbl szrmaz informcinyeresg (information gain) az eredeti (A tesztje eltti)

informciszksglet s a teszt utni j informciszksglet klnbsgeknt kaphat meg:
Az ATTRIBTUM-VLASZTS fggvnyben hasznlt heurisztika csupn azt takarja, hogy vlasszuk a legnagyobb
nyeresget biztost attribtumot. Visszatrve a 18.4. brn vizsglt attribtumokhoz:
Ez megersti azt az intucinkat, hogy a Vendgek jobb attribtum a tanthalmaz rszhalmazokra szabdalsra,
mint a Konyha. Az a helyzet, hogy a Vendgek attribtumnak van a legnagyobb informcinyeresge, ezrt a
dntsi fa tanul algoritmus ennek tesztjt vlasztan a fa gykrcsompontjba.
3.5. A tanul algoritmus teljestmnynek becslse

Egy tanul algoritmus akkor j, ha olyan hipotziseket hoz ltre, amelyek jl jsoljk meg az ltaluk elzetesen
nem ltott pldk osztlyba sorolst. A 18.5. fejezetben azt mutatjuk be, hogy mi mdon lehet elre
megbecslni a jsls minsget. Ebben a fejezetben egy olyan mdszertant vizsglunk meg, amellyel az
osztlyba sorol kpessget mrssel lehet becslni.
580

tanuls
Nyilvnvalan akkor j egy jsls, ha igaznak bizonyul, gy a hipotzis minsgt megbecslhetjk az ismertt
vlt tnyleges osztlybasorolsok alapjn. Ezt egy teszthalmaznak (test set) nevezett mintahalmaz segtsgvel
vgezhetjk el. Ha az sszes rendelkezsnkre ll pldt tantsra hasznljuk, akkor tovbbiakat kell
gyjtennk a tesztelshez. Ezrt gyakran knyelmesebb a kvetkez mdszert alkalmazni:
1. Gyjtsnk egy nagy pldahalmazt.
2. Osszuk kt diszjunkt rszre: a tant halmazra (training set) s a teszthalmazra (test set).
3. Alkalmazzuk a tant algoritmust a tant halmazon, s gy generljunk egy h hipotzist.
4. Mrjk meg a teszthalmazon, hogy a h hipotzis a halmaz hny szzalkra ad helyes osztlybasorolst.
5. Ismteljk meg az 14 lpseket klnbz tant halmaz mretekre, s mindegyik mrethez klnbz
vletlenszeren kivlasztott tant halmazokra.
Ennek az eljrsnak az eredmnyeknt egy adathalmazt kapunk, amelynek feldolgozsval megkaphatjuk az
tlagos jslsi kpessget a tant halmaz mretnek fggvnyben. Ezt a fggvnyt brzolva kapjuk az adott
algoritmusnak egy adott tmaterletre vonatkoz tanulsi grbjt (learning curve). A DNTSI-FA-TANULS
algoritmus tterem pldinkkal felvett tanulsi grbje a 18.7. brn lthat. Vegyk szre, hogy a tant halmaz
mretvel javul a predikci minsge! (Ez okbl az ilyen grbket n. boldog grbknek (happy graphs) is
nevezik.) Ez annak a jele ugyanis, hogy valban van valami mintzat az adatokban, s az algoritmus felfedezi
ezt a mintzatot.
18.7. bra - Tanulsi grbe az tterem problmatrre vletlenszeren generlt 100 plda
esetn. A grbe 20 ksrlet eredmnyt sszegzi.
A tanul algoritmusnak nyilvnvalan nem szabad az eltt ltnia a tesztadatokat, mieltt a megtantott
hipotzist teszteltk velk. Szerencstlen mdon nagyon knny beleesni abba a hibba, hogy tants kzben a
tesztadatokra kukucsklunk (peeking). Ez tipikusan a kvetkez mdon zajlik: egy tanul algoritmus ltalban
szmos hangolsi lehetsggel rendelkezik, amellyel az algoritmus viselkedst vltoztatni tudjuk. Pldul
szmos klnbz kritrium lehet, amelyek alapjn a kvetkez attribtumot kivlasztjuk a dntsi fa
tanulsnl. Klnbz belltsok mentn szmos klnbz hipotzist generlunk, majd mindegyiket
581

tanuls
leteszteljk a teszthalmazon, s a legjobb hipotzis predikcis eredmnyt tekintjk eredmnynek. Fjdalmas
br, de kukucskls trtnt! Ennek oka, hogy a hipotzist a teszthalmazon elrt eredmnye alapjn vlasztottuk
ki, gy a teszthalmaz ltal hordozott informci beszivrgott a tanul algoritmusba. Ennek a mesnek az a
tanulsga, hogy brmely eljrsnak, amelynek rsze a hipotziseknek a teszthalmazon nyjtott teljestmnyk
alapjn val sszehasonltsa, egy j teszthalmazt kell hasznlnia, amelyen a vgl kivlasztott hipotzis
teljestmnyt mri. A gyakorlatban ez tl krlmnyes, gy az emberek tovbbra is ily mdon szenynyezett
adathalmazaikon folytatjk ksrleteiket.
3.6. Zaj s tlilleszkeds

Korbban mr lttuk, hogy ha van kett vagy tbb olyan plda, amelyeknek azonos a lersuk (az
attribtumokra nzve), de eltr az osztlybasorolsuk, akkor a DNTSI-FA-TANULS algoritmus nem lehet
kpes olyan dntsi ft tallni, amely minden pldval konzisztens. Az ltalunk korbbiakban emltett megolds
a kvetkez. Ha determinisztikus osztlyzsra van igny, akkor minden levlcsompont adja vissza a hozz
tartoz halmaz tbbsgi osztlyt. Ms esetekben pedig adja vissza a relatv gyakorisgok alapjn becslt
osztlyba tartozsi valsznsgeket. Sajnos, ez mg tvol van a trtnet vgtl. Knnyen elkpzelhet, st
valjban elg valszn, hogy a tanul algoritmus akkor is tall egy olyan dntsi ft, amely az sszes pldval
konzisztens, ha nagyon fontos informci hinyzik. Ennek oka, hogy az algoritmus felhasznlhat irrelevns
attribtumokat, ha vannak ilyenek, hogy hamis megklnbztetst tegyen a pldk kzt.
Vizsgljuk meg azt a problmt, amikor egy kockadobs eredmnyt akarjuk megjsolni. Tegyk fel, hogy tbb
napon t ksrleteket vgznk szmos kockval. Mindegyik tant pldt a kvetkez attribtumokkal runk le:
1. Nap: az a nap, amelyen a kockadobst vgeztk (htf, kedd, szerda, cstrtk).
2. Hnap: a hnap, amelyben a kockadobst vgeztk (janur vagy februr).
3. Szn: a kocka szne (vrs vagy kk).
Mindaddig, amg kt dobsnak nem lesz pontosan azonos a lersa, a DNTSI-FA-TANULS kpes lesz egzakt
hipotzist tallni. Minl tbb attribtum van, annl valsznbb, hogy egzakt hipotzist kapunk. Viszont az
sszes ilyen hipotzis teljesen hamis lesz! Amit szeretnnk, az az, hogy a DNTSI-FA-TANULS miutn elg
pldt ltott mr egyetlen levlcsompontot adjon vissza, minden egyes dobsi eredmnyhez kzeltleg 1/6
valsznsggel.
Amikor a hipotzisek nagy halmaza lehetsges, akkor vatosnak kell lennnk, nehogy arra hasznljuk az ebbl
ered nagy szabadsgot, hogy rtelmetlen szablyossgot talljunk az adatokban. Ezt a problmt
tlilleszkedsnek (overfitting) nevezzk. Ez rendkvl ltalnos jelensg, akkor is jelentkezhet, amikor a
keresett fggvnynek egyltaln nincs valsznsgi jellege. Mindamellett ez a problma az sszes tanulsi
algoritmust sjtja, nem csak a dntsi fkat.
A tlilleszkeds kezelsnek kimert matematikai trgyalsa meghaladja e knyv kereteit. A problma
megoldsra itt csupn egy egyszer dntsi fa metszs (decision tree pruning) nev mdszert mutatunk
be. A metszs (vagy nyess) azon az alapon mkdik, hogy megakadlyozzuk a nem nyilvnvalan relevns
attribtumok tesztje mentn a mintahalmaz ismtelt (rekurzv) felosztst, mg akkor is, ha az adatok
osztlybasorolsa az adott csompontban nem egyforma. Az a krds, hogyan vesszk szre egy attribtumrl,
hogy irrelevns?
Tegyk fel, hogy egy irrelevns attribtumra alapozva osztottuk kett a mintahalmazunkat. ltalnossgban
szlva azt vrjuk, hogy ez esetben az eredmnyl kapott rszhalmazokban nagyjbl ugyanabban az arnyban
fognak szerepelni az egyes osztlyokba tartoz mintk, mint az eredeti halmazban. Ekkor az informcinyeresg
kzel nulla.4 Teht az informcinyeresg (annak hinya) j jelzs lehet az irrelevancira. Most az a krds
merl fel, hogy mekkornak kell lennie az informcinyeresgnek ahhoz, hogy ezen attribtum mentn
sztosszuk a mintahalmazt?
Ezt a krdst a statisztikai szignifikanciatesztet (significance test) hasznlva vlaszolhatjuk meg. Ez a teszt
azzal a felttelezssel indul, hogy a pldkban egyltaln nincs kzs mintzat (ez az gynevezett
nullhipotzis). Ezek utn az aktulis adathalmazt vizsgljuk: meg akarjuk hatrozni annak mrtkt, hogy az
adathalmaz mennyire tr el a tkletesen mintzat nlkli helyzettl. Ha az eltrs mrtke statisztikailag mr
4
Valjban a nyeresg pozitv lesz, kivve azt az esetet, amikor az arnyok mind pontosan egyformk (lsd 18.10. feladat).
582

tanuls
valszntlen (rendszerint 5% vagy ennl kisebb valsznsget rtnk ezalatt), akkor ezt annak bizonytkaknt
vesszk, hogy az adatokban jelen van egy alapvet mintzat. A valsznsget a vletlen mintavtelezs esetn
vrhat eltrsek standard eloszlst felttelezve szmtjuk ki.
Ebben az esetben a nullhipotzis az, hogy az attribtum irrelevns, ennek megfelelen egy vgtelen nagy
mintahalmazra vett informcinyeresg nulla lenne. Azt kell kiszmtanunk, hogy a nullhipotzist feltve egy
mret mintahalmazban a vrt pozitv s negatv eseteloszlstl a megfigyelt eloszls eltrse milyen
valsznsggel lphet fel. Az eltrs mrtkt megadhatjuk a rszhalmazok tnyleges pozitv s negatv
esetszmnak (pi, ni) a nullhipotzis fennllsa esetn vrt esetszmokkal
val sszehasonltsval:
A teljes eltrs knyelmesen szmthat mrtkt a kvetkez sszefggs adja:
A nullhipotzist felttelezve a D eltrs mrtk 1 szabadsgfok 2 (kh-ngyzet) eloszlst kvet. Annak

valsznsgt, hogy az attribtum valban irrelevns, standard 2 tblzatok vagy statisztikai szoftver
segtsgvel szmthatjuk ki. A 18.11. feladatban tztk ki clul, hogy a DNTSI-FA-TANULS algoritmusban
elvgezzk azokat a vltoztatsokat, amelyek a metszs ezen 2 metszs (2 pruning) nven ismert
formjhoz vezetnek.
A zaj metszs segtsgvel kezelhet: az osztlyozsi hibk lineris nvekedst okoznak a predikcis hibban,
mg az esetlersban fellp hibk aszimptotikus hatst gyakorolnak, amely egyre rosszabb, ahogy a dntsi fa
egyre kisebb halmazok kezelsre zsugorodik. Ha az adatok nagy zajjal terheltek, akkor a metszssel kszlt
dntsi fk lnyegesen jobb eredmnyt adnak, mint a metszs nlkl kszltek. Radsul a metszssel kszlt
fk gyakran jval kisebbek, ezrt knnyebben rthetk.
Egy msik tlilleszkedst cskkent technika a keresztvalidci (cross-validation). Brmely tanulsi eljrsnl
alkalmazhat, nem csupn a dntsi fa tanulsnl. Az alapvet tlet annak megbecslse, hogy az egyes
hipotzisek mennyire jl fogjk megjsolni a mg nem ltott esetekre adand vlaszokat. Ezt gy becslhetjk,
hogy az ismert adatok egy rszt flretesszk, s ezekkel teszteljk a megmaradt adatok alapjn tanulssal
ltrehozott fa predikcis kpessgt. K-szoros keresztvalidcinak nevezzk, ha k ksrletet vgznk, s minden
esetben az adatok ms s ms 1/k-ad rszt tesszk flre validcis tesztclra, majd a vgn tlagoljuk az
eredmnyeket. Az 5 s a 10 elterjedten hasznlt k rtkek. Szls esetknt hasznljk a k = n vlasztst, amelyet
hagyj-ki-egyet keresztvalidcis mdszerknt ismernk. A keresztvalidcit tetszleges dntsi fa tanulsi
mdszerrel egytt alkalmazhatjuk (belertve a metszst is), clja mindig az, hogy olyan dntsi fa kivlasztst
segtsk el, amely j predikcis kpessggel rendelkezik. A kukucsklsi jelensg elkerlse vgett ezek utn
ezt a predikcis kpessget egy j teszthalmazon kell mrnnk.
3.7. A dntsi fk alkalmazhatsgnak kiterjesztse

Egy sor problmt meg kell oldanunk ahhoz, hogy a dntsi fa indukcit a problmk szlesebb krre
kiterjeszthessk. Nagyjbl felvzoljuk mindegyiket, azt javasolva, hogy a teljesebb megrts rdekben a
kapcsold feladatokat oldja meg az olvas.
Hinyz adatok (missing data): Szmos terleten nem ismerhet meg minden plda sszes attribtuma.
Lehet, hogy az rtkek nem kerltek trolsra, vagy tl drga lenne a mrsk. Ez kt problmt vet fel:
elszr, ha van is egy teljes dntsi fnk, akkor hogyan tudunk egy olyan mintt osztlyozni, amelynek egy
tesztelend attribtuma hinyzik? Msodszor, hogyan mdostsuk az informcinyeresgre vonatkoz
formult, ha nhny plda ezen attribtumnak rtke nem ismert? Ezeket a krdseket a 18.2. feladatban
vizsgljuk.
Sokrtk attribtumok (multivalued attributes): Ha egy attribtum nagyszm rtket vehet fel, akkor az
informcinyeresg nagysga nem megfelel mrtke az attribtum hasznossgnak. Szlssges esetben egy
olyan attribtumot hasznlnnk, mint pldul az tteremNv attribtum, amely minden pldra ms s ms
rtket ad. Ez esetben pldk minden rszhalmaza egyelem lesz, egyedi osztlybasorolssal, gy az
583

tanuls
informcinyeresg erre az attribtumra veszi fel maximlis rtkt. Mindamellett ez az attribtum irrelevns,
rtktelen. Egy lehetsges megolds a nyeresgarny (gain ratio) hasznlata (lsd 18.13. feladat).
Folytonos s egsz rtk bemeneti attribtumok (continuous and integer-valued input attributes): A
folytonos vagy az egsz rtk bemeneti attribtumok mint pldul a Magassg s a Sly ltal felvehet
rtkek halmaza vgtelen. A dntsi fa tanul algoritmusok az ilyen esetekre nem generlnak vgtelen
elgazs csompontokat, inkbb megkeresik azt a kszbpontot (split point), amely a legnagyobb
informcinyeresget eredmnyezi. Pldul egy adott csompontnl az lehet a helyzet, hogy a Sly > 160
teszt adja a legnagyobb informcinyeresget. Lteznek hatkony dinamikus programozsi mdszerek j
kszbpontok megtallsra, de mg mindig messze ez a legtbb erforrst ignyl rsze a dntsi fa tanulsi
eljrsok vals problmkra val alkalmazsnak.
Folytonos rtkkszlet kimeneti attribtumok (continuous-valued output attributes): Ha egy
numerikus rtket akarunk megjsolni, pldul egy mtrgy rt, akkor nem osztlyozsra van szksgnk,
hanem egy regresszis fra (regression tree). Egy ilyen fa nem egyetlen rtket (osztlyt) ad vissza az egyes
levl csompontjaiban, hanem egy attribtumhalmaz lineris fggvnyt. Pldul a mtrgyak regreszszis
fjnak kzzel festett metszetekre vonatkoz ga a terletnek, a kornak s a sznek szmnak lineris
fggvnyhez vezethet. A tanul algoritmusnak kell azt megoldania, hogy mikor lljon le a mintk
csompontokban trtn sztosztsval, ttrve a maradk attribtumokat (vagy azok bizonyos rszhalmazt)
felhasznl lineris regresszi megalkotsra.
Egy dntsi fa tanulsra szolgl, vals problmk megoldst clz rendszernek kpesnek kell lennie
mindezen problmk kezelsre. A folytonos rtk vltozk kezelse klnsen fontos, mivel mind a fizikai,
mind a gazdasgi folyamatok numerikus rtkekkel jellemezhetk. Szmos, zleti forgalomban kaphat
programcsomag kszlt, amelyek megfelelnek mindezen a kritriumoknak, s segtsgkkel tbb szz
valamilyen konkrt terleten alkalmazott rendszert fejlesztettek ki. Az ipar s kereskedelem sok terletn, ha
mintk alapjn kialaktott osztlyozsra van szksg, akkor elssorban dntsi fkkal prblkoznak. A dntsi
fk egyik fontos tulajdonsga, hogy az ember szmra jl rthet a tanul algoritmus ltal ellltott eredmny.
(Valjban olyan gazdasgi dntsek esetn, amelyeknek megklnbztets elleni jogszablyoknak kell
megfelelnik, ez jogi kvetelmny.) A neurlis hlzatoknl hinyzik ez a fontos tulajdonsg (lsd 20. fejezet).
4. Hipotzishalmaz egyttes tanulsa

Az eddigiekben olyan tanulsi algoritmusokat vizsgltunk, amelyek eredmnyeknt a hipotzistrbl
kivlasztott egyetlen hipotzist hasznlunk arra, hogy predikcit vgezznk. Az egyttes tanuls (ensemble
learning) alaptlete, hogy vlasszunk ki a hipotzistrbl egy teljes hipotziskollekcit vagy hipotzisegyttest
(ensemble), s kombinljuk az ltaluk adott predikcikat. Generlhatunk pldul ugyanazon tant halmaz
alapjn szz klnbz dntsi ft, s egy j plda esetn szavazssal alakthatjuk ki a legjobb predikcis
osztlyozsi eredmnyt.
Az egyttes tanuls motivcija kzenfekv. Vizsgljunk egy M = 5 hipotzisbl ll egyttest, s tegyk fel,
hogy a predikcis eredmnyeket egyszer tbbsgi szavazssal kombinljuk ssze. Ahhoz, hogy az egyttes
rosszul osztlyozzon egy j pldt, legalbb hromnak az t hipotzisbl rossz osztlyozsi eredmnyt kell
adnia! Remnynk szerint ez sokkal kevsb valszn, mint az, hogy egyetlen hipotzis rossz osztlyozsra
jusson. Tegyk fel, hogy az egyttes minden hi hipotzisnek p a hibavalsznsge, azaz p annak
valsznsge, hogy hi rosszul osztlyoz egy vletlen mdon kivlasztott pldt. Tovbb tegyk fel, hogy a
hipotzisek ltal elkvetett hibk fggetlenek. Ez esetben ha p kicsi rendkvl kicsi a valsznsge, hogy
nagy szmban trtnjk tves osztlyozs. Egyszer szmtssal (lsd 18.14. feladat) megmutathat pldul,
hogy t hipotzisbl ll egyttest hasznlva a hibaarny 0,1-rl kevesebb mint 0,01-ra cskken. Valjban a
fggetlensg felttelezse nem racionlis, mert a hipotziseket a tant halmaz flrevezet tulajdonsgai hasonl
mdon vezetik flre. Mindamellett, ha a hipotzisek legalbb kismrtkben eltrek, lecskkentve a hibik kzti
korrelcit, akkor az egyttes tanuls nagyon hasznos lehet.
Az egyttes tanuls trgyalhat ms aspektusbl is: gondolhatunk r gy, mint a hipotzistr egy ltalnos
kiterjesztsre. Tekintsnk gy magra az egyttesre, mint egy hipotzisre, s az j hipotzistr legyen
mindazon lehetsges egyttesek halmaza, amelyek az eredeti hipotzistrbl konstrulhatk. A 18.8. bra
mutatja, hogyan eredmnyezhet ez egy sokkal kifejezbb hipotzisteret. Ha az eredeti hipotzistr egyszer s
hatkony tanulsi eljrst tett lehetv, akkor az egyttes tanuls mdszere egy sokkal kifejezbb
hipotzisosztly tanulst biztostja. Ennek ltalban nem tl nagy szmtsi s algoritmikus komplexits
nvekeds az ra.
584

tanuls
A legelterjedtebben hasznlt egyttes tanulsi mdszert turbzsnak (boosting) nevezzk. Ahhoz, hogy
mkdst megrtsk, be kell vezetnnk a slyozott tant halmaz (weighted training set) fogalmt. Egy
ilyen tant halmazban minden minthoz hozzrendelnk egy wj 0 slyt. Minl magasabb ez a sly, annl
nagyobb jelentsget tulajdontunk az adott mintnak a hipotzis tanulsa sorn. Az eddigiekben ttekintett
tanul algoritmusaink kzenfekv mdon mdosthatk gy, hogy slyozott tant halmazokkal is tudjanak
mkdni.5
18.8. bra - A egyttes tanuls eredmnyekppen nyert megnvekedett kifejezert

illusztrl plda. Hrom lineris kszb jelleg hipotzist vizsglunk, mindegyik a nem
vonalkzott flskon ad pozitv besorolst. Az egyttesben csak arra adunk pozitv
osztlyozst, amelyre mindhrom pozitvat ad. Az eredmnyl kapott hromszgterlet
egy olyan hipotzisnek felel meg, amelyet az eredeti hipotzistr egyetlen eleme sem
kpes kifejezni.
A turbzs az sszes mintra wj = 1 rtkkel (azaz egy norml tant halmazzal) indul. Ebbl a halmazbl
generlja az els hipotzist, h1-et. Ez a hipotzis egyes tantmintkat jl osztlyoz, msokat rosszul. Azt
szeretnnk, ha a kvetkez hipotzis jobb eredmnyt rne el a rosszul osztlyozott mintkon, ezrt megnveljk
a rosszul osztlyozottak slyait, mg a jl osztlyozottakt cskkentjk. Ebbl az j, slyozott mintahalmazbl
generljuk a h2 hipotzist. Az eljrst addig folytatjuk, mg M hipotzist nem generltunk, ahol M a turb
tanulsi algoritmus bemen paramtere. Az algoritmus eredmnyeknt kapott hipotzis egyttes nem ms, mint
az M hipotzis slyozott tbbsgi szavazssal kombinlt eredje. A slyokat aszerint hatrozzuk meg, hogy az
egyes hipotzisek mennyire jl teljestettek a tant halmazon. A 18.9. brn bemutatjuk az algoritmus
koncepcijt. Sok varinsa ismert a turb tanulsnak, eltr slymdostssal, illetve a hipotzisek klnbz
kombinlsi lehetsgeivel. Egy kivlasztott ADABOOST nev algoritmust mutatunk be a 18.10. brn. Az
alkalmazott slymdostsi eljrs jelen esetben nem tl lnyeges, viszont az ADABOOST algoritmusnak van egy
nagyon lnyeges jellemzje. Tegyk fel, hogy a hasznlt L tanulsi algoritmus egy gyenge tanulsi (weak
learning) algoritmus, ami azt jelenti, hogy L mindig visszaad egy olyan hipotzist, amelyik legalbb egy
csppet jobban teljest a tant halmaz slyozott hibjra nzve, mint a vletlen tallgats (azaz eredmnye jobb
mint 50% binris osztlyozs esetn). Ez esetben, kellen nagy M-re az ADABOOST mindig elllt egy olyan
Azon tanulsi eljrsokra, ahol ez nem lehetsges, ismtlses tant halmazt (replicated training set) hozhatunk ltre, ahol a j-edik minta
a wj sllyal arnyos pldnyszmban szerepel. Az esetleges nem egsz slyokat gy kezelhetjk, hogy a mintaszmot valsznsgi
vltozknt fogjuk fel.
5
585

tanuls
hipotzist, amely a tant mintkat tkletesen osztlyozza! Teht az algoritmus fokozza az eredeti tanul
eljrsnak a tant mintn mrt pontossgt. Ez mindig fennll, attl fggetlenl, hogy esetleg mennyire kevss
kifejez az eredeti hipotzistr, s mennyire bonyolult a keresett fggvny.
18.9. bra - A turb algoritmus mkdse. Mindegyik rnykolt tglalap egy pldnak
felel meg, a tglalap magassga mutatja a plda slyt. A pipk s keresztek mutatjk,
hogy a pldt jl vagy rosszul osztlyoztuk a pillanatnyi hipotzis alapjn. A dntsi fa
mrete mutatja, hogy ennek a hipotzisnek mekkora a slya a vgs egyttesben.
Vizsgljuk meg, hogy mennyire jl mkdik a turbzs az ttermi adatainkon. Kiindul hipotzistrknt az
gynevezett dntsi tnkk (decision stumps) tert vlasztjuk, amelyek olyan dntsi fk, amelyek csupn egy
a gykrcsompontban elhelyezked tesztbl llnak. A 18.11. (a) bra als grbje mutatja, hogy turbzs
nlkl ezek a dntsi tnkk nem adnak valami j eredmnyt, csupn 81%-os a 100 mintn mrt predikcis
teljestmnyk. Amikor turbzst alkalmazunk (M = 5), akkor a teljestmny javul, elri a 93%-ot 100 plda
esetn.
18.10. bra - Az egyttes tanuls turb mdszereinek ADABOOST nev varinsa. Az

algoritmus hipotzisek kombincijt hozza ltre. A SLYOZOTT-TBBSG egy hipotzist
generl. Ez az j hipotzis azt a kimeneti rtket adja vissza, amely a h-ban tallhat
hipotzisek kzl, a z-ben szmon tartott slyozssal a legtbb szavazatot kapta.
586

tanuls
Fontos
rdekes dolog trtnik, amikor az egyttes M mrete nvekszik. A 18.11. (b) bra mutatja a tant
halmazon mrt teljestmnyt M fggvnyben. Figyeljk meg, hogy M = 20-nl a hiba elri a nullt
(ahogy a turbzssal foglalkoz elmlet megjsolta), azaz 20 dntsi tnk slyozott tbbsgi
szavazssal sszefogott kombincija elgsges a 100 mintra val pontos illeszkedshez. Ha tovbbi
tnkket adunk az egytteshez, akkor a hiba nulla marad. A grbe mutatja ugyanakkor, hogy a
teszthalmazon mrt teljestmny mg hosszasan n azutn is, hogy a tant halmazon mrt hiba elrte a
nullt. M = 20 esetn a teszthalmazon mrt teljestmny 0,95 (a hiba 0,05), M = 137-ig nvelve az
egyttes rsztvevinek szmt a teljestmny 0,98-ra n, ezutn leesik 0,95-re.
Ez a megfigyels, amely klnbz mintahalmazokra s hipotzisterekre nzve meglehetsen robusztusnak
bizonyult, nagy meglepetst keltett a felfedezsekor. Az Ockham borotvja elv azt sugallja, hogy ne tegyk a
hipotziseket komplexebb, mint szksges, de a grbe azt mutatja, hogy a predikcik javulnak, ahogy az
egyttes hipotzis sszetettebb vlik! Szmos magyarzatot javasoltak erre a jelensgre. Az egyik megkzelts
szerint a turbzs nem ms, mint a Bayes-tanuls kzeltse (lsd 20. fejezet), amely egy bizonythatan
optimlis tanulsi eljrs. Ez a kzelts javul, ahogy tbb s tbb hipotzist adunk az egytteshez. Msik
lehetsges magyarzat, hogy tovbbi hipotziseknek az egytteshez adsa lehetv teszi, hogy hatrozottabb
legyen a megklnbztets a pozitv s negatv pldk kztt, ami segt az j mintk osztlyozsban.
18.11. bra - (a) A dntsi tnkk s a turbzott dntsi tnkk teljestmnynek az

tterem pldn trtn sszehasonltsa M = 5 esetn. (b) A tant halmazon s a
teszthalmazon kapott j vlaszok arnya M-nek az egyttesben tallhat hipotzisek
szmnak a fggvnyben. Figyeljk meg, hogy a teszthalmazon mrt pontossg mg
azutn is javul egy kicsit, amikor a tant halmazon elrte az 1-et, azaz miutn az
egyttes pontosan illeszkedett az adatokra.
587

tanuls
5. Mirt mkdik a tanuls: a tanuls szmtsi

elmlete
A legfontosabb megvlaszolatlan krds, amelyet a 18.2. alfejezetben tettnk fel, a kvetkez: hogyan
bizonyosodhat meg valaki arrl, hogy a tanulsi algoritmusa ltal ltrehozott elmlet helyesen fogja megjsolni
a jvt? Formlisan: honnan tudjuk, hogy a h hipotzis jl kzelti az f keresett fggvnyt, ha nem ismerjk f-et?
vszzadok ta foglalkoznak ezekkel a krdsekkel. Amg nem talljuk meg a vlaszokat, addig a gpi tanulst
a legjobb esetben is csak zavarba hozza sajt sikere.
Fontos
Az ebben az alfejezetben trgyalt megkzelts a tanuls szmtsi elmletn (computational
learning theory) alapul, amely az MI, a statisztika s az elmleti szmtstudomny kzs
hatrterlete. Ennek az elmletnek az alapvet elve a kvetkez: brmely slyosan hibs elmlet szinte
bizonyosan nagy valsznsggel felismerhet kisszm plda vizsglata alapjn, mivel helytelen
predikcit fog adni. Teht minden hipotzis, amely egy kielgten nagy tant pldahalmazzal
konzisztens vlaszt ad, nem valszn, hogy slyosan hibs lenne: azaz valsznleg kzeltleg
helyesnek (probably approximately correct) kell lennie. Minden olyan tanul algoritmust, amely
valsznleg kzeltleg helyes hipotziseket ad, VKH-tanul (PAC-learning) algoritmusnak
neveznk.
Van nhny bonyolultabb rsz az elbbi gondolatmenetben. A f krds a tant s a tesztpldk viszonya:
vgl is mi azt szeretnnk, ha a hipotzis nem csupn a tant halmazon lenne kzeltleg helyes, hanem
elssorban a teszthalmazon. Az alapvet feltevs az, hogy a tant s a teszthalmazt ugyanolyan valsznsgeloszlst hasznlva, vletlenszeren s fggetlenl vlasztottuk ugyanabbl a pldapopulcibl. Ezt
stacionaritsi (stationarity) feltevsnek nevezzk. A stacionaritsi feltevs nlkl az elmlet semmilyen, a
jvre vonatkoz ignnyel nem lphet fel, mivel nem lesz szksgszer kapcsolat a mlt s a jv kztt. A
stacionaritsi feltevs tmasztja al azt a gondolatot, hogy a pldkat kivlaszt eljrs nem rosszindulat.
Persze ha a tant halmaz kizrlag furcsa pldkat tartalmaz ktfej kutykat pldul , akkor a tanul
algoritmus nyilvnvalan nem tehet mst, mint sikertelen ltalnostsra jut a fell, hogy mi mdon lehet a
kutykat felismerni.
5.1. Hny pldra van szksg?

Nhny defincira szksgnk lesz ahhoz, hogy ezeket a felismerseket a gyakorlatba t tudjuk ltetni:
Jelljk X-szel az sszes lehetsges pldk halmazt.
Jellje D azt a valsznsgi eloszlst, amely alapjn a pldkat vlasztjuk.
Legyen H a lehetsges hipotzisek halmaza.
Legyen N a tant halmaz elemeinek a szma.
588

tanuls
Elzetesen feltesszk, hogy a keresett f fggvny eleme H-nak. Most mr definilhatjuk azt a hibt (error), ami
egy h hipotzisnek a keresett f fggvnytl val eltrst jellemzi a mintkra vonatkoz adott eloszls mellett,
mint annak valsznsgt, hogy h az f-tl eltr vlaszt ad egy pldra:
error(h) = P(h(x) f(x)|x a D alapjn vlasztva)
Ez ugyanaz a mennyisg, mint amelyet az elzkben bemutatott tanulsi grbkkel mrtnk a gyakorlatban.
18.12. bra - A hipotzistr sematikus brzolsa a keresett f fggvny krl felvett gmb brzolsval
Egy h hipotzist kzeltleg helyesnek (approximately correct) neveznk, ha error(h) , ahol egy kis
konstans. A bizonyts megkzeltse az, hogy megmutatjuk: N plda vizsglata utn az sszes konzisztens
hipotzis nagy valsznsggel kzeltleg helyes lesz. gy gondolhatunk egy kzeltleg helyes hipotzisre,
mint amely kzel van a keresett fggvnyhez a hipotzistrben: egy a keresett f krl felvett -gmbn (ball) bell van. A 18.12. brn bemutatjuk az sszes hipotzis H tert, amelyet kt rszre osztottunk, egyik az gmb f krl, a msik a Hrossz-szal jellt maradk.
A kvetkezk alapjn kiszmthatjuk annak valsznsgt, hogy egy slyosan hibs hr Hrossz hipotzis
konzisztens lesz az els N pldval. Tudjuk, hogy error(hr) > . Teht annak valsznsge, hogy egy adott
pldra helyes vlaszt ad, legfeljebb 1 . Ezek utn az N pldra vonatkoz sszefggs:
P(hr konzisztens N pldval) (1 )N
Annak valsznsgt, hogy Hrossz legalbb egy konzisztens hipotzist tartalmaz, a lehetsges egyedi hipotzisek
szma hatrozza meg:
P(Hrossz tartalmaz egy konzisztens hipotzist) |Hrossz|(1 )N |H|(1 )N
Kihasznltuk, hogy |Hrossz| |H|. Ezt a valsznsget valamely kellen kis rtk al akarjuk cskkenteni:
|H|(1 )N
Felhasznlva, hogy (1 ) e, a clunk elrhet, ha lehetv tesszk, hogy az algoritmus

589

tanuls
pldt megvizsglhasson. Ennek rtelmben, ha egy algoritmus ilyen mennyisg pldval konzisztens
hipotzist ad vissza, akkor legalbb 1 valsznsggel a hibja legfeljebb . Ms szavakkal kzeltleg
helyesnek nevezzk. A szksges pldaszmot, ami s fggvnyeknt adhat meg, a hipotzistr minta
komplexitsnak (sample complexity) nevezzk.
Kiderlt, hogy kulcskrds a hipotzistr mrete. Mint korbban lttuk, ha H az n attribtumon felvehet Boolefggvnyek halmaza, akkor
. Teht a tr minta komplexitsa 2n szerint n. Mivel a lehetsges pldk
n
szma szintn 2 , ebbl az kvetkezik, hogy a Boole-fggvnyek terben egyetlen tanul algoritmus sem tud
jobb eredmnyt elrni, mint egy tblzat, ha csupn arra szortkozik, hogy egy olyan hipotzist adjon vissza,
amely az sszes ismert pldval konzisztens. Ennek megmutatsra egy msik lehetsg az, hogy megfigyeljk:
egy tetszleges ismeretlen pldra a hipotzistr ugyannyi pozitv kimenetelt jsol konzisztens hipotzist
tartalmaz, mint amennyi negatv kimenetelt jsol.
A kvetkez dilemmval kerltnk szembe: ha nem korltozzuk a szba jv fggvnyek tert, akkor az
algoritmus nem lesz kpes tanulni, viszont ha korltozzuk a fggvnyek tert, akkor fennll a veszly, hogy
kihagyjuk a keresett fggvnyt. Kt lehetsgnk van, hogy kimenekljnk ebbl a dilemmbl. Az els,
hogy nem csupn ahhoz ragaszkodunk, hogy az algoritmus egy tetszleges konzisztens hipotzist adjon vissza,
hanem ahhoz is, hogy rszestse elnyben az egyszereket (mint ahogy a dntsi fa tanulsnl tettk). Ezen
algoritmusok elmleti trgyalsa tlmegy ennek a knyvnek a keretein, de megemltjk, hogy azon esetekben,
amikor az egyszer konzisztens hipotzisek keresse kezelhet problma, a mintakomplexits-eredmnyek
jobbak, mint a csupn konzisztencin alapul vizsglatok. A msik meneklsi lehetsg, amelyet kvetni is
fogunk, hogy a Boole-fggvnyek teljes halmazbl a megtanulhat fggvnyek rszhalmazra fogunk
koncentrlni. Az tlet abban ll, hogy legtbb esetben nincs szksgnk a Boole-fggvnyek teljes
kifejezerejre, korltozottabb nyelvek is kielgtk szmunkra. A kvetkezkben egy ilyen korltozottabb
nyelvet vizsglunk meg rszletesebben.
5.2. Dntsi listk tanulsa

A dntsi lista (decision list) egy kttt formj logikai kifejezs. Egy tesztsorozatbl ll, amely tesztek
mindegyike literlisok konjunkcija. Ha egy teszt valamelyik plda lersra alkalmazva pozitv eredmnyt ad,
akkor a dntsi lista hatrozza meg a pldra adand vlaszt. Ha a teszt eredmnye negatv, akkor a lista
kvetkez tesztjvel folytatdik a feldolgozs.6 A dntsi listk emlkeztetnek a dntsi fkra, de a globlis
struktrjuk egyszerbb, ezzel szemben az egyes tesztek bonyolultabbak, mint a dntsi fknl. A 18.3. bra
egy dntsi listt mutat be, amely a kvetkez hipotzist reprezentlja:
x VrjunkE(x) Vendgek(x, Nhny) (Vendgek(x, Tele) Pntek/Szombat(x))
Ha megengednk tetszleges mret teszteket, akkor a dntsi listk brmely Boole-fggvny reprezentlsra
kpesek (lsd 18.15. feladat). Msrszrl, ha az egyes tesztek mrett k literlisra korltozzuk, akkor lehetv
vlik, hogy a tanul algoritmus kisszm plda alapjn sikeresen ltalnostson. Ezt k-DL nyelvnek nevezzk.
Knynyen megmutathat, hogy a k-DL nyelvek rszhalmazknt tartalmazzk a k-DF nyelveket, amelyek a
legfeljebb k mlysg dntsi fk halmazt alkotjk. Fontos, hogy egy adott nyelv, amelyre k-DL jellssel
hivatkozunk, fgg azoktl az attribtumoktl, amelyekkel a pldkat lerjuk. A tovbbiakban k-DL(n) lesz a
jellsnk azokra a k-DL nyelvekre, amelyek n logikai attribtumot hasznlnak.
18.13. bra - Az ttermi problmra alkotott dntsi lista
Egy dntsi lista teht szerkezetben megegyezik a Lisp nyelv cond lltsval.
590

tanuls
Els feladatunk annak megmutatsa, hogy a k-DL nyelvek megtanulhatk, azaz brmely k-DL fggvny
pontosan kzelthet, ha kell szm tant mintn tanultunk. Ehhez ki kell szmtanunk a nyelvben felvehet
hipotzisek szmt. Legyen a tesztek nyelve n attribtumot hasznlva, legfeljebb k literlis konjunkcija
Conj(n, k). A dntsi listkat tesztekbl ptjk fel, s minden teszthez egy Igen vagy Nem vlaszt rendelhetnk,
illetve harmadik lehetsgknt a teszt hinyozhat a listrl, ezrt legfeljebb 3 |Conj(n,k)| klnbz teszthalmaz
ltezhet. Ezek a tesztek tetszleges sorrendben alkalmazhatk, gy
|k-DL(n)| 3|Conj(n,k)||Conj(n,k)|!
Az n attribtumot hasznl k literlis lehetsges konjunkciinak szma:
gy nhny lps utn:
Ezt a (18.1) egyenletbe helyettestve megmutathatjuk, hogy a k-DL fggvnyek VKH-tanulshoz szksges
mintk szma polinomilisan n n-nel:
Ennek rtelmben brmely algoritmus, amely konzisztens dntsi listt ad vissza, kis k rtkek esetn
elfogadhat pldaszm alapjn VKH-tanulssal kpes ellltani egy k-DL fggvnyt.
A kvetkez feladatunk, hogy hatkony algoritmust talljunk, amely konzisztens dntsi listt eredmnyez. A
DNTSI-LISTA-TANULS nev moh algoritmust fogjuk hasznlni. Ez ismtelten tall egy olyan tesztet, amely
pontosan a tant halmaz valamely rszhalmaznak felel meg. Amikor tall egy ilyen tesztet, akkor azt
hozzadja a dntsi listhoz, egyben eltvoltva a tesztnek megfelel pldkat a tant halmazbl. Ezek utn
ltrehozza a dntsi lista htralev rszt pusztn a maradk pldkra alapozva. Ezt addig ismtli, amg nem
marad tbb plda. Az algoritmust a 18.14. bra mutatja.
Ez az algoritmus nem specifiklja, hogy milyen mdszert hasznljunk a kvetkez a dntsi listhoz adni
kvnt teszt kivlasztshoz. Br a bemutatott formlisan elrt eredmnyek nem fggnek a kivlaszts
mdszertl, mgis az ltszik jzannak, ha elnyben rszestjk azokat az egyszer teszteket, amelyek az
osztlyozott pldk nagy rszhalmazainak felelnek meg. Ennek eredmnyeknt a dntsi lista a lehet
legtmrebb lesz. A legegyszerbb stratgia, ha azt a legrvidebb t tesztet keressk meg, amely egy tetszleges,
egyforma osztlybasorolssal rendelkez rszhalmaznak megfelel, figyelmen kvl hagyva a rszhalmaz
mrett. Mg ez a megkzelts is egsz jl mkdik, mint az a 18.15. brn lthat.
18.14. bra - Egy dntsi lista tanulsra hasznlhat algoritmus
18.15. bra - A DNTSI-LISTA-TANULS algoritmusnak az ttermi adatokon felvett tanulsi

grbje. Az sszehasonlts kedvrt feltntettk a DNTSI-FA-TANULS algoritmus
grbjt is.
591

tanuls
5.3. Elemzs
A tanuls szmtsi elmlete j szempontbl vilgtotta meg a tanuls problmjt. Az 1960-as vek elejn a
tanuls elmlet az identifikci hatrtmenetben (identification in the limit) problmjra koncentrlt. E
szerint egy identifikcis algoritmusnak mindenkppen vissza kell adnia egy olyan hipotzist, amely pontosan
megegyezik a keresett fggvnnyel. Erre a kvetkezkben ismertetett eljrs ad egy lehetsges mdszert.
Elszr is rendezzk a H hipotzistr minden elemt valamilyen egyszersg mrtk szerint. Ezek utn
vlasszuk azt a legegyszerbb hipotzist, amely konzisztens az sszes mr rendelkezsre ll pldval. Ahogy
jabb pldk rkeznek, a mdszer fel fogja adni az egyszerbb hipotzist, ha az j pldk rvnytelentettk, s
helyette egy bonyolultabbat vlaszt. Amikor elri a keresett fggvnyt, akkor azt mr soha nem fogja feladni.
Sajnlatos, hogy szmos hipotzistrben risi nagy lehet a keresett fggvny elrshez szksges id,
valamint a szksges pldk szma. Ezrt a tanuls szmtsi elmlete nem ragaszkodik ahhoz, hogy a tanul
gens megtallja a krnyezett vezrl egyedli helyes trvnyt. Ehelyett inkbb egy olyan hipotzist keres,
amely egy bizonyos prediktv pontossgot elr. A tanuls szmtsi elmlete ezen fell ersen hangslyozza a
hipotzis nyelv kifejezkpessge s a tanuls komplexitsa kztti kompromisszum fontossgt. Ez az elmlet
vezetett egy fontos tanul algoritmus osztlyhoz, a szupport vektorgpekhez.
Az ltalunk bemutatott, VKH-tanulsra vonatkoz eredmnyek a legrosszabb esetre rvnyesek, nem felttlenl
mutatva azt az tlagos esetre vonatkoz mintakomplexitst, amelyeket viszont a bemutatott tanulsi grbk
tkrznek. Egy, az tlagos esetre vonatkoz analzisnek tovbbi felttelezsekkel kell lnie a mintk
eloszlsrl, valamint a keresett fggvnyek eloszlsrl. Mikzben ezeket a krdseket egyre jobban
megrtjk, a tanuls szmtsi elmlete folyamatosan a gpi tanulssal foglalkoz kutatk hasznos
tmutatjnak bizonyul. Ezek a kutatk algoritmusaik mdostsban vagy algoritmusaik tanulsi kpessgnek
meghatrozsban rdekeltek. A dntsi listk mellett a Boole-fggvnyek szinte minden ismert alosztlyra, a
neurlis hlkra (lsd 20. fejezet), valamint az elsrend logikai lltsok halmazaira (lsd 19. fejezet) szlettek
eredmnyek. Az elrt eredmnyek azt mutatjk, hogy a tisztn indukcis tanuls rendkvl nehz. Tisztn
indukcis tanulson azt a helyzetet rtjk, amelyben az gens nem rendelkezik semmilyen, a keresett
fggvnyre vonatkoz, elzetes ismerettel. Mint a 19. fejezetben megmutatjuk, az elzetes tudsnak az induktv
tanuls vezrlsre val felhasznlsa lehetv teszi, hogy meglehetsen nagy lltshalmazokat elfogadhat
mintaszm alapjn megtanuljunk, mg egy olyan nyelven is, amelynek kifejezereje megegyezik az elsrend
logikval.
592

tanuls
6. sszefoglals
Ebben a fejezetben determinisztikus fggvnyek pldk alapjn val induktv tanulsra koncentrltunk. A fbb
pontok a kvetkezk voltak:
A tanulsnak szmos formja van, amely a cselekv alrendszer jellegtl, a javtani kvnt komponenstl s a
rendelkezsre ll visszacsatolstl fgg.
Ha akr egy tanr, akr a krnyezet lehetv teszi a mintk helyes rtknek visszacsatolst, akkor
ellenrztt tanulsi (supervised learning) problmrl beszlnk. A feladat, amelyet induktv tanulsnak
(inductive learning) is nevezhetnk, abban ll, hogy egy fggvnyt kell megtanulnunk annak bemeneti s
kimeneti minti alapjn. Diszkrt rtkkszlet fggvny tanulst osztlyozsnak (classification), folytonos
rtk fggvny tanulst pedig regresszinak (regression) nevezzk.
Az induktv tanuls magban foglalja, hogy egy, a pldkkal konzisztens hipotzist kell tallnunk. Az
Ockham borotvja (Ockhams razor) elv rtelmben clszer a legegyszerbb konzisztens hipotzis
vlasztsa. Ennek a feladatnak a nehzsgt a vlasztott reprezentci dnten befolysolja.
A dntsi fk (decision trees) alkalmasak tetszleges Boole-fggvny reprezentlsra. Az
informcinyeresgre (information gain) alapoz heurisztika hatkony mdszert biztost egyszer,
konzisztens dntsi fk konstrulsra.
A tanulsi algoritmus teljestmnyt a tanulsi grbn (learning curve) mrhetjk le, amely a
teszthalmazon (test set) mrt predikcis pontossgot mutatja a tant halmaz (training set) mretnek
fggvnyben.
Az egyttes tanulsi mdszerek, pldul a turbzs (boosting), gyakran jobb eredmnyt rnek el, mint az
egyedi mdszerek.
A tanuls szmtsi elmlete (computational learning theory) az induktv tanuls minta komplexitsnak
s szmtsi komplexitsnak analzisre koncentrl. Kompromisszumot kell ktnnk a hipotzis nyelv
kifejezkpessge s a tanuls nehzsge kztt.

Az 1. fejezet felvzolta az induktv tanuls filozfiai vizsglatnak trtnett. William of Ockham (12801349)
volt kornak legnagyobb hats filozfusa s a kzpkori ismeretelmlet, a logika s a metafizika egyik nagy
alakja. Neki tulajdontjk azt a mondst, ami Ockham borotvja nven rgzlt a kztudatban. Latinul: Entia
non sunt multiplicanda praeter necessitatem, ami azt jelenti magyarul, hogy A dolgokat nem kell a
szksgesnl jobban bonyoltani. Sajnos ez a dicsretes monds sehol sem tallhat meg a mveiben pontosan
gy megfogalmazva.
Az EPAM (Elementary Perceiver And Memorizer, Elemi szlel s megjegyz) volt az els rendszerek egyike,
amely dntsi fkat (diszkrimincis hlkat, discrimination nets) hasznlt (Feigenbaum, 1961). Az EPAM
ltrehozsnak clja az emberi fogalom-tanuls kognitv-szimulcis modelljnek megalkotsa volt. A CLSrendszer (Hunt s trsai, 1979) heurisztikus elretekint eljrst hasznlt a dntsi fk konstrukcijra. Az ID3
(Quinlan, 1979) hozta azt a kulcsfontossg tletet, hogy a heurisztikus fggvny hasznlja az
informcitartalmat. Az informcielmletet Claude Shannon fejlesztette ki a kommunikci tanulmnyozsra
(Shannon s Weaver, 1949). (Shannon hozzjrult a gpi tanuls terlethez is, az egyik legkorbbi pldt
szolgltatva mechanikus egervel, amely egy tvesztben naviglt a ksrlet-kudarc elvet hasznlva.) A dntsi
fk 2 metszst Quinlan rta le elszr (Quinlan, 1986). Az ipari felhasznlsra alkalmas C4.5 dntsi fa
programcsomag is Quinlan munkiban tallhat meg (Quinlan, 1993). A dntsi fa tanulsnak egy, az elzktl
fggetlen hagyomnya alakult ki a statisztikusok krben. A Classification and Regression Trees (Breiman s
trsai, 1984), amelyet rviden CART knyv-nek neveznek, az alapvet irodalom e tekintetben.
A tanuls szmos msik algoritmikus megkzeltst is vizsgltk. A pillanatnyilag-legjobb-hipotzis
(current-best-hypothesis) megkzelts egyetlen hipotzissel foglalkozik, specializlva, ha tl tgnak bizonyul,
ltalnostva, ha tl szk. Ez a filozfiban mr rgta ismert elv (Mill, 1843). A kognitv pszicholgia korai
munkjban szintn ezt javasoltk, mint az emberi fogalom tanuls termszetes formjt (Bruner s trsai,
1957). Az MI-terleten ez a megkzelts elssorban Patrick Winston munkjhoz kthet, aki PhDdisszertcijban (Winston, 1970) a komplex objektumok lersnak tanulsval foglalkozott. A verzitr
593

tanuls
(version space) mdszer (Mitchell, 1977; 1982) eltr megkzeltsen alapul, az sszes konzisztens hipotzissel
egyszerre foglalkozik, elhagyva azokat, amelyek az j pldkkal inkonzisztencit mutatnak. Ezt a megkzeltst
a META-DENDRAL kmiai szakrt rendszerben hasznltk (Buchanan s Mitchell, 1978), majd ksbb Mitchell
LEX rendszerben (Mitchell, 1983), ami matematikai analzis problmk tanulssal trtn megoldst clozta.
A harmadik nagyhats irnyzat kialaktsa Michalski s trsai munkjhoz kthet, akik az AQ algoritmusok
sorozatval foglalkoztak, amelyek logikai szablyok halmazt tanultk (Michalski, 1969; Michalski s trsai,
1986b).
Az egyttes tanuls a tanul algoritmusok teljestmnynvelsnek egyre npszerbb mdszere. A zskols
(bagging)7 (Breiman, 1966) az els hatkony mdszer, amely tbbfle indt (bootstrap) adathalmaz alapjn
megtanult hipotzisek kombincijt hozza ltre. Ezeket az adathalmazokat az eredeti alulmintavtelezsvel
lltjk el. A fejezetben ismertetett turbzs (boosting) mdszere eredetileg Schapire elmleti munkjbl
(Schapire, 1990) szrmazik. Az AdaBoost algoritmust Freund s Schapire dolgozta ki (Freund s Schapire,
1996), s Schapire adta meg elmleti analzist (Schapire, 1999). Friedman s trsai statisztikai alapon
trgyaljk a turbzs mdszert (Friedman s trsai, 2000).
A tanulsi algoritmusok elmleti vizsglata Gold munkjval kezddtt (Gold, 1967) az identifikci
hatrtmenetben (identification in the limit) problma tanulmnyozsval. Ez a megkzelts ugyan rszben
tudomnyfilozfiai felfedezsbl eredt (Popper, 1962), de alkalmazsnak legfbb terlete nyelvtanok
pldamondatok alapjn trtn tanulsa volt (Osherson s trsai, 1986).
Mg az identifikci hatrtmenetben megkzelts a vgs konvergencira koncentrl, addig a Kolmogorovkomplexits (Kolmogorov complexity) vagy ms nven algoritmikus komplexits (algorithmic
complexity), amelyet egymstl fggetlenl Solomonoff (1964) s Kolmogorov (1965) fejlesztett ki, formlis
defincit prbl adni az Ockham borotvja elvben hasznlt egyszersgnek. Hogy valahogy kimenekljenek
abbl a csapdbl, hogy az egyszersg fgg az informci reprezentcijnak mdjtl, azt javasoltk, hogy az
egyszersget annak a legrvidebb programnak a hosszval mrjk, amely egy ltalnos Turing-gpen helyesen
adja vissza a megfigyelt adatokat. Br sok klnbz ltalnos Turing-gpet lehet ltrehozni, s gy tbb
klnbz legrvidebb program lehetsges, ezek hossza legfeljebb csak egy konstansban tr el, amely
fggetlen az adatok mennyisgtl. Ezt a gynyr eredmnyt, amely betekintst nyjt abba, hogy brmely
elzetes reprezentcis eltrst vgl maguk az adatok gyznek le, csupn az teszi tnkre, hogy a legrvidebb
program hossznak kiszmtsa eldnthetetlen problmra vezet. Kzelt mrtkeket lehet alkalmazni, pldul
a legrvidebb ler hosszt (minimum description length) vagy LLH-t (Rissanen, 1984), amivel kimagasl
gyakorlati eredmnyeket rtek el. Li s Vitnyi rsa a Kolmogorov komplexits legjobb sszefoglalsa (Li s
Vitnyi, 1993).
A tanuls szmtsi elmlett azaz a VKH-tanuls elmlett Lesli Valiant vezette be (Valiant, 1984). Valiant
munkja a szmtsi komplexitsra s a mintakomplexitsra helyezte a f hangslyt. Michael Kearnsszel egytt
Valiant megmutatta, hogy szmos olyan fogalomosztly van, amely VKH-tanulssal nem kezelhet problma,
mg akkor sem, ha a pldk elegend informcit nyjtanak. Bizonyos problmaosztlyokban, pldul dntsi
listknl, elrtek nhny pozitv eredmnyt (Rivest, 1987).
A mintakomplexits vizsglatnak ettl fggetlen tradcijt tallhatjuk a statisztikusok krben, amely az
egyenletes konvergencia elmletnek (uniform convergence theory) vizsglatval kezddtt (Vapnik s
Cservonenkis, 1971). Az gynevezett VC-dimenzi nagyjbl a VKH tanulsbl szrmaz mrtkhez hasonl
br annl ltalnosabb mrtket ad. A VC-dimenzi, ellenttben a VKH-analzissel, folytonos
fggvnyosztlyokra is alkalmazhat. A VKH-analzis s a VC elmlet kztt elszr a ngy nmet, Blumer,
Ehrenfeucht, Haussler s Warmuth (1989) teremtett kapcsolatot (akik kzl valjban egyik sem nmet). A VC
elmlet tovbbi fejldse vezetett a szupport vektorgp vagy SVM8 (support vector machine) kidolgozshoz
(Boser s trsai, 1992; Vapnik, 1998). A szupport vektorgppel a 20. fejezetben foglalkozunk.
Nagyon sok, a gpi tanulssal foglalkoz fontos publikcit gyjtttek egybe a Readings in Machine Learning
c. ktetben (Shavlik s Dietterich, 1990). A ktktetes Machine Learning 1 (Michalski s trsai, 1983), illetve
Machine Learning 2 (Michalski s trsai, 1986a) is sok fontos kzlst tartalmaz, tovbb hatalmas bibliogrfit.
Weiss s Kulikowski a fggvny tanuls ttekinthet bevezetst adja gpi tanulsi, statisztikai s neurlis
alapokon (Weiss s Kulikowski, 1991). A STATLOG projektben (Michie s trsai, 1994) vgeztk a tanul
algoritmusok teljestmnynek messze legkimertbb sszehasonltst. A jelenleg is foly, a gpi tanulssal
A bagging nv eredetileg a bootstrap aggregating rvidtseknt jelent meg, de az angol bag sz jelentst nagyrszt tvette, ezrt
fordtottuk zskolsnak. (A ford.)
8
Magyarul is az SVM rvidts terjedt el. (A ford.)
7
594

tanuls
foglalkoz fontos kutatsi eredmnyek az International Conference on Machine Learning ves kiadvnyaiban, a
Neural Information Processing Systems konferencin, a Machine Learning s a Journal of Machine Learning
Research folyiratokban, tovbb a fontosabb MI-jsgokban jelennek meg. A tanuls szmtsi elmletnek
eredmnyei megjelennek az ves ACM Workshop on Computational Learning Theory (COLT) kiadvnyokban,
valamint Kearns s Vazirani (1994), tovbb Anthony s Bartlett (1999) publikciiban.
6.2. Feladatok
18.1.
Vizsglja meg a beszlni, illetve egy nyelvet megrteni tanul gyerek problmjt! Magyarzza meg, hogy ez a
folyamat hogyan illeszkedik az ltalnos tanulsi modellhez, s megfelelen azonostsa a modell egyes
komponenseit!
18.2.
Ismtelje meg a 18.1. feladatot a tenisz (vagy valamilyen n ltal ismert sport) tanulsnak esetre! Ez felgyelt
vagy megerstses tanuls?
18.3.
Rajzoljon fel egy dntsi ft arra a problmra, hogy az tkeresztezdsben elinduljunk-e elre, ha a lmpa
ppen most vltott zldre!
18.4.
Soha nem teszteljk ktszer ugyanazt az attribtumot a dntsi fa egy tvonala mentn. Mirt?
18.5.
Tegyk fel, hogy egy dntsi fa segtsgvel generlunk egy tant mintahalmazt, majd dntsi fa tanulst
alkalmazunk erre a halmazra. A tanulsi algoritmus vgl is a helyes dntsi ft fogja visszaadni, ha a tant
halmaz mrete a vgtelenhez tart? Mirt, vagy mirt nem?
18.6.
Egy j butcska tanulsi algoritmus a kvetkez: ksztsnk egy tblzatot az sszes tantpldbl.
Vizsgljuk meg, hogy milyen kimenet szerepel a legtbbszr a tantpldkban: jelljk ezt d-vel. Ezek utn, ha
olyan minta jelenik meg a bemeneten, ami nincs a tblzatban, akkor adjunk vissza d-t. Olyan bemenetekre,
amelyek megtallhatk a tblban, adjuk vissza a tblzatban a bemenethez asszocilt kimeneti rtket (vagy ha
egynl tbb kimeneti rtk van azonos bemenethez, akkor a leggyakrabban elfordult). Implementlja ezt az
algoritmust, s vizsglja meg egy pldnak vlasztott terleten (pldul az tterem problmn) azt, hogy
mennyire mkdik jl! Ennek alapjn fogalmat alkothatunk a tanuls terletnek alapszintjrl a minimlis
elvrhat teljestmnyrl, amelyet minden tanul algoritmusnak el kell rnie.
18.7.
Tegyk fel, hogy egy j algoritmussal tanulsi ksrletet folytat. Egy adathalmazt hasznl, amiben 25-25 plda
van az elfordul kt osztlyra. Azt tervezi, hogy a hagyj-ki-egyet keresztvalidcis mdszert fogja hasznlni.
sszehasonltsi alapknt egy egyszer tbbsgi szavazt hasznl. (A tbbsgi szavaznak megadva egy tant
halmazt, a bemenetektl fggetlenl mindig azt a kimenetet adja, amely kimeneti rtk a halmazban legtbbszr
elfordul.) Azt vrta, hogy a tbbsgi szavaz, a hagyj-ki-egyet keresztvalidciban nagyjbl 50%-ot fog
elrni, de meglepetsre 0% az eredmny. Meg tudja magyarzni, hogy mirt?
18.8.
A dntsi fk rekurzv ellltsa sorn nha elfordul, hogy pozitv s negatv pldk vegyes halmaza marad
egy levlcsompontban, mg akkor is, ha az szszes attribtumot hasznltuk mr. Tegyk fel, hogy p pozitv s
n negatv pldnk van.
a. Mutassa meg, hogy a DNTSI-FA-TANULS algoritmusban hasznlt megolds, amely a tbbsgi osztlyozst
vlasztja, minimalizlja a pldahalmazra vonatkoz abszolt hibt a levlnl!
595

tanuls
b. Mutassa meg, hogy a p/(p + n) osztly-valsznsg (class probability) eredmnyknt val visszaadsa
minimalizlja ngyzetes hiba sszegt!
18.9.
Tegyk fel, hogy egy tanulsi algoritmus konzisztens hipotzist keres, s az osztlyozand pldkat vletlen
mdon generljuk. A pldkat egyenletes eloszlssal vlasztjuk az n Boole-attribtum alapjn kialaktott 2n
plda lehetsgbl. Szmtsa ki, hny plda kell ahhoz, hogy egy ellentmonds felmerlsnek a valsznsge
0,5 legyen!
18.10.
Tegyk fel, hogy egy attribtum a pldk E halmazt Ei rszhalmazokra bontja, s mindegyik rszhalmazban pi
pozitv s ni negatv plda van. Mutassa meg, hogy ha a pi/(pi + ni) arny nem egyforma minden i-re, akkor az
attribtum informcinyeresge biztosan pozitv!
18.11.
Mdostsa a DNTSI-FA-TANULS algoritmust gy, hogy tartalmazza a 2 metszst! A rszleteket megtallhatja
Quinlan rsban (Quinlan, 1986).
18.12.
A fejezetben lert standard DNTSI-FA-TANULS algoritmus nem kpes azon esetek kezelsre, amelyekben
nhny plda esetn hinyoznak attribtumrtkek.
a. Elszr is valamilyen mdszerre van szksgnk, amellyel egy adott dntsi fa alapjn be tudunk sorolni
pldkat akkor is, ha a fban olyan attribtumokra vonatkoz tesztek szerepelnek, amelyek rtke hinyozhat
egyes pldknl. Tegyk fel, hogy az X plda A attribtumra vonatkoz rtke hinyzik, s a dntsi fa
teszteli A-t egy olyan csompontban, amit X elr. Ennek az esetnek egyik kezelsi lehetsge, hogy gy
tesznk, mintha a plda az sszes lehetsges attribtumrtkkel rendelkezne, de slyozzuk az egyes rtkeket
azzal a gyakorisggal, amelyet az sszes olyan pldn mrnk, amely elri a dntsi fa ezen csompontjt. A
besorolsi algoritmusnak minden olyan csompont sszes gt kvetnie kell, amelyben egy rtk hinyzik, s
mindegyik t mentn ssze kell szoroznia a slyokat. rja meg azt a mdostott dntsi fa algoritmust, amely
rendelkezik ezzel a tulajdonsggal!
b. Mdostsa az informcinyeresg szmtst a kvetkez mdon: a fa ptsnek fzisban egy adott
csompontba jut tetszleges C tant pldahalmaznl azok a pldk, amelyeknek hinyzik brmely
htralev (mg nem vizsglt) attribtumhoz tartoz rtke, a C halmazban ezen attribtumra elfordul
rtkgyakorisg szerint kapjanak mint-ha rtket!
18.13.
A 18. fejezetben megmutattuk, hogy azok az attribtumok, amelyeknek nagyon sokfle lehetsges rtkk van,
problmt jelenthetnek az informcinyeresg szmtsnl. Ezek az attribtumok j esllyel nagyon sok kis
osztlyra, akr egyelem osztlyokra bontjk a halmazt, ezrt gy tnik a nyeresg szmtsnl, hogy nagyon
fontosak az adott csompontban. A nyeresgarny (gain ratio) kritrium az attribtumokat az ltaluk hozott
informcinyeresg s a sajt bels informcitartalmuk arnyval mri. A bels informcitartalom arra a
krdsre adott vlasz, hogy Mi az rtke ennek az attribtumnak?. A nyeresgarny kritrium ennek
megfelelen azt prblja mrni, hogy mennyire hatkony informcit biztost a plda helyes osztlyozshoz ez
az attribtum. Alkossa meg az attribtum informcitartalmnak matematikai kifejezst, s mdostsa a
DNTSI-FA-TANULS algoritmust nyeresgarny-alapra!
18.14.
Egy egyttes tanulsi algoritmust vizsgl, amely M megtanult hipotzis eredmnynek egyszer tbbsgi
szavazst hasznlja. Tegyk fel, hogy az sszes hipotzisnek a hibja, s az egyes hipotzisek ltal elkvetett
hibk fggetlenek a tbbiek hibjtl. Adja meg M s fggvnyben azt az sszefggst, amelylyel az egyttes
tanulssal ellltott eszkz hibja szmthat, s szmtsa ki M = 5, 10 s 20, illetve = 0,1, 0,2 s 0,4 esetn!
Ha feladjuk a fggetlensgre vonatkoz felttelezst, akkor elfordulhat-e, hogy az egyttes hibja rosszabb
lesz, mint ?
596

tanuls
18.15.
Ez a feladat a dntsi listk kifejez erejvel foglalkozik (lsd 18.5. alfejezet).
a. Mutassa meg, hogy egy dntsi lista kpes brmely Boole-fggvny reprezentlsra, ha nem korltozzuk a
tesztek mrett!
b. Mutassa meg, hogy ha egy teszt legfeljebb k literlist tartalmazhat, akkor a dntsi lista minden olyan
fggvny reprezentlsra kpes, amely egy k mlysg dntsi fval reprezentlhat!
597
19. fejezet - A tuds szerepe a

tanulsban
Ebben a fejezetben a tanulssal foglalkozunk, de csak akkor, amikor mr tudunk is valamit.
Az elbbi hrom fejezetben bemutatott tanulsi mdszerek mindegyikben az volt az alaptlet, hogy egy olyan
fggvnyt konstrulunk, amelynek bemeneti/kimeneti viselkedse megegyezik azzal, amit az adatoknl
megfigyeltnk. Brmilyen esetet is nznk, a tanulsi mdszer tulajdonkppen nem ms, mint egy megfelel
fggvnynek a hipotzistrben trtn megkeresse, a fggvny formjra vonatkoz igen elemi
felttelezsekbl kiindulva. Ilyen felttelezs lehet pldul, hogy a fggvny egy msodrend polinom vagy
egy dntsi fa, vagy az az elfogultsg, hogy az egyszerbb a jobb. Ennek megvalstsa felrt azzal, mintha
azt mondannk, hogy mieltt valami jat tanulnnk, el kellene felejteni (majdnem) mindent, amit tudunk. Ebben
a fejezetben olyan tanulsi mdszereket tanulmnyozunk, amelyek a priori tudsbl (prior knowledge)
mertenek elnyket. Az esetek tbbsgben az a priori tudst elsrend elmletek segtsgvel reprezentljuk.
gy most elszr fogjuk sszekapcsolni a tudsreprezentcira s a tanulsra vonatkoz eredmnyeket.
1. A tanuls logikai megfogalmazsa

A 18. fejezetben a tisztn induktv tanulst olyan folyamatnak tekintettk, amely egy, az adatokkal konzisztens
hipotzist keresett. Most ezt a defincit olyan esetre pontostjuk, amikor a hipotzist logikai lltsok
halmazval reprezentljuk. A pldalersok s besorolsok szintn logikai lltsok, egy j pldt pedig gy
tudunk osztlyozni, hogy egy osztlyoz lltst a hipotzisbl s a plda lersbl kikvetkeztetnk. Ezzel a
megkzeltssel a hipotziseket inkrementlisan, lltsonknt pthetjk. A megkzelts lehetv teszi az a
priori tuds hasznlatt is, mivel a mr megismert lltsokat bevethetjk j pldk osztlyozsba. A tanuls
logikai megfogalmazsban elszr ltszlag sok a munka, ez azonban a tanuls szmos aspektust segti
tisztzni. Ez lehetv teszi, hogy a 18. fejezetben megismert egyszer tanulsi mdszereket jcskn
tlszrnyaljuk azltal, hogy a logikai kvetkeztets teljes erejt tanulsi clokra hasznljuk.
1.1. Pldk s hipotzisek

Emlkezznk a 18. fejezetben a tanulsi problmra bemutatott tterem pldra: egy olyan dntsi szably
megtanulsra, hogy vajon rdemes-e egy asztalra vrni. A pldkat olyan attribtumokkal (attributes) rtuk
le, mint az Alternatva, Br, Pntek/Szombat stb. Logikai megkzeltsben egy plda egy logikai lltssal lert
objektum; az attribtumok pedig unris prediktumok. Nevezzk ltalnossgban az i-edik pldt Xi-nek. A
18.3. bra els pldjt az albbi lltsok rjk le:
Alternatva(X1) Br(X1) PntekSzombat(X1) hes(X1)
A Di(Xi) jellssel az Xi lersra fogunk hivatkozni, ahol Di tetszleges, egyargumentum logikai kifejezs
lehet. Az objektumok osztlyozst a
VrjunkE(X1)
llts vgzi. Pozitv pldk esetn a Q(Xi), negatv pldk esetn a Q(Xi) ltalnos jellst fogjuk hasznlni. A
teljes tant halmaz az sszes ler s besorol llts konjunkcija.
Logikai megkzeltsben az induktv tanuls clja a Q clprediktummal ekvivalens logikai kifejezs
megtallsa, amivel korrektl tudjuk a pldkat osztlyozni. Mindegyik hipotzis egy-egy javaslat a keresett
logikai kifejezsre, amit mi a clprediktum defincijelltjnek (candidate definition) neveznk. Jelljk Civel a defincijelltet, ekkor mindegyik Hi hipotzis egy x Q(x) Ci(x) formj kifejezs. Pldul a dntsi fa
azt fejezi ki, hogy a clprediktum egy objektum esetben csak akkor igaz, ha az igaz-hoz vezet egyik ga
teljesl. gy a 18.6. brn lthat dntsi fa a kvetkez logikai defincit fejezi ki (amelyre a jvben Hr-rel
fogunk hivatkozni):
r VrjunkE(r) Vendgek(r, Nhny)
Vendgek(r, Tele) hes(r) Konyha(r, Francia)
598
A tuds szerepe a tanulsban

Vendgek(r, Tele) hes(r) Konyha(r, Thai)
Pntek/Szombat(r)
Vendgek(r, Tele) hes(r) Konyha(r, Burger) (19.1)
Mindegyik hipotzis azt jsolja meg, hogy pldk egy bizonyos halmaza, nevezetesen azok, amelyek kielgtik
a hipotzisdefinci jelltjt, a clprediktumnak megfelel pldk lesznek. Ezt a halmazt a prediktum
kiterjedsnek (extension) nevezzk. Kt klnbz kiterjedssel rendelkez hipotzis gy logikailag
ellentmondsban van egymssal, hiszen legalbb egy plda esetn eltr eredmnyt jsolnak. Ha viszont azonos
a kiterjedsk, akkor logikailag ekvivalensek.
A H hipotzistr ezek utn az sszes olyan hipotzis {H1, , Hn} halmaza, amelyek kezelsre a tanul
algoritmust terveztk. Pldul DNTSI-FA-TANULS algoritmus az adott attribtumokkal kialakthat sszes
dntsi fa hipotzissel kpes foglalkozni; gy hipotzistere az sszes dntsi ft tartalmazza. Felteheten a
tanul algoritmus hisz abban, hogy az egyik hipotzis korrekt, azaz hisz a
H1 H2 H3 Hn (19.2)
logikai kifejezsben. Ahogy a pldk rkeznek, a pldkkal nem konzisztens (consistent) hipotziseket ki lehet
zrni. Vizsgljuk meg alaposabban a konzisztencia ezen fogalmt. Nyilvnval, hogy ha a Hi hipotzis a teljes
tant halmazzal konzisztens, akkor mindegyik pldval konzisztensnek kell lennie. Mit jelent viszont az, hogy
valamelyik pldval ellentmondsban van? Ez ktfle mdon trtnhet meg:
A hipotzis szempontjbl egy plda hamis negatv (false negative), ha a valsgban pozitv, de a hipotzis
szerint negatv. Pldul a kvetkez lerssal rendelkez X13 j plda:
Vendgek(X13, Tele) BecsltVrakozsE(X13, 0-10) hes(X13) VrjunkE(X13)
a korbban definilt Hr hipotzis szmra hamis negatv plda lesz. Hr-bl, illetve a plda lersbl
kikvetkeztethet mind a VrjunkE(X13) ezt lltja a plda, mind a VrjunkE(X13) ezt lltja a hipotzis.
Teht a hipotzis s a plda logikailag ellentmondsban van.
A hipotzis szempontjbl egy plda hamis pozitv (false positive), ha a valsgban negatv, de a hipotzis
szerint pozitv.1
Ha egy plda hamis negatv vagy hamis pozitv egy hipotzis szempontjbl, akkor a plda s a hipotzis
logikailag ellentmondsban van egymssal. Feltve, hogy a plda a tnyek korrekt megfigyelsn alapul, a
hipotzist kizrhatjuk. Logikailag ez a kvetkeztets a rezolcis szabllyal pontos analgiban van (lsd 9.
fejezet). Hipotzisek diszjunkcija felel meg egy klznak, a plda pedig megfelel annak a literlisnak, amely a
klzban lev egyik literlissal rezolvl. Egy szoksos logikai kvetkeztet rendszer teht elmletileg tud
pldkbl tanulni oly mdon, hogy egy vagy tbb hipotzist kizr. Tegyk fel pldul, hogy a pldt az I1
lltssal jelljk, s a hipotzistr H1 H2 H3 H4. Ha I1 ellentmondsban van H2-vel s H3-mal, akkor a
logikai kvetkeztet rendszer szrmaztatni tudja az j H1 H4 hipotzisteret.
Teht az induktv tanulst logikai lerssal olyan folyamatknt jellemezhetjk, mint amelyik fokozatosan kizrja
a pldknak ellentmond hipotziseket, leszktve a lehetsgek krt. Mivel a hipotzistr rendszerint nagy
(vagy elsrend logika esetn egyenesen vgtelen), nem javasoljuk egy rezolcialap ttelbizonyt rendszer
ptst s a hipotzistr teljes szmbavtelt. Ehelyett kt megkzeltst trgyalunk, amelyek sokkal kisebb
erfesztssel logikailag ellentmondsmentes hipotziseket kpesek tallni.
1.2. A pillanatnyilag legjobb hipotzis keresse

A pillanatnyilag legjobb hipotzis (current-best-hypothesis) keressi eljrs alapgondolata az, hogy egyetlen
hipotzist vegynk figyelembe, s ha j plda rkezik, akkor ennek figyelembevtelvel alaktsuk t a hipotzist
annak rdekben, hogy az ellentmonds-mentessget fenntartsuk. Az algoritmus alapjt John Stuart Mill rta le
(Mill, 1843), de knnyen lehet, hogy mr korbban megalkottk.
Tegyk fel, hogy van valamilyen hipotzisnk, pldul Hr, amit mr meglehetsen megkedveltnk. Amg egy j
pldval sincs ellentmondsban, semmit sem kell tennnk. Aztn egyszer csak egy hamis negatv plda (X13)
Hamis pozitv s hamis negatv kifejezseket elszr a gygytsban hasznltk arra, hogy a tves laboratriumi eredmnyeket
jellemezzk. Egy eredmny akkor hamis pozitv, ha azt jelzi, hogy a pciens az adott betegsgben szenved, mg valjban nem ez a helyzet.
1
599
rkezik. Mit csinljunk? A 19.1. (a) bra sematikusan gy mutatja be Hr-t, mint egy terletet, a ngyszgn
bell minden Hr kiterjedsbe tartozik. Az eddig ltott pldkat + vagy jelli, s lthat, hogy Hr jl
sorolja be az sszes pldt, mint VrjunkE pozitv vagy negatv pldit. A 19.1. (b) brn egy j hamis negatv
plda jelenik meg (bekarikzva): a hipotzis azt lltja, hogy negatv, pedig valjban pozitv plda. A
hipotzis kiterjedst nvelni kell ahhoz, hogy tartalmazza ezt a pldt is. Ezt a lpst ltalnostsnak
(generalization) nevezzk: egy lehetsges ltalnosts a 19.1. (c) brn lthat. Ezutn a 19.1. (d) brn egy
hamis pozitv pldt ltunk: a hipotzis azt lltja, hogy pozitv, pedig valjban negatv. A hipotzis
kiterjedst cskkenteni kell ahhoz, hogy kizrjuk ezt a pldt. Ezt szktsnek (specialization) nevezzk; a
19.1. (e) brn a hipotzis egy lehetsges szktst ltjuk.
19.1. bra - (a) Egy konzisztens hipotzis. (b) Egy hamis negatv plda. (c) A hipotzist
ltalnostottuk. (d) Egy hamis pozitv plda. (e) A hipotzist szktettk.
Most mr specifiklni tudjuk a 19.2. brn lthat PILLANATNYILAG-LEGJOBB-TANULS algoritmust. Vegyk

szre, hogy valahnyszor ltalnostjuk vagy szktjk a hipotzist, ellenriznnk kell az sszes tbbi pldra,
hiszen nincs garancia arra, hogy a kiterjeds nknyes nvelse/cskkentse elkerli brmelyik msik
negatv/pozitv plda befoglalst/kirekesztst.
19.2. bra - A pillanatnyilag-legjobb-hipotzis tanul algoritmus. Konzisztens hipotzist

keres s viszszalp, ha nem tallhat konzisztens szkts/ltalnosts.
Az ltalnostst s a szktst gy definiltuk, mint olyan mveleteket, amelyek a hipotzis kiterjedst

vltoztatjk meg. Most pontosan meg kell hatroznunk azt, hogy ezek a mveletek hogyan implementlhatk
olyan szintaktikus mveletekknt, amelyek a hipotzishez rendelt defincijelltet gy vltoztatjk meg, hogy
azt egy program vgre tudja hajtani. Ehhez elszr is vegyk szre, hogy az ltalnosts s a szkts egyben
hipotzisek kztti logikai relcik. Ha a C1 defincinak megfelel H1 hipotzis a C2 defincinak megfelel H2
hipotzis ltalnostsa, akkor fenn kell llnia annak, hogy:
x C2(x) C1(x)
Teht ahhoz, hogy a H2 hipotzis ltalnostst ltrehozzuk, egyszeren egy olyan C1 defincit kell tallnunk,
amelyik logikailag kvetkezik C2-bl. Ezt knnyen megtehetjk. Ha pldul C2(x) Alternatva(x) Vendgek(x,
Nhny), akkor egy ltalnostsi lehetsg a C1(x) Vendgek(x, Nhny). Ezt felttelek trlsnek (dropping
conditions) nevezzk. Felfoghatjuk gy, hogy egy gyengbb definci jn ltre, gy a pozitv pldk nagyobb
halmazt teszi lehetv. Szmos egyb ltalnostsi eljrs is ltezik, azon nyelvtl fggen, amelyen a
600
mveleteket vgezzk. Hasonlkppen, egy hipotzist szkteni tudunk, ha tovbbi feltteleket adunk a hozz
tartoz defincijellthz, illetve ha eltvoltunk tagokat egy diszjunktv defincibl. Lssuk, hogyan mkdik
ez az ttermi feladatban, 18.3. bra adatait hasznlva:
Az els plda X1 pozitv. Alternatva(X1) igaz, teht vegyk fel a kvetkez kiindul hipotzist:
H1: x VrjunkE(x) Alternatva(x)
A msodik plda X2 negatv. H1 alapjn pozitv lenne, gy hamis pozitv. Ezrt szktennk kell H1-et. Ezt
megtehetjk pldul gy, hogy egy olyan tovbbi felttelt adunk hozz, amely felttel kizrja X2-t. Egy
lehetsg:
H2: x VrjunkE(x) Alternatva(x) Vendgek(x, Nhny)
A harmadik plda X3 pozitv. H2 alapjn negatv lenne, gy hamis negatv. Teht ltalnostanunk kell H2-t.
Ezt elrhetjk, ha trljk Alternatva felttelt, amely a kvetkez hipotzisre vezet:
H3: x VrjunkE(x) Vendgek(x, Nhny)
A negyedik plda X4 pozitv. H3 alapjn negatv lenne, gy hamis negatv. gy ltalnostanunk kell H3-at.
Nem trlhetjk Vendgek felttelt, mert ez egy mindent tartalmaz hipotzishez vezetne, ami
ellentmondsban van X2-vel. Egyik lehetsg a kvetkez diszjunkci bevezetse:
H4: x VrjunkE(x) Vendgek(x, Nhny)
(Vendgek(x, Tele) Pntek/Szombat(x))
A hipotzis ezek utn mr kezd sszernek tnni. Nyilvnval, hogy ms lehetsgek is vannak, amelyek
konzisztensek az els ngy pldval, kett ezek kzl:
A PILLANATNYILAG-LEGJOBB-TANULS algoritmust nem determinisztikusan rjuk le, mivel brmely ponton

szmos olyan szktsi vagy ltalnostsi lehetsg lehet, melyek brmelyikt alkalmazhatjuk. A mr
meghozott dntsek nem szksgszeren vezetnek a legegyszerbb hipotzishez, st olyan megoldhatatlan
szitucihoz is vezethetnek, amelyben nincs a hipotzisnek olyan egyszer mdostsa, amely minden adattal
konzisztens hipotzist llt el. Ilyen esetekben a programnak egy elz vlasztsi ponthoz kell visszalpnie.
A PILLANATNYILAG-LEGJOBB-TANULS algoritmust s klnbz vltozatait szmos gpi tanulst
felhasznl rendszerben alkalmaztk, elszr Patrick Winston (Winston, 1970) v-tanul programjban.
Azonban ha a tr nagy, s nagyszm pldval dolgozunk, akkor bizonyos nehzsgek merlnek fel:
1. Az sszes elz plda jraellenrzse minden egyes mdostsnl nagyon munkaignyes.
2. Nehz j keressi heurisztikt tallni, s a visszalpsek rkk tarthatnak. Mint a 18. fejezetben mr lttuk,
a hipotzistr ktszeresen exponencilisan nagy tr lehet.
1.3. Legkisebb megkts elv keress

A visszalpsre azrt van szksg, mert a pillanatnyilag-legjobb-hipotzis eljrsban vlasztani kell egy
legjobb becslst, egy partikulris hipotzist, akkor is, ha mg nincs elg adatunk ahhoz, hogy biztosak legynk a
vlasztsunk helyessgben. Ehelyett azt tehetjk, hogy az sszes olyan s csak olyan hipotzist megtartjuk,
amelyek az eddigi adatainkkal konzisztensek. Ezek utn mindegyik j eset vagy nincs hatssal, vagy kizr
nhnyat a hipotziseink kzl. Emlkezznk arra, hogy a hipotzistr egy diszjunktv lltsnak tekinthet:
H1 H2 H3 Hn
Ahogy egyre tbb hipotzis bizonyul a pldkkal inkonzisztensnek, ez a diszjunktv llts zsugorodik, csak
azokat a hipotziseket tartva meg, amelyeket nem szrtnk ki. Feltve, hogy az eredeti hipotzistr tartalmazza
a helyes vlaszt, a reduklt diszjunktv lltsnak is szksgszeren tartalmaznia kell azt, hiszen csak inkorrekt
601
hipotziseket szrtnk ki. A megmaradt hipotzisek halmazt nevezzk verzitrnek (version space). Az ilyen
elven mkd tanulsi algoritmust (amelyet a 19.3. brn vzoltunk fel) verzitr tanulsi algoritmusnak (ms
nven jellteltvoltsi candidate elimination algoritmusnak) nevezzk.
19.3. bra - Verzitr tanul algoritmus. V-nek olyan rszhalmazt tanulja meg,
amelynek elemei a pldkkal konzisztensek.
Fontos tulajdonsga ennek a megkzeltsnek, hogy inkrementlis: soha nem kell visszalpnnk s
jravizsglnunk a rgi pldkat. Az sszes megmaradt hipotzis garantltan konzisztens az sszes pldval.
Msrszt legkisebb megkts elv (least commitment) algoritmusnak is nevezhetjk, ugyanis nem tesz
nknyes vlasztsokat (v. a 11. fejezetben tallhat rszben rendezett tervkszt algoritmussal). Van viszont
egy nyilvnval problma. Mr leszgeztk, hogy a hipotzistr risi, hogyan tudjuk akkor lerni ezt az risi
diszjunktv lltst?
19.4. bra - A verzitr a pldkkal konzisztens sszes hipotzist tartalmazza
602
A kvetkez egyszer analgia sokat segt a megrtsben. Hogyan brzoljuk az szszes 1 s 2 kz es vals
szmot? Vgl is vgtelen sok ilyen van! A megolds az intervallumbrzols, amelyik csak a halmaz hatrait
specifiklja: [1, 2]. Ez azrt mkdik, mert a vals szmok felett rtelmezett egy rendezs.
A hipotzistr felett is rendelkeznk rendezssel, nevezetesen az ltalnosts/szkts alapjn. Ez egy rszleges
rendezs, ami azt jelenti, hogy a hatr nem egy pont, hanem a hipotzisek egy halmaza: a hatrhalmaz
(boundary set). A nagyszer a dologban az, hogy a teljes verzitr reprezentlhat csupn kt hatrhalmaz: egy
legltalnosabb hatrhalmaz (a G halmaz) s egy legszkebb hatrhalmaz (az S halmaz) segtsgvel. E kett
kz es brmely hipotzis garantltan konzisztens az sszes pldval. Mieltt ezt bizonytjuk, rviden foglaljuk
ssze az eddigieket:
A jelenlegi verzitr azon hipotzisek halmaza, amelyek az sszes eddigi pldval konzisztensek. Ezt az S
halmaz s a G halmaz segtsgvel brzoljuk, mindkett a hipotzisek valamilyen halmaza.
Az S halmaz sszes eleme konzisztens az sszes eddigi megfigyelssel, s nincs ennl szkebb konzisztens
hipotzis.
A G halmaz sszes eleme konzisztens az sszes eddigi megfigyelssel, s nincs ennl ltalnosabb
konzisztens hipotzis.
Azt kvnjuk meg, hogy a kezdeti tr (mieltt brmelyik pldt megvizsgltuk volna), az sszes elkpzelhet
hipotzist tartalmazza. Ezt gy biztostjuk, hogy a G halmazt egyszeren az Igaz rtkre lltjuk (az a hipotzis,
amely mindent tartalmaz), az S halmazt pedig egyszeren a Hamis rtkre lltjuk (az a hipotzis, amelynek
kiterjedse res).
A 19.4. bra a verzitr hatrhalmazokkal val brzolsnak ltalnos struktrjt mutatja. Ahhoz, hogy
megmutassuk, hogy ez az brzols elgsges, kt tulajdonsgra van szksgnk:
603
1. Mindegyik konzisztens hipotzis (amelyik nem valamelyik hatrhalmaz eleme) szkebb, mint a G halmaz
valamelyik eleme, s ltalnosabb, mint az S halmaz valamelyik eleme. (Azaz nincsenek kvl kbor
elemek.) Ez kzvetlenl kvetkezik az S s G defincijbl. Ha lenne egy kbor h, akkor az vagy nem
lehetne szkebb G valamely elemnl, teht G-hez kellene tartoznia, vagy nem lehetne ltalnosabb S
valamely elemnl, ebben az esetben viszont S-hez tartozna.
2. Mindegyik hipotzis, amelyik szkebb a G halmaz valamely elemnl, s ltalnosabb az S halmaz valamely
elemnl, konzisztens hipotzis (azaz a hatrok kztt nincsenek lyukak). Brmely az S s G kz es
h-nak az sszes olyan negatv pldt vissza kell utastania, amelyet G minden egyes tagja visszautast (mivel
szkebb), ugyanakkor el kell fogadnia az sszes pozitv pldt, amelyet az S akrmelyik tagja elfogad (mivel
ltalnosabb). gy h az sszes pldt jl kezeli, teht nem lehet inkonzisztens. A 19.5. bra mutatja be a
helyzetet: nincs ismert plda, amely S-en kvl, de G-n bell helyezkedik el, gy a kett kzt elhelyezked
sszes hipotzisnek konzisztensnek kell lennie.
19.5. bra - A G s az S elemeinek kiterjesztsei. A kett kztt nem tallhat ismert

plda.
Bemutattuk teht, hogy ha S-t s G-t defincijuknak megfelelen kezeljk, akkor a verzitr kielgt lerst
adjk. Az egyetlen htralv problma, hogy hogyan mdostsuk S-t s G-t egy j plda esetn (a VERZI-TRMDOSTS fggvny feladata). Elsre ez meglehetsen bonyolultnak tnik, de a defincik s a 19.4. bra
alapjn nem tl nehz az algoritmus ellltsa.
Az S s G halmazok Si s Gi elemeivel kell foglalkoznunk. Az j plda brmelyik esetn lehet hamis pozitv
vagy hamis negatv.
1. Si-re hamis pozitv. Azt jelenti, hogy Si tl ltalnos, de mivel Si-nek (a defincija rtelmben) nincs
konzisztens szktse, gy Si-t eltvoltjuk az S halmazbl.
2. Si-re hamis negatv. Azt jelenti, hogy Si tl szk, gy Si-t az sszes kzvetlen ltalnostsval helyettestjk,
feltve, hogy ezek szkebbek, mint G egyes elemei.
3. Gi-re hamis pozitv. Azt jelenti, hogy Gi tl ltalnos, gy az sszes kzvetlen szktsvel helyettestjk,
feltve, hogy ezek ltalnosabbak, mint S egyes elemei.
604
4. Gi-re hamis negatv. Azt jelenti, hogy Gi tl szk, de mivel nincs konzisztens ltalnostsa (defincija
rtelmben), gy Gi-t eltvoltjuk a G halmazbl.
Ezeket a mveleteket minden j pldra elvgezzk addig, amg az albbi hrom eset valamelyike fel nem lp:
1. Pontosan egy hipotzis marad a verzitrben, ebben az esetben ezt adjuk vissza mint az egyetlen hipotzist.
2. A verzitr sszeomlik vagy S, vagy G ress vlik, azt jelezve, hogy nincs a tant halmazra nzve
konzisztens hipotzis. Ez megegyezik az egyszer dntsi fa algoritmus sikertelen kimenetelvel.
3. Kifogyunk a pldkbl, mikzben szmos hipotzis maradt a verzitrben. Ez azt jelenti, hogy a verzitr a
hipotzisek diszjunkcijt reprezentlja. Ha egy j plda esetn a diszjunkci sszes tagjban azonos
eredmnyt kapunk, akkor ezt adhatjuk vissza mint a plda besorolst. Ha az eredmnyek nem egyeznek
meg, akkor egyik lehetsgknt alkalmazhatjuk a tbbsgi szavazst.
Gyakorls cljra hagyjuk a VERZI-TR-TANULS algoritmusnak az ttermi adatokra val alkalmazst.
A verzitr megkzeltsnek kt alapvet htrnya van:
Ha a problmaterlet adatai zajt tartalmaznak, vagy ha az attribtumok a pontos besorolshoz nem
elgsgesek, akkor a verzitr mindig sszeomlik.
Ha korltlan mret diszjunkcit megengednk a hipotzistrben, akkor az S halmaz mindig tartalmazni fog
egy egyedi legszkebb hipotzist, nevezetesen az sszes eddig ltott pozitv plda diszjunkcijt.
Hasonlkppen a G halmaz tartalmazni fogja a negatv pldk diszjunkcijnak negltjt.
Egyes hipotzistereknl az S- s a G-beli elemek szma az attribtumok szmban exponencilisan
nvekedhet annak ellenre, hogy az ilyen hipotzisterekhez ismertek hatkony tanul algoritmusok.
A zaj problmjra napjainkig nem ismert teljes, sikeres megolds. A diszjunktv kapcsolatok problmja
kezelhet oly mdon, hogy csak korltozott mret diszjunktv formkat engednk meg, vagy az ltalnosabb
prediktumokra egy ltalnostsi hierarchit (generalization hierarchy) vezetnk be. Pldul a
BecsltVrakozs(x, 30-60) BecsltVrakozs(x, >60) helyett hasznlhatjuk a HosszVrakozs(x) literlt.
Az ltalnostsi s a szktsi mveletek egyszeren kiterjeszthetk ennek kezelsre.
A verzitr algoritmus tiszta vltozatt elszr a Meta-DENDRAL rendszerben alkalmaztk. Ezt a rendszert olyan
szablyok megtanulsra terveztk, amelyek azt rjk le, hogy egy tmegspektromterben a molekulk hogyan
esnek szt darabokra (Buchanan s Mitchell, 1978). A Meta-DENDRAL kpes volt olyan szablyok generlsra,
amelyek elg jak voltak egy analitikus kmival foglalkoz jsgban val publiklhatsghoz. Ezek voltak az
els egy szmtgpes program ltal felfedezett vals tudomnyos eredmnyek. Az algoritmust az elegns
LEX rendszerben (Mitchell s trsai, 1983) szintn hasznltk, ez a rendszer sajt sikereinek s kudarcainak
tanulmnyozsa alapjn szimbolikus integrlsi problmk megoldsnak megtanulsra volt kpes. Br a
verzitr-mdszerek valsznleg a legtbb vals problma tanulsa esetn fleg a zaj miatt nem
praktikusak, j betekintst adnak a hipotzistr logikai szerkezetbe.
2. A tuds szerepe a tanulsban

Az elbbi rszben az induktv tanuls egyszer smjval foglalkoztunk. Ahhoz, hogy a httrtuds szerept
megrthessk, beszlnnk kell a hipotzisek, a pldalersok s a besorolsok kztti kapcsolatrl. Jellje a
Lersok az sszes pldalers konjunkcijt s a Besorolsok a pldabesorolsok konjunkcijt. A
megfigyelst megmagyarz Hipotzis-nek akkor a kvetkez tulajdonsggal kell rendelkeznie (emlkezznk,
hogy a jelentse a logikailag maga utn vonz):
Hipotzis Lersok Besorolsok
(19.3)
Az ilyen kapcsolatot, ahol a Hipotzis az ismeretlen, vonzatknyszernek (entailment constraint) nevezzk.

Ennek a knyszernek a megoldsa a tiszta induktv tanuls, amikor a Hipotzis-t valamilyen elre definilt
hipotzistrbl vesszk. Ha pldul a dntsi ft logikai formulnak tekintjk (lsd 1.1. szakasz - Pldk s
hipotzisek rszben (19.1) kplet), akkor egy dntsi fa, amely az sszes pldval konzisztens, kielgti a (19.3)
kpletet. Termszetesen abban az esetben, ha a hipotzisek logikai formjt semmiben nem korltozzuk, a
Hipotzis = Besorolsok szintn teljesti a knyszert. ltalban az Ockham borotvja elve azt sugallja, hogy kis
605
konzisztens hipotziseket kellene elnyben rszesteni, valami jobbat kell teht kitallnunk annl, minthogy
csupn a pldkat memorizljuk.
Fontos
Az induktv tanuls ezen egyszer kpe az 1980-as vek elejig uralkodott. A korszer megkzelts
az, hogy olyan genseket terveznk, amelyek mr tudnak valamit, s amelyek igyekeznek, hogy mg
tbbet tudjanak. Lehet, hogy ez nem tnik flelmetesen mly gondolatnak, azonban igen nagy
klnbsget jelent, ha az gensek tervezst tekintjk. St az is lehet, hogy ez a megkzelts
valamilyen mrtkben hozzjrul annak megrtshez, hogy a tudomny maga hogyan mkdik. Az
ltalnos sma a 19.6. brn lthat.
19.6. bra - A kumulatv tanulsi folyamat felhasznlja s idvel folyamatosan bvti a

httrtuds kszlett
Amennyiben egy httrtudst felhasznl autonm tanul genst szeretnnk felpteni, az gensnek legelszr
valamilyen mdszerrel meg kell szereznie a httrtudst, hogy utna azt az j tanulsi epizdokban
felhasznlhassa. E mdszernek nmagban is egy tanulsi folyamatnak kell lennie. Az gens lettjt gy
kumulatv vagy inkrementlis fejlds jellemzi. Az gens felttelezheten a semmibl kezdhet, egy j kis
induktv program mintjra. Ha egyszer azonban evett mr a Tuds Fjbl, tbb ilyen naiv spekulcira nem
adhatja a fejt, s a httrtudst a minl hatsosabb tanulsra kell fordtania. A krds most az, hogyan tudjuk
ezt megvalstani.
2.1. Nhny egyszer plda

Nzznk nhny jzan sz pldt a httrtuds felhasznlsval trtn tanulsra. Sok, a kvetkeztetsen
alapul, ltszlag racionlis viselkedsrl ki fog derlni, hogy ha a megfigyelseket is figyelembe kell venni,
nyilvnval lesz, hogy az gens nem a tiszta indukci egyszer elvt kveti.
Nha az ltalnos konklzit mr egyetlenegy megfigyels alapjn megfogalmazhatjuk. Gary Larson egy
karikatrjban Zog, a szemveges sember egy fanyrs vgre tztt gykot st a tz felett. Kevsb
intelligens barlangtrsainak bmulatba ejtett csoportja figyeli: k az ennivalt a tz felett csupasz kezkben
tartjk. Ez a megvilgost tapasztalat elegend, hogy a csoport tagjai a fjdalommentes fzs elvt
elsajttsk.
Vagy vegyk pldul a Brazliba rkez utaz esett, amikor is az els brazil bennszlttel tallkozik.
Hallvn, hogy az portuglul beszl, utaznk egybl megllaptja, hogy Brazliban mindenki beszl
portuglul, felfedezvn azonban, hogy a bennszlttet Fernandnak hvjk, ezt a felfedezst az sszes brazil
frfira egyltaln nem terjeszti ki. Hasonl esetek a tudomnyra is jellemzk. Amikor pldul egy kezd
fizikushallgat egy adott hmrsklet rzmintnak a srsgt s az elektromos vezetkpessgt mri, a
mrsi eredmnyeket magabiztosan ltalnostja a rz minden lehetsges darabkjra. Ha azonban a minta
tmegt mri, meg sem fordul a fejben, hogy ms rzdarabkknak is ez lenne a tmege. Ez az ltalnost
feltevs viszont egszen rtelmes lenne, ha pldul az amerikai 1 centes rmkrl lenne sz.
Vgl vegyk egy gygykezelsben jratlan, diagnosztikai szempontbl azonban kpzett orvostanhallgat
esett, aki egy pciens s egy szakrt belgygysz konzultcijt figyeli. Egy sor krds s felelet utn a
szakrt egy bizonyos antibiotikumos gygykezelst r el a pciens rszre. A hallgatnk azt az ltalnos
szablyt fogalmazza meg, hogy ez a konkrt antibiotikum hatsos erre a konkrt tpus fertzsre.
606
Fontos
Ezek mind olyan esetek, amikor a httrtuds felhasznlsa sokkal gyorsabb tanulst tesz lehetv
ahhoz kpest, mint amit a tisztn induktv programtl el lehetne vrni.
2.2. Nhny ltalnos sma

Az elz pldkban azrt fordulunk a httrtudshoz, hogy a megvlasztott ltalnostst megprbljuk igazolni.
Most azt nzzk meg, mik azok a vonzatknyszerek, amelyek ott rejtznek. A knyszerek a Hipotzis-en, a
megfigyelt Lersok-on s a Besorolsok-on kvl a Httrtuds-ra is kiterjednek.
A gyksts esetn az semberek gy ltalnostottak, hogy megmagyarztk a nyrs sikert: a nyrs megtartja a
gykot a tz felett, mikzben a kz srtetlen marad. Ebbl a magyarzatbl azt az ltalnos szablyt vonhatjk
le, hogy egy hossz, merev, hegyes objektum alkalmas a kis, puha test, ehet dolgok stshez. Az ilyen
ltalnost folyamatot magyarzatalap tanulsnak vagy MAT-nak (explanation-based learning, EBL)
nevezzk. Figyeljk meg, hogy az ltalnos szably az semberek birtokban lv httrtudsbl logikai mdon
kvetkezik. A MAT ltal teljestett vonzatknyszerek teht a kvetezk:
Httrtuds Hipotzis
Fontos
Az els knyszer a (19.3) kplettel megegyezik, azrt a MAT-ot eredetileg a pldkbl val tanuls
jobb mdszernek tekintettk. Azonban amiatt, hogy a httrtudsnak elegendnek kell lennie a
Hipotzis megmagyarzshoz is, ami viszont a megfigyelst magyarzza meg, a megfigyelt esetbl az
gens igazbl semmi tnyszeren jat nem tanul. Az gens a pldt akr ki is kvetkeztethette volna az
ismert tudsanyag alapjn, br elkpzelhet, hogy ez elfogadhatatlan mennyisg szmtssal jrt volna
egytt. jabban a MAT-ot gy tekintik, mint az egyik olyan mdszert, amely elsdleges elmleteknek
specilis cl tudsba val konvertlst vgzi. A MAT algoritmussal a 19.3. alfejezetben
foglalkozunk.
A Brazliba utaznak egszen ms a helyzete. Az utas szksgszeren nem is kpes megmagyarzni, hogy
Fernando mirt beszl gy, ahogy beszl, amg az idevg ppai bullkat nem ismeri. Az ltalnostsra
azonban kpes lesz a trtnelemben teljesen jratlan utas is. Ebben az esetben a relevns httrtuds az, hogy
minden egyes orszgban az emberek tbbsge ugyanazt a nyelvet beszli. Azt azonban nem ttelezzk fel, hogy
minden brazil embert Fernandnak hvnak, mert az effajta szablyossg a nevekre nem vonatkozik.
Hasonlkppen, az elsves fizikushallgat is nehezen tud magyarzatot adni a rznl felfedezett vezetsi s
srsgi rtkekre. Azt azonban tudja, hogy a vezetst az objektum anyaga s annak hmrsklete hatrozza
meg egyttesen. Mindegyik esetben az a priori Httrtuds szerepe az, hogy a clprediktum szempontjbl
relevns tulajdonsghalmazok krlhatrolhatk legyenek. Ez a tuds megfigyelsekkel egytt lehetv teszi,
hogy az gens j, ltalnos szablyt hozzon ltre megfigyelseinek megmagyarzsra:
Httertuds Lersok Besorolsok Hipotzis (19.4)
Ezt a fajta ltalnostst relevanciaalap tanulsnak vagy RAT-nak (relevance-based learning, RBL)
nevezzk (br ez az elnevezs mg nem mondhat teljesen elfogadottnak). Vegyk szre, hogy annak ellenre,
hogy a RAT a megfigyelsek tartalmt felhasznlja, a megfigyelsek s a httrtuds logikai tartalmn tlmutat
hipotziseket nem eredmnyez. Ez a tanuls egy deduktv formja, s egymagban nem lehet felels j
tudsanyagnak az alapokbl val ltrehozsrt.
A szakrtt figyel orvostanhallgat esetben felttelezzk, hogy a hallgat elzetes tudsa elegend ahhoz,
hogy a pciens D betegsgt a tnetekbl megllaptsa. Ez azonban nem elegend annak indoklsra, hogy az
orvos mirt ppen az M orvossgot rta fel. A hallgatnak egy msik szablyt kell javasolnia, azaz, hogy az M
orvossg a D-vel szemben hatsos. Ezzel a szabllyal s a hallgat elzetes tudsval most mr kpes
magyarzatot adni, hogy az orvos ebben a konkrt esetben mirt az M gygyszert rja fel. A pldt
ltalnosthatjuk egy vonzatknyszer megadsval:
Httrtuds Hipotzis Lersok Besorolsok (19.5)
607
Fontos
Pldk magyarzatt teht a httrtuds s az j hipotzis egyttesen adja meg. A tisztn induktv
tanulshoz hasonlan a tanul algoritmusnak a lehet legegyszerbb s a knyszerekkel konzisztens
hipotziseket kellene ellltania. A (19.5) knyszert teljest algoritmusokat tudsalap induktv
tanulsnak vagy TIT-nek (knowledgebased inductive learning, KBIL) nevezzk.
A 19.5. alfejezetben rszletesen lert TIT algoritmusokat fleg az induktv logikai programozs, ILP
(inductive logical programming) terletn tanulmnyoztk. Az elzetes tudsnak egy ILP-rendszerben kt
kulcsszerepe van a tanuls komplexitsnak cskkentsben:
1. Tekintettel arra, hogy a megfogalmazott hipotzisek mindegyiknek konzisztensnek kell lennie a
megfigyelsekkel s az elzetes tudssal is, tnylegesen egy reduklt hipotzistrrel van dolgunk, hiszen ez a
hipotzistr csakis azokat az elmleteket tartalmazza, amelyek az eddig ismert dolgokkal konzisztensek.
2. Brmilyen adott megfigyelshalmaz esetn a megfigyelsek magyarzatt megad hipotzis lnyegesen
reduklt mret lehet, hiszen a megfigyelseket magyarz j szablyok meghatrozshoz az elzetes tuds
is rendelkezsnkre ll. Viszont minl kisebb a hipotzis, annl knnyebb azt megtallni.
Az a priori tuds befogadsn tl, az ILP-rendszerek kpesek arra, hogy hipotziseket ltalnos elsrend
logikban s nem a 18. fejezetben hasznlt, korltozott attribtumalap nyelven fogalmazzk meg. Ez azt is
jelenti, hogy az ILP-rendszerek kpesek olyan krnyezetekben tanulni, amelyek rthetetlenek az egyszerbb
rendszerek szmra.
3. Magyarzatalap tanuls
Ahogy a fejezet bevezetjben elmagyarztuk, a magyarzatalap tanuls olyan mdszer, ami megfigyelsekbl
ltalnos szablyokat nyer ki. Tekintsk pldul az algebrai kifejezsek egyszerstst s differencilst (lsd
9.15. feladat). X2-et X szerint differencilva 2X-et kapunk (vegyk szre, hogy az aritmetikai ismeretlent nagy X
betvel jelljk az x logikai vltoztl megklnbztetve). Egy logikai kvetkeztet rendszerben a clt gy a
KRDEZ(Derivlt(X2, X) = d, TB) kifejezssel fejezhetjk ki, ahol a megolds a d = 2X.
Brki, aki a differencilszmtst ismeri, a megoldst rnzsre tudja. Az ilyen problmkkal els alkalommal
tallkoz hallgatnak vagy netn a tapasztalatot nlklz programnak sokkal nehezebb lesz a dolga. A
differencils kzismert szablyai segtsgvel a kifejezst elbb-utbb az 1 (2 (X(21))) alakra lehet hozni, s
ez elbb-utbb elvezet minket a 2X-hez. A szerzk logikai programjnak ez 136 bizonytsi lpsbe kerlt,
amibl 99 lps a bizonyts zskutca elgazsaira esett. Ezt tapasztalva azt szeretnnk, ha a program
ugyanennek a problmnak a megoldst a kvetkez alkalommal lnyegesen gyorsabban adn meg.
A memoizls (memoization) mdszert a szmtgp-tudomnyban rgta alkalmazzk, miszerint a
szmtsok meggyorsthatk az eredmnyek eltrolsa rvn. A memofggvny alapgondolata, hogy
bemenet/kimenet prokat gyjtnk ki egy kln adatbzisba. Meghvskor a fggvny elszr megvizsglja az
adatbzist, htha a problma teljes jbli megoldst gy meg tudja kerlni. A magyarzatalap tanuls ezt az
tletet tovbbfejleszti gy, hogy egy ltalnos szablyt fogalmaz meg, amely az esetek egsz osztlyt kpes
lefedni. A differencils esetben a memoizls emlkezne ugyan arra, hogy az X2-nek X szerinti derivltja 2X, a
Z2 Z szerinti derivltjnak kiszmtst azonban teljes egszben az gensre hagyn. Clszer lenne, ha egy
olyan ltalnos szablyt2 tudnnk megfogalmazni, amely minden lehetsges u aritmetikai ismeretlen esetn
megadn, hogy az u2-nek u szerint derivltja 2u. A logikban ezt az albbi szabllyal fejezhetjk ki:
AritmetikaiIsmeretlen(u) Derivlt(u2, u) = 2u
Ha a tudsbzis rendelkezik egy ilyen szabllyal, akkor minden j eset, ami a szably egy pldnya, azonnal
megoldhat.
Fontos
Termszetesen ez csupn egy trivilis plda egy igen ltalnos jelensgre. Ha egyszer megrtettnk
valamit, azt ltalnostva ms krlmnyek kztt is felhasznlhatjuk. Egy nyilvnval megoldsi
Termszetesen az un ltalnos szablyt is meg tudnnk valstani, a mondanivalt azonban a kzlt plda is jl illusztrlja.
608
lpst kapunk, amely ptkockaknt felhasznlhat bonyolultabb problmk megoldsban. Alfred

North Whitehead, aki Bertrand Russell-lel egytt a Principia Mathematica trsszerzje taln a Zog
felfedezse jelleg esemnyek megrtshez sajt magra alkalmazva a MAT elvt azt rta, hogy A
civilizci azltal halad elre, hogy szaportja azoknak a fontos cselekvseknek a szmt, amelyeket
gondolkods nlkl vghezvihetnk (Whitehead, 1911). Ha n, kedves olvas, a derivlsi plda
lnyegt megrtette, akkor az agya mr buzgn azon dolgozik, hogy megksrelje a magyarzatalap
tanuls ltalnos elvt kinyerni ebbl a pldbl. Figyelje meg, hogy hacsak nem lnyegesen okosabb a
szerzknl, a magyarzatalap plda bemutatsa eltt mg nem ismerte fel a MAT-ot. A Zogot figyel
semberekhez hasonlan nnek (s neknk is) egy pldt kellett ltnunk, mieltt az alapelvet meg
tudtuk fogalmazni. Ez azrt van gy, mert megmagyarzni, hogy mirt j egy tlet, sokkal knnyebb,
mint magt az tletet megfogalmazni.
3.1. ltalnos szablyok kinyerse pldkbl

A MAT alaptlete az, hogy elszr az elzetes tudsra alapozva megkonstruljuk a megfigyels magyarzatt,
majd meghatrozzuk annak az esetosztlynak a defincijt, amelyre a megkonstrult magyarzat alkalmazhat.
A definci alapul szolgl az osztly eseteit lefed szably szmra. A magyarzat lehet egy logikai
bizonyts, de ltalnossgban lehet akrmilyen kvetkeztetsi vagy problmamegold folyamat, feltve, hogy a
lpsei jl definiltak. Kulcsfontossg azoknak a szksges feltteleknek az azonostsa, amelyek rvn az
egyes lpsek ms esetre is alkalmazhatk lesznek.
Kvetkeztet rendszerknt a 9. fejezetben lert egyszer, htrahalad ttelbizonyt rendszert fogjuk hasznlni.
A Derivlt(X2, X) = 2X bizonytsi fja tlsgosan nagy ahhoz, hogy pldaknt szerepeljen, ezrt az ltalnosts
mdszertant egy valamivel egyszerbb pldval fogjuk illusztrlni. Tegyk fel, hogy az 1 (0 + X) kifejezst
akarjuk egyszersteni. A tudsbzis az albbi szablyokat tartalmazza:
trs(u, v) Egyszersts(v, w) Egyszersts(u, w)
Primitv(u) Egyszersts(u, u)
AritmetikaiIsmeretlen(u) Primitv(u)
Szm(u) Primitv(u)
trs(1 u, u)
trs(0 + u, u)
Annak bizonytsa, hogy a vlasz X, a 19.7. bra fels rszben lthat. A MAT-mdszer egyidben kt
bizonytsi ft konstrul. A msodik bizonytsi fa a szabad vltozkkal rendelkez clt hasznlja, ahol az
eredeti cl konstansait vltozkkal helyettestettk. Ahogy az eredeti bizonyts halad elre, gy halad a szabad
vltozs bizonyts is, pontosan ugyanazokat a szablyokat alkalmazva. Lehetsges, hogy nhny vltozt
kzben le kell ktni. Ahhoz, hogy az trs(1 u, u) szablyt hasznlhassuk, az trs(x (y + z), v) rszcl x
vltozjt 1-re kell lektni. Hasonlkppen az trs(y + z, v') rszcl y vltozjt 0-ra kell lektni, ha az
trs(0 + u, u) szablyt szeretnnk alkalmazni. Az ltalnostott bizonytsi fa birtokban a levelekbl (a
szksges ktseket figyelembe vve) a clprediktum ltalnos szablyt kpezzk:
trs(1 (0 + z),0 + z) trs(0 + z, z) AritmetikaiIsmeretlen(z)
Egyszersts(1 (0 + z), z)
Vegyk szre, hogy a bal oldal els kt felttele igaz fggetlenl attl, hogy z-nek mi az rtke. gy ezeket
kihagyhatjuk a szablybl, s eredmnyl azt kapjuk, hogy:
AritmetikaiIsmeretlen(z) Egyszersts(1 (0 + z), z)
ltalnossgban elmondhat, hogy a vgleges szablybl azok a felttelek hagyhatk ki, amelyek nem
jelentenek knyszert a szably jobb oldaln lv vltozkra vonatkozlag. Az eredmnyl kapott szably
tovbbra is igaz, st mg hatkonyabb is lesz. Vegyk szre azt is, hogy az AritmetikaiIsmeretlen(z) felttel nem
hagyhat ki, hiszen a z-nek nem minden lehetsges rtke aritmetikai ismeretlen. A z ms jelleg rtkei esetn
609
felteheten ms egyszerstsi szablyokat kellene alkalmazni pldul ha z netn 2 3 lenne, akkor az 1 (0

+ (2 3)) helyes egyszerstse 6, s nem 2 3 lenne.
sszegezve, az alap MAT-mdszer a kvetkezkppen mkdik:
1. Ha adott egy plda, a rendelkezsre ll httrtudst felhasznlva konstruljunk egy bizonytst arra, hogy a
clprediktum rvnyes a pldra.
2. Az elbbivel egy idben az eredeti bizonyts kvetkeztetsi lpseivel azonos lpseket alkalmazva
konstruljuk meg a szabad vltozs cl ltalnostott bizonytsi fjt.
3. Konstruljuk meg az j szablyt gy, hogy a szably bal oldala a fa leveleibl ll, a jobb oldala viszont a
szabad vltozs cl (az ltalnostott bizonyts vltozktseit figyelembe vve).
4. Hagyjuk ki azokat a feltteleket, amelyek a clban foglalt vltozk rtkeitl nem fggnek.
19.7. bra - Az egyszerstsi problma bizonytsi fi. Az els fa az eredeti

problmapldny bizonytsa, amibl az AritmetikaiIsmeretlen(z) Egyszersts(1 (0
+ z), z) vezethet le. A msodik fa az a bizonyts, amikor az eredeti
problmapldnyban szerepl sszes konstanst vltozkkal helyettestettk, amibl
viszont tovbbi szablyok sokasgt vezethetjk le.
3.2. A hatkonysg javtsa
610
A 19.7. brn lthat ltalnostott bizonytsi fbl tbb ltalnostott szablyt is kpesek vagyunk kinyerni. Ha
a fa jobb oldali gnak nvekedst lelltjuk, vagy az gat lemetsszk (prune), amikor Primitv lpshez
jutottunk, az albbi szablyt kapjuk:
Primitv(z) Egyszersts(1 (0 + z), z)
Ez a szably annyira rvnyes, mint az AritmetikaiIsmeretlen-t felhasznl szably, br annl ltalnosabb,

mivel olyan esetekre is vonatkozik, amikor z numerikus rtk. Mg ltalnosabb szablyokat is kinyerhetnk,
ha az Egyszersts(y + z, w) utn metsznk. Ekkor a szably:
Egyszersts(y + z, w) Egyszersts(1 (y + z), w)
ltalnossgban elmondhat, hogy szablyokat az ltalnostott bizonytsi fa brmely rszfjbl nyerhetnk.

Szembe kell nznnk azonban azzal a problmval, hogy ezek utn melyik szablyt vlasszuk.
Az a dnts, hogy melyik szablyt rdemes ltrehozni, vgs soron a hatkonysgon mlik. A MAT ltal
biztostott hatkonysgnvekedsnek hrom tnyezje van:
1. A tudsbzishoz nagyszm szably hozzadsa a kvetkeztetsi folyamatot lelassthatja, mivel a
kvetkeztetsi mechanizmusnak ezeket a szablyokat akkor is meg kell vizsglnia, amikor ezek nem jrulnak
hozz a megoldshoz. Mskppen fogalmazva, a keressi tr elgazsi tnyezje (branching factor)
ilyenkor nvekszik.
2. Ahhoz, hogy ezt a jelensget kompenzljuk, a ltrehozott szablyoknak lnyeges sebessgnvekedst kell
garantlniuk az ltaluk lefedett problmapldnyok esetben. Az ilyen sebessgnvekeds fleg abbl
szrmazik, hogy a szrmaztatott szablyok rvn elkerlhetjk azokat a holtgakat, amelyekbe klnben a
bizonyts sorn belemennnk, illetve abbl, hogy a bizonytsok rvidebbek lesznek.
3. A szrmaztatott szablyoknak a lehet legltalnosabbaknak kell lennik, hogy a lehet legnagyobb
esethalmazt fedjk le.
A szrmaztatott szablyok hatkonysgt megszokott mdon gy biztosthatjuk, hogy megkveteljk a szably
minden rszcljtl, hogy hatsos (operational) legyen. Durvn fogalmazva, egy cl hatsos, ha knny
megoldani. A Primitv(z) rszclt pldul knny megoldani, a megoldshoz kt lps elegend. Ezzel
szemben az Egyszersts(y + z, w) rszcl tetszleges szm kvetkeztetshez vezethet az y s a z rtkeinek
fggvnyben. Ha az ltalnostott bizonyts megkonstrulsakor a hatsossgi tesztet minden lpsnl
elvgezzk, az gat azonnal lemetszhetjk, amint egy hatsos rszclra rtalltunk. A hatsos rszclt ilyenkor
az j szably egy konjunktv elemeknt megtartjuk.
Sajnos a hatsossg s az ltalnossg kztt ltalban kompromisszumot kell ktni. A konkrtabb rszclokat
knnyebb megoldani, viszont azok kevesebb esetet fednek le. A hatsossg tovbb fokozhat; egy vagy kt
lps nyilvnvalan hatsos, de mi a helyzet 10-zel vagy 100-zal? Egy adott rszcl megoldsnak a kltsge
vgl attl fgg, hogy a tudsbzis milyen egyb szablyokat tartalmaz. A kltsg nvekedhet vagy
cskkenthet, ahogy a tudsbzishoz j szablyokat adunk. Az adott kezdeti tudsbzis hatkonysgnak
maximalizlsnl a MAT-rendszerek valban igen komplex optimizcis problmval kerlnek szembe. Nha
megalkothat annak matematikai modellje, hogy egy adott szably hozzadsa ltalban milyen hatssal van a
hatkonysgra, s ennek a modellnek a hasznlatval a hozzadand legjobb szably megvlaszthat. Az
elemzs azonban igen kompliklt lehet, klnskppen ha rekurzv szablyokkal van dolgunk. gretes
megkzelts a hatkonysg empirikus vizsglata, amikor nhny szably hozzadsval meggyzdnk arrl,
hogy a szablyok kzl melyik az, amelyik tnylegesen hasznos, s amelyik az eljrsokat felgyorstja.
Fontos
A hatkonysg empirikus elemzsnek gondolata a MAT lnyegt rinti. Amit eddig informlisan az
adott tudsbzis hatkonysgnak neveztnk, az nem ms, mint egy tlagos esetkomplexits a
megoldand problmk egy eloszlsn mrve. A rgi pldk ltalnostsval a MAT nveli a
tudsbzis hatkonysgt a jvben sszeren vrhat problmk szempontjbl. Az tlet addig j,
amg a rgi pldk eloszlsa durvn megegyezik a jvbeli pldk eloszlsval. Ez a felttelezs
azonos azzal, amit a 18.5. alfejezetben a VKH-tanuls kapcsn megtettnk. Ha a MAT-rendszert
gondosan kiviteleztk, a ksbbi problmknl lnyeges javuls rhet el. Egy nagyon nagy mret,
svd s angol nyelv kztti beszdfordtsra kifejlesztett, Prolog-alap, termszetes nyelvi rendszerben
611
pldul, a vals idej fordtsi kpessget csak az elemz folyamatra alkalmazott MAT rvn sikerlt
elrni (Samuelsson s Rayner, 1991).
4. Tanuls relevns informci alapjn

gy tnik, hogy a Brazliba utaznk kpes a Brazliban beszlt nyelvre vonatkoz megbzhat ltalnostsra.
A kvetkeztetsre az a httrtudsa jogostja, miszerint egy adott orszg laki (ltalban) ugyanazt a nyelvet
beszlik. Ezt a tudst az elsrend logikban az albbi mdon fejezhetjk ki: 3
Nemzetisge(x, n) Nemzetisge(y, n) Nyelve(x, l) Nyelve(y, l) (19.6)
(sz szerint: Ha x s y azonos n llampolgrsg, s x az l nyelvet beszli, akkor y szintn az l nyelvet

beszli.). Nem nehz kimutatni, hogy a fenti kijelentsbl s a
Nemzetisge(Fernando, Brazil) Nyelve(Fernando, Portugl)
megfigyelsbl logikailag kvetkezik (lsd 19.1. feladat), hogy:

Nemzetisge(x, Brazil) Nyelve(x, Portugl)
A (19.6) tpus mondatok szigor relevancit fejeznek ki: a nemzetisg teljesen meghatrozza a nyelvet.
Mskppen fogalmazva: a nyelv a nemzetisg fggvnye. Az ilyen mondatokat funkcionlis fggsgeknek
(functional dependencies) vagy meghatrozsoknak (determinations) nevezzk. Bizonyosfajta
alkalmazsoknl (pldul az adatbzisrendszer-tervek specifiklsnl) ezek annyira ltalnosan fordulnak el,
hogy a felrsukhoz specilis szintaxist hasznlnak. Davies (Davies, 1985) jellsvel lve:
Nemzetisge(x, n) Nyelve(x, l)
Ez persze csak egy egyszer szintaktikai nyalnksg, azonban vilgosan mutatja, hogy egy meghatrozs
valjban prediktumok kztti relci: a nemzetisg meghatrozza a nyelvet. Az anyag vezetkpessgt s
srsgt meghatroz relevns tulajdonsgokat hasonlkppen kifejezhetjk:
Anyaga(x, m) Hmrsklete(x, t) Vezetkpessge(x, )
Anyaga(x, m) Hmrsklete(x, t) Srsge(x, d)
A hozz tartoz ltalnostsok a meghatrozsokbl s a megfigyelsekbl szrmaznak.
4.1. A hipotzistr meghatrozsa

Fontos
Annak ellenre, hogy meghatrozsok igazoljk az sszes brazilra vagy az adott hmrsklet rz
minden darabjra vonatkoz ltalnos kvetkeztetsek levonst, ahhoz termszetesen nem elegendk,
hogy egyetlenegy pldbl kvetkeztessnk ki egy ltalnos prediktv tulajdonsg elmletet, amely az
sszes nemzetisgre, az sszes hmrskletre s anyagra vonatkozik. Hatsuk gy kpzelhet el
legjobban, hogy leszktik a tanul gens ltal figyelembe veend hipotzisek tert. A vezetkpessg
elrejelzsnl pldul csupn az anyagra s a hmrskletre kell koncentrlnunk, figyelmen kvl
hagyva a tmeget, a tulajdonviszonyokat, a ht napjt, a jelenlegi llamelnkt stb. A hipotzisek
termszetesen tartalmazhatnak olyan komponenseket, mint pldul a molekulris struktra, a termikus
energia, a szabad elekronok srsge, amit az anyag s a hmrsklet befolysol. A meghatrozsok
egy elgsges alapsztrt adnak meg ahhoz, hogy a clprediktumra vonatkoz hipotziseket
megkonstruljuk. Ezt a kijelentst gy lthatjuk be, hogy megmutatjuk: egy adott meghatrozs
logikailag ekvivalens azzal az lltssal, miszerint a clprediktum helyes defincija a meghatrozs
bal oldaln lv prediktumok ltal kifejezhet defincik egyike.
Intuitv mdon rthet, hogy a hipotzistr mretnek szmtsi reduklsnak knynyebb kell tennie a
clprediktum megtanulst. A szmtsi tanuls elmlet alaperedmnyeit (lsd 18.5. alfejezet) felhasznlva, a
Az egyszersg kedvrt felttelezzk, hogy egy szemly csak egy nyelven beszl. Az olyan orszgok esetn, mint Svjc vagy India, a
szablyt termszetesen bvteni kell.
3
612
lehetsges nyeresg mennyisgileg is kifejezhet. Emlkezznk arra, hogy egy Boole-fggvny esetn log(|H|)
szm plda (ahol |H| a hipotzistr mrete) szksges ahhoz, hogy egy elfogadhat hipotzishez
konvergljunk. Ha a tanul n Boole-tulajdonsggal rendelkezik a hipotzisek megkonstrulshoz, akkor egyb
korltozsok hinyban
, gy a pldk szma O(2n). Ha a meghatrozs bal oldaln d szm
d
prediktum ll, a tanulnak O(2 ) pldra van szksge, ami O(2nd) mret redukcit jelent. Elfogult
hipotzistr, pldul konjuktv elfogultsgok esetn, a redukci mg mindig szmottev lesz, br kevsb lesz
ltvnyos.
19.8. bra - Algoritmus egy minimlis konzisztens meghatrozs megkeressre
4.2. Tanuls relevns informci felhasznlsval

Ahogy ezt a fejezet bevezetjben mr megemltettk, az elzetes tuds hasznos a tanuls szempontjbl,
azonban valahogy ezt is meg kell tanulni. Hogy a relevanciaalap tanulst teljes mrtkben megfogalmazhassuk
a meghatrozsok tanulsi mechanizmust meg kell mg adnunk. A most bemutatsra kerl algoritmus alapja a
megfigyelsekkel konzisztens legegyszerbb meghatrozs megtallsa. Egy P Q meghatrozs azt jelenti,
hogy ha egy plda illeszkedik P-re, akkor Q-ra is kell illeszkednie. Egy meghatrozs konzisztens a pldk egy
halmazval, ha minden pldapr, amely a bal oldali prediktumokon illeszkedik egymsra, a clprediktumon is
illeszkedik, magyarn, ha a besorolsa azonos. Tegyk fel, hogy bizonyos anyagi mintkat megmrve a
vezetkpessg albbi mrseivel rendelkeznk:
A minimlis konzisztens meghatrozs: Anyaga Hmrsklete Vezetkpessge. Ltezik konzisztens, de

nem minimlis meghatrozs is: Tmege Nagysga Hmrsklete Vezetkpessge. Ez azrt konzisztens
a pldkkal, mert a tmeg s a mret meghatrozza a srsget, s az adatbzisunkban nincs kt klnbz
anyag, amelynek srsge azonos lenne. Mint mindig, most is nagyobb pldahalmazra lenne szksgnk, hogy
a kzel helyes hipotzist kiszrjk.
613
A minimlis konzisztens meghatrozs megkeressnek tbb lehetsges algoritmusa ltezik. Kzenfekv

megkzelts a meghatrozsok terben keresni, elszr az egyprediktumos, a ktprediktumos stb.
meghatrozsokat ellenrizve, amg r nem lelnk egy konzisztens meghatrozsra. Egyszer attribtumalap
brzolst tteleznk fel, hasonlan ahhoz, mint amit a dntsi fk tanulsnl a 18. fejezetben hasznltunk.
Tekintettel arra, hogy a clprediktumot rgztettnek vesszk, a d meghatrozst a bal oldal attribtumhalmaza
fogja kpviselni. Az algoritmust a 19.8. bra mutatja.
Ennek az algoritmusnak az idignye a legkisebb konzisztens meghatrozs nagysgtl fgg. Tegyk fel, hogy
az ilyen meghatrozsnak p attribtuma van a lehetsges n-bl. Az algoritmus addig nem lesz kpes a
meghatrozst megtallni, amg az A-nak p nagysg rszhalmazait nem kezdi vgigvizsglni. Miutn
ilyen rszhalmaz ltezik, kvetkezskppen az algoritmus a minimlis meghatrozs mrett
tekintve exponencilis lesz. Az is kiderlt, hogy a problma NP-teljes, gy ltalnos esetben sem vrhatunk
jobbat. A legtbb trgytartomny azonban elegend loklis strukturltsggal (a loklisan strukturlt
trgytartomny defincijra lsd 14. fejezet) rendelkezik, gy p minden bizonnyal kicsi lesz.
Ha a meghatrozsok tanul algoritmusa mr adott, a tanul gensnek mdja van egy olyan minimlis hipotzist
megkonstrulni, amelyen bell kell a clprediktumot megtanulnia. sszemsolhatjuk a MINIMLISKONZISZTENS-MEGH s a DNTSI-FA-TANULS algoritmusait, s gy az RADFT-t, a relevanciaalap dntsi fa
tanul algoritmust kapjuk, amely elszr a relevns attribtumok minimlis halmazt azonostja, majd ezen
halmazt tanuls cljbl dntsi fa algoritmusnak adja tovbb. A DNTSI-FA-TANULS-sal ellenttben az
RADFT egyidejleg tanulja s hasznlja a relevns informcit ahhoz, hogy a hipotzisteret minimalizlja.
Elvrjuk, hogy az RADFT tanulsi grbje a DNTSI-FA-TANULS tanulsi grbjnl jobb legyen, s tnyleg
ez a helyzet. A 19.9. brn a kt algoritmus tanulsi grbje lthat, vletlen mdon generlt adatokon s egy
olyan tanuland fggvny esetn, amely a lehetsges 16 attribtumbl csupn 5-t hasznl fel. Termszetesen
azokban az esetekben, amikor az sszes attribtum relevns, az RADFT nem mutat elnyket.
19.9. bra - Az RADFT s a DNTSI-FA-TANULS hatkonysgnak sszehasonltsa

vletlen mdon generlt adatok s egy olyan clfggvny esetn, amely a lehetsges 16
attribtumbl csak 5-t hasznl
614
Ez a rsz csak rintette a deklaratv elfogultsg (declarative bias) terlett, melynek az a clja, hogy
megrtsk, hogy az elzetes tudst hogyan kell felhasznlni a megfelel hipotzistr azonostshoz, amelyben
a korrekt cldefincit keressk. Sok krds megvlaszolatlan maradt:
Hogyan kell az algoritmust kiterjeszteni a zaj kezelsre is?
Tudunk-e folytonos rtkeket felvev vltozkat kezelni?
Hogyan lehetne felhasznlni az elzetes tuds ms tpust is, a meghatrozsokon kvl?
Hogyan lehet az algoritmusokat ltalnostani, hogy egy elsrend elmletre, s nem csupn az
attribtumalap reprezentcira vonatkozzanak ?
Az egyes krdsekre a kvetkez alfejezetben keresnk vlaszt.
5. Induktv logikai programozs

Az induktv logikai programozs (ILP) az induktv mdszereket az elsrend reprezentcik erejvel
kombinlva, az elmletek logikai programok formjban trtn kifejezsre helyezi a hangslyt. 4 Az ILP
hrom oknl fogva terjedt el. Elszr is az ILP az ltalnos tudsalap induktv tanulsi problma precz,
szigor megkzeltst adja. Msodszor, teljes algoritmusokat szolgltat az ltalnos elsrend elmletek
indukcis ton, pldk alapjn trtn ellltsra. Kvetkezskppen olyan terleteken is kpes sikeresen
tanulni, ahol az attribtumalap algoritmusokat nehz alkalmazni. Ennek egy pldja a fehrjemolekulk
sszehajtogatsnak a tanulsa (lsd 19.10. bra). A fehrjemolekula hromdimenzis konfigurcijt egy
attribtumhalmazzal sszeren kifejezni nem lehet, mert a konfigurci lnyege az objektumok kztti
relcikra vonatkozik, s nem az egyes objektumok attribtumaira. A relcik lersra megfelel appartus az
elsrend logika. Harmadszor, induktv logikai programozs ltal ltrehozott hipotzisek emberek szmra
(viszonylag) knnyen olvashatk. A 19.10. brabeli termszetes nyelv fordtst a gyakorl biolgusok
vgigelemezhetik s kritizlhatjk. Ez azt jelenti, hogy az induktv logikai programrendszerek rszt vehetnek a
ksrletezs, a hipotzisgenerls, a megvitats s a cfolat tudomnyos ciklusban. Az ilyen rszvtel a fekete
doboz osztlyozkat gyrt mdszerek szmra, mint amilyenek pldul a neurlis hlk, lehetetlen lenne.
5.1. Egy plda

Emlkezznk a (19.5) egyenlet alapjn, hogy az ltalnos tudsalap indukcis problma az albbi
vonzatknyszer:
Httrtuds Hipotzis Lersok Besorolsok
megoldsa az ismeretlen Hipotzis-re nzve, feltve, hogy adottak a Httrtuds, valamint a Lersok s a
Besorolsok ltal lert pldk. Hogy ezt megvilgtsuk, tekintsk a rokonsgi relcik pldk alapjn trtn
tanulst. A megfigyelseket egy kiterjedt csaldfa kpezi, az Anyja, Apja, Hzas relcikkal, valamint a Frfi
s N tulajdonsgokkal lerva. A 8.11. feladat csaldfjt fogjuk hasznlni, amit a 19.11. bra mutat. A pldhoz
tartoz lersok az albbiak:
Apja(Flp, Kroly) Apja(Flp, Anna) ...
Anyja(Mami, Margit) Anyja(Mami, Erzsbet) ...
Hzas(Diana, Kroly) Hzas(Erzsbet, Flp) ...
Frfi(Flp) Frfi(Kroly) ...
N(Beatrix) N(Margit) ...
A Besorolsok lltsai azon mlnak, hogy milyen clfogalmat szeretnnk megtanulni. A clprediktumok olyan
fogalmak lehetnnek, mint pldul a Nagyszlje, a Sgora, illetve az se. A Nagyszlje esetn a Besorolsok
teljes halmaza 20 20 = 400
Nagyszlje(Mami, Kroly) Nagyszlje(Erzsbet, Beatrix)
Azt javasoljuk, hogy ezen a ponton az olvas ismtelten fusson vgig a 9. fejezetben bemutatott nhny fogalmon, belertve a Hornklzokat, a konjunktv norml formt, az egyestst s a rezolcit.
4
615
Nagyszlje(Mami, Harry) Nagyszlje(Spencer, Pter)
alak konjunktbl ll. Termszetesen e teljes halmaz rszhalmazbl is tudnnk tanulni.
19.10. bra - Az (a) s (b) bra a fehrjemolekula sszehajtogatsnak trgyterletn a

ngy-heliklis fel-s-le kteg fogalom pozitv s negatv pldjt mutatja. Mindkt
plda struktrjt egy olyan kb. 100 konjunktv tagot tartalmaz logikai kifejezsbe
kdoltk, mint amilyen pldul a TeljesHossz(D2mhr, 118) HeliklisSzm(D2mhr, 6)
kifejezs.
Az ilyen lersokbl s az sszehajtogats(NGY-HELIKLIS-FEL-S-LE-KTEG, D2mhr) jelleg

besorolsokbl a PROGOL induktv logikai programrendszer (Muggleton, 1995) az albbi szablyt tanulta meg:
sszehajtogats(Ngy-Heliklis-Fel-s-Le-Kteg, f)
Heliklis(f, cs1) Hossz(cs1, Magas) Pozci(f, cs1, n)
(1 n 3) Szomszdos(f, cs2, cs2) Heliklis(f, cs2)
Ilyen tpus szablyt az elbbi fejezetekben ltott, attribtumalap mechanizmusokkal megtanulni, st kifejezni
sem lehet. A szably a termszetes nyelvben kifejezve:
Az F fehrje a Ngy-heliklis fel-s-le kteg sszehajtogatsi osztlyhoz tartozik, ha egy hossz cs1 heliklist
tartalmaz a msodlagos struktra 1. s 3. kztti pozciban, valamint cs1 a msodik heliklissal szomszdos.
19.11. bra - Egy tipikus csaldfa
616
Az induktv tanul program trgya egy olyan lltshalmaz Hipotzis-knt val ellltsa, amely a
vonzatknyszert kielgti. tmenetileg tegyk fel, hogy az gens nem rendelkezik httrtudssal, a Httrtuds
res. Akkor egy lehetsges megolds a Hipotzis-re a kvetkez:
Nagyszlje(x, y) [ z
Anyja(x, z) Anyja(z, y)]
[z
Anyja(x, z) Apja(z, y)]
[z
Apja(x, z) Anyja(z, y)]
[z Apja(x, z) Apja(z, y)]
Vegyk szre, hogy egy attribtumalap tanul algoritmus, mint pldul a DNTSI-FA-TANULS sehogy sem
fog ezzel a problmval boldogulni. Ahhoz, hogy a Nagyszlje-t attribtumknt (azaz egy unris
prediktumknt) fejezzk ki, az embereket prosval objektumknt kell tudnunk kezelni:
Nagyszlje( Mami, Kroly )
Ezek utn ott akadunk el, amikor megksreljk egy plda lerst formlisan reprezentlni. Csupn olyan
elrettent attribtumokat tudnnk hasznlni, mint az:
ErzsbetAnyjaAzElsElem( Mami, Kroly )
Fontos
A Nagyszlje-nek az ilyen attribtumokkal kifejezett defincija nem lesz ms, mint egy nagy
diszjunkci, ami az egyes konkrt esetekbl ll, s amit lehetetlen az j esetekre ltalnostani. Az
attribtumalap tanul algoritmusok kptelenek relcis prediktumokat megtanulni. Az ILP egyik
legfontosabb elnye teht az, hogy a problmk sokkal szlesebb vlasztkban alkalmazhatk,
belertve a relcis problmkat is.
Az olvas termszetesen szreveszi, hogy egy kis httrtuds segtene a Nagyszlje defincijnak
reprezentcijnl. gy pldul, ha a Httrtuds tartalmazn az albbi lltst:
Szlje(x, y) [Anyja(x, y) Apja(x, y)]
akkor a Nagyszlje defincijt a:

Nagyszlje(x, y) [z Szlje(x, z) Szlje(z, y)]
lltsra lehetne reduklni. Ez megmutatja, hogy mennyire tud a httrtuds hozzjrulni a pldk
megmagyarzshoz szksges hipotzis mretnek drasztikus cskkentshez.
Az ILP-algoritmus j prediktumokat is ltesthet, hogy a magyarz jelleg hipotzis kifejezst egyszerstse.
Az elbbi pldt tekintve, teljesen sszer egy ptprediktumot javasolni amit Szlje-nek tudnnk nevezni
, hogy a clprediktum defincijt egyszerstsk. Azok az algoritmusok, amelyek j prediktumokat tudnak
617
ltesteni, az n. konstruktv indukcis (constructive induction) algoritmusok. Vilgos, hogy a konstruktv

indukci a bevezetben vzolt kumulatv tanuls egy szksges komponense. A kumulatv tanuls a gpi tanuls
egyik legnehezebb problmja, azonban egyes ILP-technikk kellen hatkony mechanizmusnak bizonyultak a
megoldsra.
A fejezet htralv rszben az ILP kt alapvet megkzeltst fogjuk tanulmnyozni. Az els a dntsi fk
ltalnostsn, a msik a rezolcis bizonyts invertlsn alapul.
5.2. Fellrl lefel tanulsi mdszerek

Az ILP els megkzeltsben egy igen ltalnos szabllyal kezdnk s azt fokozatosan leszktjk, hogy az
adatokra illeszkedjen. Ez az, ami lnyegben a dntsi fa tanulsnl trtnik, ahol a dntsi fa fokozatosan
nvekszik, amg a megfigyelsekkel konzisztens nem lesz. Hogy az ILP-t magvalstsuk, elsrend literlokat
hasznlunk attribtumok helyett, a hipotzis pedig egy klzhalmaz, a dntsi fa helyett. Ebben a rszben az
egyik legels ILP-programmal, a FOIL-lal foglalkozunk (Quinlan, 1990).
Tegyk fel, hogy tovbbra is a Nagyszlje(x, y) prediktum defincijt szeretnnk megtanulni az elbb kzlt
csaldi pldk alapjn. A dntsi fa tanulshoz hasonlan a pldkat pozitv s negatv pldkra bontjuk. A
pozitv pldk:
Gyrgy, Anna , Flp, Pter , Spencer, Harry ,
mg a negatv pldk:
Gyrgy, Erzsbet , Harry, Zara , Kroly, Flp ,
Figyeljk meg, hogy mindegyik plda egy objektumpros, hiszen a Nagyszlje egy binris prediktum.
Egszt tekintve a csaldfban 12 pozitv s 388 negatv (a szemlyek minden ms prostsa) plda tallhat.
A FOIL program klzok egy halmazt alaktja ki, mindegyik Nagyszlje(x, y)-nal mint fejjel. A klzoknak a 12
pozitv pldt a Nagyszlje(x, y) relci pldnyostsnak kell osztlyozniuk, a tbbi 388-at viszont kizrni. A
klzok Horn-klzok, melyeket neglt literlokkal bvtnk ki, ahol a neglst mint kudarcot hasznljuk,
hasonlan a Prologhoz. Egy res test klzzal kezdnk:
Nagyszlje(x, y)
Mivel ez a vlaszts minden pldt pozitvnak sorol be, leszktsre szorul. Ez gy tehet meg, hogy egy
lpsben egy literlt adunk a bal oldalhoz. A hrom lehetsges eset:
Apja(x, y) Nagyszlje(x, y)
Szlje(x, z) Nagyszlje(x, y)
Apja(x, z) Nagyszlje(x, y)
(Vegyk szre, hogy a Szlje-t definil klzzal a httrtuds mr rendelkezik.) E hrom eset kzl az els az
sszes 12 pozitv pldt helytelenl negatvnak sorolja be, gy ezt az esetet kizrjuk. A msodik s a harmadik
az sszes pozitv pldval sszhangban van. A msodik eset azonban a negatv pldk nagyobb halmazn
pontosabban ktszer annyi pldn helytelen, mert az anykat s az apkat is megengedi. gy a vlasztsunk a
harmadik esetre esik.
Most az esetet tovbb kell szkteni, kizrva azokat az eseteket, amikor x valamilyen z szlje, de z mgsem y
szlje. Egy egyedi Szlje(z, y) literl hozzadsa a kvetkez klzt eredmnyezi:
Apja(x, z) Szlje(z, y) Nagyszlje(x, y)
amely az sszes pldt helyesen sorolja be. A FOIL kpes lesz ezt a literlt megtallni s kivlasztani, s ezzel a
tanulsi feladatot megoldja. ltalnossgban, a helyes megolds megtallsa eltt, a FOIL-nak szmos sikertelen
klz kztt kell keresnie. Ez a plda a FOIL mkdsnek egyszer illusztrcija. A teljes algoritmus vza a
19.12. brn lthat. Az algoritmus lnyegben literlrl literlra egy klzt konstrul, amg az meg nem egyezik
a pozitv pldk valamilyen rszhalmazval, s egyik negatv pldval sem egyezik. A klz ltal lefedett pozitv
pldkat ekkor a tant halmazbl elhagyjuk, s az eljrst folytatjuk, amg egyetlen pozitv plda sem marad.
618
Az algoritmus kt f komponense szorul magyarzatra az J-LITERLOK, amely a klzhoz hozzadand

sszes j literlt konstrulja, s a LITERL-MEGVLASZTSA, amely kivlasztja a hozzadand literlt.
19.12. bra - A FOIL algoritmus vza, amely pldkbl elsrend Horn-klzokat tanul
meg. Az J-LITERLOK s a LITERL-MEGVLASZTSA eljrsokat a szvegben magyarzzuk
meg.
Az J-LITERLOK egy klzt kap bementknt, s minden lehetsges hasznos literlt konstrul, amit a klzhoz
hozz lehetne adni. Vegyk pldul az albbi klzt:
Apja(x, z) Nagyszlje(x, y)
Hromfajta literlt adhatunk hozz a klzhoz:

1. Prediktumokat hasznl literlok: a literl lehet neglt vagy ponlt, minden ltez prediktum (a
clprediktumot is belertve) hasznlhat, s minden argumentum csakis vltoz lehet. A prediktumok
argumentumai tetszleges vltozk lehetnek, egy kiktssel: minden literlnak tartalmaznia kell legalbb egy
vltozt egy korbbi literlbl vagy a klz fejbl. Olyan literlok, mint: Anyja(z, u), Hzas(z, z), Frfi(y)
s Nagyszlje(v, x) megengedettek, m Hzas(u, v) nem. Megjegyzend, hogy a klz fejbl szrmaz
prediktumok hasznlata lehetv teszi, hogy a FOIL a rekurzv defincit is megtanulja.
2. Egyenlsgi s egyenltlensgi literlok: ezek a klzban mr szerepl vltozkat ktik ssze. gy pldul a
klzhoz hozzadhatjuk, hogy: z x. Ezekben a literlokban a felhasznl ltal specifiklt konstansok is
felhasznlhatk. Az aritmetikt tanulva clszer kitntetni a 0-t s az 1-et, a listafggvnyeknl pedig az res
[] listt.
619
3. Aritmetikai sszehasonltsok: folytonos vltozj fggvnyek tanulsnl clszer lehet az olyan literlok
hozzadsa, mint az x > y s az y z. A dntsi fa tanulshoz hasonlan egy konstans kszbrtket is lehet
hasznlni, ami a teszt diszkrimincis erejt maximalizlja.
Mindez a keressi trben nagyon nagy elgazsi tnyezhz vezet (lsd 19.6. feladat), azonban a Foil
implementciiban a tpusinformcit is fel lehet hasznlni a hipotzistr leszktsre. Az embereket s a
szmokat tartalmaz trgytartomnyban pldul a tpusleszkts nem engedn, hogy az J-LITERLOK olyan
literlokat generljon, mint a Szlje(x, n), ahol x egy ember, n viszont egy szm.
A LITERL-MEGVLASZTSA az informcinyeresgre (lsd 3.4. szakasz - Attribtumteszt-vlaszts rsz)
valamilyen mrtkben hasonl heurisztikt hasznl, hogy eldntse, melyik literlt adja hozz a klzhoz. A
rszletek itt nem klnsen fontosak, radsul szmos kiprblt vltozat is ltezik. A Foil egyik rdekes
jrulkos tulajdonsga az Ockham borotvja elvnek az alkalmazsa bizonyos hipotzisek eliminlsra. Ha
(egy bizonyos mrtk szerint) egy klz hosszabbnak mutatkozik, mint az ltala megmagyarzott pozitv pldk
sszhossza, akkor ezt a klzt a tovbbiakban nem tekintjk lehetsges hipotzisnek. Ezzel a technikval
elkerlhetjk az adatokban tallhat zajra illeszked, tlsgosan bonyolult klzok szrmaztatst. A zaj s a
klzhossz kapcsolatnak magyarzatt lsd a 1. szakasz - Statisztikai tanuls rszben.
A FOIL-t s trsait szmos definci megtanulsra vetettk be. Az egyik leghatsosabb demonstrci (Quinlan
s Cameron-Jones, 1993) a listakezel fggvnyekre vonatkoz feladatok hossz sornak a megoldsa volt
Bratko Prolog-tanknyvbl (Bratko, 1986). A program mindegyik esetben kpes volt a fggvny helyes
defincijt kisszm plda alapjn megtanulni, mikzben httrtudsknt hasznlta a korbban megoldott
fggvnyeket.
5.3. Induktv tanuls inverz rezolcival

Az ILP-nek msik f megkzeltse a megszokott deduktv bizonytsi folyamat invertlsa. Az inverz
rezolci (inverse resolution) azon az szrevtelen alapul, hogy ha a plda Besorolsok a Httrtuds
Hipotzis Lersok-bl kvetkeznek, akkor ezt a tnyt rezolcival be kell tudnunk bizonytani (hiszen a
rezolci teljes). Ha kpesek volnnk a bizonytst visszafel prgetni, akkor tudnnk egy olyan Hipotzis-t
tallni, amire a bizonyts sikeres lesz. A kulcsproblma teht, hogy hogyan tudnnk a rezolcis eljrst
invertlni, hogy a bizonyts visszafel fusson le.
Az inverz rezolci visszafel halad bizonytsi eljrst mutatjuk be, amely egyedi visszafel mutat
lpsekbl ll. Egy kznsges rezolcis lps a C1 s C2 klzbl indul ki, s azokat rezolvlja egy C
rezolvenst ltrehozva eredmnyl. Az inverz rezolucis lps a C rezolvens alapjn kt klzt, C1-et s C2-t hoz
ltre gy, hogy C a C1 s C2 rezolvlsnak az eredmnye, vagy pedig C s C1 alapjn llt el egy lehetsges C2t.
19.13. bra - Az inverz rezolcis eljrs kezd lpsei. Az rnykolt klzokat az inverz
rezolcis eljrs generlja a jobb oldalon s az alatta lv klzokbl. A nem rnykolt
klzok a Lersok-bl s a Besorolsok-bl szrmaznak.
620
A 19.13. bra inverz rezolcis eljrs kezd lpseit mutatja, ahol a figyelem kzppontjban a
Nagyszlje(Gyrgy, Anna) pozitv plda ll. Az eljrs a bizonyts vgn kezd (amit az bra aljn
brzolunk). A C rezolvensnek res klzt (azaz egy ellentmondst) vlasztunk, C2-nek pedig a
Nagyszlje(Gyrgy, Anna)-t, amely a clplda neglsa. Az els inverz lps C-bl s C2-bl C1-nek a
Nagyszlje(Gyrgy, Anna)-t generlja. A kvetkez lps e klzt C-nek veszi, a Szlje(Erzsbet, Anna) klzt
pedig C2-nek, s az albbi C1 klzt generlja:
Szlje(Erzsbet, y) Nagyszlje(Gyrgy, y)
Az utols lps ezt a klzt rezolvensknt kezeli. A Szlje(Gyrgy, Erzsbet) klzt C2-nek vve, egy lehetsges
C1 klz az albbi hipotzis lehet:
Szlje(x, z) Szlje(z, y) Nagyszlje(x, y)
Egy rezolcis bizonytsunk van teht arra, hogy a hipotzis, a lersok s a httrtuds maga utn vonzza a
Nagyszlje(Gyrgy, Anna) osztlyozst.
Vilgos, hogy az inverz rezolci keresst tartalmaz. Minden egyes inverz rezolcis lps
nemdeterminisztikus, hiszen az adott C s C1-hez tbb, st vgtelen sok olyan C2 klz lehet, amely kielgti azt a
felttelt, miszerint C1-gyel rezolvlva C-t ad eredmnyl. gy a 19.13. bra utols lpsben a
Szlje(Erzsbet, y) Nagyszlje(Gyrgy, y) megvlasztsa helyett az inverz rezolcis lps a kvetkez
lltsokat is tudn generlni:
Szlje(Erzsbet, Anna) Nagyszlje(Gyrgy, Anna)
Szlje(z, Anna) Nagyszlje(Gyrgy, Anna)
Szlje(z, y) Nagyszlje(Gyrgy, y)
(Lsd a 19.4. s a 19.5. feladatot.) Az egyes lpsekben rszt vev klzokat meg lehet vlasztani a Httrtudsbl, a plda Lersok-bl, a neglt Besorolsok-bl vagy az inverz rezolcis fban eddig mr legenerlt
hipotzisklzokbl. A nagyszm lehetsg, egyb kontroll nlkl, nagy elgazsi tnyezt (s gy kevss
hatkony keresst) jelent. A keress kzben tartsra tbb megkzeltst probltak ki az implementlt ILPrendszerekben:
1. A redundns vlasztsok eliminlhatk pldul a legspecifikusabb lehetsges hipotzisek generlsval,
valamint megkvetelve, hogy a hipotzisklzok mind konzisztensek legyenek egymssal s a
megfigyelsekkel. Az utols kritrium kizrn az elbbiekben megadott Szlje(z, y)
Nagyszlje(Gyrgy, y) klzt.
2. A bizonytsi stratgia szintn megszorthat. A 9. fejezetben lttuk pldul, hogy a lineris rezolci
(linear resolution) egy teljes, megszortott stratgia, amely lehetv teszi, hogy a bizonytsi fknak csak
lineris elgazsi struktrja lehessen (mint a 19.13. brn).
3. A reprezentcis nyelv is megszorthat, a fggvnyszimblumok eliminlsval s csak Horn-klzokat
megengedve. A PROGOL pldul Horn-klzokkal dolgozik, inverz vonzatrelcit (inverse entailment)
alkalmazva. Az tlet a
Httrtuds Hipotzis Lersok Besorolsok
vonzatknyszer megvltoztatsa a
Httrtuds Lersok Besorolsok Hipotzisek
logikailag ekvivalens formra.

Ebbl a Hipotzisek szrmaztatsra mr a Prolog-beli norml Horn-klz dedukcira hasonlt mdszert
hasznlhatjuk, neglssal mint kudarccal. Mivel ez Horn-klzokra korltozott, gy nem teljes mdszer, azonban
a teljes rezolcinl hatkonyabb lehet. Inverz vonzatrelcival lehetsges a teljes kvetkeztets alkalmazsa is
(Inoue, 2001).
4. A kvetkeztetst modellellenrzssel is megvalsthatjuk a ttelbizonyts helyett. A PROGOL rendszer
(Muggleton, 1995) a modellellenrzs egy formjt hasznlja keresskorltozs cljra. Azaz, hasonlan a
vlaszhalmaz-programozshoz, a logikai vltozk lehetsges rtkeit generlja, s a konzisztencit ellenrzi.
621
5. A kvetkeztetst az alap tletklzokkal is megtehetjk az elsrend logika helyett. A LINUS-rendszerben

(Lavrac s Dzeroski, 1994) az elsrend elmleteket tletlogikra fordtjk le, tletlogikai tanul rendszerrel
oldjk meg azokat, majd visszafordtjk. Egyes problmk esetn tletlogikai lltsokkal sokkal
hatkonyabban lehet dolgozni, ahogy ezt a 11. fejezetben a SATPLAN esetben mr lttuk.
5.4. Felfedezs induktv logikai programozssal

Egy teljes rezolcis stratgit invertl inverz rezolcis eljrs elvben az elsrend elmletek tanulsnak egy
teljes algoritmusa. Ez azt jelenti, hogy ha valamely ismeretlen Hipotzis egy sor pldt generl, akkor az inverz
rezolcis eljrs a pldkbl tudja generlni a Hipotzis-t. Ez a megfigyels egy rdekes lehetsget is sugall.
Tegyk fel, hogy a rendelkezsre ll pldk szabadon es testek ltal lert trajektrik egy halmazt
tartalmazzk. Lehetsges, hogy egy inverz rezolcis program elvben kpes a gravitci trvnyt megtanulni?
A vlasz termszetesen igen, mert a gravitci trvnye, megfelel matematikai httr mellett, lehetv teszi a
pldk magyarzatt. Hasonlkppen el lehet kpzelni, hogy az elektromgneses hullmok elmlete, a
kvantummechanika s a relativitselmlet, mind beletartoznak az ILP-programok hatskrbe. Persze a gpr
majom hatskrbe is beletartoznak; jobb heurisztikkra s a keressi teret jobban strukturl technikkra mg
mindig szksg van.
Egy dolgot azrt az inverz rezolcis rendszer meg fog tenni a rsznkre: j prediktumokat fog kitallni. Ez a
kpessge kiss mgikusnak tnik, hiszen a szmtgpre szoks gy tekinteni, mint ami csak azzal dolgozik,
amit bemenetknt kapott. Tny, hogy az j prediktumok egyenesen az inverz rezolcis lpsbl pottyannak
ki. A legegyszerbb az az eset, amikor egy adott C klz esetn kt j klz, C1 s C2 ltezst kellene felvetni. A
C1 s C2 rezolcija a kt klz ltal kzsen tartalmazott literlt eliminlta, lehetsges ht, hogy az eliminlt
literlban olyan prediktum is szerepelt, amely C-ben mr nem lp fel. Visszafel haladva teht lehetsgknt
addik egy j prediktum ltrehozsa, amibl viszont a hinyz literl mr rekonstrulhat.
A 19.14. bra arra mutat pldt, ahogy az se defincijnak tanulsa kzben egy j P prediktumot generlunk.
Ha mr ellltottuk a P-t, akkor ez hasznlhat az inverz rezolci ksbbi lpseiben is. Egy ksbbi lps
pldul felttelezheti, hogy az Anyja(x, y) P(x, y). Az j prediktum jelentst gy a prediktumot felhasznl
hipotzis generlsa korltozza. Egy msik plda elvezethet az Apja(x, y) P(x, y)-ig. Ms szval a P
prediktum olyan valami, ami minket ltalban a Szlje relcira emlkeztet. Korbban emltettk, hogy j
prediktumok bevezetse a clprediktum defincijnak a mrett lnyegesen cskkentheti. Az j
prediktumok kialaktsnak beptett kpessgvel, az inverz rezolcis rendszer sokszor olyan tanulsi
problmkkal is megbirkzik, amelyekre ms mdszerek alkalmatlanok.
A tudomny legmlyebbre hat forradalmai j prediktumok s fggvnyek bevezetsvel fggnek ssze, ilyen
pldul a Galilei felfedezte gyorsuls vagy Joule termikus energija. Ha ezek a fogalmak mr adottak, az j
trvnyek felfedezse (viszonylag) egyszer. A f nehzsg arra rjnni, hogy egy j entits bevezetse, amely
a ltez entitsokkal meghatrozott konkrt kapcsolatban van, lehetv teszi a megfigyelsek egsz halmaznak
a korbban lehetsgesnl sokkal egyszerbb s elegnsabb elmlet keretein bell trtn magyarzatt.
19.14. bra - Egy j P prediktumot generl inverz rezolcis lps
Az ILP-rendszerek egyelre Galilei- vagy Joule-szint felfedezseket nem tettek, a felfedezseit azonban
tudomnyos irodalomban val publiklsra rdemesnek talltk. gy pldul Journal of Molecular Biology-ban
Turcotte rja le a fehrje sszehajtogatsi szablyok automatikus felfedezst a PROGOL ILP programmal
(Turcotte s trsai, 2001). A Progol ltal felfedezett szablyok kzl sokat az ismert elvekbl ugyan le lehetett
volna kvetkeztetni, a tbbsgt azonban a standard biolgiai adatbzisok rszeknt korbban mgsem
publikltk (lsd 19.10. bra pldja). Egy ehhez kapcsold kutats rszeknt Srinivasan (Srinivasan s trsai,
1994) molekula-struktraalap szablyok felfedezsvel foglalkozott nitroaromatikus komponensek
mutagenicitsra. Ilyen komponensek a gpkocsik ltal kibocstott kipufoggzban tallhatk. A standard
622
adatbzisokban lv komponensek 80%-ban lehetsges a ngy fontos jellemzt azonostani, s az erre pl

lineris regresszi jobb az ILP-nl. A maradk 20% esetn a jellemzk nmagukban nem elegendk az
elrejelzshez, az ILP relcikat azonost, amelyekkel a lineris regresszi, a neurlis hlk s a dntsi fk
kpessgein tltesz. King (King s trsai, 1992) azt mutatta meg, hogy a klnbz gygyszerek gygykezelsi
hatst hogyan lehetne elre jelezni. Ezen esetek mindegyikben gy tnik, hogy az ILP nagy hatkonysghoz
a relcik reprezentlsi kpessge s a httrtuds hasznlata jrulnak hozz. Az a tny, hogy az ILP ltal
megtallt szablyokat az emberek is kpesek interpretlni, inkbb segti ezeknek a technolgiknak az
elfogadst a biolgiai folyiratokban, mint a szmtgpes tudomnnyal foglalkoz folyiratokban.
Az ILP a biolgin tl ms tudomnyokhoz is hozzjrult. A legfontosabbak egyike a termszetes
nyelvfeldolgozs, ahol az ILP-t komplex relcis informci szvegekbl val kinyersre alkalmaztk. Ezeket
az eredmnyeket a 23. fejezet foglalja ssze.
6. sszefoglals
Ebben a fejezetben klnbz mdszereket vizsgltunk meg arra vonatkozan, hogy az elzetes tuds hogyan
segtheti az genst abban, hogy j tapasztalatokbl tanuljon. Mivel az elzetes tuds zme inkbb a relcis
modellekkel, s nem attribtumalap modellekkel van megadva, a relcis modellekbl tanul rendszerekkel is
foglalkoztunk. Az albbiakban sszefoglaljuk a fontos tudnivalkat.
Az elzetes tuds felhasznlsa a tanulsnl a kumulatv tanulshoz (cumulative learning) vezet, ahol az
gens az j tuds beszerzsvel javtja a tanulsi kpessgt.
Az elzetes tuds segt a tanulsban, mert a klnben konzisztens hipotziseket eliminlja, s a pldk
magyarzatnak kitltsvel rvidebb hipotzisekhez vezet. Ezek a tulajdonsgok javtjk a tanuls mintas szmtsi komplexitst.
Az elzetes tuds ltal betlttt klnbz vonzatknyszerek (entailment constraints) formjban
kifejezett logikai szerepeknek a megrtse segt a klnfle tanulsi mdszerek definilsban.
A magyarzatalap tanuls (MAT) (explanation-based learning, EBL) az egyedi pldkbl gy emeli ki
az ltalnos szablyokat, hogy a pldkat elszr megmagyarzza, majd a magyarzatot ltalnostja. Ezzel a
deduktv mdszerrel az elsdleges tudst hasznos, hatkony, specilis rendeltets szaktudss vltoztatjuk.
A relevanciaalap tanuls (RAT) (relevance-based learning, RBL) az elzetes tudst meghatrozsok
formjban hasznlja a relevns attribtumok azonostsra. Ily mdon egy reduklt hipotzisteret generl, s
a tanulsi folyamatot meggyorstja. A RAT lehetv teszi az egyedi pldk deduktv ltalnostst is.
A tudsalap induktv tanuls (TIT) (knowledge-based inductive learning, KBIL) induktv hipotziseket
keres, amelyek a httrtuds segtsgvel megmagyarzzk a megfigyelsek halmazt.
Az induktv logikai programozsi (ILP) (inductive logic programming) technikk a TIT-hez
folyamodnak, az elsrend logikban kifejezett httrtudst felhasznlva. Az ILP-mdszerek olyan relcis
tuds megtanulsra is alkalmasak, amelyet az attribtumalap rendszerekben nem lehet kifejezni.
Az ILP fellrl lefel megkzeltssel, a nagyon ltalnos szablyok finomtsval, vagy pedig lentrl felfel
megkzeltssel, a deduktv folyamat invertlsval valsthat meg.
Az ILP-mdszerek termszetes mdon generlnak j prediktumokat is, amelyekkel j elmletek tmren
kifejezhetk, s ltalnos cl tudomnyos elmletforml rendszerekknt is gretesnek mutatkoznak.

Br az elzetes tuds felhasznlsa a tanulsban termszetes tmnak tnhet a tudomnyfilozfusok szmra,
mostanig meglepen kevs formlis eredmny szletett. Nelson Goodman filozfus a Fact, Fiction, and
Forecast c. mvben megcfolta azt a korbbi felttelezst, miszerint az indukci nem ms, mint egy
univerzlisan kvantifiklt kijelents megfelelen sok pldjnak a megszemllse s hipotzisknt val
elfogadsa (Goodman, 1954).
Vegyk pldul azt a hipotzist, hogy Minden smaragd zlk, ahol a zlk azt jelenti, hogy zld, ha t id
eltt figyeljk meg, utna azonban kk. A t id eltt brmikor pldk milliit lthatnnk, amelyek mind
623
altmasztjk, hogy a smaragdok zlkek, negatv pldk nlkl, mgis hezitlnnk a szablyt elfogadni. A
jelensg csakis az indukcis folyamat szempontjbl relevns a priori tuds szerepvel magyarzhat. Goodman
a hasznosthat a priori tuds teljes vlasztkt javasolja, a meghatrozsok tlzott hipotzisnek
(overhypothesis) nevezett vltozatt is belertve. Sajnos a gpi tanulssal foglalkoz korai kutatsnl Goodman
munkjra nem figyeltek fel.
A MAT gykerei a tervksztsnl hasznlt STRIPS mdszereihez nylnak vissza (Fikes s trsai, 1972). Egy
terv elksztsvel a terv egy ltalnostott vltozatt a tervek knyvtrban troltk, s ksbb
makropertorknt (macro-operator) a tervksztsnl felhasznltk. Hasonl tletek Anderson ACT *
architektrjban is megjelentek, tudskompills (knowledge compilation) cmen (Anderson, 1983) s SOAR
architektrjban tudsdarabols (chunking) cmen (Laird s trsai, 1986). A smabeszerzs (schema
acquisition) (DeJong, 1981), az analitikus ltalnosts (analytical generalization) (Mitchell, 1982) s a
knyszeralap ltalnosts (constraint-based generalization) (Minton, 1984) a MAT tanuls irnyban
jelentkez s a (Mitchell s trsai, 1986; DeJong s Mooney, 1986) publikcik stimullta gyorsan nvekv
rdekldsnek kzvetlen elfutrai voltak. A szvegben bemutatott MAT algoritmust Hirsh (Hirsh, 1987)
vezette be, aki azt is megmutatta, hogy az algoritmust hogyan kell egy logikai programozsi rendszerbe gyazni.
Van Harmelen s Bundy a MAT-ot a programelemz rendszerekben (Jones s trsai, 1993) hasznlt rszleges
kirtkel (partial evaluation) mdszer varinsaknt magyarzzk (Van Harmelen s Bundy, 1988).
Az utbbi idben a szigor elemzs s a ksrleti kutats a MAT jobb megrtshez vezetett a
problmamegolds sebessgben mrt lehetsges kltsgeinek s elnyeinek tern. Minton azt mutatta meg,
hogy hacsak tekintlyes munkt nem fektetnk bele, a MAT a programot lnyegesen lelassthatja (Minton,
1988). Tambe hasonl problmkkal kszkdtt a tudsdarabolsnl, s a szablynyelv kifejezerejnek a
mrsklst javasolta, hogy a szablyok munkamemrihoz val illesztsnek jelents kltsgt minimlizljuk
(Tambe s trsai, 1990). Ers a prhuzam ezen kutats s az elsrend logika leszktett vltozatnak
kvetkeztetsi komplexitsra vonatkoz jelenlegi eredmnyei kztt (lsd 9. fejezet). A MAT vrhat
nyeresgnek formlis valsznsgi elemzse a (Greiner, 1989; Subramanian s Feldman, 1990) munkkban
tallhat. Egy kivl ttekints Dietterichtl szrmazik (Dietterich, 1990).
Ahelyett hogy a pldkat mint az ltalnosts fkuszpontjait tekintennk, j problmk megoldsra
kzvetlenl felhasznlhatk az analgis kvetkeztets (analogical reasoning) elnevezs megkzeltsben.
Az ilyen kvetkeztetsnek tbb vltozata is ltezik. Idetartozik a hasonlsg mrtkn alapul plauzbilis
kvetkeztets (Gentner, 1983) s a meghatrozsokon alapul deduktv kvetkeztets (Davies s Russell, 1987),
amely azonban megkvnja a plda jelenltt ahhoz, hogy a belle kialaktott lusta MAT a rgi plda
ltalnostst az j problma szksgletei szerint irnytsa. Az analgis kvetkeztetsnek ezt az utbbi
formjt ltalban meg lehet tallni az esetalap kvetkeztetsnl (case-based reasoning) (Kolodner, 1993) s
a szrmaztatsi analginl (derivational analogy) (Veloso s Carbonell, 1993).
A relevns informcival funkcionlis fggsgek formjban elszr az adatbzis-kutatsnl foglalkoztak, ahol
ez a nagy attribtumhalmazok kezelhet rszhalmazokra val strukturlsnak eszkze volt. Funkcionlis
fggsgeket analgis kvetkeztetsre Carbonell s Collins, majd logikai sznezettel Bobrow s Raphael
hasznltak (Carbonell s Collins, 1973; Bobrow s Raphael, 1974). Davies s Russell (Davies, 1985; Davies s
Russell, 1987) a fggsgeket msoktl fggetlenl jra felfedeztk, s az analgis kvetkeztets
szempontjbl teljes kr logikai elemzsnek vetettk al. A fggsgeket deklaratv elfogultsg cljbl
Russell s Grosof hasznltk (Russell s Grosof, 1987). A meghatrozsok s a leszktett sztrral rendelkez
hipotzistr kztti ekvivalencit Russell (Russell, 1988) bizonytotta be. A meghatrozsokat tanul
algoritmust s az RADFT megnvelt hatkonysgt elszr a FOCUS algoritmusban mutattk be (Almuallim s
Dietterich, 1991). Tadepalli a meghatrozsok tanulsra egy gyes algoritmust kzlt, amely a tanulsi
sebessgben igen lnyeges javulst mutat (Tadepalli, 1993).
Az a gondolat, hogy az induktv tanuls kivitelezhet inverz dedukcival W. S. Jevonsig vezethet vissza
(Jevons, 1874), aki azt rta, hogy: Mind a formlis logika, mind a valsznsg-elmlet tanulmnyozsa arra az
llspontra juttatott engem, hogy egy olyan dolog, mint egy kln indukcis mdszer, a dedukcival
szembelltva nincs, s az indukci egyszeren a dedukci egy fordtott alkalmazsa. A szmtstudomnyi
elemzsek Gordon Plotkin figyelemre mlt PhD-disszertcijval kezddtek Edinburghban (Plotkin, 1971).
Br Plotkin szmos, a mai ILP terletn hasznlt ttelt s mdszert dolgozott ki, az indukci egyes
rszproblmira vonatkoz bizonyos eldnthetetlensgi eredmnyek elvettk a kedvt. A MIS (Shapiro, 1981)
jbl bevezette a logikai programok tanulsi problmjt, azonban ezt fleg az automatikus hibakeress
elmlethez val hozzjrulsnak tekintettk. A szablyindukci kutatsa, vagyis az olyan rendszerek, mint az
ID3 (Quinlan, 1986) s CN2 (Clark s Niblett, 1989) a FOIL-hoz vezettek (Quinlan, 1990), amely els zben
tette lehetv relcis szablyok gyakorlati indukcijt. A terletet Muggleton s Buntine pezsdtettk fel
624
(Muggleton s Buntine, 1988). CIGOL programjuk az inverz rezolci nem egszen teljes vltozatt tartalmazta,
s j prediktumok generlsra is alkalmas volt.5 A prediktum felfedezsvel Wirth s ORorke is
foglalkoztak (Wirth s ORorke, 1991). A kvetkez nagyobb rendszer a GOLEM volt (Muggleton s Feng,
1990), amely a Plotkin-fle relatve legkevsb ltalnos ltalnosts tletn alapul lefed algoritmust
hasznlja. A FOIL fentrl lefel mdon, mg a CIGOL s a GOLEM lentrl felfel mdon dolgoztak. E korszak ms
rendszerei az ITOU (Rouveirol s Puget, 1989) s a CLINT (De Raedt, 1992) rendszerek voltak. jabban a
PROGOL (Muggleton, 1995) az inverz vonzatrelci egy hibrid (fentrl lefel s lentrl felfel) megkzeltst
valstotta meg, s a rendszert szmos gyakorlati problmra alkalmaztk, klnskppen a biolgiban s a
termszetes nyelvfeldolgozsban. Muggleton a PROGOL egy kiterjesztst rja le (Muggleton, 2000),
sztochasztikus logikai programok alakjban reprezentlt bizonytalansg kezelsre.
Az ILP-mdszerek formlis elemzst (Muggleton, 1991) tartalmazza, mg a (Muggleton, 1992) egy nagy
cikkgyjtemny. A mdszerek s az alkalmazsok nagy gyjtemnye a (Lavrac s Dzeroski, 1994) knyv. A
terlet trtnetrl s a jv kihvsairl jabb ttekintst ad (Page s Srinivasan, 2002). Haussler korai
komplexitsi eredmnyei azt sugalltk, hogy az elsrend lltsok tanulsa remnytelenl bonyolult (Haussler,
1989). A klzokra vonatkoz klnbz szintaktikai korltozsok jobb megrtsvel azonban pozitv
eredmnyek is megjelentek, mg a rekurzit tartalmaz klzokra is (Dzeroski s trsai, 1992). Az ILP
komplexitsi eredmnyeirl Kietz s Dzeroski, valamint Cohen s Page rtak tfog cikkeket (Kietz s
Dzeroski, 1994; Cohen s Page, 1995).
Br az ILP jelenleg a konstruktv indukci problmjnak dominl megkzeltse, nem csak ezzel
prblkoztak. Az n. felfedez rendszerek (discovery systems) clja az j koncepcik tudomnyos
felfedezsnek ltalban a koncepci definciterben trtn kzvetlen keress tjn trtn modellezse.
Doug Lenat AM (Automated Mathematician) programja (Davis s Lenat, 1982) szakrt szablyok formjban
megfogalmazott felfedez heurisztikkat hasznlt arra, hogy elemi szmelmleti koncepcik s sejtsek
keresst irnytsa. les ellenttben a matematikai kvetkeztetsre kifejlesztett rendszerekkel, az AM nlklzte
a bizonyts fogalmt, s csak sejts szinten tudott mkdni. A program jra felfedezte a Goldbach-sejtst s az
egyrtelm prmtnyezkre bontst. Az AM architektrjt ksbb az EURISKO rendszerben (Lenat, 1983)
ltalnostottk, a rendszert a sajt felfedez heurisztikkat trni kpes szablyokkal bvtve. Az EURISKO-t
ms, a matematikai felfedezstl eltr tartomnyokban is alkalmaztk, de az AM-nl kisebb sikerrel. Az AM s
az EURISKO mdszertana vitatott, lsd (Ritchie s Hanna, 1984; Lenat s Brown, 1984).
A felfedez rendszerek egy msik csoportja a vals fizikai adatokkal val munkt clozza s j trvnyek
felfedezst ksrli meg. A DALTON, a GLAUBER s a STAHL (Langley s trsai, 1987) olyan szablyalap
rendszerek, amelyek fizikai rendszerekbl szrmaz adatokban kvantitatv sszefggseket keresnek.
Mindegyik rendszer kpes volt egy tudomny trtnetbl jl ismert felfedezs jbli meghozatalra. A
probabilisztikus technikkon klnskppen az j kategrikat felfedez klaszterez algoritmusokon alapul
felfedez rendszerekkel a 20. fejezetben foglalkozunk.
6.2. Feladatok
19.1.
Mutassa ki a konjunktv norml formba val talaktsval s a rezolci alkalmazsval, hogy a 4. szakasz Tanuls relevns informci alapjn rszben tallhat s a brazilokra vonatkoz konklzi helyes.
19.2.
Az albbi meghatrozs mindegyikre rja fel a meghatrozs logikai reprezentcijt, s magyarzza meg,
hogy a meghatrozs mirt igaz (ha igaz egyltaln).
a. A postai kd meghatrozza a megyt.
b. A kls kialakts s a nvleges rtk meghatrozzk az rme tmegt.
c. Adott program esetn a bemenetek meghatrozzk a kimeneteket.
d. A klma, a tpllkozs, a fizikai gyakorlat s a metabolizmus meghatrozzk, hogy valaki fogyni vagy
slyban gyarapodni fog.
5
Az inverz rezolcis mdszer (Russell, 1986)-ben is megjelenik, a teljes algoritmust egy lbjegyzetben kzlik.
625
e. A kopaszsgot (vagy annak hinyt) az anyai gon az egyik nagyszlnek a kopaszsga hatrozza meg.
19.3.
Hasznos lenne a meghatrozsoknak egy valsznsgi verzija? Javasoljon egy defincit.
19.4.
Ptolja a C1 s/vagy C2 klzok rtkt az albbi klzhalmazban, figyelembe vve, hogy C a C1 s a C2
rezolvense:
(a) C = Igaz P(A, B), C1 = P(x, y) Q(x, y), C2 = ??
(b) C = Igaz P(A, B), C1 = ??, C2 = ??
(c) C = P(x, y) P(x, f(y)), C1 = ??, C2 = ??
Ha tbb megolds is lehetsges, a klnbz eseteket kln pldkkal illusztrlja.
19.5.
Tegyk fel, hogy egy rezolcis lpst vgrehajt logikai programot runk. Legyen teht a Rezolvls(c1, c2, c)
sikeres, ha a c a c1 s a c2 rezolvlsnak az eredmnye. Rendes krlmnyek kztt a Rezolvls-t a
ttelbizonyts rszeknt fogjuk hasznlni gy, hogy meghvjuk a c rezolvens generlsra, mikzben a c1 s a c2
vltozba konkrt klzrtkeket helyettestnk be. Tegyk most fel, hogy az eljrst a behelyettestett c-vel s a
szabad c1-gyel, valamint c2-vel hvjuk meg. Megszletik-e az inverz rezolcis lps helyes eredmnye?
Szksges-e a logikai program valamilyen specilis talaktsa, hogy az inverz lps helyesen mkdjn?
19.6.
Tegyk fel, hogy a FOIL program egy klzhoz egy literlt gy add hozz, hogy egy binris P prediktumot
hasznl, s hogy az elbbi literlok (a klz fejrszt belertve) t klnbz vltozt tartalmaznak.
a. Hny funkcionlisan klnbz literlt lehet generlni? A kt literl funkcionlisan egybeesik, ha csupn az
ltaluk tartalmazott j vltozk neveiben klnbznek.
b. Meg tudna adni ltalnos kpletet a klnbz, r argumentummal rendelkez prediktumot hasznl literlok
szmnak meghatrozsra, ha elzleg n vltozt hasznltunk?
c. A FOIL mirt nem enged olyan literlokat hasznlni, amelyek az elzleg hasznlt vltozkat nem
tartalmazzk?
19.7.
A 19.11. brn lthat csaldfa adatainak vagy annak rszhalmaznak felhasznlsval alkalmazza az se
prediktum megtanulsra a FOIL algoritmust.
626
20. fejezet - Statisztikai tanulsi

mdszerek
Ebben a fejezetben megfigyelsek alapjn trtn bizonytalan kvetkeztetsnek tekintjk a tanulst.
Az V. rszben rmutattunk, hogy a vals letre jellemz krnyezetben gyakran elfordul, hogy a tuds
bizonytalan. Az gensek a bizonytalansgot valsznsg- s dntselmleti mdszerekkel tudjk kezelni, de
ehhez elszr tapasztalataik alapjn fel kell lltaniuk a vilgra vonatkoz valsznsgi modelljket. Ez a
fejezet bemutatja, hogy milyen mdon tudjk ezt megtenni. Ltni fogjuk, hogyan kell gy formalizlni a
tanulsi feladatot, mint egy valsznsgi kvetkeztetsi folyamatot (lsd 20.1. alfejezet). Bemutatjuk, hogy a
tanuls bayesi megkzeltse rendkvl hatkony: ltalnos megoldst ad a zaj, a tlilleszkeds s az optimlis
predikci problmira. Tovbb figyelembe veszi azt a tnyt, hogy a nem-egszen-mindentud gens soha nem
tudhatja biztosan, hogy a vilgrl alkotott melyik elmlet helyes, mgis dntseket kell hoznia.
A 20.2. s 20.3. alfejezetben valsznsgi modellek elssorban a Bayes-hlk tanulsi mdszereit
ismertetjk. A 20.4. alfejezet olyan mdszereket trgyal, amelyek specilis mintk trolst s elhvst
vgzik. A 20.5. alfejezet a neurlis hl (neural network) tantssal foglalkozik, mg a 20.6. alfejezet a
kernelgpekkel (kernel machine). Ennek a fejezetnek egy rsze ersebben matematikai megkzelts
(felttelezi a tbbvltozs analzis alapjainak ismerett), br az ltalnos tanulsgok megrthetk anlkl is,
hogy elmerlnnk a matematikai rszletekben. Hasznos lehet, ha az olvas ezen a ponton elszr tnzi a 13. s
a 14. fejezeteket, valamint az A) fggelket.
1. Statisztikai tanuls
Az ebben a fejezetben hasznlt alapvet koncepcik ismt az adat (data) s a hipotzis (hypothesis), ppgy,
mint ahogy a 18. fejezetben volt. Itt az adatok a tnyek (evidence) ezek a terletet ler valsznsgi
vltozk egy rsznek vagy mindegyiknek egy konkrt megvalsulst jelentik. A hipotzis valamilyen
valsznsgi elmlet arrl, hogy a vilg adott terlete hogyan is mkdik, ennek specilis esetei a logikai
elmlettel lert terletek.
Vegynk egy nagyon egyszer pldt. Kedvenc meglepets cukorknk ktfle, meggy- (nyam-nyam) s
citrom- (brrrr) zben kaphat. A cukorkagyrtnak sajtos humora van, s mindegyik cukorkt ztl
fggetlenl ugyanolyan tltszatlan paprba csomagolja. Az dessget nagyon nagy zskokban ruljk,
amelyekbl tfle van kvlrl megint csak megklnbztethetetlenek egymstl:
h1: 100% meggy
h2: 75% meggy + 25% citrom
h5: 100% citrom
Egy adott j zsk cukorka esetn a H (hipotzist jell) vletlen vltoz a zsk tpust jelenti, lehetsges rtkei
h1-tl h5-ig terjednek. Termszetesen H kzvetlenl nem figyelhet meg. Ahogy a cukorkkat felbontjuk s
megvizsgljuk, adatokat gyjtnk amelyeket D1, D2, , DN jell. Mindegyik Di egy olyan vletlen vltoz,
amelynek lehetsges rtkei a meggy, illetve a citrom. Az gens feladata, hogy jslst adjon a kvetkez
cukorka zre.1 Ez a nyilvnvalan trivilis feladat rdekes mdon mgis j betekintst nyjt a legfontosabb
problmk kzl tbbre is. Az gensnek valban elmletet kell alkotnia a vilgrl, br csak nagyon egyszert.
A Bayes-tanuls (Bayesian learning) sorn egyszeren kiszmtjuk minden egyes hipotzis valsznsgt az
adatokra tmaszkodva, majd ennek alapjn adunk predikcit. Azaz nem egyetlen legjobb hipotzist
hasznlunk a predikcihoz, hanem az szszes hipotzist hasznljuk, valsznsgkkel slyozva ket.
A statisztikban jrtasabb olvas felismeri, hogy ez a plda valjban az urna s goly (urn and ball) feladat vltozata. gy talltuk, hogy
az urna s a goly kevesebb kihvst jelent, mint a cukorka, tovbb a cukorka plda elvezet egy msik feladathoz elcserljk-e a zacskt
egy bartunkkal, vagy sem (lsd 20.3. feladat).
1
627
Statisztikai tanulsi mdszerek
Reprezentlja D az sszes adatot, legyen d a megfigyelt rtkek vektora, ekkor az egyes hipotzisek
valsznsgt a Bayes-szabllyal adhatjuk meg:
P(hi|d) = P(d|hi)P(hi) (20.1)
Tegyk fel, hogy egy ismeretlen X mennyisgre vonatkoz predikci a clunk. Ebben az esetben:
ahol azt feltteleztk, hogy az sszes hipotzis meghatroz X-re valamilyen eloszlst. Ez az sszefggs azt
mutatja, hogy a predikci az egyes hipotzisekbl add predikcik slyozott sszege. Maguk a hipotzisek
tulajdonkppen a nyers adatok s a predikcik kzti kzvettk. A Bayes-megkzeltsben a P(hi) prior
hipotzisek (hypothesis prior), illetve a hipotzisek mellett fellp P(d|hi) adatvalsznsgek (likelihood) a
kulcsmennyisgek.
A cukorka pldnkban azt felttelezzk, hogy a h1,, h5 a priori valsznsgei megfelelnek a gyrt
reklmjban kzlt 0,1, 0,2, 0,4, 0,2, 0,1 rtkeknek. Az adatok valsznsgt e.f.e (angol rvidtse: i.i.d.)
felttelezssel szmtjuk azaz egyforma s fggetlen eloszlst (independently and identically distributed)
tesznk fel, gy:
Tegyk fel pldul, hogy a cukorks zsk valjban csupa citromtpus (h5), s az els 10 kibontott cukorka
mind citromz, ekkor P(d|h3) = 0,510, mivel a h3 tpus zskokban a cukorkk fele citrom.2 A 20.1. (a) bra
mutatja, hogyan vltozik az t hipotzis a posteriori valsznsge, ahogy sorban szleljk a 10 citromz
cukorkt. Vegyk szre, hogy a valsznsgek az a priori rtkekrl indulnak, ennek megfelelen kezdetben h3
a legvalsznbb lehetsg, s ez gy is marad mg az els cukor felbontsa utn is. A msodik citromz
cukorka felbontsa utn h4 a legvalsznbb, 3 s tbb esetn h5 (a rettegett csupa citrom zsk). 10 citromz
cukorka utn mr meglehetsen biztosak vagyunk vgzetnket illeten. A 20.1. (b) bra mutatja annak a (20.2)
egyenlet alapjn jsolt valsznsgt, hogy a kvetkez cukorka citromz. Vrakozsunknak megfelelen
monoton nvekszik az 1 fel.
20.1. bra - (a) A (20.1) egyenletbl szmtott P(hi|d1,,dN) a posteriori valsznsgek.

A megfigyelsek szma 1-tl 10-ig terjed, s mindegyik megfigyels citromz cukorka.
(b) A (20.2) egyenlet alapjn szmtott P(dN+1 = citrom|d1,,dN) Bayes-predikci.
Fontos
Korbbiakban leszgeztk, hogy a cukorks zskok nagyon nagyok, mskpp az e.f.e. felttel nem ll fenn. Korrektebb lenne (de kevsb
higinikus) felttelezni, hogy minden vizsglat, kstols utn visszacsomagoljuk a cukorkt, s visszatesszk a zskba.
2
628
Pldnk azt mutatja, hogy a Bayes-predikciban az igaz hipotzis vglis dominnss vlik. Ez
jellemz a Bayes-tanulsra. Brmilyen rgztett priorra, amely nem zrja ki a helyes megoldst, a
hamis hipotzisek a posteriori valsznsge vglis nullhoz tart. Ennek egyszeren az az oka, hogy
elhanyagolhatan kicsi annak valsznsge, hogy vgtelen ideig nem jellemz adatokat generljunk.
(Ezen a ponton rvelsnk hasonl a 18. fejezetben, a VKH-tanulsnl alkalmazottal.) Ennl is
fontosabb, hogy a Bayes-predikci optimlis, akr kicsi, akr nagy adathalmazunk van. Adott a priori
hipotziseloszls mellett brmely ms predikci ritkbban lesz helyes, mint a Bayes-predikci.
A Bayes-tanuls optimalitsnak termszetesen ra van. Mint a 18. fejezetben lttuk, a vals tanulsi
problmknl a hipotzistr rendszerint nagyon nagy vagy vgtelen. Nha a (20.2) egyenletben az sszegzs
(vagy folytonos esetben az integrls) pontos elvgzse kezelhet problmra vezet, de a legtbb esetben
kzelt vagy egyszerstett megoldsokra kell szortkoznunk.
Nagyon elterjedt approximcis mdszer a tudomnyos feladatokban rendszerint ezt alkalmazzuk , hogy
egyetlen, a legvalsznbb hipotzis alapjn vgezzk a predikcit, azaz olyan hi alapjn, amely maximlja a
P(hi|d)-t. Ezt maximum a posteriori vagy MAP hipotzisnek nevezzk. A MAP hipotzis alapjn vgzett
predikcik kzeltleg Bayes-predikcik. Ez a kzelts annyira j, amennyire j a P(X|d) P(X|hMAP kzelts.
A cukorka pldnkban hrom egyms utni citromz cukor szlelse utn hMAP = h5, gy a MAP-tanuls alapjn
a negyedik cukorra 1,0 valsznsggel citromzt jsolunk. Ez nyilvn sokkal veszlyesebb jslat, mint a
Bayes-predikci, amely 0,8valsznsg, ahogy a 20.1. brn is lthatjuk. Ahogy egyre tbb adatunk van, a
MAP s Bayes-predikcik egyre inkbb konverglnak egymshoz, mivel a MAP hipotzis alternatvi egyre
kevsb valsznv vlnak. Br pldnk ezt nem mutatja, de a MAP hipotzis ellltsa sokszor lnyegesen
egyszerbb, mint a Bayes-tanuls. Ennek oka, hogy csupn egy optimalizlsi problma megoldst ignyli,
szemben egy nagyon nagy sszegzsi (vagy integrlsi) problmval. A fejezet ksbbi rszben majd ltunk
pldkat erre.
Mind a Bayes-tanulsban, mind a MAP-tanulsban a P(hi) a priori hipotzis valsznsgek nagy szerepet
jtszanak. Lttuk a 18. fejezetben, hogy tlilleszkeds (overfitting) lphet fel, ha tlzottan nagy a hipotzistr
kifejezkpessge, vagyis tl sok olyan hipotzist tartalmaz, amely jl illeszkedik az adatokra. A Bayes- s a
MAP-tanuls nem alkalmaz valamilyen nknyes korltot a figyelembe vett hipotzisekre, inkbb az a priori
valsznsgeket hasznljk fel arra, hogy bntessk a hipotzisek komplexitst. A komplex hipotziseknek
tipikusan kisebb az a priori valsznsge rszben azrt, mert sokkal tbb komplex hipotzis van, mint
egyszer. Msrszrl a komplex hipotziseknek nagyobb kapacitsa van az adatokra val illeszkedshez.
(Extrm esetet vve egy tblzat 1,0 valsznsggel s tkletes pontossggal reproduklni tudja az adatokat.)
Ennek megfelelen az a priori valsznsgben testesl meg a hipotziskomplexits s az adatokra val
illeszkedsi kpessg kztti kompromisszum.
Fontos
Ezt a kompromisszumot a logikai esetben figyelhetjk meg legjobban, amikor is H csak
determinisztikus hipotziseket tartalmaz. Ebben az esetben P(d|hi) rtke akkor 1, ha hi konzisztens az
adatokkal, klnben 0. A (20.1) egyenlet alapjn azt ltjuk, hogy hMAP a legegyszerbb logikai hipotzis
lesz, amely konzisztens az adatokkal. Teht a maximum a posteriori tanuls Ockham borotvjnak egy
termszetes megvalsulsa.
A hipotziskomplexits s az adatokra val illeszkedsi kpessg kztti kompromisszumot j mdon vilgtja
meg, ha a (20.1) egyenlet logaritmust kpezzk. A hMAP hipotzis olyan kivlasztsa, amely maximlja a
P(d|hi)P(hi)-t ugyanaz, mint amikor minimalizljuk a kvetkez kifejezst:
log2P(d|hi) log2P(hi)
Hasznljuk fel az informcikdols s a valsznsg kztt a 18. fejezetben bevezetett kapcsolatot. Azt ltjuk,
hogy a log2P(hi) tag nem ms, mint a hi hipotzis specifiklshoz szksges bitek szma. A log2 P(d|hi)-tag
viszont azoknak a tovbbi biteknek a szma, amelyek ahhoz szksgesek, hogy az adott hipotzis
felttelezsvel specifikljuk az adatokat. (Ennek demonstrlsra mutatjuk be azt az esetet, amikor a hipotzis
pontosan megjsolja az adatokat, ilyenkor nincs szksg egyetlen bitre sem az adatok specifiklshoz. Ilyen
pldul a h5 hipotzis esete, amikor sorban rkeznek a citromz cukorkk s valban log2 1 = 0.) Ebben az
rtelemben a MAP-tanuls jellemzje, hogy maximlisan tmrti az adatokat. Ezt a feladatot sokkal
kzvetlenebbl clozza a minimlis hosszsg lers (MHL) (minimum description length, MDL) tanulsi
629
mdszer, amely a valsznsgekkel val foglalkozs helyett a hipotzis mretnek s az adat kdolsnak
minimalizlsra trekszik.
Az utols egyszerstst az adja, ha a hipotzistrben egyenletes (uniform) priort feltteleznk. Ebben az
esetben a MAP-tanuls egy olyan hi vlasztsra redukldik, amely maximlja P(d|hi) -t. Ezt maximumlikelihood (ML) hipotzisnek nevezzk, s hML-lel jelljk. A maximum-likelihood tanuls nagyon elterjedt a
statisztikban. Ez egy olyan tudomny, amelynek sok kutatja nem bzik az a priori hipotzisek szubjektv
sk az egyik
hipotzist egy msikkal szemben, pldul amikor az szszes hipotzis egyformn komplex. Az ML-tanuls j
kzeltst adja a Bayes- s MAP-tanulsnak olyankor, amikor az adathalmaz nagy, hiszen az adatok vgl is
fellrjk a hipotzisek a priori eloszlst, de kis adathalmazok esetn problmk merlnek fel az
alkalmazsnl (mint ltni fogjuk).
2. Teljes adattal trtn tanuls

A statisztikai tanulsi mdszerek trgyalst a legegyszerbb feladattal kezdjk: paramtertanuls (parameter
learning) teljes adat (complete data) alapjn. A paramtertanuls egy rgztett struktrj valsznsgi
modell paramtereinek megtallst foglalja magban. Pldul meg akarjuk tanulni egy adott struktrj Bayeshl feltteles valsznsgeit. Az adatokat akkor nevezzk teljesnek, ha mindegyik adatpont rtkeket hordoz a
megtanuland valsznsgi modell mindegyik paramterre. A teljes adatok nagyban egyszerstik a komplex
modellek paramtereinek tanulst. Nagy vonalakban ttekintjk majd a struktratanuls problematikjt is.
2.1. Maximum-likelihood paramtertanuls: diszkrt modellek

Tegyk fel, hogy j gyrttl vsrolunk egy zsk citrom- s meggycukorkt, a meggyarny teljesen ismeretlen,
brhol lehet 0 s 1 kztt. Ez esetben kontinuum szmossg hipotzisnk van. A paramter (parameter),
amelyet -val jellnk, most a meggycukorkk arnya, a hipotzis pedig h. (A citromzek arnya egyszeren 1
.) Ha felttelezzk, hogy a priori minden arny egyformn valszn, akkor a maximum-likelihood
megkzelts az sszer. Ha Bayes-hlval modellezzk a helyzetet, akkor csupn egyetlen vletlen vltozra
van szksgnk. Legyen ez az z nev vltoz (a zacskbl vletlenszeren vlasztott cukorka ze). Lehetsges
rtkei a meggy s a citrom, ahol a meggy valsznsge (lsd 20.2. (a) bra). Tegyk fel, hogy kibontunk N
cukorkt, amelyek kzl c meggyz s = N c citromz. A (20.3) egyenlet alapjn ennek a specilis
adathalmaznak a valsznsge:
20.2. bra - (a) Bayes-hl modell az ismeretlen arnyban citrom-, illetve meggyz
cukorkk esetre. (b) Annak a modellje, amikor a csomagolpapr szne fgg
(valsznsgi alapon) a cukorka ztl.
630
A maximum-likelihood hipotzist az a rtk adja, amely maximlja ezt a kifejezst. Ugyanezt az rtket
kapjuk, ha a log likelihood fggvnyt maximljuk.
(A kifejezs logaritmust kpezve a szorzatot szummv redukltuk, amit rendszerint egyszerbb maximlni.) A
maximum-likelihood rtk megtallsa rdekben differenciljuk L-et szerint, a kapott kifejezst pedig
tegyk egyenlv nullval:
Magyarn a hML maximum-likelihood hipotzis azt lltja, hogy a zacskban a meggyz cukorkk vals arnya
megegyezik az eddig kibontott cukorkknl megfigyelt arnnyal!
gy tnik, rengeteget dolgoztunk, hogy felfedezznk egy nyilvnval eredmnyt. Valjban lefektettnk egy
standard mdszert a maximum-likelihood paramtertanulsra:
1. rjunk fel egy a paramter(ek)tl fgg kifejezst az adatok egyttes valsznsgre (rjuk fel a
likelihood fggvnyt).
2. rjuk fel minden egyes paramter szerint a log likelihood fggvny derivltjt.
3. Keressk meg azokat a paramterrtkeket, amelyek mellett a derivltak nulla rtket vesznek fel.
Fontos
A legtrkksebb lps ltalban az utols. Az elz pldnkban trivilisan megoldhat volt, de ltni
fogjuk, hogy sokszor iteratv megoldsokhoz vagy ms numerikus optimalizlsi technikkhoz kell
folyamodnunk, mint ahogy a 4. fejezetben trgyaltuk. A plda a maximum-likelihood tanuls egy
ltalnos problmjt is illusztrlja: ha az adathalmaz elg kicsi ahhoz, hogy nhny esemnyt mg nem
figyeltnk meg pldul nem talltunk mg meggyz cukorkt , akkor a maximum-likelihood
hipotzis nulla valsznsget rendel ezekhez az esemnyekhez. Szmos trkkt hasznlnak, hogy
elkerljk ezt a problmt, mint pldul minden esemny kezdeti valsznsgt 1-re lltjk nulla
helyett.
631
Nzznk egy msik pldt. Tegyk fel, hogy a cukorka gyrtja nmi informcit akar adni a fogyasztnak,
ezrt piros s zld csomagolpaprt hasznl. A Csomagol mindegyik cukorkhoz vletlenszeren kerl
kivlasztsra, valamilyen ismeretlen az ztl fgg feltteles valsznsg-eloszls szerint. Az ehhez tartoz
valsznsgi modellt a 20.2. (b) bra mutatja. Vegyk szre, hogy hrom paramtere van: , 1 s 2. Ezekkel a
parmterekkel a Bayes-hlk standard szemantikjt hasznlva megadhat annak a valsznsge, hogy
mondjuk egy meggyz cukorkt tallunk egy zld csomagolban (2.1. szakasz - Az egyttes valsznsgeloszls fggvny lersa rsz):
Most kibontunk N cukorkt, amelyek kzl c meggyz s citromz. A csomagolsfajtk szmai a

kvetkezk: rc meggyz volt pirosba csomagolva s gc zldbe, mg r citromz volt pirosba csomagolva, mg g
zldbe. Ezen adatok egyttes valsznsge:
Ez meglehetsen ijesztnek tnik, de segt, ha a logaritmust vesszk:

L = [clog + log(1 )] + [rc log1 + gc log(1 1)] + [r log2 + g log(1 2)]
A logaritmuskpzs elnye nyilvnval: a log likelihood fggvny hrom tag sszege, ahol mindegyik tag
csupn egyetlen paramtert tartalmaz. Amikor sorban mindegyik paramter szerint vesszk az sszefggs
derivltjt, majd nullv tesszk a derivltakat, hrom fggetlen egyenlethez jutunk, s mindegyik csupn
egyetlen paramtert tartalmaz:
A -ra kapott megolds ugyanaz, mint az elbb. A 1-re kapott megolds, teht annak valsznsge, hogy egy
meggyz cukorka piros paprba csomagolt, nem ms, mint a megfigyelt meggyz cukorka piros papr arny,
hasonl a helyzet 2-vel.
Fontos
Ezek az eredmnyek nagyon knyelmesek, s knnyen belthat, hogy kiterjeszthetk brmely Bayeshlra, amelynek feltteles valsznsgeit tblzatokkal adjuk meg. A legfontosabb eredmny a
kvetkez: teljes adatok esetn a Bayes-hl paramtertanulsi problmja elklnl tanulsi
problmkra dekomponlhat, egy-egy problma egy-egy paramterre.3 A msodik eredmny, hogy az
egyes paramterek adott szl melletti rtkei ppen a szlrtkek mellett megfigyelt gyakorisgokkal
egyeznek meg. ppgy, mint az elz helyzetben, itt is vatosnak kell lennnk, hogy kis adathalmazok
esetn el tudjuk kerlni a nulla rtkeket.
2.2. Naiv Bayes-modellek

Valsznleg a gpi tanuls terletn hasznlt legelterjedtebb Bayes-hl modell a naiv Bayes-modell (naive
Bayes). Ebben a modellben a C osztlyvltoz (amelyet meg akarunk jsolni) a gykr, mg az Xi
attribtumvltozk a levelek. A modell azrt naiv, mert felttelezi, hogy adott osztly mellett az attribtumok
felttelesen fggetlenek egymstl. (A 20.2. (b) bra modellje egy egyvltozs naiv Bayes-modell.) Logikai
vltozkat felttelezve a paramterek:
3
Nem tblzatos formra lsd a 20.7. feladatot, amelyben mindegyik paramter hatssal van szmos feltteles valsznsgre.
632
= P(C = igaz), i1 =P(Xi = igaz|C = igaz), i2 = P(Xi = igaz|C = hamis)
A maximum-likelihood paramtereket pontosan gy kapjuk meg, mint a 20.2. (b) bra esetn. Ha a modellt ezen
az ton megtantottuk, akkor felhasznlhat arra, hogy olyan j pldkat osztlyozzon, amelyekre a C
osztlyvltoz nem ismert. A megfigyelt x1, ..., xn attribtumrtkek mellett az egyes osztlyok valsznsgt a
kvetkez sszefggs adja:
20.3. bra - A 18. fejezet tterem problmjra alkalmazott naiv Bayes-tanuls tanulsi
grbje. A dntsi fa tanuls tanulsi grbjt sszehasonlts cljbl brzoltuk.
Fontos
Ha a legvalsznbb osztlyt vlasztjuk, determinisztikus predikci adhat. A 20.3. bra mutatja a
mdszer tanulsi grbjt, ha a 18. fejezet tterem problmjra alkalmazzuk. A mdszer elg jl tanul,
de nem olyan jl, mint egy dntsi fa tanuls. Ennek oka valsznleg az, hogy a helyes hipotzis ami
egy dntsi fa nem reprezentlhat pontosan naiv Bayes-modellel. A naiv Bayes-tanuls sok
alkalmazsi terleten meglepen jl teljest, a fokozott teljestmny, turb vltozata (boosted version)
egyike a leghatkonyabb ltalnos cl tanul algoritmusoknak (lsd 20.5. feladat). A mdszer nagyon
nagy mret problmkhoz is jl alkalmazhat, n logikai vltoz esetn is csak 2n + 1 paramtere lesz,
s ahhoz, hogy a naiv Bayes-tanuls meghatrozza hML-t, nincs szksg keressre. Vgl a naiv Bayestanulsnak nem jelentenek gondot a zajos adatok, tovbb ha szksges, akkor kpes valsznsgi
predikcikat is adni.
2.3. Maximum-likelihood paramtertanuls: folytonos eset

A 14.3. alfejezetben vezettk be a folytonos valsznsgi modelleket, mint pldul a lineris Gauss- (linearGaussian) modelleket. Mivel a vals alkalmazsokban mindentt folytonos vltozkkal tallkozunk, fontos
633
ismernnk a folytonos modellek adatokbl trtn megtanulsnak mdszereit. A maximum-likelihood tanuls

elvei azonosak a diszkrt esetre vonatkoz tanuls elveivel.
Kezdjk egy rendkvl egyszer esettel: egyetlen skalr vltoz Gauss-srsgfggvnynek a paramtereit
tanuljuk. Azaz az adatokat a kvetkez sszefggssel generljuk:
A modell paramterei a tlag s a szrs. (Vegyk szre, hogy a normalizl konstans is fgg -tl, ezrt
nem hanyagolhatjuk el.) Legyenek a megfigyelt rtkek x1,..., xN. Ekkor a log likelihood:
A derivltakat szoksos mdon nullv tve a kvetkezket kapjuk:
Teht az tlag maximum-likelihood becslse a mintatlag, a szrs maximum-likelihood becslse pedig a minta
tlagos szrsngyzetnek ngyzetgyke. Ezek ismt kedvez eredmnyek, mivel megerstik a jzan sszel
kvetett gyakorlatot.
Vizsgljunk most egy lineris Gauss-modellt, amelyben egy X folytonos szl s Y folytonos gyermek van.
Mint az 3.1. szakasz - Bayes-hlk folytonos vltozkkal rszben megmutattuk, Y Gauss-eloszls, tlaga
linerisan fgg X-tl, mg variancija rgztett. A P(X|Y) feltteles eloszls tanulshoz maximalizlhatjuk a
feltteles likelihood fggvnyt:
20.4. bra - (a) Egy y = (1 + j + 2) egyenlettel lerhat lineris Gauss-modell additv,

rgztett variancij Gauss-zajjal. (b) E modell alapjn generlt 50 adatpontbl ll
halmaz.
634
Itt a paramterek 1, 2 s . Mint a 20.4. brn szemlltettk, az (xj, yj) prok gyjtemnye adja az adatokat. A
szoksos mdszereket hasznlva (lsd 20.6. feladat) megkaphatjuk a paramterek maximum-likelihood rtkeit.
Itt most egy msik dolgot akarunk megmutatni. Vegyk csupn a 1 s 2 paramtereket, amelyek az x s y kzti
lineris sszefggst definiljk! Nyilvnval, hogy a log likelihood ezen paramterekkel trtn
maximalizlsa azonos azzal, mintha a (20.5) kifejezsben a kitev szmlljt minimalizlnnk:
Az (yj (1xj + 2)) mennyisg valjban az (xj, yj) hibja (error) azaz a tnyleges yj rtk s a becslt rtk
klnbsge. gy E nem ms, mint a jl ismert hibangyzetek sszege (sum of squared errors). Ezt a standard
lineris regresszi (linear regression) minimalizlja. Most megrthetjk, hogy mirt: a hibangyzetek
sszegnek minimalizlsa nem ms, mint a maximum-likelihood lineris (egyenessel brzolhat) modell
megadsa, feltve, hogy az adatokat rgztett variancij Gauss-zaj mellett generltuk.
2.4. Bayes-paramtertanuls
A maximum-likelihood tanuls alkalmat ad nhny nagyon egyszer eljrs ltrehozsra, de kis adathalmazok
esetn slyos hinyossgokat mutat. Pldul egyetlen meggyz cukorka szlelse utn az a maximumlikelihood hipotzis, hogy a csomag 100%-a meggytpus (azaz = 1,0). Ha nincs olyan hipotzis prior, hogy a
csomagok mind vagy csupa meggy-, vagy csupa citromtpusak, akkor ez nem jzan kvetkeztets. A Bayesmegkzelts paramtertanuls egy hipotzis priort llt fel a lehetsges paramterrtkekre, s ahogy az adatok
rkeznek, gy frissti az eloszlst.
A 20.2. (a) cukorka pldnak egyetlen paramtere van; annak valsznsge, hogy egy vletlenszeren
kivlasztott cukorka meggyz. Bayes-megkzeltsben a valsznsgi vltoz (ismeretlen) rtke, a
hipotzis prior pedig nem ms, mint a P() a priori eloszls. gy P( = ) annak a priori valsznsge, hogy a
csomag arnyban tartalmaz meggyz cukrokat.
20.5. bra - Pldk a bta[a,b] eloszlsra klnbz [a,b] rtkek esetn
Ha a tetszleges rtket felvehet 0 s 1 kztt, akkor a P()-nek egy folytonos eloszlsnak kell lennie, amely
csak 0 s 1 kztt nem nulla rtk, s integrlja 1. Egy lehetsges jellt az egyenletes eloszls P() = U[0, 1]
(). (Lsd 13. fejezet.) Az egyenletes eloszls a bta-eloszlsok (beta distributions) csaldjnak tagja. Minden
egyes bta-eloszls kt hiperparamterrel4 (hyperparameter) a-val s b-vel definilhat a kvetkez
egyenlet szerint:
bta[a,b] () = a1 (1)b1 (20.6)
A (20.6) megadja -ra a [0, 1] tartomnyban a srsgfggvny rtkt. Az norml konstans a-tl s b-tl
fgg. (Lsd 20.8. feladat.) A 20.5. brn bemutatjuk, hogy hogyan nz ki az eloszls klnbz a-k s b-k
esetn. Az eloszls tlaga a/(a + b), teht nagyobb a rtkek arra utalnak, hogy -t 1-hez kzelebb hisszk,
4
Azrt hvjuk hiperparamtereknek, mert eloszlsnak paramtereirl van sz, ahol maga is egy paramter.
635
mint 0-hoz. Az a + b nagyobb rtkei az eloszlst cscsosabb teszik, ami a rtke felli nagyobb
bizonyossgunkat jelenti. Lthat, hogy a bta-csald a hipotzis prior lehetsgek hasznos vlasztkt nyjtja.
Rugalmassgn tl a bta-csaldnak van mg egy csodlatos tulajdonsga: ha a priorja bta[a, b], akkor egy
adatpont megfigyelse utn a posteriori eloszlsa is bta-eloszls. A bta-csaldot a logikai vltozk eloszlsa
konjuglt priorjnak (conjugate prior) nevezzk.5 Lssuk, hogyan is mkdik ez. Tegyk fel, hogy
megfigyeltnk egy meggyz cukrot, ekkor:
P(|D1 = meggy) = P(D1 = meggy|)P()
= ' beta[a,b]() = ' a1(1 )b1
= 'a (1 )b1 = beta[a + 1,b]()
Teht egy meggyz cukrot szlelve egyszeren inkrementljuk az a paramtert, hasonlkppen, ha egy
citromzt szlelnk, akkor inkrementljuk a b paramtert ezzel megkapjuk az a posteriori eloszlst. Ezek
szerint gy tekinthetnk a-ra s b-re, mint virtulis szmllkra (virtual counts), abban az rtelemben, hogy a
bta[a, b] prior pontosan gy viselkedik, mintha egyenletes eloszls priorral indultunk volna, s a 1
meggycukorkt s b 1 citromz cukorkt lttunk volna.
Tanulmnyozva a bta-eloszlsok sorozatt nvekv de lland arny a s b mentn, jl lthatjuk, hogyan
vltozik a paramter a posteriori eloszlsa az adatok berkezse sorn. Tegyk fel pldul, hogy a vizsglt
zacsk 75%-a meggytpus. A 20.5. (b) bra mutatja a bta[3, 1], bta[6, 2], bta[30, 10] eloszlssorozatot.
Nyilvnval, hogy az eloszls egy a vals krl elhelyezked keskeny cscs fel tart. Nagy adathalmazok
esetn a Bayes-tanuls (legalbbis ebben az esetben) ugyanahhoz az eredmnyhez konvergl, mint amit a
maximum-likelihood tanuls adott.
A 20.2. (b) brn a hlnak hrom paramtere volt: , 1 s 2, ahol 1 volt annak valsznsge, hogy piros
csomagols van egy meggycukorkn, mg 2 az, hogy egy citromz cukron van piros csomagols. A Bayes
hipotzis priornak mindhrom paramtert le kell fednie azaz P(, 1, 2)-t kell specifiklnunk. Rendszerint
paramterfggetlensget (parameter independence) tteleznk fel:
P(, 1, 2) = P()P(1)P(2)
Ezen felttelezs esetn minden egyes paramternek sajt bta-eloszlsa lehet, amelyet kln-kln
frissthetnk az adatok rkeztekor.
20.6. bra - Egy Bayes-tanulsnak megfelel Bayes-hl. A , 1, 2 vltozk a

posteriori eloszlsai kikvetkeztethetk az a priori eloszlsokbl s az zi, Csomagoli
vltozkra vonatkoz tnyekbl.
Tovbbi konjuglt priorok: a diszkrt tbbvltozs eloszlsok paramtereire a Dirichlet csald, a Gauss-eloszlsok paramtereire a
NormalWishart csald. Lsd Bernardo s Smith (1994).
5
636
Ha mr az volt az tletnk, hogy az ismeretlen paramtereket valsznsgi vltozkkal reprezentljuk

amilyen pldul , akkor termszetes mdon addik, hogy azokat beptsk magba a Bayes-hlba. Ahhoz,
hogy ezt megtehessk, minden egyes plda lershoz msolatot kell ksztennk a vltozkrl. Ha pldul
hrom cukorkt figyeltnk meg, akkor szksgnk van a kvetkez vltozkra: z1, z2, z3 s Csomagol1,
Csomagol2, Csomagol3. A paramtervltoz hatrozza meg minden egyes zi vltoz valsznsgt:
P(zi = meggy| = ) =
Hasonlkppen a csomagol valsznsge 1-tl s 2-tl fgg. Pldul:

P(Csomagoli = piros|zi = meggy, 1 = 1) = 1
Fontos
Ezek utn az egsz Bayes-tanulsi folyamat formalizlhat egy megfelelen konstrult Bayes-hl
kvetkeztetsi problmjaknt, amint a 20.6. brn lthat. Egy j pldny predikcija egyszeren azt
jelenti, hogy j pldnyvltozkat adunk a hlhoz, amelybl egyesekre rkrdeznk. A tanuls s a
predikci ezen formalizmusa nyilvnvalv teszi, hogy a Bayes-tanulshoz nem kell semmilyen extra
tanulsi elv. Megllapthatjuk tovbb, hogy lnyegben csak egyetlen tanulsi algoritmus van, ami a
Bayes-hl kvetkeztetsi algoritmusa.
2.5. Bayes-hlstruktrk tanulsa

Az eddigiekben azt feltteleztk, hogy a Bayes-hl struktrja ismert, s csak a paramtereket prbljuk
megtanulni. A hl struktrja a terlet alapvet oksgi viszonyaira vonatkoz tudst reprezentlja, amit sok
esetben egy szakember, de mg egy naiv felhasznl is, nagyon egyszeren meg tud adni. Nhny esetben
azonban az oksgi sszefggsek nem llnak rendelkezsre vagy vitatottak pldul bizonyos nagyvllalatok
rgta lltjk, hogy a dohnyzs nem okoz rkot. Ilyenkor fontos megrteni, hogy a Bayes-hl struktrja mi
mdon tanulhat meg az adatokbl. Jelenleg a struktratanulsi algoritmusok gyerekcipben jrnak, ezrt csak
egy elnagyolt vzlatot adunk a legfontosabb elvekrl.
637
A legkzenfekvbb megkzelts, ha egy j modell rdekben keresst folytatunk. Elindulhatunk egy

kapcsolatokat nem tartalmaz modellel, majd elkezdnk szlcsompontot adni minden csomponthoz, az
elbbiekben bemutatott mdszerekkel illesztve a paramtereket, s mrjk a modell pontossgt. Msik
lehetsg, hogy egy becslt struktrval indulunk, s hegymsz vagy szimullt lehtst alkalmaz
algoritmusokat hasznlunk a mdostsokhoz, minden egyes struktravltoztats utn jrahangolva a
paramtereket. A mdostsok kz tartozik az lek megfordtsa, hozzadsa, trlse. Nem szabad ciklusokat
ltrehoznunk a folyamat sorn, ezrt sok algoritmus azt felttelezi, hogy adott a vltozk egy rendezse, s egy
csompont szlje csak azon csompontok kzl kerlhet ki, amelyek elbb jnnek a rendezsben (ppgy,
mint a 14. fejezet konstrukcis eljrsban). A teljes ltalnossg kedvrt a lehetsges rendezsek kztt is
keresnnk kell.
Kt alternatv mdszer van arra, hogy szrevegyk, amikor egy j megoldst talltunk. Az els annak tesztelse,
hogy az aktulis adatok kielgtik-e azokat a feltteles fggetlensgre vonatkoz lltsokat, amelyek a
struktrban implicit mdon benne vannak. Pldul az tterem problma egy naiv Bayes-modellje felttelezi,
hogy:
P(Pntek/Szombat, Br|VrjunkE) P(Pntek/Szombat|VrjunkE)P(Br|VrjunkE)
s leellenrizhetjk az adatokon, hogy ugyanez az egyenlet fennll-e a megfelel feltteles gyakorisgok kzt is.
Viszont mg akkor is, ha a struktra a terlet vals oksgi termszett rja le, az adathalmaz a statisztikai
ingadozsok miatt az egyenletet soha nem elgti ki pontosan. Ezrt megfelel statisztikai prbkat kell
elvgeznnk, hogy eldntsk: elg bizonytkunk van-e arra, hogy a fggetlensgi hipotzisek srlnek. Az
eredmnyl kapott hl bonyolultsga az ezen tesztekben alkalmazott kszbtl fgg majd minl szigorbb a
fggetlensgi teszt, annl tbb kapcsolatot adunk majd a struktrhoz, s annl nagyobb lesz a tlilleszkeds
veszlye.
A jelen fejezetben bemutatott gondolatoknak jobban megfelel megkzelts annak rtkelse, hogy a javasolt
modell mennyire magyarzza meg az adatokat (valsznsgi rtelemben). Mindamellett vatosnak kell lennnk
ennek mrsnl. Ha egyszeren a maximum-likelihood hipotzist akarjuk megtallni, akkor egy teljesen
sszekttt hlnl fogunk kiktni, mivel tovbbi szlcsompontok hozzadsa egy csomponthoz nem
cskkentheti a valsznsget (lsd 20.9. feladat). Valamilyen mdon bntetnnk kell a modell bonyolultsgt.
A MAP (vagy MLH) megkzelts egyszeren levon egy bntettagot az egyes struktrk valsznsgbl
(miutn hangolta paramtereiket), ezek utn hasonltja ssze a klnbz struktrkat. A Bayes-megkzelts a
struktrk s paramterek egyttes priorjt hasznlja. Rendszerint tl sok a vltozk szmn
szuperexponencilis struktra van ahhoz, hogy mind felett sszegezznk, gy a gyakorlatban legtbben az
MCMC (Markov lnc Monte Carlo) mdszert hasznljk, hogy mintt vegyenek a struktrkbl.
A bonyolultsg bntetse (akr MAP, akr Bayes-megkzeltsben) fontos kapcsolatot hoz be az optimlis
struktra s a feltteles valsznsgek hlbeli reprezentcis mdja kztt. Tblzatosan brzolt eloszls
esetn a bonyolultsg bntetse a szlcsompontok szmval exponencilisan n, mg, mondjuk, zajos-vagy
eloszlsok esetn csak linerisan. Ez azt jelenti, hogy a zajos-vagy (illetve ms tmren paramterezett)
modellek tanulsa tbb szlcsompontot eredmnyez, mint a tblzatos eloszls tanulsa.
3. Rejtett vltozkkal trtn tanuls: az EM

algoritmus
Fontos
Az elz rsz a teljesen megfigyelhet esettel foglalkozott. Szmos vals problmban vannak rejtett
vltozk (hidden variables), amelyeket nha latens vltozknak (latent variables) is hvnak. Ezek
nem figyelhetk meg a tanuls cljra rendelkezsre ll adatokban. Pldul az orvosi feljegyzsek
gyakran tartalmazzk a megfigyelt tneteket, az alkalmazott kezelst, esetleg e kezels eredmnyt, de
ritkn tartalmazzk magnak a betegsgnek a kzvetlen megfigyelst. 6 Megkrdezhetnnk, ha a
betegsget magt nem figyelhetjk meg, akkor mirt nem lltunk fel egy modellt nlkle? A vlaszt a
20.7. brn tntettk fel, amely szvbetegsgek egy kis, fiktv modelljt mutatja. Hrom hajlamost
tnyez s hrom megfigyelhet tnet van (amelyek tl nyomasztk ahhoz, hogy megnevezzk ket).
Tegyk fel, hogy mindegyik hromfle rtket vehet fel (pl. nincs, kzepes, slyos). A rejtett vltoz
Nhny feljegyzs tartalmazza az orvos ltal fellltott diagnzist, de ez a szimptmk oksgi kvetkezmnye, amit viszont a betegsg
okozott.
6
638
eltvoltsa az (a) hlbl a (b) hlhoz vezet; a paramterek szma 78-rl 708-ra n. Teht a rejtett
vltozk drmaian cskkenthetik a Bayes-hl megadshoz szksges paramterek szmt. Ez viszont
drmaian cskkentheti a paramterek megtanulshoz szksges adatok mennyisgt.
20.7. bra - (a) A rejtett vltoznak felttelezett szvbetegsg egyszer diagnosztikai

hlja. Minden egyes vltoznak hrom lehetsges rtke van, a vltozkat a feltteles
eloszlsukban szerepl fggetlen vltozk szmval cmkztk, a vgs szmuk 78. (b)
A SzvBetegsg eltvoltsval kszlt ekvivalens hl. Vegyk szre, hogy a
tnetvltozk most mr nem felttelesen fggetlenek, ha a szlket megadjuk. Ez a hl
708 paramtert ignyel.
A rejtett vltozk fontosak, de bonyoltjk a tanulsi problmt. A 20.7. (a) brn pldul nem vilgos, hogy
adott szlcsompontok esetn hogyan tanulhat meg a SzvBetegsg feltteles eloszlsa, mivel nem ismert az
rtke az egyes esetekben. Ugyanez a problma fellp a tnetek eloszlsnak tanulsnl is. Ebben a rszben
egy olyan expectationmaximization,7 EM nev algoritmust ismertetnk, amely nagyon ltalnos
megoldst ad erre a problmra. Hrom pldt mutatunk be, majd ltalnos lerst adunk. Ez az algoritmus
elszr holmi mginak tnik, de amint a mgttes intucit megrtettk, a tanulsi problmk hatalmas
terletn egy sor helyen alkalmazhatjuk.
3.1. Nem ellenrztt osztlyozs: Gauss-eloszlsok keverknek

tanulsa
A nem ellenrztt osztlyozs vagy klaszterezs (unsupervised clustering) az a problma, amikor
objektumok valamilyen gyjtemnyben tbb kategrit klnbztetnk meg. A problma nem ellenrztt,
mivel a kategriacmkk nincsenek megadva. Tegyk fel pldul, hogy felvesszk szzezer csillag spektrumt.
Az a krds, hogy a spektrumok alapjn vannak-e klnbz tpus csillagok, s ha igen, akkor hnyfle, s mik
a jellemzik? Mindannyian jl ismernk olyan neveket, mint vrs ris s fehr trpe, de a csillagoknak
nincs ilyen cmke a kalapjukon a csillagszoknak nem ellenrztt osztlyozst kell vgeznik ahhoz, hogy
ezeket a kategrikat fellltsk. Ms pldk lehetnek: a fajok, nemek, rendek stb. azonostsa a Linn-fle
taxonmiban vagy htkznapi trgyak termszetes kategriinak megalkotsa (lsd 10. fejezet).
A nem ellenrztt osztlyozs az adatokkal kezddik. A 20.8. (a) bra 500 adatpontot brzol, mindegyik kt
folytonos attribtum rtkt adja meg. Az adatpontok megfelelhetnek pl. csillagoknak, a kt attribtum pedig pl.
a spektrumvonalak erssge kt adott frekvencin. A kvetkez lps, hogy meg kell rtennk, milyen
valsznsgi eloszls generlhatta az adatokat. Az osztlyozs azt felttelezi, hogy az adatok a P kevert
eloszlsbl (mixture distribution) szrmaznak. Egy ilyen eloszls k komponensbl (component) ll, amelyek
mindegyike nmagban egy-egy eloszls. Az adatpont gy jn ltre, hogy elszr kivlasztjuk az egyik
komponenst, majd ebbl a komponensbl generlunk egy mintt. Jelljk a C vletlen vltozval a
komponenseket, amely vltoz az 1, , k rtkeket veheti fel. A kevert eloszlst ekkor a
Az eljrst magyarul vrhatrtk-kpzsmaximalizs eljrsnak nevezhetnnk, de a magyar szakirodalomban is az angol elnevezs

terjedt el. (A szerk.)
7
639
sszefggs rja le, ahol x jelenti az adatpont attribtumait. Folytonos adatok esetn a komponensekre
termszetesen addik a tbbvltozs Gauss-eloszls, ami az gynevezett kevert Gauss- (mixture of
Gaussians) eloszls csaldot adja. A kevert Gauss-eloszls paramterei: wi = P(C = i) (az egyes komponensek
slya), i (az egyes komponensek vrhat rtke) i (az egyes komponensek kovariancija). A 20.8. (b) bra
hrom Gauss-eloszls keverkt mutatja, valjban ez volt az (a) brn lthat adathalmaz forrsa.
Ez esetben a nem ellenrztt osztlyozsi problma abban ll, hogy a 20.8. (a) brn lthat nyers adatokbl
kell visszalltani a 20.8. (b) brn lthathoz hasonl kevert modellt. Nyilvnval, hogy ha tudnnk, melyik
adatot melyik komponens generlta, akkor knny lenne visszalltanunk az egyes Gauss-komponenseket.
Egyszeren kivlaszthatnnk az egyes komponensekhez tartoz sszes adatpontot, majd alkalmazhatnnk a
(20.4) egyenletet (tulajdonkppen annak tbbvltozs verzijt) a Gauss-paramtereknek az adatokhoz val
illesztsre. Msrszrl, ha tudnnk az egyes komponensek paramtereit, akkor legalbbis valsznsgi
rtelemben meg tudnnk adni, hogy melyik adatpont melyik eloszlshoz tartozik. A problma az, hogy sem az
adatpontok komponensekhez rendelst, sem a komponensek paramtereit nem ismerjk.
20.8. bra - (a) 500 ktdimenzis adatpont, amely hrom osztly jelenltt sugallja. (b)
Egy hrom-komponens kevert Gauss-modell, a slyok (balrl jobbra) 0,2, 0,3 s 0,5.
Az (a) brn lthat adatokat ebbl a modellbl generltuk. (c) Az adatokbl az EM
algoritmussal rekonstrult modell
Az EM algoritmus alaptlete ebben az sszefggsben az, hogy gy tesznk, mintha ismernnk a modell
paramtereit, majd kiszmtjuk minden egyes pont minden egyes komponenshez val tartozsnak
valsznsgt. Ezek utn jraillesztjk a komponenseket az adatokhoz: mindegyik komponenst a teljes
adathalmazhoz illesztjk, az egyes adatpontokat az adott komponenshez tartozs valsznsgvel slyozva. Az
eljrst a konvergencia elrtig folytatjuk. Lnyegben teljess tesszk az adatokat azzal, hogy a rejtett
vltozk melyik adat melyik komponenshez tartozik valsznsgi eloszlst kikvetkeztetjk a
pillanatnyilag hasznlt modell segtsgvel. A kevert Gauss-eloszls esetn a paramtereknek tetszleges mdon
kezdeti rtket adunk, majd a kvetkez kt lpst ismteljk:
1. E-lps: Szmtsuk ki a pij = P(C = i|xj valsznsgeket, amelyek azt fejezik ki, hogy milyen valsznsggel
generlta az i-edik komponens xj-t. A Bayes-szably alapjn pij = P(xj|C = i) P(C = i). A P(xj|C = i) tnyez
az xj valsznsge az i-edik Gauss-eloszlsban, mg P(C = i) az i-edik Gauss-eloszls slya. Hasznljuk a
defincit.
2. M-lps: Szmtsuk ki az j tlag, szrs s komponens sly paramtereket a kvetkezk szerint:
640
Az E-lps vagy expectation (vrhatrtk-kpzs) lps gy foghat fel, mintha a rejtett indiktor vltoz
(indicator variable) Zij valsznsgnek pij vrhat rtkt (expected value) szmtannk ki. Ha az i-edik
komponens generlta xj-t, akkor Zij rtke 1, klnben pedig 0. Az M-lps vagy maximization
(maximumkeress) lps a rejtett vltozk adott vrhat rtke mellett megkeresi azokat a paramtereket,
amelyek maximljk az adatokra fellltott log likelihood fggvnyt.
Fontos
A vgs modellt amelyet az EM segtsgvel a 20.8. (a) bra adatain tanultunk a 20.8. (c) bra
mutatja. Ltszlag megklnbztethetetlen attl az eredeti modelltl, amellyel az adatokat generltuk.
A 20.9. (a) bra az adatoknak a pillanatnyi modellbl szmtott log likelihood rtkt mutatja az EM
algoritmus futsa sorn. Kt pontra hvjuk fel a figyelmet. Elszr is, a vgs modellre a log likelihood
nmileg meghaladja az arra a vals modellre szmtott rtket, amelyekkel az adatokat generltuk. Ez
meglepnek tnhet, de egyszeren azt mutatja, hogy az adatokat vletlenszeren generltuk, s nem
pontosan tkrzik a mgttes modellt. A msodik, hogy az EM minden itercis lpsben nveli az
adatok log likelihood rtkt. Ez ltalnossgban is bizonythat. Tovbb bizonyos felttelek mellett
belthat, hogy az EM biztosan elri a likelihood egy loklis maximumt. (Ritka esetekben elrhet egy
nyeregpontba, vagy akr egy loklis minimumba is.) Ebben az rtelemben az EM egy gradiensalap
hegymsz algoritmusra emlkeztet, de vegyk szre, hogy nincs lpsmret paramtere!
20.9. bra - Az L log likelihood rtknek az EM iterciszmnak fggvnyben val

alakulst bemutat grbk. A vzszintes vonal a helyes modellnek megfelel log
likelihood rtket mutatja. (a) A 20.8. brn lthat kevert Gauss-modellre vonatkoz
grbe. (b) A 20.10. (a) brn lthat Bayes-hlra vonatkoz grbe.
A dolgok nem mennek mindig olyan jl, mint ahogy a 20.9. (a) bra esetleg sugallja. Elfordulhat, hogy az
egyik Gauss-komponens gy sszezsugorodik, hogy csak egyetlen adatpontot fed le. Ebben az esetben a
variancija nullhoz tart, a belle szmtott likelihood pedig vgtelenhez! Msik problma lehet, hogy kt
komponens sszeolvad, azonos tlagot s variancit vesz fel, az adatpontokon pedig osztoznak. Az ilyen
tpus degenerlt loklis maximumok slyos problmt jelentenek, elssorban sokdimenzis terekben. Ennek a
problmnak egyik megoldsa lehet megfelel priorok lltsa a modell paramtereire s az EM algoritmus
MAP-vltozatnak alkalmazsa. Msik lehetsg a komponens jraindtsa j paramterekkel, ha tl kicsiv
vlik vagy tl kzel kerl ms komponensekhez. A paramterek sszer kezdeti rtkei szintn segtenek a
problma megoldsban.
3.2. Rejtett vltozkkal felptett Bayes-hlk tanulsa
641
A rejtett vltozkkal felptett Bayes-hlk tanulsnl ugyanazokat a megkzeltseket alkalmazzuk, amelyek

jl mkdtek a kevert Gauss-eloszlsokra. A 20.10. bra azt a helyzetet mutatja, amikor kt zsk cukorkt
sszekevertek. A cukrokat hrom tulajdonsg rja le, az z s a Csomagols mellett nhnynl megjelenik egy
Lyuk a cukorka kzepn, msoknl pedig nincs lyuk.
A cukorkk eloszlst minden egyes zskban egy naiv Bayes-modell rja le; a tulajdonsgok adott zsk esetn
fggetlenek, de mindegyik tulajdonsg feltteles valsznsg eloszlsa fgg a zsktl. A kvetkez
paramtereink vannak: annak az a priori valsznsge, hogy a cukorka az 1. zskbl szrmazik; I1, illetve I2
annak valsznsge, hogy a cukorka meggyz, feltve, hogy az 1., illetve a 2. zskbl szrmazik; Cs1, illetve
Cs2 azokat a valsznsgeket jellik, hogy a csomagols piros; Ly1, illetve Ly2 pedig azokat a
valsznsgeket, hogy a cukorka lyukas. Vegyk szre, hogy az egsz modell egy kevert modell. (Valjban a
kevert Gauss-eloszlsokat is modellezhetjk Bayes-hlval, ahogy azt a 20.10. (b) bra mutatja.) Az brn a
zsk egy rejtett vltoz, mivel attl a pillanattl, hogy sszekevertk a zskok tartalmt, tbbet nem tudjuk
megmondani egy cukorkrl, hogy melyik zskbl szrmazott. Vissza tudjuk ebben az esetben nyerni a zskok
lerst, ha csupn az sszekevert cukorkkat tudjuk megfigyelni?
20.10. bra - (a) A cukorkk kevert modellje. A klnbz z cukorkk, a

csomagolsok, valamint a lyukas cukrok arnya a zsktl fgg, amelyet nem figyelnk
meg. (b) Egy kevert Gaussra vonatkoz Bayes-hl. Az X megfigyelhet vltoz tlaga
s kovariancija a C komponenstl fgg.
Vigyk vgig az EM-itercit erre a problmra. Elszr nzzk az adatokat. 1000 mintt generltunk a
kvetkez paramterekkel rendelkez (valdi) modell alapjn:
= 0,5, I1 = Cs1 = Ly1 = 0,8, I2 = Cs2 = Ly2 = 0,3 (20.7)
Azaz a cukorkk egyforma valsznsggel szrmazhatnak mindkt zskbl, az els zsk nagyobbrszt
meggyz cukrokat tartalmaz piros csomagolsban, s sok kztk a lyukas, a msodik inkbb nem lyukas
citromzeket, zld csomagolsban. A lehetsges nyolcfle cukor elfordulsi szmai a kvetkezk:
642
A paramterek alaprtkre lltsval kezdnk. A knny szmthatsg kedvrt a kvetkez rtkeket

vlasztjuk:8
Elszr nzzk a paramtert. A teljesen megfigyelhet esetben ezt kzvetlenl az 1. zskbl, illetve 2. zskbl
szrmaz cukorkk megfigyelt szmaibl becslnnk. Mivel a zsk rejtett vltoz, ehelyett a vrhat
szmrtkekkel szmolunk. A vrhat cukorkaszm
sszegezve, hogy a cukorka az 1. zskbl szrmazik:
annak valsznsge, az sszes cukorkra
Ezek a valsznsgek a Bayes-hlkra kifejlesztett tetszleges kvetkeztetsi algoritmussal szmthatk. Naiv

Bayes-hlkra, mint amilyen pldnkban is szerepel, a kvetkeztets kzzel elvgezhet, a Bayes-szably s a
feltteles fggetlensg felhasznlsval:
(Figyeljk meg, hogy a normalizl konstans szintn a paramterektl fgg.) Alkalmazva ezt a kpletet,
mondjuk, a 273 pirosan csomagolt meggyz cukorkra, amelyekben lyuk van, a kvetkezt kapjuk:
A szmok tblzatban tallhat msik ht cukorkafajtval folytatva, (1) = 0,6124-et kapunk.

Nzzk a tovbbi paramtereket, mint pl. I1-et. A teljesen megfigyelhet esetben ezt kzvetlenl a megfigyelt,
1. zskbl szrmaz meggy- s citromz cukorkk szmbl becslnnk. Az 1. zskbl szrmaz
meggycukorkk vrhat szma:
Ezek a valsznsgek ismt brmely Bayes-hl algoritmussal kiszmthatk. Befejezve ezt az eljrst,
megkapjuk az sszes paramter j rtkt:
A gyakorlatban jobb vletlen rtkeket vlasztani, hogy elkerljk a szimmetria ltal okozott loklis maximumokat.
643
Az adatok log likelihood rtke a kezdeti kb. 2044-rl az els iterci sorn kb. 2021-re n, ahogy a 20.9. (b)
brn lthat. Eszerint a frissts magt a likelihoodot kb. e23 1010 szorzfaktorral nvelte. A tizedik itercira
a megtanult modell jobban illeszkedik, mint a valdi (L = 1982,214). Ezek utn a javuls nagyon lassv vlik.
Ez nem szokatlan az EM algoritmusnl, ezrt sok gyakorlatban hasznlt rendszer a tanuls vgs fzisban
gradiensalap algoritmusokkal mint pl. a NewtonRaphson-mdszer (lsd 4. fejezet) kombinlja az EM
algoritmust.
Fontos
Az ebbl a pldbl levonhat ltalnos tanulsg az, hogy a rejtett vltozkkal trtn Bayes-hl
tanulsparamtereinek frisstse kzvetlenl rendelkezsnkre ll az egyes pldkon trtn
kvetkeztets eredmnyekppen. Radsul csak loklis a posteriori valsznsgekre van szksgnk az
egyes paramterekhez. Az ltalnos esetben, amikor az egyes Xi vltozk feltteles valsznsgi
paramtereit azaz a ijk = P(Xi = Xij|Pai = paik) rtkeket tanuljuk, adott szlcsompontok esetn, a
frisstst a normalizlt vrhat szmrtkek adjk:
A vrhat szmrtkek a pldk sszegzsvel nyerhetk, kiszmtva a P(Xi = xij, Pai = paik) valsznsgeket
egy tetszleges Bayes-hl kvetkeztetsi algoritmussal. A pontos algoritmusok esetn belertve a vltoz
elimincit is ezek a valsznsgek mind a kvetkeztets mellktermkeknt kzvetlenl nyerhetk, a
tanulshoz nincs szksg semmilyen specilis extra szmtsra. St minden egyes paramter tanulshoz
szksges informci loklisan rendelkezsre ll.
3.3. Rejtett Markov-modellek tanulsa

Az EM algoritmus utols, itt bemutatott alkalmazsa a rejtett Markov-modellek (RMM) (hidden Markov model,
HMM) llapottmenet-valsznsgeinek tanulsa. Idzzk fel a 15. fejezetbl, hogy a rejtett Markov-modellek
olyan dinamikus Bayes-hlval reprezentlhatk, amelyeknek egyetlen, diszkrt llapotvltozja van, amint ez a
20.11. brn is lthat. Minden egyes adatpont egy vges hosszsg megfigyelssorozatnak felel meg, teht a
megoldand problma az, hogy megfigyelsi sorozatok halmaza (vagy esetleg egyetlen hossz sorozat) alapjn
llapottmenet-valsznsgeket kell megtanulnunk.
Mr kimunkltuk, hogy mi mdon tudunk Bayes-hlkat megtanulni, de van egy nehzsg: a Bayes-hlknl
minden egyes paramter elklnl, a rejtett Markov-modellben viszont idben ismtldnek az egyes ijt = P(Xt+1
= j|Xt = i) llapottmenet-valsznsgek (annak valsznsge, hogy a t idpillanatban az i-edik llapotbl a jedikbe jutunk), azaz ijt = ij minden t-re. Ahhoz, hogy megbecsljk az i-edik llapotbl a j-edik llapotba val
tmenet valsznsgt, egyszeren kiszmtjuk azon esetek vrhat arnyt, amikor a rendszer az i-edik
llapotban van s a j-edik llapotba megy:
20.11. bra - Rejtett Markov-modellt reprezentl kitertett dinamikus Bayes-hl (a

15.14. bra megismtlse)
644
Ismt tetszleges RMM kvetkeztetsi algoritmust hasznlhatunk a vrhat szmrtkek kiszmtsra. A 15.4.
brn bemutatott elre-htra (forward-backward) algoritmus knnyen mdosthat gy, hogy kiszmtsa a
szksges valsznsgeket. Egy fontos szempont, hogy azokra a valsznsgekre van szksgnk, amelyeket
inkbb simtssal (smoothing) nyernk, nem pedig szrssel (filtering): azaz neknk utlagosan kell
rtkelnnk a bizonytkokat az adott llapottmenet bekvetkezsi valsznsgnek becslsekor. Mint a 15.
fejezetben mondtuk, a gyilkossg bizonytkt ltalban a gyilkossg bekvetkezte (azaz az i llapotbl a j
llapotba val tmenetet) utn nyerjk.
3.4. Az EM algoritmus ltalnos alakja

Szmos pldt lttunk az EM algoritmusra. Mindegyik tartalmazta azt a lpst, hogy kiszmtottuk a rejtett
vltozk vrhat rtkt minden pldra, majd ezeket a vrhat rtkeket gy hasznltuk, mintha megfigyelt
rtkek lettek volna, s segtsgkkel jraszmoltuk a paramtereket. Legyen x az sszes pldban az sszes
megfigyelt rtk, jellje Z az sszes pldban az sszes rejtett vltozt, s legyen a valsznsgi modell
sszes paramtere. Ekkor az EM algoritmus:
Az EM algoritmus dihjban ez az egyenlet. Az E-lps az sszegzs kiszmtsa, ami a teljess tett adatokra,
a log likelihoodnak a P(Z = z|x, (i)) eloszls szerint szmtott vrhat rtke. Ez a valsznsg a rejtett
vltozknak az adatok felhasznlsval nyert a posteriori valsznsge. Az M-lps viszont nem ms, mint
ennek a log likelihoodnak a maximalizlsa a paramterek szerint. Kevert Gauss-jelekre a rejtett vltozk a Zij-k,
ahol Zij = 1, ha a j-edik mintt az i-edik komponens generlta. Bayes-hlknl az egyes pldk nem megfigyelt
vltoz rtkei a rejtett vltozk. RMM esetben az i j tmenetek a rejtett vltozk. Ha azonostottuk a
megfelel rejtett vltozkat az adott alkalmazsban, akkor az ltalnos formbl kiindulva levezethet az EM
algoritmus.
Amint megrtettk az ltalnos elgondolst, amin az EM alapul, az sszes varins s javts knnyen
levezethet. Pldul: sok esetben az E-lps a rejtett vltozk posteriorjainak kiszmtsa kezelhetetlen
problmt okoz, mint pldul a nagy Bayes-hlkban. Kiderlt, hogy alkalmazhatunk egy kzelt E-lpst, s
mg ezzel is hatkony algoritmust kapunk. Egy mintavteli algoritmussal mint amilyen pldul az MCMC
(lsd 14.5. alfejezet) a tanulsi folyamat nagyon szemlletes: minden egyes, az MCMC ltal bejrt llapotot (a
rejtett s megfigyelt vltozk konfigurcijt) gy kezelnk, mintha teljes megfigyels volna. Ennek
megfelelen a paramterek minden egyes MCMC-tmenet utn frissthetk. A kzelt kvetkeztets ms
formi mint pldul a varicis s hurkos mdszerek szintn hatkonynak bizonyultak nagyon nagy hlk
tanulsnl.
3.5. Bayes-hlstruktra tanulsa rejtett vltozk esetn

A 20.2. alfejezetben a Bayes-hlstruktra tanulsnak problmjt trgyaltuk teljes adatok esetn. Amikor
rejtett vltozkat is figyelembe vesznk, a dolgok nehezebb vlnak. A legegyszerbb esetben a rejtett vltozk
a megfigyeltekkel egytt fel vannak sorolva, br az rtkk nem ismert, de a tanul algoritmus tud a
ltezskrl, s helyet kell nekik talljon a hlstruktrban. Pldul egy algoritmus tanulhatja gy a 20.7. (a)
brn lthat struktrt, hogy megadjuk neki, hogy egy SzvBetegsg nev (hromrtk) vltozt be kell
ptsen a struktrba. Ha a tanul algoritmus nem kapja meg ezt az informcit, akkor kt lehetsg van: vagy
gy viselkedik, mintha az adatok teljesek volnnak (ami arra knyszerti, hogy a 20.7. (b) sokparamteres
modellt tanulja meg), vagy kitall j rejtett vltozkat a modell egyszerstse rdekben. Ez utbbi
645
megkzelts megvalsthat gy, hogy j mdostsi lehetsgeket vezetnk be a struktrakeressbe: a

kapcsolatok mdostsn tl az algoritmus hozzadhat vagy trlhet egy rejtett vltozt, illetve
megvltoztathatja argumentumszmt. Termszetesen az algoritmus nem fogja tudni, hogy a bevezetett j
vltoz neve SzvBetegsg; hasonlkppen nem tud rtelmes nevet adni az rtkeinek. Szerencsre ltalban a
bevezetett j rejtett vltoz elzetesen mr ltez vltozkkal van kapcsolatban, gy egy szakember rendszerint
meg tudja vizsglni az j vltozt is tartalmaz loklis feltteles eloszlsokat, s meg tudja llaptani a
jelentst.
ppgy, mint a teljes adatokra vonatkoz esetben, egy tisztn maximum-likelihood struktratanuls teljesen
sszekttt hlt eredmnyez (radsul rejtett vltozk nlklit), gy hasznlnunk kell a komplexitsbntets
valamilyen formjt. Hasznlhatjuk az MCMC-t is a Bayes-tanuls approximcijra. Pldul: ismeretlen
komponensszm kevert Gauss-jelek tanulsakor tlmintavtelezhetjk a szmot; ekkor a kzelt Gauss-jelek
szmnak kzelt a posteriori eloszlst az MCMC-folyamat mintavteli frekvencija adja.
Az eddigiekben az ltalunk vizsglt eljrsnak volt egy kls hurka, amely a struktrakeress folyamata, s egy
bels hurka, ami egy paramteres optimalizlsi eljrs. A teljes adatokra vonatkoz esetben a bels hurok
nagyon gyors csupn ki kell nyerni az adathalmazbl a feltteles gyakorisgokat. Ha rejtett vltozk is
vannak, akkor a bels hurok az EM algoritmussal trtn szmos itercit vagy egy gradiensalap algoritmust is
tartalmazhat. Minden itercis ciklusban ki kell szmtani a Bayes-hl a posteriori eloszlsait, ami nmagban
NP-teljes problma. Ez a megkzelts bonyolult modellek tanulsa esetn napjainkig nem bizonyult a
gyakorlatban is alkalmazhatnak. Egy lehetsges elrelps a strukturlis EM (structural EM), ami nagyon
hasonlan mkdik, mint a norml (parametrikus) EM, leszmtva azt, hogy nemcsak a paramtereket, hanem a
struktrt is frissti. ppgy, mint ahogy a norml EM algoritmus arra hasznlja az aktulis paramtereket, hogy
a vrhat szmrtkeket meghatrozza az E-lps sorn, majd alkalmazza ezeket a szmrtkeket az M-lpsben
j paramterek vlasztsra, a strukturlis EM az aktulis struktrt hasznlja a vrhat szmrtkek
meghatrozsra, majd arra alkalmazza ezeket a szmrtkeket az M-lpsben, hogy a potencilis j struktrk
likelihoodjt meghatrozza. (Ellenttben a kls hurok/bels hurok mdszerrel, amelynl minden potencilis
struktrra kiszmtjuk a vrhat szmrtkeket.) Ezen az ton a strukturlis EM szmos strukturlis vltoztatst
tud vgrehajtani a hln anlkl, hogy egyszer is jraszmoln a vrhat szmrtkeket. gy a mdszer kpess
vlik nemtrivilis Bayes-hlstruktrk tanulsra. Mindamellett sok munkt kell mg befektetni, mg azt
mondhatjuk majd, hogy a struktratanuls problmja megoldott.
4. Pldnyalap tanuls
Eddigiekben a statisztikai tanuls trgyalsban arra koncentrltunk, hogy valsznsgi modellek egy
behatrolt csaldjnak paramtereit egy struktrjban nem kttt adathalmazra illesszk. Pldul a kevert
Gaussokat hasznl, nem ellenrztt tanuls felttelezi, hogy az adatok megmagyarzhatk rgztett szm
Gauss-eloszls sszegeknt. Az ilyen mdszereket paramteres tanulsnak (parametric learning) nevezzk.
A paramteres tanul eljrsok gyakran nagyon egyszerek s hatkonyak, de egy meghatrozott behatrolt
modellcsald felttelezse sokszor tlzott egyszerstse annak, ami az adatokat szolgltat vals vilgban
trtnik. Nos, az termszetesen igaz, hogy ha nagyon kevs adatunk van, akkor nem remnykedhetnk egy
bonyolult s rszletes modell megtanulsban, de butasgnak tnik a hipotzis komplexitst akkor is rgztve
tartani, amikor az adathalmaz nagyon nagyra n.
A paramteres mdszerekkel ellenttben a nemparamteres tanulsi (nonparametric learning) mdszerek
lehetv teszik, hogy a hipotzis bonyolultsga egytt nvekedjk az adatokkal. Minl tbb adatunk van, annl
krmnfontabb lehet a hipotzis. Kt, nagyon egyszer nemparamteres pldnyalap tanulst hasznl
mdszercsaldot fogunk vizsglni, amelyeket azrt neveznk gy, mert kzvetlenl a tant pldnyokbl
hoznak ltre hipotziseket.
4.1. Legkzelebbi-szomszd modellek

A legkzelebbi-szomszd (nearest-neighbor) modellek alaptlete az, hogy brmely egyedi x bemeneti pont
tulajdonsgai valsznleg hasonlk az x pont krnyezetbe es pontok tulajdonsgaihoz. Pldul ha
srsgbecslst (density estimation) kvnunk vgezni azaz meg akarjuk becslni egy ismeretlen
valsznsg srsgfggvny-rtkt x-ben , akkor egyszeren mrhetjk azt, hogy x krnyezete milyen
srn van beszrva pontokkal. Ez nagyon egyszeren hangzik, amg r nem jvnk, hogy meg kell hatroznunk,
mit is rtnk szomszdsg alatt. Ha a szomszdsg tl kicsi, akkor egyltaln nem fog pontokat tartalmazni.
Ha tl nagy, akkor esetleg az sszes adatpontot tartalmazni fogja, s olyan srsget eredmnyez, ami mindentt
ugyanakkora. Egy megoldsi lehetsg, ha a szomszdsgot gy definiljuk, hogy legyen ppen elg tg ahhoz,
646
hogy k pontot tartalmazzon, ahol k elg nagy ahhoz, hogy sszer becslst vgezhessnk. Rgztett k esetn a
szomszdsg mrete vltoz, ahol ritkn vannak az adatok, ott a szomszdsg tg trrsz, ahol az adatok srn
helyezkednek el, ott a szomszdsg szk. A 20.12. (a) bra egy pldt mutat: kt dimenziban sztszrt
adatpontokat. A 20.13. bra mutatja az ezen adatokra elvgzett k-legkzelebbi-szomszd srsgbecslst k = 3,
10 s 40 esetre. k = 3 esetben a srsgbecslst minden egyes pontban csak 3 szomszdos pontra alapozzuk,
s ezrt ersen vltoz eredmnyt kapunk. k = 10 esetn a 20.12. (b) brn lthat valdi srsg j becslst
kapjuk. k = 40 esetn a szomszdsg tl tgg vlik, s az adatok struktrjt mindenestl elvesztjk.
Gyakorlatban kis dimenziszm esetn egy 5 s 10 kz es k a legtbb esetben j eredmnyt ad.
Keresztvalidci alkalmazsval is j rtket kaphatunk a k-ra.
20.12. bra - (a) A 20.8. (a) bra adatainak 128 pontos rszhalmaza, kt kivlasztott
ponttal, s 10 legkzelebbi szomszdjukkal. (b) Az adatok ellltsnl hasznlt kevert
Gauss-eloszls 3D brja.
20.13. bra - A 20.12. (a) brn lthat adatokra vgzett srsgbecsls, k = 3 (a); k = 10
(b) s k = 40 (c) esetn
Ahhoz, hogy egy krdses pontban a legkzelebbi szomszdokat meg tudjuk hatrozni, egy tvolsgmetrikra
D(x1, x2)-re van szksgnk. A 20.12. bra ktdimenzis pldjban euklideszi tvolsgot hasznltunk. Ez
nem felel meg, ha a tr minden dimenzijban valami mst mrnk pldul magassgot s slyt , mivel egy
dimenzi skljnak megvltoztatsa megvltoztatja a legkzelebbi szomszdok halmazt. Az egyik lehetsg,
hogy minden egyes dimenzi skljt normalizljuk. Ehhez elszr megmrjk az sszes tulajdonsg
variancijt a teljes adathalmazon, majd a tulajdonsgrtket gy fejezzk ki, hogy megadjuk: a
tulajdonsgrtk az adott tulajdonsg variancijnak hnyszorosa. (Ez a Mahalanobis-tvolsg [Mahalanobis
distance] amely a tulajdonsgok kovarianciamtrixt veszi figyelembe specilis esete.) Vgl diszkrt
esetben alkalmazhatjuk a Hamming-tvolsgot (Hamming distance), amely gy definilja D(x1, x2)-t, mint
azon tulajdonsgok szmt, amelyben x1 s x2 eltr.
647
A 20.13. brn lthathoz hasonl srsgbecslsek a bemeneti tr feletti egyttes eloszlsokat hatroznak meg.
A Bayes-hlktl eltren a pldnyalap reprezentcik nem tartalmaznak rejtett vltozkat, ami azt jelenti,
hogy nem alkalmazhatunk nem ellenrztt osztlyozst, mint ahogy a kevert Gauss-modellnl tettk. Tovbbra
is alkalmazhatjuk a kvnt y rtknek az x bemeneti tulajdonsgok alapjn trtn jslsra a srsgbecslst, ha
kiszmtjuk P(y|x) = P(y, x)/P(x)-et, feltve, hogy a tant adatok a kvnt rtkre nzve is tartalmaznak
rtkeket.
A legkzelebbi-szomszd tanulsi algoritmus hasznlhat kzvetlen ellenrztt tanulsra is. Ha adott egy
tesztplda x bemeneti rtkekkel, akkor az y = h(x) az x k-legkzelebbi-szomszdjnak y rtkeibl nyerhet.
Diszkrt esetben tbbsgi szavazssal kaphatunk egyetlen jsolt rtket. Folytonos esetben tlagolhatjuk a k
darab rtket, vagy loklis lineris regresszit vgezhetnk a k pontra illesztve, ez utbbi esetben a jslst a
kialakul hipersk x-beli rtke adja.
A k-legkzelebbi-szomszd tanulsi algoritmus nagyon egyszeren megvalsthat, kevs hangolst ignyel, s
gyakran elg jl mkdik. J dolog, ha elszr egy j tanulsi problmn prbljuk ki. Mindazonltal nagy
adathalmazokban hatkony mechanizmust kell tallnunk arra, hogy a krdses x pont legkzelebbi szomszdjait
megtalljuk, hiszen tl hossz lenne minden pontra kiszmtani a tvolsgot. Egy sor szellemes, a tant adatok
elfeldolgozsn alapul mdszert javasoltak ennek a lpsnek a hatkonyny ttelre. Szerencstlen mdon a
legtbb ilyen mdszer nem viselkedik jl a tr dimenzijnak nvekedsvel (azaz a tulajdonsgok szmnak
nvekedsvel).
A sokdimenzis terek mg egy tovbbi problmt jelentenek, nevezetesen azt, hogy egy ilyen trben a
legkzelebbi szomszdok rendszerint nagyon messze vannak. Vegynk egy N elem, d dimenzis
egysgkockban elhelyezked adathalmazt, s tegyk fel, hogy a szomszdsgok b oldal hiperkockk, amelyek
trfogata bd. (Ugyanez a megfontols mkdne hipergmbk felttelezse esetn is, de a hipergmb
trfogatkplete bonyolultabb.) Ahhoz, hogy k pontot tartalmazzon, az tlagos szomszdsg a teljes trfogat
amit egysgnyinek tekintnk k/N-ed rszt kell elfoglalnia. Ennek megfelelen bd = k/N, vagyis b = (k/N)1/d.
Eddig j. Legyen most d = 100, k = 10 s N = 1 000 000 rtk. Akkor b 0,89 azaz a szomszdsg majdnem
az egsz bemeneti teret elfoglalja! Ez arra utal, hogy sokdimenzis esetben a legkzelebbi-szomszd alap
mdszerek nem megbzhatk. Alacsony dimenziszm esetn nincs problma, d = 2 esetn b = 0,003.
4.2. Kernelmdszerek
A kernelmodellben (kernel model) gy tekintnk minden tant pldnyra, mintha egy kis sajt
srsgfggvnyt kernelfggvnyt (kernel function) generlna. Az ered srsgfggvny becsls nem
ms, mint a kis kernelfggvnyek slyozott sszege. Egy xi tant pldny egy K(x, xi) kernelfggvnyt generl,
amely a tr minden x pontjhoz egy valsznsget rendel. gy a srsgbecsls:
Normlis esetben a kernelfggvny csak az x s xi kztti D(x, xi) tvolsgtl fgg. A legnpszerbb
kernelfggvny (termszetesen) a Gauss-fggvny. Az egyszersg kedvrt egy gmbszimmetrikus Gaussfggvnyt feltteleznk, amelynek minden tengely mentn w a szrsa, azaz:
ahol d az x dimenziszma. Htra van mg a megfelel w rtk vlasztsnak problmja. ppgy, mint az
elzkben egy tl kis szomszdsg nagyon hepehupss teszi a becslst mint a 20.14. (a) brn lthat. A (b)
brn lthat, hogy egy kzepes w rtk nagyon j becslst ad. A (c) brn bemutattuk, hogy a tl nagy
szomszdsg eredmnyekpp teljesen elvesztjk a struktrt. J w rtket vlaszthatunk keresztvalidcival.
20.14. bra - A 20.12. (a) brn lthat adatok srsgbecslse Gauss-kernelekkel, w =

0,02 (a); w = 0,07 (b) s w = 0,20 (c) esetn.
648
Ellenrztt tanulst kernelekkel gy vgezhetnk, hogy a tant pldnyokbl szrmaztatott sszes jsls
slyozott kombincijt vesszk. (sszehasonltva a k-legkzelebbi-szomszd mdszerrel, ott a k-legkzelebbipldny slyozatlan kombincijt hasznljuk.) Az i-edik pldnynak a krdses x pontra vett slyt a K(x, xi)
kernelfggvnyrtk adja. Diszkrt jsls esetn slyozott szavazst vehetnk, folytonos esetben slyozott
tlagot vagy slyozott lineris regresszit. Figyeljk meg, hogy a kernelekkel vgzett jsls azt ignyli, hogy az
sszes tant pldnyt figyelembe kell vennnk. A kernelek sszekombinlhatk a legkzelebbi-szomszd
indexelsi smival azrt, hogy csupn a szomszdos pldnyok alapjn ellltott slyozott jslst
alkalmazzuk.
5. Neurlis hlk
A neuron egy olyan agysejt, amelynek alapfeladata elektromos jelek sszegyjtse, feldolgozsa s
sztterjesztse. A 2.4. szakasz - Neurlis tudomnyok (1861-tl napjainkig) rszben az 1.2. bra egy tipikus
neuron sematikus rajzt mutatja. Azt gondoljuk, hogy az agy informcifeldolgoz kapacitsa elssorban ilyen
neuronok hlzatbl alakul ki. Ezrt a korai MI nhny kutatsa mestersges neurlis hlk (neural
networks) ltrehozsra irnyult. (A terlet ms, szintn hasznlt elnevezsei: konnekcionizmus
[connectionism], prhuzamos elosztott feldolgozs [parallel distributed processing] s neurlis
szmtstechnika [neural computation].) A 20.15. bra a neuron egyszer matematikai modelljt mutatja,
ahogy McCulloch s Pitts (McCulloch s Pitts, 1943) megalkottk. Elnagyolva az mondhat, hogy a neuron
akkor tzel, amikor a bemeneti rtkek slyozott sszege meghalad egy kszbt. 1943 ta sokkal
rszletesebb s valsghbb modelleket alkottak mind a neuronra, mind az agy nagyobb rendszereire, ez
vezetett a szmtgpes ideghl-modellezs (computational neuroscience) modern tudomnyterletnek
megjelenshez. Msrszt az MI s a statisztika kutatinak rdekldst felkeltettk a neurlis hlzatok
absztraktabb tulajdonsgai, mint pldul az elosztott szmts elvgzsre, a bemeneti zajjal szembeni
rzketlensgre s a tanulsra val kpessg. Br ma mr tudjuk, hogy ms rendszerek, pldul a Bayes-hlk is
rendelkeznek ezekkel a tulajdonsgokkal, de a neurlis hl maradt a tanul rendszerek egyik leghatkonyabb s
legnpszerbb formja, ezrt megri kln trgyalni.
20.15. bra - A neuron egyszer matematikai modellje. Az egysg kimeneti aktivcija

ahol aj a j-edik egysg kimeneti aktivcija s Wj,i a j-tl i-ig vezet
sszekttets slya.
649
5.1. A neurlis hl egysgei

A neurlis hlk irnytott kapcsolatokkal (link) sszekttt csompontokbl vagy egysgekbl (unit) llnak.
A j-edik egysgtl az i-edik fel vezet kapcsolat hivatott az aj aktivcit j-tl az i-ig terjeszteni. Minden egyes
kapcsolat rendelkezik egy hozz aszszocilt Wj,i numerikus sllyal (weight), ami meghatrozza a kapcsolat
erssgt s eljelt. Minden egyes i egysg elszr a bemeneteinek egy slyozott sszegt szmtja ki:
A kimenett gy kapja, hogy ezek utn egy g aktivcis fggvnyt (activation function) alkalmaz a kapott
sszegre:
Figyeljk meg, hogy hasznltunk egy eltolsslyt (bias weight) W0,i-t, amelyet egy rgztett rtk a0 = 1
bemenetre kapcsolunk. Rvidesen megmagyarzzuk, hogy mi a jelentsge.
Az aktivcis fggvnnyel szemben kt elvrsunk van. Elszr az, hogy az egysg legyen aktv (+1 krli
kimenet), ha a helyes bemeneteket kapja, s inaktv (0 krli kimenet), ha rossz bemeneteket kap.
Msodszor az, hogy az aktivci legyen nemlineris, klnben az egsz neurlis hl egy egyszer lineris
fggvnny fajul (lsd 20.17. feladat). A 20.16. bra ktfle aktivcis fggvnyt mutat be: a kszbfggvnyt
(threshold function), illetve a szigmoid fggvnyt (sigmoid function) (mely utbbi logisztikus fggvnyknt
[logistic function] is ismert). A szigmoid fggvny elnye, hogy differencilhat, ami mint ksbb ltni
fogjuk fontos a slytanulsi algoritmus szempontjbl. Vegyk szre, hogy mindkt fggvnynek van egy
kszbpontja (akr kemny, akr lgy) a nullnl; az eltolssly lltja be az egysg aktulis kszbpontjt. Ez
azt jelenti, hogy az egysg akkor aktivldik, ha a valdi bemenetek slyozott sszege
meghaladja W0,i-t.
20.16. bra - (a) A kszb aktivcis fggvny, amely 1-et ad a kimeneten, ha a

bemenete pozitv, klnben pedig 0-t. (Nha az eljelfggvnyt is hasznljk ehelyett,
amely 1-et ad a bemenet eljeltl fggen.) (b) A szigmoid fggvny 1/(1+ex).
650
20.17. bra - Megfelel bemeneti s eltolsslyokkal rendelkez, kszbaktivcij

egysgek kpesek logikai kapuknt mkdni
Nmi fogalmunk alakulhat ki az egyes egysgek mkdsrl, ha sszehasonltjuk ket a logikai kapukkal. Az
egyes egysgek tervezsnek eredeti motivcii kztt (McCulloch s Pitts, 1943) szerepelt az, hogy kpesek az
alapvet logikai fggvnyek reprezentlsra. A 20.17. bra bemutatja, hogy az s, vagy s nem logikai
fggvnyek hogyan reprezentlhatk egy megfelel slyokkal rendelkez kszbegysg segtsgvel. Ez azrt
fontos, mert azt jelenti, hogy ezen egysgek felhasznlsval tetszleges logikai fggvny kiszmtsra tudunk
hlzatot pteni.
5.2. Hlstruktrk
A neurlis hlstruktrk kt f csoportja: a hurokmentes vagy elrecsatolt hlk (feed-forward network) s a
visszacsatolt vagy rekurrens hlk (recurrent network). Az elrecsatolt hl a pillanatnyi bemenet
fggvnyt reprezentlja, azaz nincs semmilyen ms bels llapota, csak maguk a slyok. A rekurrens hl
viszont a kimeneteit visszacsatolja a bemeneteire. Ez azt jelenti, hogy a hl aktivcis szintjei dinamikus
rendszert alkotnak, elrhetnek stabil llapotot, de mutathatnak oszcillcit, st kaotikus viselkedst is. Ezenfell
a hl egy adott bemenetre adott vlasza a kezdeti llapottl fgg, amely a korbbi bemenetektl fgghet.
Ennlfogva a rekurrens hlk (ellenttben az elrecsatolt hlkkal) rvid tv memrit is biztosthatnak.
Ezltal rdekesebb vlnak mint agymodellek, de egyben nehezebben is rthetk. Ez a rsz az elrecsatolt
hlkra koncentrl, a fejezet vgn nhny hivatkozst adunk, segtve a rekurrens hlk tovbbi
tanulmnyozst.
Nzzk meg kzelebbrl azt az lltst, hogy az elrecsatolt hl a bemeneteinek fggvnyt reprezentlja.
Vizsgljuk a 20.18. bra egyszer hlzatt, amelynek kt bemeneti egysge, kt rejtett egysge (hidden unit)
s egy kimeneti egysge van. (Az egyszersg kedvrt ebben a pldban elhagytuk az eltolsegysgeket.)
Adott x = (x1, x2) bemeneti vektor esetn a bemeneti egysgek aktivcija (a1, a2) = (x1, x2), s a hlzat a
kvetkez szmtst vgzi:
a5 = g(W3,5a3 + W4,5a4)
= g(W3,5g(W1,3a1 + W2,3a2) + W4,5g(W1,4a1 + W2,4a2)) (20.11)
651
Azaz kifejezve a rejtett egysgek kimenett, mint a sajt bemeneteik fggvnyt, megmutattuk, hogy az egsz
hl a5 vgs kimenete a hl bemeneteinek fggvnye. Tovbb azt ltjuk, hogy a hl slyai ennek a
fggvnynek a paramtereiknt szolglnak; ha W-vel jelljk a paramtereket, akkor a hl a hW(x) fggvnyt
szmtja ki. Ha vltoztatjuk a slyokat, akkor vltozik a hl ltal reprezentlt fggvny. Ez a mdja a neurlis
hlk tanulsnak.
A neurlis hlt osztlyozsra vagy regresszira hasznlhatjuk. Ha folytonos kimenete van a hlnak (pl.
szigmoid egysgekkel), akkor logikai osztlyozs esetn hagyomnyosan egy kimeneti egysget hasznlunk, s
ha ennek aktivcis rtke 0,5 feletti, azt az egyik, ha 0,5 alatti, akkor a msik osztlyba tartozsknt
interpretljuk. Egy k osztlyos osztlyozsi feladatnl feloszthatjuk az egyetlen kimeneti egysg
rtktartomnyt k rszre, de megszokottabb, hogy ehelyett k elklnlt kimeneti egysget hasznljunk, ahol
mindegyiknek az aktivcis rtke a bemenet adott osztlyba tartozsnak valsznsgt reprezentlja.
Az elrecsatolt hlkat rendszerint rtegekbe (layer) szervezzk oly mdon, hogy minden egyes egysg csak a
kzvetlenl megelz rteg egysgeitl kap bemeneti jelet. A kvetkez kt alfejezetben egyrszt az egyrteg
hlzatokkal foglalkozunk, amelyeknek nincsenek rejtett egysgei, msrszt a tbbrteg hlkkal, amelyek egy
vagy tbb rejtett rteggel rendelkeznek.
20.18. bra - Egy nagyon egyszer, kt bemeneti egysggel, egyetlen kt egysgbl ll

rejtett rteggel s egy kimeneti egysggel rendelkez hl
5.3. Egyrteg elrecsatolt neurlis hlk (perceptronok)

Azt a hlt, amelyben az sszes bemenet kzvetlenl a kimenetekre kapcsoldik egyrteg neurlis hlnak
(single layer neural network) vagy perceptron (perceptron) hlnak nevezzk. Mivel mindegyik kimeneti
egysg fggetlen a tbbitl mindegyik sly csak egyetlen kimenetre van hatssal vizsglatainkat
korltozhatjuk az egykimenet perceptronra, mint azt a 20.19. (a) bra magyarzza.
Kezdjk annak a hipotzistrnek a tanulmnyozsval, amelyet egyetlen perceptron reprezentlhat.
Kszbaktivcis fggvny esetn gy tekinthetjk a perceptront, mint ami logikai fggvnyt reprezentl. Az
elemi logikai fggvnyeken (s, vagy s nem, lsd 20.17. bra) tl a perceptron kpes nhny egszen
bonyolult logikai fggvnyt is nagyon tmren reprezentlni. Pldul a tbbsgfggvnyt (majority
function), amely csak akkor ad ki 1-et, ha n bemeneteinek tbb mint fele 1, egy olyan perceptron reprezentl,
amelynek minden slya Wj = 1 s a kszb W0 = n/2. Egy dntsi fnak O(2n) csompontra lenne szksge
ennek a fggvnynek a reprezentlshoz.
Sajnos szmos olyan logikai fggvny van, amelyet a kszbfggvnyt hasznl perceptron nem tud
reprezentlni. A (20.10) egyenletet vizsglva ltjuk, hogy a kszbrtk-perceptron akkor s csak akkor ad 1-et,
ha bemeneteinek (belertve az eltols- bemenetet is) slyozott sszege pozitv:
652
20.19. bra - (a) Egy perceptronhlzat hrom kimeneti egysgbl, amelyeknek t kzs
bemenete van. Ha kivlasztunk egy kimeneti egysget (mondjuk a msodikat, vastag
vonallal kiemelve), akkor azt ltjuk, hogy bemeneti sszekttetsei nincsenek semmilyen
hatssal a tbbi kimeneti egysgre. (b) Egy ktbemenet szigmoid aktivcis fggvny
perceptronegysg kimenetnek brzolsa.
Fontos
A W x = 0 egyenlet egy hiperskot hatroz meg a bemeneti trben, teht a perceptron akkor s csak
akkor ad 1-et, ha a bemenet ennek a hipersknak az egyik oldaln van. Ezrt a kszbperceptront
lineris szepartornak (linear separator) is nevezik. A 20.20. (a) s (b) bra mutatja a szeparl
hiperskot (ami kt dimenziban egy egyenes) a ktbemenet s, illetve vagy fggvnyek
perceptronreprezentcija esetn. Fekete ptty jelzi a bemeneti tr olyan pontjait, amelyekre a
fggvny rtke 1, fehr ptty pedig az olyan pontokat, amelyre 0 ez az rtk. A perceptron azrt kpes
reprezentlni ezt a fggvnyt, mert ltezik olyan egyenes, ami az sszes fehr pontot az sszes
fekettl elvlasztja. Az ilyen fggvnyeket linerisan szeparlhatnak (linearly separable)
nevezzk. A 20.20. (c) bra egy olyan fggvnyre mutat pldt, amely nem szeparlhat linerisan ez
az xor fggvny. Nyilvnvalan nincs lehetsg arra, hogy egy kszbperceptron megtanulja ezt a
fggvnyt. ltalnossgban elmondhat, hogy egy kszbperceptron csak linerisan szeparlhat
fggvnyek reprezentcijra kpes. Ez a fggvnyeknek csak kis tredkt jelenti; a 20.14. feladat azt
kri, hogy fejezze ki szmszeren, mekkora is ez a tredk. A szigmoiddal felptett perceptronok
hasonlkppen korltozott kpessgek abban az rtelemben, hogy csupn lgy lineris
szepartorokat reprezentlnak. (Lsd 20.19. (b) bra.)
20.20. bra - Lineris szeparlhatsg kszbperceptronok esetn. Fekete ptty jelzi a

bemeneti tr olyan pontjait, amelyekre a fggvny rtke 1, fehr ptty pedig az olyan
pontokat, amelyre 0 ez az rtk. A perceptronkimenet az egyenes nem rnykolt oldaln
1. A (c) esetben nincs olyan egyenes, amely jl osztlyozn a bemeneteket.
653
Fontos
Korltozott kifejezkpessge ellenre a kszbperceptronnak vannak elnyei is. Klnsen is fontos,
hogy ltezik olyan egyszer tanul algoritmus, amely a kszbperceptront tetszleges linerisan
szeparlhat adathalmazra kpes illeszteni. Mgsem mutatjuk most be ezt, inkbb levezetnk egy
ehhez kzel ll tanul algoritmust a szigmoid perceptronokra.
Ennek az algoritmusnak az az alapgondolata (valjban a neuronhl tanul algoritmusok legtbbjnek is ez),
hogy a tant mintahalmazon mrt hiba valamilyen mrtknek minimalizlsa rdekben mdostjuk a
neuronhl slyait. Teht a tanulst formlisan a slytrben (weight space) vgzett optimalizlsi keressknt
fogalmazzuk meg.9 A hiba klasszikus mrtke a ngyzetes hibasszeg, amit a lineris regresszinl a 2.3.
szakasz - Maximum-likelihood paramtertanuls: folytonos eset rszben is hasznltunk. Egyetlen, x bemenettel
s y kvnt kimenettel megadott plda ngyzetes hibja a kvetkezkppen rhat fel:
ahol hW(x) a perceptron kimeneti rtke.

A ngyzetes hiba cskkentsre gradiensalap optimalizlsi eljrst hasznlhatunk, ehhez az E minden egyes
slyra vonatkoz parcilis derivltjt meg kell hatroznunk. Teht:
ahol g' az aktivcis fggvny derivltja.10 Amikor a gradiensalap algoritmusban cskkenteni akarjuk E-t, a
slyfrissts sszefggse a kvetkez:
Wj Wj + Err g'(in) xj (20.12)
ahol a btorsgi faktor (vagy tanulsi faktor, learning rate). Intuitve ez nagyon sszer. Ha a hiba Err = y
hW(x) pozitv, akkor a hl kimenete tl kicsi, teht a pozitv bemenetekhez tartoz slyokat nveljk, a
negatvakhoz tartozkat pedig cskkentjk. Ha a hiba negatv, akkor ppen ennek ellenkezje trtnik. 11
A teljes algoritmus a 20.21. brn lthat. Egyesvel sorban vgigfuttatja a mintkat a hln, s minden egyes
plda utn a hiba cskkentse rdekben kiss mdostja a slyokat. A mintahalmaz egyszeri vgigfuttatst
A folytonos terekben hasznlhat ltalnos optimalizlsi technikkat lsd a 4.4. alfejezetben.
Szigmoid fggvny esetn ez a derivlt g' = g(1 g).
11
Kszbperceptronokra, ahol g'(in) nem definilt, a Rosenblatt (Rosenblatt, 1957) ltal kidolgozott eredeti perceptron tanulsi szably
(perceptron learning rule) megegyezik a (20.12) egyenlettel, leszmtva, hogy a g'(in) kimarad. Mivel g'(in) minden slyra azonos,
elhagysa az egyes mintknl sszessgben csak a slyfrissts nagysgt vltoztatja meg, az irnyt nem.
9
10
654
epochnak (epoch) nevezzk. Az epochokat addig ismteljk, amg valamilyen lellsi felttel nem teljesl
tipikus, hogy akkor llunk le, amikor a slyvltozsok mr nagyon kicsiv vlnak. Ms mdszerek esetn ered
gradienst szmtunk az egsz tant halmazra, egyszeren sszeadva az egyes pldknl a (20.12) szrmaz
gradienseket, s az ered gradiens alapjn frisstjk a slyokat. A sztochasztikus gradiens (stochastic
gradient) mdszer nem ciklikusan veszi a tant halmaz mintit, hanem inkbb vletlenszeren vlaszt mintkat
a tant halmazbl.
A 20.22. bra kt klnbz problmra bemutatja a perceptron tanulsi grbjt. A bal oldali brn a 11
logikai bemenetre vonatkoz tbbsgfggvny (teht a kimenet akkor 1, ha 6 vagy tbb bemenet 1) tanulsi
grbje lthat. Vrakozsunknak megfelelen a perceptron meglehetsen gyorsan tanulja a fggvnyt, mivel a
tbbsgfggvny linerisan szeparlhat. Msrszrl viszont a dntsi fa tanul nem nagyon halad a tanulssal,
mert a tbbsgfggvnyt nagyon nehz (br nem lehetetlen) dntsi fban reprezentlni. A jobb oldali brn az
tterem plda lthat. A problma megoldsa knnyen brzolhat dntsi fval, de linerisan nem
szeparlhat. Az adatokra felvett legjobb szeparl sk csak 65%-ot osztlyoz helyesen.
20.21. bra - A gradiensalap perceptron tanulsi algoritmus, felttelezve, hogy a g

aktivcis fggvny differencilhat. Kszbperceptronokra elhagyjuk a g'(in) faktort
a slyfrisstsbl. A NEURLIS-HL-HIPOTZIS fggvny egy olyan hipotzist ad vissza,
amely brmely bemenetre kiszmtja a hl vlaszt.
Az eddigiekben gy tekintettk a perceptronokat, mint olyan determinisztikus fggvnyeket, amelyeknek

valsznleg hibval terhelt a kimenete. Lehetsgnk van, hogy a szigmoid perceptron kimenett
valsznsgknt interpretljuk annak valsznsgeknt, hogy adott bemenetek esetn a vals kimenet 1.
Ezzel az interpretcival gy hasznlhatjuk a szigmoidot, mint a Bayes-hlk feltteles eloszlsainak kanonikus
reprezentcijt (lsd 14.3. alfejezet). Levezethetnk egy tanul algoritmust is, a standard mdszernek
megfelelen maximalizlva az adatok (feltteles) log likelihood rtkt, amint ezt a fejezet korbbi rszben
ismertettk. Lssuk, hogyan is mkdik ez.
20.22. bra - A perceptronok s dntsi fk teljestmnynek sszehasonltsa. (a) A

perceptronok jobbak a 11 bemenet tbbsgfggvny tanulsban. (b) A dntsi fk
jobbak az tterem pldban a VrjunkE prediktum tanulsban.
655
Vegynk egyetlen tant pldt, amelynek kvnt kimeneti rtke T, s legyen erre a pldra a perceptron
vlasza p. Ha T = 1, akkor az adat feltteles valsznsge p, ha T = 0, akkor a feltteles valsznsg (1 p).
Egy egyszer trkk alkalmazsval a log likelihoodot differencilhat formban rhatjuk fel. A trkk az, hogy
ha a 0/1 vltozt egy kifejezs kitevjbe rjuk, akkor indiktorvltozknt (indicator variable) viselkedik:
pTakkor p, ha T = 1, egybknt 1; hasonlkppen (1 p)(1T) akkor (1 p), ha T = 0, klnben 1. Ezek szerint az
adat log likelihood rtkt felrhatjuk, mint:
L = log pT(1 p)(1 T) = T log p + (1 T) log(1 p) (20.13)
A szigmoid fggvny tulajdonsgainak hla, a gradiens rendkvl egyszer formra hozhat (20.16. feladat):
Fontos
Vegyk szre, hogy szigmoid perceptronok esetn a maximum-likelihood tanuls slyfrisstsi vektort
megad egyenlete alapveten azonos a ngyzetes hiba minimalizlsn alapul frissts vektorval.
Teht azt mondhatjuk, hogy a perceptronnak mg akkor is van valsznsgi interpretcija, ha a
tanulsi szablyt determinisztikus megkzeltssel szrmaztattuk.
5.4. Tbbrteg elrecsatolt neurlis hlk

Vizsgljuk most a rejtett neuronokkal rendelkez hlkat. A legelterjedtebb esetben egy rejtett rteget 12 szoktak
hasznlni, ezt mutatja 20.24. bra. A rejtett rteg hozzadsnak az az elnye, hogy kiterjeszti a hl ltal
reprezentlhat hipotzisek tert. Gondoljunk minden egyes rejtett neuronra gy, mint ami egy lgy
kszbfggvnyt reprezentl a bemeneti trben lsd a 20.19. (b) brt. Ezek utn gondoljunk gy egy kimeneti
neuronra, mint ami szmos ilyen fggvny lineris kombincijnak lgy kszbfggvnye. Pldul sszeadva
kt egymssal szemben ll lgy kszbfggvnyt, s kszbzve az eredmnyt, a 20.23. (a) brn lthat
hegygerinc fggvnyt kapjuk. Egymsra derkszgben ll kt ilyen hegygerinc kombinlsval (teht 4
rejtett neuron kimenetnek kombinlsval) a 20.23. (b) brn lthat dudort kapjuk.
Tbb rejtett neuronnal klnbz helyeken tbb, eltr mret dudort tudunk ltrehozni. Valjban egyetlen,
megfelelen nagy rejtett rteggel a bemenetek tetszleges folytonos fggvnye tetszleges pontossggal
reprezentlhat, st kt rteggel mg nemfolytonos fggvnyek is reprezentlhatk. 13 Sajnos egy egyedi neurlis
struktra esetn nemigen lehet megmondani, hogy milyen fggvnyek reprezentlhatk, s milyenek nem.
Tegyk fel, hogy az tterem problmra akarunk konstrulni egy egy-rejtett-rteggel rendelkez hlt. Minden
pldt 10 attribtum r le, teht egy 10 bemenet hlra lesz szksg. Hny rejtett neuron kell? A 20.24. brn
bemutatunk egy ngy rejtett neuronnal felptett hlt. Az derlt ki, hogy ez nagyjbl megfelel ehhez a
Egyesek ezt hromrteg hlzatnak nevezik, msok ktrtegnek (mivel a bemenetek nem igazi neuronok). A zrzavar elkerlse
rdekben mi egy-rejtett-rteg hl-nak nevezzk.
13
A bizonyts bonyolult, de legfbb pontja az, hogy a bemenetek szmval exponencilisan n a szksges rejtett neuronok szma. Pldul
n bemenet logikai fggvnyek kdolsra 2n/n rejtett neuron kell.
12
656
problmhoz. A rejtett neuronok szmnak elzetes meghatrozsa mg napjainkban sem jl megoldott

problma. (Lsd 5.5. szakasz - Neurlis hlstruktrk tanulsa rszben.)
20.23. bra - (a) Kt egymssal szemben ll lgy kszbfggvny kombincijnak

eredmnye: egy hegygerinc. (b) Kt hegygerinc kombincijnak eredmnye a dudor.
A tbbrteg hl tanul algoritmusa hasonl a 20.21. brn bemutatott perceptrontanulsi algoritmushoz. Egy
kisebb klnbsg, hogy tbb kimenet is lehet, gy nem egy skalr kimeneti rtknk, hanem egy hW(x) kimeneti
vektorunk van, s minden egyes pldhoz is egy y kvnt kimeneti vektor tartozik. Fontosabb klnbsg, hogy
mg a kimeneti rtegben a hiba nyilvnvalan y hW, addig a rejtett rtegben a hiba misztikusnak tnik, hiszen a
tant mintk nem mutatjk, hogy minek kellene lennie a rejtett csompontok rtknek. Kiderl, hogy a hibt
viszszaterjeszthetjk (back-propagate) a kimeneti rtegrl a rejtett rtegekre. A hiba-visszaterjesztsi eljrs
(back-propagation) kzvetlenl kiaddik a teljes hibagradiens levezetsbl. Elszr egy intuitv bizonytssal
mutatjuk be az eljrst, majd megmutatjuk a levezetst is.
20.24. bra - Tbbrteg neurlis hl egy rejtett rteggel s 10 bemeneti egysggel,

alkalmas az tterem problmhoz
A kimeneti rtegre a slyfrisstsi szably azonos a (20.12) egyenlettel. Tbb kimenetnk van, legyen Erri az y
hW hibavektor i-edik komponense. Hasznos lesz, ha bevezetjk a mdostott hibt, i = Erri g'(ini)-t, gy a
slyfrisstsi szably:
Wj,i Wj,i + aj i (20.14)
Ahhoz, hogy a bemeneti neuronok s a rejtett neuronok kzti sszekttetsek frisstst megoldjuk, a kimeneti
csompontok hibjhoz hasonl mennyisget kell definilnunk. Ez az a pont, ahol a hiba-visszaterjesztst
vgezzk. A gondolat az, hogy a j rejtett csompont valamilyen arnyban felels minden egyes vele
sszekttetsben lv kimeneti csompont i hibjrt. gy a i rtkeket a rejtett csompont s a kimeneti
csompont kztti sszekttets erssge alapjn osztjuk s visszaterjesztjk, hogy megkapjuk a rejtett rteg j
rtkeit. A rtkek terjesztsi szablya a kvetkez:
657
Ezek utn a bemenetek s a rejtett rteg kztti slyok frisstsi szablya szinte azonos a kimeneti rteg frisstsi
szablyval:
Wk,j Wk,j + ak j
A hiba-visszaterjesztsi algoritmus a kvetkez mdon foglalhat ssze:

Szmtsuk ki a kimeneti neuronokra a rtkeket a megfigyelt hiba alapjn.
A kimeneti rteggel kezdve ismteljk a kvetkez lpseket minden rtegre, amg a legels rejtett rteget el
nem rjk:
Terjesszk vissza a rtkeket a megelz rtegre.
Frisstsk a kt rteg kztti slyokat.
Az algoritmust a 20.25. bra mutatja be rszleteiben.
20.25. bra - A tbbrteg hlkra kidolgozott hiba-visszaterjesztses tanulsi

algoritmus
A matematika irnt vonzalmat rzk kedvrt most az alapegyenletekbl levezetjk a hiba-visszaterjesztsi

algoritmust. Egyetlen mintra a ngyzetes hiba defincija:
ahol az sszegzs a kimeneti rteg csompontjaira vonatkozik. Egy bizonyos Wj,i slyra vett gradiens
kiszmtshoz csak az ai aktivcit kell derivlnunk, mivel az sszeg sszes tbbi tagja fggetlen Wj,i-tl:
658
ahol i-t az elzkkel megegyezen definiltuk. Ahhoz, hogy a bemeneti rteget s a rejtett rteget sszekt
Wk,j slyokra vonatkoz gradienst megkapjuk, meg kell tartanunk az i feletti teljes sszegzst, hiszen az sszes
kimeneti ai rtkre hatssal lehetnek Wk,j vltozsai. Az aj aktivcikat szintn mind ki kell fejtennk.
Aprlkosan bemutatjuk a levezetst, mivel rdekes megfigyelni, ahogy a differencil opertor visszaterjed
hln keresztl:
ahol a j-t az elzkkel megegyezen definiltuk. Teht megkaptuk azt a frisstsi szablyt, amelyet mr
korbban megkaptunk intuitv ton is. Az is nyilvnval, hogy az eljrs folytathat tbb mint egy rejtett rteg
hlkra is, ami igazolja a 20.25. brn bemutatott ltalnos algoritmust.
Keresztlverekedvn magunkat (vagy tugorva) a matematikai levezetsen lssuk most, hogy milyen
teljestmnyt nyjt egy egy-rejtett-rteg hl az tterem problmn. A 20.26. brn kt grbt mutatunk be. Az
els a tantsi grbe (training curve), amely a slyfrissts sorn az tlagos ngyzetes hiba alakulst mutatja
egy adott 100 elem tterem pldahalmazon mrve. Ez jl demonstrlja, hogy a hl valban konvergl a tant
mintkra val tkletes illeszkedshez. A msodik grbe az tteremadatok standard tanulsi grbje. A neurlis
hl jl tanul, br nem annyira gyorsan, mint a dntsi fa tanuls. Ez taln nem meglep, hiszen az adatokat egy
egyszer dntsi fval generltuk.
20.26. bra - (a) Az tterem problma egy adott pldahalmazn felvett tanulsi grbe,
ami a slyok szmos epoch sorn trtn mdostsval elrt fokozatos hibacskkenst
mutatja. (b) sszehasonlt tanulsi grbk, amelyek azt mutatjk, hogy a dntsi fa
tanuls valamivel jobb teljestmnyt ad, mint a tbbrteg hl hiba-visszaterjesztses
tanulsa.
659
A neurlis hlk termszetesen messze bonyolultabb tanulsi feladatokra kpesek, br meg kell jegyeznnk,
hogy szksg van nmi babrlsra ahhoz, hogy megfelel hlstruktrt kapjunk, s a slytrben valahol a
globlis optimum kzelbe konvergljunk. A sz szoros rtelmben tzezerszm vannak publiklt neurlis hl
alkalmazsok. A 20.7. alfejezet alaposabban bemutat egyet.
5.5. Neurlis hlstruktrk tanulsa

Az eddigiekben adott hlstruktra mellett trtn slytanulssal foglalkoztunk. A Bayes-hlkhoz hasonlan
azt is meg kell rtennk, hogy hogyan tallhatjuk meg a legjobb hlstruktrt. Ha tl nagy hlt hasznlunk,
akkor az egy nagy tblzatot kialaktva kpes lesz memorizlni az sszes pldt, de nem felttlenl lesz kpes
olyan bemenetekre jl ltalnostani, amelyeket nem ltott korbban. 14 Ms szavakkal a neurlis hl ppgy,
mint az sszes statisztikus modell hajlamos a tlilleszkedsre (overfitting), ha tl sok modellparamter van.
Ezt bemutattuk a 18.1. brn (2. szakasz - Induktv tanuls rsz), ahol a (b) s (c) sokparamteres modell jl
illeszkedett az adatokra, de nem volt kpes olyan j ltalnostsra, mint a kevs paramterrel rendelkez (a) s
(d) modellek.
Ha ragaszkodunk a teljesen sszekttt hlkhoz, akkor egyedl a rejtett rtegek szmra s mretre
korltozdnak a vlasztsi lehetsgeink. A szoksos megkzelts, hogy sok struktrt kiprblunk, s
megtartjuk a legjobbat. A 18. fejezetben ismertetett keresztvalidcis (cross-validation) technikra van
szksgnk, ha el akarjuk kerlni a teszthalmazra val kukucsklst (peeking). Azaz azt a hlarchitektrt
vlasztjuk, amely a validcis halmazon a legnagyobb jslsi pontossgot adja.
Ha figyelembe akarunk venni nem teljesen sszekttt hlkat is, akkor szksgnk van egy hatkony
mdszerre, amely a lehetsges sszekttetsi topolgik nagyon nagy terben keres. Az optimlis
agykrosods (optimal brain damage) mdszere egy teljesen sszekttt hlbl indul ki, s
sszekttetseket tvolt el belle. Miutn a hlt els menetben tantottuk, egy informcielmleti
megkzelts segtsgvel meghatrozzuk az eltvolthat sszekttetsek optimlis kszlett. A hlt ezek utn
jratantjuk, s ha teljestmnye nem cskkent, az eljrst megismteljk. Az sszekttetsek eltvoltsn fell
olyan neuronokat is eltvolthatunk, amelyek nem sokkal jrulnak hozz a megoldshoz.
Rengeteg algoritmust javasoltak arra, hogy egy kisebb hlbl nagyobbat nvesszenek. Egyikk, a csempzs
(tiling), a dntsi fa tanulsra emlkeztet. Az tlet az, hogy kezdjnk egyetlen neuronnal, amely a legjobbjt
nyjtja, hogy annyi tant mintra adjon helyes vlaszt, ahnyra csak lehet. Tovbbi neuronokat adunk hozz,
hogy megoldjuk azokat a pldkat, amelyekre az els neuron rossz vlaszt adott. Az algoritmus csak annyi
neuront ad hozz, amennyi az sszes minta megoldshoz szksges.
6. Kernelgpek
Azt figyeltk meg, hogy a nagyon nagy hlk mindaddig jl ltalnostanak, amg a slyaikat kis rtken tartjuk. Ez a megszorts az
aktivcis rtkeket a g(x) szigmoid fggvny lineris tartomnyban tartja, ahol x kzel nulla. Ez viszont azt jelenti, hogy a hl gy
viselkedik, mint egy sokkal kevesebb paramterrel rendelkez lineris fggvny (lsd 20.17. feladat).
14
660
A neurlis hlk trgyalsa utn maradt egy dilemmnk. Az egyrteg hlknak nagyon egyszer s hatkony
tanulsi algoritmusuk van, de nagyon korltozott a kifejezkpessgk, csupn lineris dntsi hatrokat
kpesek megtanulni a bemeneti trben. Msrszt a tbbrteg hlk sokkal kifejezbbek ltalnos nemlineris
fggvnyeket kpesek reprezentlni , de a rengeteg loklis minimum jelenlte, illetve a sokdimenzis slytr
miatt nagyon nehz a tantsuk. Ebben az alfejezetben egy relatve j tanulmdszer csaldot fedeznk fel, az
gynevezett szupport vektor gpeket (support vector machines, SVM), vagy ltalnosabban a kernelgpeket
(kernel machines). Bizonyos fokig a kernelgpek a kt oldal legjobb tulajdonsgait egyestik. Azaz ezek a
mdszerek hatkony tantsi algoritmusokat alkalmaznak, ugyanakkor kpesek bonyolult, nemlineris
fggvnyek reprezentlsra.
A kernelgpek teljes mlysg trgyalsa meghaladja ennek a knyvnek a kereteit, de a f gondolatot egy
pldn keresztl illusztrljuk. A 20.27. (a) bra egy ktdimenzis bemeneti teret mutat, amelyet az x = (x1, x2)
attribtumok rnak le. A pozitv pldk (y = +1) egy kr alak rsz belsejben, a negatv pldk (y = 1) azon
kvl helyezkednek el. Nyilvnval, hogy a problma megoldsra nem ltezik lineris szepartor. Tegyk fel,
hogy valamilyen szmtott tulajdonsgok segtsgvel j formra hozzuk a pldkat azaz az sszes bemeneti x
vektort lekpezzk a tulajdonsgrtkekbl formlt j, F(x) vektorra. A pldban hasznljuk a kvetkez hrom
tulajdonsgot:
Rvidesen ltni fogjuk, hogy honnan vesszk ezeket a tulajdonsgokat, de most csak nzzk meg azt, hogy mi
is trtnt. A 20.27. (b) bra mutatja az adatokat az j, a tulajdonsgok ltal definilt hromdimenzis trben:
ebben a trben linerisan szeparlhatk! Ez a jelensg elgg ltalnos: ha az adatokat megfelelen
sokdimenzis trbe kpezzk le, akkor mindig linerisan szeparlhatk lesznek. Itt mi csak hrom dimenzit
hasznltunk,15 de ha N pontunk van akkor specilis esetek kivtelvel , egy N 1 vagy ennl magasabb
dimenzis trben a pontok mindig linerisan szeparlhatk lesznek (lsd 20.21. feladat).
20.27. bra - (a) Egy ktdimenzis tant halmaz, amelyben a pozitv pldkat fekete, a
negatvakat fehr krk jellik. Az
valdi elvlaszt hatrt is bejelltk. (b)
Ugyanazok az adatok az
hromdimenzis trbe val lekpezs utn. Az (a)
brn lthat kr alak dntsi hatr a hromdimenzis trben lineris dntsi
felletbe ment t.
Ennyi az egsz? Egyszeren ltrehozunk egy nagy halom szmtott tulajdonsgot, s a megfelel sokdimenzis
trben megkeressk a lineris szepartort? Sajnlatos mdon nem ilyen egyszer. Emlkezznk, hogy a d
dimenzis trben a lineris szepartort egy d paramteres egyenlet hatrozza meg, gy aztn az a veszly
15
Az olvas felfedezheti, hogy elg lett volna csupn f1 s f2 hasznlata, de a 3D lekpezs jobban illusztrlja az tletet.
661
fenyeget, hogy ha d N (ahol N az adatpontok szma), akkor knnyen tlilleszkedhetnk az adatokra. (Ez
ahhoz hasonl, mint amikor egy magas fokszm polinommal tlillesztnk adatokat, ahogy ezt a 18. fejezetben
trgyaltuk.) Ezen okbl a kernelgpek rendszerint az optimlis lineris szepartort talljk meg. Azt nevezzk
optimlisnak, amelynek legnagyobb a tartalka (margin): a lineris szepartor s a pozitv pldk kztt az
egyik oldalon, illetve a lineris szepartor s a negatv pldk kztt a msikon. (Lsd 20.28. bra.) A
szmtgpes tanuls elmlet mdszereit (lsd 18.5. alfejezet) hasznlva megmutathat, hogy ez a szepartor az
j pldk robusztus ltalnostsra nzve nagyon j tulajdonsgokkal rendelkezik.
20.28. bra - Az els kt dimenzira vettett kzelkp: a 20.27. (b) bra optimlis
szepartora. A szepartort vastag vonallal jelltk, a hozz legkzelebbi pontokat a
szupport vektorokat bekarikztuk. A tartalk nem ms, mint a pozitv s negatv
pldk kzti elvlaszt sv szlessge.
Hogyan talljuk meg ezt a szepartort? Kiderl, hogy ez egy kvadratikus programozssal (quadratic
programming) megoldhat optimalizlsi feladat. Tegyk fel, hogy xi pldink vannak, az osztlybasorolsuk
yi = 1, s a bemeneti trben optimlis szepartort akarunk tallni. Ekkor a megoldand kvadratikus
programozsi feladat azon paramterrtkek megtallsa, amelyek az i 0 s ii yi = 0 korltoz felttelek
mellett maximljk a kvetkez kifejezst:
662
Fontos
Br ennek a kifejezsnek a derivlsa nem nagyon fontos pontja a trtnetnek, de azrt van kt
lnyeges tulajdonsga. Elszr is a kifejezsnek egyetlen, globlis maximuma van, ami hatkonyan
megtallhat. Msodszor az adatok kizrlag pontprok skalrszorzataknt jelennek meg a
kifejezsben. Ez a msodik tulajdonsg magra a szepartorra is igaz, ha az optimlis i-ket
kiszmtottuk, akkor:
Az ezen egyenlettel definilt optimlis szepartor utols fontos tulajdonsga az, hogy az egyes adatpontokkal
asszocilt i slyok mind nullk, kivve a szepartorhoz legkzelebb es pontokat ezeket nevezzk szupport
vektoroknak (support vector). (Azrt nevezzk gy ket, mert k tartjk a szeparl skot.) Mivel rendszerint
jval kevesebb szupport vektor van, mint adatpont, ezrt az optimlis szepartort meghatroz tnyleges
paramterszm rendszerint jval kisebb N-nl.
Rendszerint nem vrhatjuk el, hogy lineris szepartort talljunk az x bemeneti trben, de knnyen belthat,
hogy a sokdimenzis F(x) tulajdonsgtrben tallhatunk lineris szepartorokat. Ennek rdekben a (20.17)
egyenletben xi xj-t egyszeren kicserljk F(xi) F(xj)-re. Ez nmagban nem tlzottan figyelemre mlt x
kicserlse F(x)-re brmely tanul algoritmusban elrn a kvnt hatst , de a skalrszorzatnak van nhny
rdekes tulajdonsga. Az F(xi) F(xj) gyakran kiszmthat anlkl, hogy elszr kiszmtannk minden pontra
F-et. A (20.16) egyenlettel definilt hromdimenzis tulajdonsgtr pldnkban nmi algebrai talaktsokkal
megmutathat, hogy:
F(xi) F(xj) = (xi xj)2
Az (xi xj)2 kifejezst kernelfggvnynek (kernel function) nevezzk, s K(xi, xj)-vel jelljk. A kernelgpek
szempontjbl ez egy olyan fggvny, amely pontprokra alkalmazhat avgett, hogy valamilyen
tulajdonsgtrben kiszmtsuk a skalrszorzatukat. Ennek megfelelen jrafogalmazhatjuk lltsunkat: a
(20.17) egyenletben xi xj-t egyszeren kicserlve a K(xi, xj) kernelfggvnyre, a sokdimenzis F(x)
tulajdonsgtrben tallhatunk lineris szepartorokat. gy a tanulst a sokdimenzis trben vgezhetjk, de
csupn kernelfggvnyek rtkt kell kiszmtanunk, nem kell az szszes pontra a tulajdonsgok teljes kszlett
kiszmtani.
Fontos
A kvetkez lps aminek most mr kzenfekvnek kell lennie az, hogy meglssuk, a K(xi, xj) = (xi
xj)2 kernelben nincs semmi klnleges. Ez egy bizonyos sokdimenzis tulajdonsgtrnek felel meg, de
ms kernelfggvnyek ms tulajdonsgterekkel vannak kapcsolatban. A Mercer-ttel (1909) azt
mondja ki, hogy brmely sszer16 kernelfggny megfelel valamilyen tulajdonsgtrnek. Ez a
tulajdonsgtr mg egsz rtatlannak ltsz kernelek esetn is nagyon nagy lehet. Pldul a K(xi, xj) =
(1 + xi xj)d polinomilis kernel (polynomial kernel) egy olyan tulajdonsgtrnek felel meg,
amelynek dimenzija d-ben exponencilis. Ha a (20.17) egyenletben ilyen kerneleket hasznlunk,
akkor hatkonyan kereshetnk lineris szepartorokat sok millird (vagy egyes esetekben vgtelen)
dimenzis terekben. Az eredmnyknt kapott lineris szepartorokat visszavettve az eredeti bemeneti
trbe, a pozitv s negatv pldkat elvlaszt tetszlegesen tekervnyes, nemlineris hatrfelleteket
kaphatunk.
Emltettk az elz rszben, hogy a kernelgpek kiemelkeden teljestenek a kzrsos szmjegyek
felismersben, de gyorsan felhasznljk ket ms alkalmazsokhoz is, klnsen olyanokhoz, ahol sok
bemeneti tulajdonsg van. Ennek a folyamatnak rszeknt szmos j kernelt dolgoztak ki, amelyek
karakterfzrekre, fkra s ms nemnumerikus adattpusokra alkalmazhatk. Az is megfigyelhet, hogy a
kernelmdszer nemcsak optimlis szepartorok keressre alkalmas, hanem brmely olyan algoritmusra, amely
gy talakthat, hogy csak adatpontprok skalrszorzatt hasznlja, mint a (20.17), illetve (20.18) egyenlet.
Amint ezt sikerlt megtennnk, a skalrszorzat kicserlhet egy kernelfggvnyre, s elksztettk az
algoritmus kernelestett (kernelized) vltozatt. Ez az talakts tbbek kzt a k-legkzelebbi-szomszd
algoritmusra s a perceptron tanulsra is knnyen elvgezhet.
16
Itt sszer alatt azt rtjk, hogy a kij = K(xi, xj) mtrix pozitv definit; lsd A) fggelk.
663
7. Esettanulmny: kzzel rott szmjegyek felismerse

A kzzel rott szmjegyek felismerse szmos alkalmazsban felmerl fontos problma. Nhny ezek kzl:
postai levelek irnytszm szerinti automatikus osztlyozsa, csekkek s ad-visszatrtsi szmlk
automatikus leolvassa, kzi szmtgpek adatbevitele. Ez olyan terlet, ahol gyors volt a fejlds, rszben a
jobb tanul algoritmusoknak, rszben a jobb tant adatbzisoknak ksznheten. Az Egyeslt llamok Mrss Szabvnygyi Hivatala (National Institute of Standards and Technology, NIST) egy 60 000 megcmkzett
szmjegybl ll archvumot hozott ltre, amelyben minden szmjegy egy 20 20 = 400 pixeles, 8 bites szrke
rnyalat kpen jelenik meg. Ez az j tanul algoritmusok sszehasonltsnak egyik standard mrcjv
(benchmark) vlt. A 20.29. bra bemutat nhny szmjegyet.
Szmos klnbz tanul algoritmust kiprbltak. Az elsk egyike, s egyben valsznleg a legegyszerbb, a
3-legkzelebbi-szomszd (3-nearest-neighbor) osztlyoz, amelynek tovbbi nagy elnye, hogy nem ignyel
tantsi idt. Ugyanakkor memriaalap algoritmusknt mind a 60 000 kpet trolnia kell, s a futsi idej
teljestmny lass. A teszthalmazon elrt hibaarnya 2,4%.
Kifejlesztettek egy egy-rejtett-rteg neurlis hlt (single-hidden-layer neural network) a feladatra, 400
bemenettel (egy bemenet pixelenknt) s 10 kimenettel (osztlyonknt egy). Keresztvalidcit hasznlva azt
talltk, hogy durvn 300 rejtett neuron adta a legjobb teljestmnyt. A rtegek kztt teljes sszekttetst
valstottak meg, gy sszesen 123 300 slyt hasznltak. Ez a hl 1,6% hibaarnyt rt el.
LeNet nven egy sor specilis neurlis hlt (specialized neural network) szerkesztettek egybe azrt, hogy a
problmban rejl struktrt kihasznljk. Az egyik strukturlis adottsg, hogy a bemeneti pixelek ktdimenzis
tmbt alkotnak, a msik, hogy egy bra kismrtk pozci- vagy dlsiirny-vltozsa lnyegtelen. Minden
egyes hl 32 32 egysgbl ll bemeneti rteget tartalmaz, amelyre a 20 20 pixelt gy kapcsoltk, hogy
minden egyes bemeneti egysg egy loklis szomszdsgot reprezentlt. Ezt hrom rejtett rteg kvette.
Mindegyik rteg szmos n n-es mezbl ll, ahol n kisebb, mint a megelz rteg, teht a hl a bemenetek
alul-mintavtelezst valstja meg. Egy mezn bell mindegyik egysgre azonos slyokat knyszertnk, gy a
mez tulajdonsgdetektorknt mkdik: olyan tulajdonsgokat rzkel, mint egy hossz fggleges vonal vagy
egy rvid flkrv jelenlte. A kimeneti rteg 10 neuronbl ll. Ennek az architektrnak szmos vltozatt
kiprbltk: egyik tipikus kpviseljk a rejtett rtegeiben rendre 768, 192, illetve 30 neuront tartalmaz hl
volt. A tant halmazt kiegsztettk tovbbi mintkkal, ezeket a valsakbl kismrtk affin transzformcikkal
nyertk, amelyek a kvetkezk voltak: eltols, kismrtk elforgats, nagyts/kicsinyts. (Termszetesen a
transzformciknak kismrtkeknek kell lennik, klnben a 6-ot 9-c transzformljuk!) A LeNet ltal elrt
legkisebb hibaarny 0,9% volt.
Egy turbzott neurlis hl (boosted neural network) hrom LeNet-architektrt kombinlt: a msodikat egy
olyan mintakeverkkel tantottk, amelyen az els 50%-os hibt produklt, a harmadikat pedig olyan mintkkal,
amelyekre az els kett klnbz eredmnyt adott. A tesztels sorn a hrom hl a tz lehetsges szmjegy
mindegyikre egy-egy sllyal szavazott, ezeket sszeadva hatroztk meg a gyztest. A teszthibaarny 0,7%
volt.
Egy 25 000 szupport vektort hasznl szupport vektor gp (support vector machine) (lsd 20.6. alfejezet)
1,1% hibaarnyt rt el. Ez azrt figyelemre mlt, mert az SVM-technika ppgy mint az egyszer
legkzelebbi-szomszd megkzelts szinte nem ignyelt gondolkodst vagy iteratv ksrletezst a
fejleszttl, mgis az vekig fejlesztett LeNet-et megkzelt eredmnyt rt el. A szupport vektor gpek
valjban nem hasznljk ki a problma struktrjt, teht ugyanolyan jl teljestennek, ha a pixeleket
valamilyen permutlt sorrendben hasznlnnk.
A virtulis szupport vektor gpet (virtual support vector machine) egy standard SVM-knt indtjuk, majd
egy olyan technikval javtjuk, amelyet a problma struktrjnak kihasznlsra hoztak ltre. Ahelyett hogy az
sszes lehetsges pixelprbl kpzett kernelt megengednnk, ez olyan kernelekre koncentrl, amelyek
szomszdos pixelprokbl formldtak. A LeNethez hasonlan itt is a pldk transzformltjaival egsztjk ki a
tant halmazt. Egy virtulis SVM rte el az eddigi legjobb hibaarnyt, 0,56%-ot.
20.29. bra - Nhny plda az NIST kzzel rt szmjegyekre ltrehozott adatbzisbl.

A fels sorban a 09 karakterek knnyebben felismerhet pldit mutatjuk be, az als
sorban pedig ugyanezen szmjegyekre nehezebben felismerhet pldkat ltunk.
664
Az alakilleszts (shape matching) a szmtgpes lts egyik eljrsa, amelyet arra hoztak ltre, hogy trgyak
kt klnbz kpnek megfelel rszeit sszerendeljk. (Lsd 24. fejezet.) Az alaptlet, hogy vegynk egy-egy
ponthalmazt mindkt kprl, s szmtsuk ki az els kp minden egyes pontjra, hogy a msodik kp mely
pontja felel meg neki. Ebbl a megfeleltetsbl aztn szmtsuk ki a kt kpet sszekapcsol transzformcit.
Ez a transzformci a kpek kzt egy tvolsgmrtket hatroz meg. Ez a tvolsgmrtk indokoltabb, mint
egyszeren az egymstl klnbz pixelek megszmllsa. Kiderlt, hogy az erre a tvolsgmrtkre alapozott
3-legkzelebbi-szomszd algoritmus nagyon jl mkdik. Csupn 20 000-et hasznlva a 60 000 szmjegybl, s
egy Canny ldetektor kpnek csupn 100 pixelt felhasznlva az alakillesztses eljrs 0,63% teszthibaarnyt
rt el.
Becslsek szerint az emberek (human) kb. 0,2% hibaarnyt rnek el ennl a problmnl. Ez a szm
nmikppen gyans, mert az embereket nem teszteltk olyan alaposan, mint a gpi tanuls algoritmusait. Az
Egyeslt llamok Postjnak (United States Postal Service) egy hasonl szmjegyekbl kpzett
adathalmazn az emberek ltal elkvetett hibaarny 2,5% volt.
A kvetkez bra sszegzi a trgyalt ht eljrs esetn a hibaarnyt, a futsi idt, a memriaignyt s a
szksges tantsi idt. Mg egy mrtket ad ezekhez, a szmjegyek azon arnyt, amelyet vissza kell
utastanunk, hogy a 0,5% hibaarnyt elrjk. Ha pldul egy SVM-nek megengedjk, hogy bemeneti kpeinek
1,8%-t visszautastsa azaz tpasszolhatja valakinek, hogy az hozza meg a vgs dntst , akkor a kpek
tbbi 98,2%-n a hibaarny 1,1%-rl 0,5%-ra cskken.
A kvetkez tblzat a ht trgyalt technikra sszegzi a hibaarnyt s nhny tovbbi jellemzt.
8. sszefoglals
A statisztikai tanuls mdszerei szles skln helyezkednek el: az egyszer tlagszmtsoktl a bonyolult
modellek mint pldul a Bayes-hlk vagy neurlis hlk konstrulsig. Alkalmazsi terletk a
szmtgp-tudomnyra, a mrnki alkalmazsokra, a neurobiolgira, a pszicholgira s a fizikra is kiterjed.
Ebben a fejezetben bemutattunk nhny alapelvet, s zeltt adtunk a matematikai trgyalsbl. A kvetkez f
pontok szerepeltek:
A Bayes-tanulsi (Bayesian learning) mdszerek a tanulst valsznsgi kvetkeztetsknt fogalmazzk
meg, a megfigyelsek alapjn frisstve a hipotzisek a priori eloszlsait. Ez a megkzelts j eszkz az
Ockham borotvja elv megvalstsra, de bonyolult hipotzisterek esetn hamar kezelhetetlenn vlik.
A maximum a posteriori (MAP) tanuls az adatok alapjn vlaszt ki egyetlen, a legvalsznbb hipotzist.
A hipotzis priort itt is hasznljuk, ez a mdszer gyakran jobban kezelhet, mint a tiszta Bayes-tanuls.
665
A maximum-likelihood tanuls egyszeren azt a hipotzist vlasztja, amely maximlja az adatok likelihood
rtkt. Megfelel egy egyenletes prior mellett vgrehajtott MAP-tanulsnak. Egyszer esetekben, mint a
lineris regresszi s a teljesen megfigyelhet Bayes-hlk, a maximum-likelihood megolds knnyen
elllthat zrt alakban. A naiv Bayes- (naive Bayes) tanuls klnsen hatkony technika, amely
klnbz bonyolultsg feladatokra is jl illeszthet.
Amikor a vltozk kzt van nhny rejtett (nem megfigyelhet), akkor az EM algoritmussal loklis
maximum-likelihood megoldsokat tallhatunk. Az alkalmazsok kiterjednek a kevert Gauss-jelek
osztlyozsra, a Bayes-hlk tanulsra s a rejtett Markov-modellek tanulsra.
A modellvlasztsra (model selection) ad pldt a Bayes-hlk struktrjnak tanulsa. Ez rendszerint egy, a
struktrk terben vgzett diszkrt keresst foglal magban. Szksg van valamilyen mdszerre a modell
bonyolultsga s az illeszkeds mrtke kzti kompromisszum ltrehozshoz.
A pldnyalap modellek (instance-based model) a tant pldnyok gyjtemnynek eloszlst
reprezentljk. gy a paramterek szma a tant halmaz mretvel n. A legkzelebbi-szomszd (nearest
neighbor) mdszerek a krdses mintapont kzelben lv pldnyokat nzik, mg a kernelmdszerek az
sszes pldny tvolsggal slyozott kombincijt.
A neurlis hlk (neural networks) nem msok, mint sok paramterrel rendelkez, komplex nemlineris
fggvnyek. Paramtereiket zajos adatok alapjn tanulhatjk meg. Tbb ezer alkalmazsban hasznltk mr
ket.
A perceptron egy elrecsatolt neurlis hl, amelynek nincs rejtett rtege, s csak linerisan szeparlhat
(linearly separable) fggvnyek reprezentlsra alkalmas. Ha az adatok linerisan szeparlhatk, akkor egy
egyszer slyfrisstsi szably alkalmazsval az adatokra val pontos illeszkedst tudunk elrni.
A tbbrteg elrecsatolt (multilayer feed-forward) neurlis hlk ha kell szm neuronjuk van
tetszleges fggvnyek reprezentlsra kpesek. A hiba-visszaterjesztsi (back-propagation) algoritmus a
kimeneti hiba minimalizlsa rdekben gradiensalap cskkentst valst meg a paramtertrben.
A statisztikai tanuls tovbbra is igen aktv kutatsi terlet. Mind az elmlet, mind a gyakorlat hatalmas
lpsekkel haladt, mg elrtnk addig a pontig, hogy szinte brmely modell megtanulhat, ha megvalsthat r
egzakt vagy kzelt kvetkeztets.

Az MI korai veiben a statisztikai tanulselmlet a kutats aktvan mvelt terlete volt (Duda s Hart, 1973), de
elklnlt az MI fsodrtl, ahogy ez utbbi egyre inkbb a szimbolikus mdszerekre koncentrlt. Klnbz
formkban folytatdott egyesek explicit mdon valsznsgiek, msok nem olyan terleteken, mint az
alakzatfelismers (pattern recognition) (Devroye s trsai, 1996) s az informcikeress (information
retrieval) (Salton s McGill, 1983). Nem sokkal a Bayes-hl modellek bevezetse utn, az 1980-as vek vgn
az rdeklds ismt ersen rirnyult, nagyjbl ugyanebben az idben jelent meg a neurlis hlk statisztikai
megkzeltse. Az 1990-es vek vgn a gpi tanuls, a statisztika s a neuronhlk terletn is az rdeklds
kzppontjba kerltek az adatok alapjn nagy valsznsgi modelleket ltrehoz mdszerek.
A naiv Bayes-modell egyike a legrgebbi s legegyszerbb Bayes-hlknak, megjelense egszen az 1950-es
vekig kvethet vissza. Eredetket megemltettk a 13. fejezet zr megjegyzseiben. Rszleges magyarzat
tallhat Domingos s Pazzani publikcijban (Domingos s Pazzani, 1997). A naiv Bayes-tanuls turbzott
vltozata nyerte az els KDD Cup adatbnyszati versenyt (Elkan, 1997). Heckerman kitn bevezetst adja a
Bayes-hl tanuls ltalnos problematikjnak (Heckerman, 1998). Spiegelharter s trsai a Bayes-hlk
Bayesi paramtertanulst trgyaltk Dirichlet-priorok esetre (Spiegelharter s trsai, 1993). A BUGS
szoftvercsomag (Gilks s trsai, 1994) szmos gondolatot megtestestett ezek kzl, nagyon hatkony eszkzt
biztostott az sszetett valsznsgi modellek fellltsra s tanulsra. A Bayes-hlstruktra tanulsnak
els algoritmusai feltteles fggetlensgi teszteket hasznltak (Pearl, 1988; Pearl s Verma, 1991). Spirtes s
trsai hasonl elvek alapjn dolgoztk ki tfog megkzeltsket, valamint a Tetrad csomagot Bayeshlstruktra tanuls cljaira (Spirtes s trsai, 1993). Az azta vgrehajtott algoritmikus javtsok a 2001-es
KDD Cup adatbnyszati versenyen egy Bayes-hl tanulsi algoritmus (Cheng s trsai, 2002) meggyz
gyzelmhez vezettek. (Itt a specilis megoldand feladat egy 139 351 tulajdonsggal lert bioinformatikai
problma volt!) Cooper s Herskovits egy likelihood maximalizlson alapul struktratanulsi megkzeltst
fejlesztett ki (Cooper s Herskovits, 1992), ezt Heckerman s trsai fejlesztettk tovbb (Heckerman s trsai,
666
1994). Friedman s Goldszmidt mutattk ki a loklis feltteles eloszlsok reprezentcijnak a megtanult

struktrra gyakorolt hatst (Friedman s Goldszmidt, 1996).
A rejtett vltozkkal s a hinyz adatokkal val valsznsgi modell tanuls ltalnos problematikjt az EM
algoritmussal ksreltk meg kezelni (Dempster s trsai, 1977). Ezt szmos meglv mdszerbl absztrahltk,
amelyek kzt tallhat a rejtett Markov-modell (HMM) tanulsra szolgl BaumWelch-algoritmus is (Baum s
Petrie, 1966). (Maga Dempster az EM algoritmust inkbb smnak tekinti, nem algoritmusnak, mivel j adag
elmleti matematikai munkra lehet szksg mieltt egy j eloszlscsaldra alkalmazhat lenne.) Manapsg az
EM egyike a tudomnyos kutatsban legelterjedtebben hasznlt algoritmusoknak, McLachlan s Krishnan egy
teljes knyvet szenteltek neki s tulajdonsgainak (McLachlan s Krishnan, 1997). A kevert modellek
belertve a kevert Gauss-modellek tanulsnak specilis problmit Titterington s trsai trgyaltk
(Titterington s trsai, 1985). Az AUTOCLASS volt az els sikeres rendszer az MI-n bell, amely az EM-et
alkalmazta kevert modellezsre (Cheeseman s trsai, 1988; Cheeseman s Stutz, 1996). Az AUTOCLASS-t egy
sor vals tudomnyos osztlyozsi feladatra alkalmaztk; ezek kzl kett: spektrlis tulajdonsgok alapjn j
csillagtpusok felfedezse (Goebel s trsai, 1989); j fehrje- s intronosztlyok felfedezse
DNS/fehrjeszekvencia adatbzisokban (Hunter s States, 1992).
A rejtett vltozkkal rendelkez Bayes-hlk tanulsra kifejlesztett EM algoritmus Lauritzen munkja
(Lauritzen, 1995). Mind a Bayes-hlk, mind a dinamikus Bayes-hlk esetn a gradiensalap eljrsok is
hatkonynak bizonyultak (Russell s trsai, 1995; Binder s trsai, 1997a). A strukturlis EM algoritmus
kifejlesztse Friedman nevhez fzdik (Friedman, 1998). A Bayes-hlk struktrjnak megtanulhatsga
szoros kapcsolatban van a kauzlis kapcsolatok adatokbl trtn visszanyersnek krdsvel. Azaz
lehetsges-e Bayes-hlkat gy megtanulni, hogy az ellltott hlstruktra vals kauzlis hatsokat jelezzen?
A statisztikusok hossz vek ta elkerltk ezt a krdst, azt hittk, hogy a megfigyelt adatok (ellenttben a
ksrletek sorn ellltakkal) csak korrelcis informcit hordoznak. Vgl is brmely kt vltozra, amelyek
egymssal kapcsolatban llnak tnnek, lehet, hogy valjban inkbb egy harmadik mindkettre kauzlis
hatst gyakorl ismeretlen vltoz hatsa alatt llnak, nem pedig egymsra gyakorolnak kzvetlen hatst.
Ennek ellenkezjre Pearl adott meggyz rveket (Pearl, 2000). Megmutatta, hogy valjban szmos eset van,
amikor a kauzalits kiderthet, s kauzlis hl (causal network) formalizmus alakthat ki az oksgi
kapcsolatok, a beavatkozs hatsnak, valamint a szoksos feltteles valsznsgek beptsre.
A legkzelebbi-szomszd modellek legalbb Fix s Hodges (Fix s Hodges, 1951) munkjig nylnak vissza, s
azta a statisztika s alakfelismers standard eszkzei. Az MI-n bell Stanfill s Waltz npszerstettk ezeket a
modelleket (Stanfill s Waltz, 1986), k a tvolsgmetrika adatokhoz trtn adaptlsi mdszereivel
foglalkoztak. Hastie s Tibshirani kifejlesztettek egy mdszert, amellyel a tr egyes pontjaihoz ktttk az ezen
pont krli adateloszlstl fgg metrikt (Hastie s Tibshirani, 1996). A legkzelebbi-szomszdok hatkony
indexelsi smval trtn megtallsval az algoritmusokat kutat kzssg foglalkozott (pl. Indyk, 2000). A
kernelsrsg-becslst, amelyet Parzen ablak (Parzen window) srsgbecslsnek is neveznek, kezdetben
Rosenblatt s Parzen tanulmnyozta (Rosenblatt, 1956; Parzen, 1962). Azta risi az irodalma a klnbz
becslk tulajdonsgai vizsglatnak. Devroye alapos bevezetst nyjt ehhez a tmhoz (Devroye, 1987).
A neurlis hlk irodalma tl nagy ahhoz (napjainkig kb. 100 000 publikci), hogy rszletesen bemutathassuk.
A korai fejlemnyekrl Cowan s Sharp ksztett sszefoglalt (Cowan s Sharp, 1988b; 1988a), McCulloch s
Pitts munkssgval kezdve az ttekintst (McCulloch s Pitts, 1943). Norbert Wiener a kibernetika s a
szablyozselmlet egyik ttrje (Wiener, 1948) egytt dolgozott McCullochkal s Pitts-szel, s nagy hatst
gyakorolt egy sor fiatal kutatra, pldul Marvin Minskyre, aki valsznleg elsknt fejlesztett ki mkd
neurlishl-hardvert 1951-ben (Minsky s Papert, 1988, pp. ixx.) Ezalatt Nagy-Britanniban W. Ross Ashby
(szintn a kibernetika egyik ttrje; Ashby, 1940), Alan Turing, Grey Walter s msok megalaktottk a Rci
Klubot (Ratio Club) azok szmra, akik rjttek Wiener gondolataira, mg mieltt Wiener knyve megjelent.
Ashby Az agy felptse (Design for a Brain, 1948, 1952) cm knyvben vetette fel, hogy stabil adaptv
viselkedst ltrehoz alkalmas visszacsatol hurkokkal rendelkez homeostatikus17 (homeostatic) eszkzk
segtsgvel intelligencit lehetne ltrehozni. Turing egy kutatsi jelentst rt Intelligens Gpek (Intelligent
Machinery) cmen (Turing, 1948), amely a kvetkez mondattal kezddik: Javaslom megvizsglni azt a
krdst, hogy vajon lehetsges-e az, hogy a gpek intelligens viselkedst mutassanak, majd lerja a rekurrens
neurlis hlzatokat, amelyeket B tpus nem szervezett gpek nven vezet be, s megadja tantsuknak egy
lehetsges megkzeltst. Sajnos ezt a jelentst 1969-ig nem is publikltk, s napjainkig lnyegben figyelmen
kvl hagytk.
Homeosztzis: egy szervezet klnbz, de egymssal klcsnhatsban ll elemei vagy elemek csoportjai kztt fennll stabil
egyensly vagy egyensly fel val trekvs. Gyakran biolgiai sszefggsben hasznlt kifejezs. (A ford.)
17
667
Frank Rosenblatt (Rosenblatt, 1957) nevhez fzdik a modern perceptron felfedezse, s bizonytotta be a
perceptronkonvergencia ttelt (Rosenblatt, 1960), br ezt mr a neurlis hlk terletn kvl es, tisztn
matematikai munkk is elrevettettk (Agmon, 1954; Motzkin s Schoenberg, 1954). Volt nmi, a tbbrteg
hlzatokra irnyul korai kutats is, amelynek eredmnyei pldul a Gamba-perceptronok (Gamba s trsai,
1961) s a madaline-ok (Widrow, 1962). A Learning Machines (Nilsson, 1965) c. knyv ttekintst ad a korai
kutats legnagyobb rszrl. A korai perceptronkutatsok hallt siettette a szerzk ksbbi lltsa szerint
csak magyarzta a Perceptrons c. knyv (Minsky s Papert, 1969), amelyben a terlet matematikai
precizitsnak hinyt panaszoltk fel. A knyv rmutatott, hogy egyrteg perceptronokkal csak linerisan
szeparlhat helyzetek reprezentlhatk, s felhvta a figyelmet a tbbrteg hlk hatkony tanul
algoritmusainak hinyra.
A San Diegban, 1979-ben tartott konferencia publikciira alapozott kiadvny (Hinton s Anderson, 1981)
tekinthet a konnekcionizmus jjledse jelnek. Nagy figyelmet keltett a ktrszes PDP (Prhuzamos
elosztott feldolgozs Parallel Distributed Processing) antolgia (Rumelhart s trsai, 1986a), illetve a Natureben megjelent rvid cikk (Rumelhart s trsai, 1986b). A neurlis hlkkal foglalkoz cikkek szma az 1980
1984 kztti publikcik szmrl 200-szorosra ntt 19901994-re. A mgneses spin vegek fizikai
elmletnek felhasznlsval elvgzett neurlis hl analzis (Amit s trsai, 1985) nem csupn szorosabb
kapcsolatot hozott a statisztikus mechanika s neurlis hlk elmlete kzt, hanem tekintlyt is adott a
terletnek. A hiba-visszaterjeszts (back-propagation) technikjt viszonylag hamar kitalltk (Bryson s Ho,
1969), de tbb alkalommal jra felfedeztk (Werbos, 1974; Parker, 1985).
Az 1990-es vekben megjelent szupport vektor gpeknek (Cortes s Vapnik, 1995) napjainkban gyorsan
nvekv az irodalmuk, amely olyan tanknyveket is magban foglal, mint Cristianini s Shawe-Taylor knyve
(Cristianini s Shawe-Taylor, 2000). Nagyon npszernek s bizonyos feladatokra nagyon hatkonynak
bizonyultak, ilyenek pldul a szvegkategorizls (Joachims, 2001), a bioinformatikai kutats (Brown s trsai,
2000), a termszetes nyelv szveg feldolgozsa, mint a kzzel rt szmjegyek DeCoste s Schlkopf ltal
megvalstott felismerse (DeCoste s Schlkopf, 2002). A szavaz perceptron szintn egy olyan technika,
amely a kerneltrkkt alkalmazza az exponencilis tulajdonsgtr implicit reprezentcijra (Collins s Duffy,
2002).
Szmos forrs adhat meg a neurlis hlk valsznsgi interpretcijra, pldul (Baum s Wilczek, 1988),
valamint (Bridle, 1990). A szigmoid fggvny szerept Jordan trgyalja (Jordan, 1995). MacKay javasolta a
neurlis hlk Bayes-i paramterbecslst (MacKay, 1992), amelyet Neal fejlesztett tovbb (Neal, 1996). A
neurlis hlk fggvnyreprezentcis kpessgeit Cybenko vizsglta (Cybenko, 1988; 1989), aki megmutatta,
hogy kt rejtett rteg elegend tetszleges fggvny reprezentcijhoz, tetszleges folytonos fggvny
reprezentcijhoz pedig elg egy rteg. A haszontalan sszekttetsek eltvoltst clz optimlis
agykrosods mdszer LeCun s trsai eredmnye (LeCun s trsai, 1989), mg Sietsma s Dow mutattk meg,
hogyan kell a felesleges neuronokat eltvoltani (Sietsma s Dow, 1988). A nagyobb struktrk nvesztssel
val ellltsra szolgl csempzsi algoritmus Mzard s Nadal munkja (Mzard s Nadal, 1989). A kzzel
rt szmjegyek felismersvel foglalkoz algoritmusokrl LeCun s trsai rtak ttekint publikcit (LeCun s
trsai, 1995). Azta jobb hibaarnyt rtek el Belongie s trsai (2002) az alakillesztsi eljrs (Belongie s
trsai, 2002), valamint DeCoste s Schlkopf a virtulis szupport gp alkalmazsval (DeCoste s Schlkopf,
2002).
A szmtgpes tanuls elmlete terletn tevkenyked kutatk foglalkoztak a neurlis hl tanuls
komplexitsval. Az els szmtsi eredmnyeket Judd kapta (Judd, 1990), aki megmutatta, hogy egy
pldahalmazzal konzisztens slyhalmaz megtallsnak ltalnos problmja mg nagyon ersen korltoz
felttelek esetn is NP-teljes. A mintakomplexitsra vonatkoz eredmnyek kzl nhny Baum s Haussler
munkjhoz fzdik, akik megmutattk, hogy W sly esetn a hatkony tantshoz szksges mintaszm W log
W arnyban n (Baum s Haussler, 1989).18 Azta Anthony s Bartlett egy sokkal fejlettebb elmletet
fejlesztettek ki (Anthony s Bartlett, 1999), amely magban foglalja azt a fontos eredmnyt, hogy a hl
reprezentcis kpessge a slyok nagysgrendjtl s szmtl egyarnt fgg.
Az ltalunk nem trgyalt legnpszerbb neurlis hl a radilis bzisfggvny (RBF) (radial basis function)
hl. A radilis bzisfggvny kernelek slyozott kombincijt (termszetesen rendszerint Gauss-kernelekt)
alkalmazza fggvnyapproximcira. Az RBF-hlkat kt fzisban tanthatjuk: elszr egy nem ellenrztt
osztlyozssal tantjuk a Gauss-fggvnyek paramtereit (az tlagokat s variancikat), mint a 20.3. alfejezetben
lttuk. A msodik fzisban a Gauss-fggvnyek relatv slyt hatrozzuk meg. Ez egy lineris egyenletrendszer
Ez nagyjbl igazolta Bernie bcsi trvnyt: a szablyt Bernie Widrowrl neveztk el, aki azt javasolta, hogy nagyjbl tzszer annyi
mintt hasznljanak, mint a slyok szma.
18
668
megoldsa, amirl tudjuk, hogy kzvetlenl hogyan oldhat meg. gy az RBF-tants mindkt fzisnak vonz
tulajdonsgai vannak: az els fzis nem ellenrztt, teht nincs szksgnk hozz cmkzett mintkra, a
msodik ugyan felgyelt, de hatkonyan elvgezhet. A rszleteket lsd Bishop publikcijban (Bishop, 1995).
A rekurrens hlkat (recurrent network), amelyekben a neuronok hurkokba vannak kapcsolva, emltettk
ugyan a fejezetben, de nem rszleteztk. A legjobban megrtett rekurrens hl osztlyt valsznleg a Hopfieldhlk (Hopfield networks) (Hopfield, 1982) alkotjk. A Hopfield-hl ktirny kapcsolatokat hasznl
szimmetrikus slyokkal (azaz Wi,j = Wj,i), minden neuron bemeneti s egyben kimeneti egysg is, a g aktivcis
fggvny az eljelfggvny, az aktivcis szint pedig csak a 1 lehet. A Hopfield-hl asszociatv
memriaknt mkdik: miutn egy mintahalmazon tantottuk, egy j bemeneti stimulus hatsra egy olyan
aktivcis mintra ll be, amely a tant pldk kzl a leginkbb emlkeztet az j bemenetre. Ha pldul a
tant halmaz egy halom fnykp, az j bemenet pedig az egyik fnykp egy kis darabja, akkor aktivcis
szintjeivel a hl vissza fogja lltani az adott darabbl a fnykpet. Figyeljk meg, hogy a fnykpek nincsenek
elklnlten trolva a hlban: mindegyik sly az sszes fnykp egy rszleges kdja. rdekes elmleti
eredmny, hogy az N neuronbl ll Hopfield-hl legfeljebb 0,138N tant mintt kpes megbzhatan trolni.
A Boltzmann-gpek is szimmetrikus slyokat hasznlnak, de tartalmaznak rejtett egysgeket is (Hinton s
Sejnowski, 1983; 1986). Radsul aktivcis fggvnyk sztochasztikus: a kimenet 1 rtknek valsznsge a
teljes slyozott bemenetnek valamilyen fggvnye. A Boltzmann-gpek ennek megfelelen a szimullt lehts
keressi eljrsra (lsd 4. fejezet) emlkeztet llapottmenetek sorn jutnak el a tant halmazt a legjobban
kzelt konfigurcihoz. Kimutathat, hogy a Boltzmann-gpek nagyon kzeli rokonsgban vannak bizonyos
specilis Bayes-hlkkal, amelyeket sztochasztikus szimulcis algoritmussal rtkelnk ki. (Lsd 14.5.
alfejezet.)
A kernelgpek alaptletnek els alkalmazsa Aizerman s trsai munkjhoz fzdik (Aizerman s trsai,
1964, de a szupport vektor gpek fel mutat, teljes elmleti kidolgozs Vlagyimir Vapniknak s kollginak
ksznhet (Boser s trsai, 1992; Vapnik, 1998). A precz elmleti trgyals megtallhat Cristianini s
Shawe-Taylor, illetve Schlkopf s Smola knyvben (Cristianini s Shawe-Taylor, 2000; Schlkopf s Smola,
2002), valamint egy bartsgosabb kifejts tallhat Cristianini s Schlkopf AI Magazine-ban megjelent
cikkben.
Ennek a fejezetnek az anyaga a statisztika, alakfelismers s neurlis hlk kutatsban elrt eredmnyeket
integrlja, teht a trtnetet sokszor, sokfle mdon elmondtk mr. A Bayes-statisztikrl j publikcikat
tallunk, ilyenek pldul a (DeGroot, 1970), a (Berger, 1985), tovbb a (Gelman s trsai, 1995). A statisztikus
tanuls elmletnek kivl trgyalsa tallhat a (Hastie s trsai, 2001) munkban. Az alakosztlyozs
tmakrben Duda s Hart knyve szmt klasszikusnak (Duda s Hart, 1973), melynek nemrg j kiadsa is
megjelent (Duda s trsai, 2001). A neurlis hlkrl a (Bishop, 1995) s a (Ripley, 1996) a legfontosabb
knyvek. A szmtgpes neurlis tudomnyt a (Dayan s Abbott, 2001) knyv trgyalja. A neurlis hlk s
hozzjuk kapcsold tmk legfontosabb konferencii az vente megrendezett NIPS- (Neural Information
Processing Conference) konferencik, melyek kiadvnyait az Advances in Neural Information Processing
Systems sorozatban jelentetik meg. A Bayes-hlk tanulsrl szl rsok az Uncertainty in AI s a Machine
Learning konferencikon jelennek meg, tovbb szmos statisztikval foglalkoz konferencin. A neurlis
hlkkal foglalkoz jsgok kztt rdemes megemlteni a Neural Computationt, a Neural Networkst s az
IEEE Transaction on Neural Networkst.
8.2. Feladatok
20.1.
A 20.1. brn hasznlt adatokat gy tekinthetjk, mintha h5 generlta volna ket. A msik ngy hipotzis
mindegyikre generljon egy-egy 100 hosszsg adathalmazt, rajzolja fel a megfelel P(hi|d1,, dm) s P(Dm+1
= citrom|d1,, dm) grbket! rtkelje az eredmnyeket.
20.2.
Ismtelje meg a 20.1. feladatot gy, hogy a P(Dm+1 = citrom|hmap,, dm), illetve P(Dm+1 = citrom|hml) grbket
rajzolja fel.
20.3.
669
Tegyk fel, hogy Anna szmra a meggycukorkk hasznossga cA, a citromcukorkk A, mg Bla szmra a
hasznossgok rendre cB s B. (De ha Anna kibontott egy cukorkt, akkor azt Bla mr nem fogja megvsrolni
tle.) Ha Bla sokkal jobban szereti a citromz cukorkt, mint Anna, akkor Anna feltehetleg blcsen teszi, ha
eladja a cukros zacskjt, amikor mr kellen biztos a citromzek arnyban. Msrszrl viszont, ha Anna tl
sok cukrot kibontott mr az arny eldntse sorn, akkor a zacsk rtktelenn vlik. Vizsglja meg a
cukroszacsk-elads optimlis pillanatnak meghatrozst. Hatrozza meg az optimlis eljrs vrhat
hasznossgt, a 20.1. alfejezet a priori eloszlsainak felttelezsvel.
20.4.
Kt statisztikus elmegy az orvoshoz, s mindkettrl ugyanazt a diagnzist lltja fel az orvos: 40% esllyel a
hallos A betegsgben, 60% esllyel a szintn vgzetes B betegsgben szenvednek. Szerencsre van az A s B
betegsgnek is olcs, 100%-ban hatsos, mellkhats nlkli gygyszere. A statisztikusoknak lehetsgk van
az A elleni, a B elleni vagy mindkt gygyszert szedni, de dnthetnek gy is, hogy egyiket sem szedik. Mit fog
az els statisztikus aki elsznt Bayes-hv vlasztani? Mit tesz a msodik, aki mindig a maximum-likelihood
hipotzist vlasztja?
Az orvos nmi kutats utn felfedezi, hogy a B betegsgnek kt vltozata van, a dextro-B s a levo-B, amelyek
egyforma valsznsggel lpnek fel, s egyformn jl kezelhetk az anti-B gygyszerrel. Mit fog csinlni a kt
statisztikus most, hogy hrom hipotzis van?
20.5.
Magyarzza meg, hogyan alkalmazhat a 18. fejezetben trgyalt turbzs mdszere a naiv Bayes-tanulsra.
Tesztelje a kapott algoritmust az tterem tanulsi problmn.
20.6.
Vegyen m darab (xj, yj) adatpontot, az xj-bl a (20.5) egyenlet alapjn generlja yj-t. Keresse meg azokat a 1, 2
s rtkeket, amelyek maximljk az adatok feltteles log likelihood rtkt.
20.7.
Vizsglja a lz 14.3. alfejezetben bemutatott zajos-VAGY modelljt. Magyarzza meg, hogyan alkalmazhat a
maximum-likelihood tanuls arra, hogy egy teljes adathalmazra illesszk egy ilyen modell paramtereit.
(Segtsg: a parcilis derivltakra hasznlja a lncszablyt.)
20.8.
Ebben a feladatban a (20.6) egyenlettel definilt bta-eloszlsok tulajdonsgait vizsgljuk.
a. A [0, 1] tartomny feletti integrls alapjn mutassa meg, hogy a bta[a,b] eloszls normalizl faktort =
(a + b)/ (a) (b) adja, ahol (x) az gynevezett gamma-fggvny, amelynek defincija: (x + 1) = x
(x) s (1) = 1. (Egsz x-ekre (x + 1) = x!)
b. Mutassa meg, hogy az tlagrtk a/(a + b).
c. lltsa el a modus(oka)t (a legvalsznbb rtke(ke)t).
d. Jellemezze a bta[, ] eloszlst nagyon kis esetn. Mi trtnik, ha egy ilyen eloszlst frisstnk?
20.9.
Vegyen egy tetszleges Bayes-hlt, egy ehhez a hlhoz tartoz teljes adathalmazt s az adathalmaznak a hl
ltal megadott likelihood-rtkt. Adjon egyszer bizonytst arra, hogy az adathalmaz likelihood-rtke nem
cskkenhet, ha a hlhoz hozzadunk egy j kapcsolatot, majd jraszmoljuk a maximum-likelihood
paramtereket.
20.10.
Vizsglja meg az EM alkalmazst arra a problmra, amikor a 20.10. (a) brn lthat hl paramtereit
akarjuk tanulni, mikzben az igazi paramterrtkeketa (20.7) egyenlet adja.
670
a. Magyarzza meg, hogy mirt nem mkdne az EM algoritmus, ha csak kt attribtum volna, s nem hrom.
b. Vgezze el az els itercira vonatkoz szmtst a (20.8) egyenletbl kiindulva.
c. Mi trtnik, ha indulskor az sszes paramtert ugyanarra a p rtkre lltjuk? (Segtsg: hasznos lehet, ha
empirikusan megvizsglja, mieltt az ltalnos eredmnyt megprbln levezetni.)
d. rja fel a 3.2. szakasz - Rejtett vltozkkal felptett Bayes-hlk tanulsa rszben tallhat adattblzatra a
log likelihoodnak a paramterekkel kifejezett sszefggst. Szmtsa ki minden egyes paramterre a
parcilis derivlt rtkt! Vizsglja meg a (c) rszben rgztett pont jellegt.
20.11.
Hozzon ltre manulisan egy olyan neurlis hlt, amely kt bemenetnek az xor fggvnyt szmtja ki.
Bizonyosodjon meg arrl, helyesen specifiklta-e azt, hogy milyen egysgeket kell hasznlni.
20.12.
Hozzon ltre egy olyan szupport vektor gpet, amely az xor fggvnyt szmtja ki. Knyelmesebb lesz, ha mind
a bemeneteknl, mind a kimenetnl 1-et s +1-et hasznl 0 s +1 helyett. Ennek megfelelen egy minta pldul
([1, 1], 1) vagy ([1, 1], 1) lesz. Tipikus, hogy az x bemenetet egy tdimenzis trre kpezzk le, ahol kett
az eredeti x1 s x2 dimenzi, a msik hrom pedig x12, x22, illetve x1 x2 kombincii. Ebben a feladatban viszont
csak kt dimenzit hasznlunk: x1-et s x1 x2-t. Rajzolja fel ebben a trben a ngy bemeneti pontot s a maximlis
tartalkkal rendelkez osztlyozt. Mekkora a tartalk? Rajzolja meg a hatrol vonalat az eredeti, euklideszi
trben.
20.13.
Egy egyszer perceptron nem kpes az xor fggvny (vagy ltalnosabban a paritsfggvny) brzolsra.
Mutassa be, hogy hogyan alakulnak egy ngybemenet, ugrsfggvnyt hasznl perceptron slyai, amikor
sorban a paritsfggvnybl szrmaz mintk rkeznek (kezdetben minden sly 0,1 rtk volt).
20.14.
Idzzk fel a 18. fejezetbl, hogy n bemenet esetn 22 klnbz logikai fggvny ltezik. Hnyat tud
reprezentlni ezek kzl az ugrsfggvnyt hasznl perceptron?
20.15.
Vegyk a kvetkez hat bemeneti rtket (I1I6) s egy, ezekhez tartoz kvnt kimeneti rtket (T) megad
mintahalmazt.
a. Futassa a perceptron tanulsi szablyt erre az adathalmazra, s adja meg a vgs slyokat.
b. Futassa a dntsi fa tanulsi algoritmust, s adja meg az eredmnyl kapott dntsi ft.
c. rtkelje az eredmnyeket.
20.16.
671
A (20.13) egyenletbl kiindulva mutassa meg, hogy L/Wj = Err xj.

20.17.
Tegyk fel, hogy egy lineris aktivcis fggvnyeket hasznl neurlis hlnk van. Azaz minden neuron
kimenete a bemenetek slyozott sszegnek c-szerese, ahol c egy konstans.
a. Tegyk fel, hogy a hlnak egy rejtett rtege van. rja fel a slyok egy adott W rtkkszletre azokat az
egyenleteket, amelyek megadjk a kimeneti rteg neuronjainak kimeneti rtkeit W s a bemeneti rteg I
rtkeinek fggvnyben anlkl hogy explicit mdon megjelennnek az egyenletekben a rejtett neuronok
kimeneti rtkei. Mutassa meg, hogy ltezik olyan hl, amelynek nincs rejtett rtege, de ugyanezt a
fggvnyt valstja meg.
b. Ismtelje meg az (a) rsz alatti feladatot, de tetszleges szm rejtett rteg esetre. Milyen kvetkeztetst
vonhat le a lineris aktivcis fggvnyekre?
20.18.
Hozzon ltre egy adatstruktrt rtegekbe szervezett, elrecsatolt neurlis hlk lersra, amely tartalmazza az
elreterjesztshez s a hiba-visszaterjesztshez szksges informcit is. Ezt hasznlva rjon egy NEURLISHL-KIMENET nev programot, amely egy mintt s egy neurlis hlt kap bemenetknt, s kiszmtja a
neurlis hlnak a mintra adott kimeneti vlaszt.
20.19.
Tegyk fel, hogy egy tant halmaz csupn egyetlen pldt tartalmaz, de azt 100-szor. A 100 esetbl 80-ban az
egyetlen kimeneti rtk 1; a msik 20-ban 0. Mit ad erre a pldra egy hiba-visszaterjesztssel tantott hl, ha
tantottuk, s elrte a globlis optimumot? (Segtsg: a globlis optimum megtallshoz differencilja a
hibafggvnyt, s keresse a nullahelyt.)
20.20.
A 20.24. brn lthat hlnak ngy rejtett neuronja van. Ezt a neuronszmot nmikppen tletszeren
vlasztottuk. Vgezzen szisztematikus ksrleteket, hogy klnbz szm rejtett neuronnal rendelkez hlkra
lemrje a tanulsi grbt. Mi az optimlis neuronszm? Lehetsges lenne keresztvalidcis mdszerrel
megtallni a legjobb hlt mg a ksrletek eltt?
20.21.
Vegyk azt a problmt, amikor N adatpontot akarunk lineris osztlyozval sztvlasztani pozitv s negatv
pldkra. Nyilvnval, hogy N = 2 pont esetn ez egy d = 1 dimenzis egyenesen mindig megtehet,
fggetlenl attl, hogy a pontok hol helyezkednek el, s hogy vannak cmkzve (kivve, ha ugyanazon a helyen
vannak).
a. Mutassa meg, hogy a szeparls mindig elvgezhet N = 3 pontra egy d = 2 dimenzis skon, ha a pontok
nem egy egyenesre esnek.
b. Mutassa meg, hogy nem lehet mindig elvgezni a szeparlst N = 4 pontra egy d = 2 dimenzis skon.
c. Mutassa meg, hogy a szeparls mindig elvgezhet N = 4 pontra egy d = 3 dimenzis trben, ha a pontok
nem esnek egy skra.
d. Mutassa meg, hogy nem lehet mindig elvgezni a szeparlst N = 5 pontra egy d = 3 dimenzis trben.
e. Egy trekv dik kitzheti maga el, hogy bebizonytja: N 1 dimenzis trben ltalnos helyzetben
tallhat N pont linerisan szeparlhat (de N + 1 nem). Ebbl kvetkezik, hogy az N 1 dimenzis lineris
flterek VC-dimenzija (lsd 18. fejezet) N.
672
21. fejezet - Megerstses tanuls

Ebben a fejezetben azt vizsgljuk, hogy egy gens hogyan kpes tanulni a sikereibl s a kudarcaibl, illetve a
jutalombl s a bntetsbl.
1. Bevezets
A 18. s 20. fejezetben olyan tanul mdszereket mutattunk be, amelyek pldk alapjn fggvnyeket vagy
valsznsgi modelleket sajttanak el. Ebben a fejezetben azzal foglalkozunk, hogy az gens mi mdon
tanulhatja meg azt, hogy mit tegyen, klnsen akkor, amikor nincs tanr, aki minden elfordul krlmny
esetre elruln a helyes cselekvst.
Fontos
Vegyk pldaknt a sakkot. Tudjuk, hogy az gens kpes megtanulni sakkozni felgyelt tanulssal,
vagyis ha pldaknt sakkllsokat mutatunk neki, megnevezve az adott llsban a legjobb lpst. De
mit tud csinlni az gens akkor, ha nincs kznl egy bartsgos tant, aki pldkat mutatna? Vletlen
lpsek kiprblsval vgl is az gens felptheti krnyezetnek prediktv modelljt: milyen lesz az
lls, ha meglp egy adott lpst, esetleg mg azt is modellezheti, hogy az ellenfl vrhatan mit fog
vlaszul lpni. A kvetkez azonban a problma: visszacsatols nlkl teht anlkl, hogy tudn, mi
a j s mi a rossz az gensnek semmilyen alapja sem lesz eldnteni azt, hogy melyik lpst hzza
meg. Az gensnek tudnia kell, hogy valami j trtnt, amikor nyert, illetve valami rossz trtnt, amikor
vesztett. Az ilyen tpus visszacsatolst nevezzk jutalomnak (reward) vagy megerstsnek
(reinforcement). A sakkhoz hasonl jtkokban a megersts csak a jtk vgn jelenik meg. Ms
krnyezetben a jutalom gyakrabban jn, pldul a pingpongban mindegyik pont jutalomnak tekinthet
ppgy, mint a mszs tanulsakor brmely elrefel halads. Az ltalunk hasznlt trgyalsmdban az
gens a jutalmat is az szlels rszeknt kezeli, de valahogy bele kell lennie huzalozva, hogy ez a
rsz jutalom, s nem csupn egy szlelsfajta. gy tnik, hogy az llatokba be van ptve, hogy a
fjdalom s az hsg negatv jutalom, mg a gynyr s az lelem pozitv jutalom. A megerstses
tanulst az llatok pszicholgijt kutatk 60 ve intenzven tanulmnyozzk.
A jutalom fogalmt a 17. fejezetben vezettk be, ahol a Markov dntsi folyamatok (Markov decision
process, MDP) optimalitsnak definilsra szolglt. Optimlis stratginak neveztk azt a stratgit, amely
maximlja a vrhat sszjutalmat. A megerstses tanuls (reinforcement learning) feladata az, hogy
optimlis (vagy kzel optimlis) stratgit tanuljunk az adott krnyezethez. Mg a 17. fejezetben az gensnek a
teljes krnyezeti modell s a jutalomfggvny a rendelkezsre llt, addig a jelen fejezetben egyikrl sem
feltteleznk semmilyen elzetes tudst. Kpzelje el, hogy egy j, ismeretlen jtkot jtszik, amelynek nem
ismeri a szablyait. Nagyjbl szz lps utn az ellenfele bejelenti: n vesztett. Dihjban ez jellemzi a
megerstses tanulst.
Szmos bonyolult problmaterleten a megerstses tanuls az egyetlen lehetsges t arra, hogy egy
programnak magas szint mkdst tantsunk. Pldul a jtkok tern nagyon nehz lenne a szakember dolga: a
lehetsges nagyszm lls pontos s kvetkezetes rtkelst kellene elvgeznie annak rdekben, hogy a
pldk alapjn kzvetlenl megtantson egy kirtkel fggvnyt. Ehelyett a programnak megadhat az az
informci, hogy nyert vagy vesztett, s ezt felhasznlhatja egy olyan kirtkel fggvny tanulsra, amely
elfogadhat pontossggal kpes megbecslni brmely adott llsban a nyers valsznsgt. Hasonlkppen
rendkvl nehz megtantani egy genst helikopter vezetsre, de ha megfelel negatv jutalmat kap minden
balesetnl, bukdcsol mozgsnl vagy a belltott tvonaltl val eltrsnl, akkor az gens nllan
megtanulhat replni.
Bizonyos rtelemben a megerstses tanuls az egsz MI-problmt tfogja. Egy genst belehelyeznk
valamilyen krnyezetbe, s meg kell tanulnia ott sikeresen viselkedni. Ahhoz, hogy ezt a fejezetet ttekinthet
bonyolultsgi szinten tartsuk, csak egyszer helyzetekre s egyszer gensekre fogunk koncentrlni. A fejezet
legnagyobb rszben teljesen megfigyelhet krnyezetet feltteleznk, teht a megfigyelsek informlnak az
aktulis llapotrl. Msrszt viszont azt felttelezzk, hogy az gens sem azt nem tudja, hogyan mkdik a
krnyezet, sem azt, hogy cselekedeteinek mi a hatsa, tovbb megengedjk a cselekedetek valsznsgi
(nemdeterminisztikusan meghatrozott) kimenetelt. Hrom olyan gensfelptst fogunk ttekinteni, amelyeket
elszr a 2. fejezetben vezettnk be:
673
Megerstses tanuls
A hasznossgalap gens (utility-based agent) az llapotokra alapozott hasznossgfggvnyt tanul, s

ennek alapjn vlasztja ki azokat a cselekvseit, amelyekkel maximlja az elrhet hasznossg vrhat
rtkt.
A Q-tanul (Q-learning) gens egy cselekvsrtk (action-value) fggvnyt vagy ms nven Qfggvnyt tanul, valamilyen vrhat hasznot tulajdontva egy adott helyzetben egy adott cselekvsnek.
Egy reflexszer gens (reflex agent) olyan stratgit tanul, amely kzvetlenl kpezi le az llapotokat
cselekvsekre.
Egy hasznossgalap gensnek a krnyezet valamilyen modelljvel is rendelkeznie kell ahhoz, hogy tudja,
cselekvse milyen llapotba vezet. Pldul ahhoz, hogy az ostblajtk hasznossgfggvnynek hasznt
vegyk, az ostblajtkot jtsz programnak tudnia kell, hogy melyek a lehetsges szablyos lpsek, s ezek
hogyan hatnak az llsra. Csak ilyen mdon van arra lehetsge, hogy a lpse eredmnyekppen kapott llsra
alkalmazza a hasznossgfggvnyt. Egy Q-tanul gens viszont ssze tudja hasonltani a lehetsges vlasztsait
anlkl, hogy tudn, mire vezetnek, gy nincs szksge a krnyezet modelljre. Msrszt viszont, mivel nem
tudjk, hogy cselekvseik hova vezetnek, a Q-tanul gensek nem kpesek elre nzni. Ez viszont, mint ltni is
fogjuk, slyosan korltozhatja tanulsi kpessgeiket.
A 21.2. alfejezetben a passzv tanulssal (passive learning) kezdnk foglalkozni, amelyben az gensnek
rgztett stratgija van, s az llapotok hasznossgnak (vagy az llapot-cselekvs prok hasznossgnak)
megtanulsa a feladat. Ez magban foglalhatja a krnyezet modelljnek megtanulst is. A 21.3. alfejezet az
aktv tanulssal (active learning) foglalkozik, amikor is az gensnek azt is meg kell tanulnia, hogy mit tegyen.
Az alapvet elv a felfedezs (exploration), az gensnek a lehet legtbbet meg kell tapasztalnia krnyezetrl
ahhoz, hogy megtanulja, mi a clszer viselkeds benne. A 21.4. alfejezet bemutatja, hogy az gens hogyan
tudja felhasznlni az induktv tanulst arra, hogy sokkal gyorsabban tanuljon a tapasztalataibl. A 21.5. alfejezet
a kzvetlen stratgiareprezentci tanulsnak mdszereivel foglalkozik reflexszer genseknl. A Markov
dntsi folyamatok (lsd 17. fejezet) megrtse dnt fontossg ennek a fejezetnek a trgyalsa szempontjbl.
2. Passzv megerstses tanuls

Az egyszersg kedvrt egy ismert, teljes mrtkben hozzfrhet krnyezet llapot-reprezentcijt hasznl
passzv gens esett trgyaljuk elszr. Passzv tanuls esetn az gens stratgija rgztett, az s llapotban
mindig a (s) cselekvst hajtja vgre. A cl egyszeren a stratgia jsgnak teht az U (s)
hasznossgfggvnynek a megtanulsa. Pldaknt a 17. fejezetben bevezetett 4 3-as vilgot fogjuk
hasznlni. A 21.1. bra mutatja ezt a vilgot, s a megfelel hasznossgokat. Nyilvnval, hogy a passzv
tanuls hasonl a stratgiakirtkelsi (policy evaluation) feladathoz, amely rsze a 17.3. alfejezetben
ismertetett stratgiaitercis (policy iteration) algoritmusnak. A legfontosabb klnbsg, hogy a passzv gens
nem ismeri az llapottmenet-modellt (transition model), a T(s, a, s')-t, amely annak a valsznsget adja
meg, hogy az a cselekvs hatsra az s llapotbl az s' llapotba jutunk, tovbb nem ismeri a
jutalomfggvnyt (reward function), R(s)-et, amely minden llapothoz megadja az ott elnyerhet jutalmat.
21.1. bra - (a) A 4 3-as vilgban alkalmazott stratgia. Ez optimlis stratgia, ha

nem alkalmazunk lertkelst, s minden llapotban, amely nem vgllapot, R(s)=
0,04. (b) A 4 3-as vilg llapotainak hasznossga a stratgia esetn.
674
Megerstses tanuls
Az gens stratgija felhasznlsval egy sor ksrletet (trial) vgez. Minden egyes ksrletben az (1,1)
llapotbl indul, s az llapottmenetek valamilyen sorozatt szleli, amg el nem rkezik a (4,2), illetve a (4,3)
vgllapotok valamelyikbe. szlelsei alapjn informcit kap mind az aktulis llapotrl, mind az ott nyert
jutalomrl. Pldul gy nzhetnek ki a tipikus ksrletek:
(1,1)0,04(1,2)0,04(1,3)0,04(1,2)0,04(1,3)0,04(2,3)0,04(3,3)0,04(4,3)+1
(1,1)0,04(1,2)0,04(1,3)0,04(2,3)0,04(3,3)0,04(3,2)0,04(3,3)0,04(4,3)+1
(1,1)0,04(2,1)0,04(3,1)0,04(3,2)0,04(4,2)1
Vegyk szre, hogy mindegyik llapotszlels mellett als indexknt feltntettk az elnyert jutalmat. Clunk
a jutalmakban rejl informci felhasznlsa arra, hogy az egyes s llapotokhoz amelyek nem vgllapotok
rendelhet vrhat hasznossgot, U (s)-t megtanuljuk. A hasznossgot gy definiljuk, mint a stratgia
kvetse esetn az sszegzett (lertkelt) jutalom vrhat rtke. Ez ahogy a (17.3) egyenletben a 1.2. szakasz
- Optimalits szekvencilis dntsi problmkban rszben mr felrtuk:
Mindegyik sszefggsnkben figyelembe vesznk egy lertkelsi tnyezt (discount factor), de a 4 3

vilgban = 1-et hasznlunk.
2.1. Kzvetlen hasznossgbecsls

Widrow s Hoff az adaptv szablyozselmlettel (adaptive control theory) foglalkozva egy egyszer
mdszert fedeztek fel a kzvetlen hasznossgbecslsre (direct utility estimation) (Widrow s Hoff, 1960). Az
tlet a kvetkez: az llapot hasznossga nem ms, mint az adott llapotbl kiindulva az sszegzett jutalom
vrhat rtke, s minden egyes ksrlet ennek az rtknek egy mintjval szolgl minden bejrt llapotra.
Pldul az elzkben bemutatott hromelem tipikus ksrlethalmaz els ksrlete egy 0,72 rtk sszegzett
jutalommintt ad az (1,1) llapotra, kt 0,76 s 0,84 rtk mintt az (1,2) llapotra, tovbb kt 0,80 s
0,88 rtk mintt az (1,3) llapotra s gy tovbb. Ennek megfelelen az algoritmus mindegyik ksrleti
lpssorozat vgn kiszmtja az sszes llapotra a megfigyelt htralev jutalmat, s ez alapjn frissti az llapot
hasznossgt, egyszeren minden egyes llapotra mozgablak tlagolst vgezve, s az eredmnyt egy tblban
trolva. Ha a ksrletek szma a vgtelenhez tart, a mintk tlaga a (21.1) egyenlettel megadott valdi vrhat
rtkhez fog tartani.
Nyilvnval, hogy a kzvetlen hasznossgbecsls nem ms, mint egy pldnya a felgyelt tantsnak. A tant
pldaprok bemeneti rsze az llapot, kimeneti rsze pedig a megfigyelt htralev jutalom. Teht a
megerstses tanulst standard induktv tanulsi problmra redukltuk, a 18. fejezetben trgyaltaknak
megfelelen. A 21.4. alfejezetben ttekintjk a hasznossgfggvnyek hatkonyabb reprezentlsra szolgl
eszkzk hasznlatt, pldul a neurlis hlkt. Ezeknek a reprezentciknak a hasznlata esetn a tanulsi
technika kzvetlenl a megfigyelt adatokra alkalmazhat.
675
Megerstses tanuls
Fontos
A kzvetlen hasznossgbecslssel sikerlt a megerstses tanulst standard induktv tanulsi
problmra reduklnunk, amelyrl mr nagyon sok mindent tudunk. Sajnlatos mdon egy nagyon
fontos informciforrs hinyzik, nevezetesen az, hogy az llapotok hasznossga nem fggetlen
egymstl! Minden egyes llapot hasznossga egyenl az ebben az llapotban elnyerhet jutalom s az
t kvet llapotok vrhat hasznossgnak sszegvel. Teht a hasznossgrtkek kielgtik a
rgztett stratgira vonatkoz Bellman-egyenletet (lsd mg (17.10) egyenlet):
Azzal, hogy figyelmen kvl hagyja az llapotok kztti sszefggseket, a kzvetlen hasznossg becslse
eljtssza a tanuls lehetsgeit. Pldul a bemutatott hrom ksrlet kzl a msodik rinti a (3,2) llapotot,
amelyet elzleg az gens nem rintett mg. A kvetkez tmenet utn (3,3)-ba jut, amely az els ksrlet
alapjn nagy hasznossgot mutat. A Bellman-sszefggs azonnal rmutat, hogy valsznleg akkor a (3,2)-nek
is nagy a hasznossga, mivel a (3,3)-ba vezet, de a kzvetlen hasznossgbecsls semmit se tanul meg ebbl a
ksrlet vgig. ltalnosabban megfogalmazva azt mondhatjuk, hogy a kzvetlen hasznossgbecslsre gy
tekinthetnk, mint ami jval nagyobb U hipotzistrben keres, mint amire szksg van. Ennek oka, hogy szmos
olyan fggvnyt is szmon tart a hipotzisek kzt, amelyek srtik a Bellman-egyenletet. Emiatt az algoritmus
gyakran csak nagyon lassan konvergl.
2.2. Adaptv dinamikus programozs

Ahhoz, hogy hasznlhassuk az llapotok kzti knyszerekben rejl informcit, az gensnek meg kell tanulnia,
hogy az llapotok kztt milyen kapcsolatok llnak fenn. Egy adaptv dinamikus programozs (ADP)
(adaptive dynamic programming, ADP) alap gens mkdsnek lnyege, hogy menet kzben megtanulja a
krnyezet llapottmenet-modelljt, s dinamikus programozsi mdszerrel megoldja a hozz kapcsolhat
Markov dntsi folyamatot. Egy passzv tanul gens szmra ez azt jelenti, hogy a megtanult T(s, (s), s')
llapottmenet-modellt s a megfigyelt R(s) jutalmakat behelyettesti a (21.2) Bellman-egyenletbe, majd
kiszmtja az llapotok hasznossgt. Mint a 17. fejezetben a stratgiaitercinl rmutattunk, ezek az
egyenletek linerisak (nincs maximalizlsi lps), gy brmely lineris algebrai programcsomaggal
megoldhatk. Egy msik alternatva, ha a mdostott eljrsmd-itercit (modified policy iteration)
vlasztjuk (lsd 3. szakasz - Eljrsmd-iterci rszben), egy egyszerstett rtkitercis eljrst hasznlva
arra, hogy a tanult modell minden vltozsa utn frisstsk a hasznossgbecsls eredmnyt. Mivel a modell
legtbbszr csak keveset vltozik az egyes megfigyelsek utn, az rtkitercis algoritmus kiindul rtkknt
felhasznlhatja az elz hasznossgbecslst, s egsz gyorsan konverglhat.
Magnak a modellnek egyszer a megtanulsa, mivel a krnyezet teljesen megfigyelhet. Ennek megfelelen
egy ellenrztt tantsi feladatunk van, amelyben a bemenet az llapot-cselekvs pr, a kimenet pedig a
kvetkez llapot. A legegyszerbb esetben az llapottmenet-modellt valsznsgek tblzatval
reprezentlhatjuk. Szmon tartjuk, hogy a cselekvsek egyes eredmnyei milyen gyakran lpnek fel, s abbl a
gyakorisgbl becsljk a T(s, a, s') llapottmenet valsznsgt, hogy hnyszor kvetkezett s', amikor az s
llapotban az a cselekvst vlasztottuk.1 Pldul ha a 2. szakasz - Passzv megerstses tanuls rsz hrom
tvonalban a Jobbra cselekvst hromszor vlasztottuk az (1,3) llapotban, s a hrombl ktszer a (2, 3) lett a
kvetkez llapot, akkor T((1, 3), Jobbra, (2, 3)) becslt rtke 2/3 lesz.
A passzv ADP-gens teljes programja a 21.2. brn lthat. A 21.3. bra mutatja a 4 3-as vilgon elrt
teljestmnyt. Az rtkbecslseinek javulsi sebessge szempontjbl az ADP-gens a lehetsgekhez kpest a
legjobban mkdik, ahogy csak az llapottmenet-modell tanulsi kpessgnek megfelelen haladni tud.
Ebben az rtelemben ms megerstses tanulsi algoritmusok mrsnek standardjaknt szolglhat.
Ugyanakkor nagy llapotterek esetn nmikpp kezelhetetlenn vlhat. Pldul az ostblajtkban nagyjbl
1050 egyenletet kell megoldania 1050 ismeretlenre nzve.
21.2. bra - Egy adaptv lineris programozs alapon tanul passzv megerstses
gens. A kd egyszerstse rdekben feltettk, hogy minden egyes szlels
sztbonthat egy szlelt llapotra s egy jutalomjelre.
1
Ez mint a 20. fejezetben is trgyaltuk a maximum-likelihood becsls. Egy Bayes-frissts Dirichlet-priorral jobb is lehet.
676
Megerstses tanuls
21.3. bra - A passzv ADP-tanul tanulsi grbi a 4 3-as vilg tanulsa sorn, a 21.1.
brn lthat optimlis stratgia hasznlata esetn. (a) Az llapotok egy kivlasztott
rszhalmazra kiszmtott hasznossgbecslsek a ksrletek szmnak fggvnyben.
Figyeljk meg a 78-adik ksrlet krnykn a jelents vltozsokat ez az els eset,
amikor az gens a (4,2) vgllapotba jut, melyben 1 jutalmat kap. (b) Az U(1,1)
hibjnak RMS-rtke 20 egyenknt 100 ksrletbl ll futsra tlagolva.
2.3. Az idbeli klnbsg tanulsa

Fontos
Lehetsgnk van a kt vilg (szinte) legjobb vonsait egyesteni: kzelthetjk az llapotok kzti
knyszereket ler egyenleteket anlkl, hogy megoldannk az sszes lehetsges llapotra. Az alaptlet
a kvetkez: hasznljuk fel a megfigyelt llapottmeneteket a megfigyelt llapotok olyan mdostsra,
hogy azok megfeleljenek a korltoz egyenleteknek. Vegyk pldul az (1,3)-bl (2,3)-ba val
tmenetet a 2. szakasz - Passzv megerstses tanuls msodik ksrletben. Tegyk fel, hogy az els
ksrlet eredmnyeknt a hasznossguk becslt rtke U(1,3) = 0,84 s U(2,3) = 0,92. Ha ez az
tmenet mindig elll, akkor azt vrjuk, hogy a hasznossgoknak meg kell felelnik a kvetkez
knyszernek:
U (1,3) = 0,04 + U (2,3)
677
Megerstses tanuls
gy U(1,3) eszerint 0,88 lenne. Teht a jelenlegi becslt rtk (0,84) egy kicsit alacsonyabb a
kvnatosnl, nvelni kellene. ltalnosabban megfogalmazva, ha egy s-bl s'-be trtn tmenet lp
fel, akkor a kvetkez mdon frisstjk az U (s) hasznossgot:
U(s) U(s) + (R(s) + U(s') U(s)) (21.3)
Ebben az egyenletben az gynevezett btorsgi faktor (learning rate). Mivel ez az egyenlet a

hasznossgok egymst kvet llapotokhoz tartoz rtkeit hasznlja, ezrt gyakran idbeli klnbsg
vagy IK- (temporal-difference, TD) egyenletnek nevezik.
Fontos
Az idbeli klnbsgen alapul mdszerek alaptlete az, hogy elszr hatrozzuk meg azokat a
feltteleket, amelyek korrekt becslsi rtkek esetn loklisan fennllnak, majd lltsunk fel egy olyan
rtkfrisstsre szolgl egyenletet, amely ezen idelis egyenslyi egyenlet irnyba viszi a
becslseket. Passzv tanuls esetn az egyenslyi egyenletet a (21.2) szolgltatja. A (21.3) egyenlet
tnylegesen a (21.2) ltal megadott egyenslyi helyzetbe viszi az genst, br van nmi finom trkk a
dologban. Elszr vegyk szre, hogy a frissts csak a megfigyelt kvetkez llapotot, s' -t veszi
figyelembe, mg a tnyleges egyenslyi felttel az sszes lehetsges kvetkez llapotot. Azt
hihetnnk, hogy ez tlzottan megvltoztatja U(s)-t, amikor egy ritka tmenet kvetkezik be. Valjban
viszont ritka tmenetek ritkn kvetkeznek be, ezrt az U(s) tlagos rtke a helyes rtkhez fog
konverglni. Tovbb, ha -t megvltoztatjuk gy, hogy ne egy rgztett paramter legyen, hanem egy
fggvny, amely aszerint cskken, ahogy egy llapotnak a ksrletekben trtn elfordulsa n, akkor
maga az U(s) is a helyes rtkhez fog tartani.2 Ez a 21.4. brn lthat gensprogramhoz vezet. A 21.5.
bra bemutatja a passzv IK-gens ltal a 4 3 vilgban mutatott teljestmnyt. Ugyan nem tanul olyan
gyorsan, mint az ADP-gens, s nagyobb vltozkonysgot mutat, de sokkal kevesebb szmtst
ignyel megfigyelsenknt. Vegyk szre, hogy az IK nem ignyel modellt a frissts elvgzshez. A
krnyezet szolgltatja a szomszdos llapotok kzti kapcsolatokat, a megfigyelt tmenetek formjban.
21.4. bra - Egy idbeli klnbsg alapon hasznossgot tanul passzv megerstses
gens
21.5. bra - Az IK-tanuls 4 3-as vilgon mrt tanulsi grbi. (a) Nhny kivlasztott
llapot hasznossgbecslse a ksrletszm fggvnyben. (b) Az U(1,1) becslsnek
RMS-hibja, amelyet 20 futs tlagbl szmoltunk, mindegyik futs 500 ksrletet
tartalmazott. Csak az els 100 ksrletbl szrmaz eredmnyt rajzoltuk fel, hogy a
grbe a 21.3. brval sszehasonlthat legyen.
Technikailag azt kvnjuk meg, hogy

s
a felttelnek. A 21.5. brn (n) = 60/(59 + n)-t hasznltuk.
fennlljon. Az (n) = 1/n cskkens megfelel ennek
678
Megerstses tanuls
Az ADP- s IK-megkzelts valjban szoros rokonsgban van. Mindkett loklis vltoztatsokat vgez a
hasznossgbecslsben annak rdekben, hogy minden egyes llapot megfeleljen a rkvetkezknek.
Ugyanakkor van egy klnbsg. Az IK gy mdostja az llapotot, hogy az megfeleljen a megfigyelt
rkvetkez llapotnak ((21.3) egyenlet). Az ADP viszont gy mdostja az aktulis llapotot, hogy az sszes
lehetsges kvetkez llapotnak megfeleljen, de ezeket az llapotokat a valsznsgkkel slyozza (21.2)
egyenlet). Ez a klnbsg eltnik, amikor az IK-mdostst nagyszm tmenetre tlagoljuk, mivel az
llapothalmaz kvetkez llapotainak gyakorisga nagyjbl arnyos a valsznsgkkel. Egy, az elznl
fontosabb klnbsg, hogy mg az IK minden megfigyelt llapottmenet utn egyetlen mdostst vgez, addig
az ADP annyit, amennyi csak szksges ahhoz, hogy helyrelltsa az U hasznossgbecslsek s a T
krnyezetmodell kzti konzisztencit. Br a megfigyelt llapottmenet csak loklisan vltoztatja meg T-t, de
szksg lehet arra, hogy ezt vgigterjesszk U-n. Ennek megfelelen gy vehetjk, hogy az IK egy durva, de
hatkony kzeltse az ADP-mdszernek.
Mindegyik, az ADP ltal elvgzett mdosts az IK szempontjbl gy is tekinthet, mint az aktulis krnyezeti
modell szimulcija segtsgvel generlt pszeudoksrlet eredmnye. Kiterjeszthetjk az IK-megkzeltst
gy, hogy a krnyezeti modell segtsgvel szmos pszeudoksrletet generljon ltrehozva olyan
tmeneteket, amelyekrl az aktulis krnyezet modellje alapjn az IK-gens el tudja kpzelni, hogy
megtrtnhetnek. Az IK-gens akr nagyszm kpzelt tmenetet is generlhat minden megfigyelt tmenetre.
Ennek eredmnyekppen a hasznossg becslsei egyre inkbb az ADP becslseihez kzeltenek, termszetesen a
fizetend r a megnvekedett szmtsi id lesz.
Hasonl mdon az ADP-eljrs hatkonyabb vltozatait hozhatjuk ltre kzvetlenl approximlva az
rtkiterci s stratgiaiterci algoritmusait. Ne felejtsk, hogy a teljes rtkiterci kezelhetetlenn vlhat, ha
az llapottr nagy. Ugyanakkor a mdostsi lpsek kzl szmos csak nagyon parnyi. Elfogadhatan j
vlaszok gyors generlshoz vezet lehetsges megkzelts, ha megktjk a megfigyelt tmenetek utn
elvgzett mdostsok szmt. Azt is megtehetjk, hogy valamilyen heurisztika segtsgvel rangsoroljuk a
lehetsges mdostsokat, s csak a legfontosabbakat vgezzk el. A prioritsos vgigsprs (prioritized
sweeping) heurisztikja preferlja azon llapotok mdostst, amelyek valszn kvet llapotainak
hasznossgban ppen most nagy mdosts trtnt. Ehhez hasonl heurisztikk segtsgvel a kzelt ADPalgoritmusok rendszerint nagyjbl ugyanolyan gyorsan kpesek tanulni, mint a teljes ADP, ha pusztn a tant
szekvencik szmt nzzk. Viszont tbb nagysgrenddel hatkonyabbak lehetnek, ha a szmtsi ignyt
vizsgljuk (lsd 21.3. feladat). Ezltal lehetv vlik szmukra olyan llapotterek vizsglata is, amelyek messze
tl nagyok a teljes ADP-nek. A kzelt ADP-algoritmusoknak tovbbi elnye, hogy egy j krnyezet
tanulsnak korai fzisban a T krnyezeti modell gyakran olyan tvol van a helyestl, hogy nincs sok rtelme
egy azzal pontosan konzisztens hasznossgfggvnyt kiszmtani. A kzelt algoritmus hasznlhat olyan
minimlis mret mdostst, amely cskken annak mentn, ahogy a krnyezeti modell egyre pontosabb vlik.
Ez elkerlhetv teszi a nagyon hossz rtkitercikat, amelyek a tanuls korai szakaszban azrt lpnek fel,
mert nagy vltozsok trtnnek a modellben.
3. Aktv megerstses tanuls
679
Megerstses tanuls
A passzv tanul gensnek rgztett stratgija van, ez hatrozza meg a viselkedst. Az aktv gensnek viszont
el kell dntenie, hogy melyik cselekvst vlassza. Vegyk elszr az adaptv dinamikus programozs alapjn
tanul genst, s nzzk meg azt, hogyan kell mdostani, hogy ezt az j lehetsget kezelni tudja.
Elszr is az gensnek nem csupn egy rgztett stratgia modelljt kell megtanulnia, hanem egy teljes modellt,
amibe az sszes cselekvsnek lehetsges eredmnyeihez tartoz valsznsgek is beletartoznak. Erre a
PASSZV-ADP-GENS esetn alkalmazott egyszer tanulsi eljrs is kivlan alkalmas. Ezek utn figyelembe
kell vennnk, hogy az gens vlaszthat a cselekvsek kztt. A megtanuland hasznossgok azok, amelyeket az
optimlis stratgia definil. Ezek a hasznossgok megfelelnek a 2.1. szakasz - Az llapotok hasznossga rszben
kzlt Bellman-egyenletnek, amit itt megismtlnk:
A 17. fejezetben kzlt rtkitercis vagy stratgiaitercis algoritmusok segtsgvel ezek az egyenletek
megoldhatk az U hasznossgfggvnyre nzve. A vgs krds az, hogy mit csinljunk az egyes lpsekben.
Az egyik lehetsg, hogy a megtanult modell alapjn nyert optimlis U hasznossgfggvny alapjn az gens
meghatroz egy egy lpsre elretekint optimlis cselekvst annak rdekben, hogy maximlja a vrhat
hasznossgot. A msik lehetsg, hogy ha stratgiaitercit hasznlt, akkor az optimlis stratgia mr
rendelkezsre ll, gy gondolkods nlkl csak vgre kell hajtania az optimlis stratgia ltal javasolt
cselekvst. A krds az, hogy valban vgre kell-e hajtania?
3.1. Felfedezs
A 21.6. bra bemutatja annak a ksrletsorozatnak az eredmnyt, amely sorn az ADP-gens az egyes lpsek
sorn tanult optimlis stratgia ltal javasolt cselekvst kveti. Lthat, hogy az gens nem tanulja meg sem a
helyes hasznossgrtkeket, sem az igazi optimlis stratgit! Ehelyett a 39-edik ksrletnl megtall egy
stratgit, amely a +1 jutalomhoz vezet az als (2,1), (3,1), (3,2), (3,3) ton (lsd 21.6. bra). Ezek utn
kisebb vltoztatsokkal gyjti a tapasztalatokat, s a 276-ik ksrlettl kezdve mereven ragaszkodik ehhez a
stratgihoz, gy soha nem tanulja meg a tbbi llapot hasznossgt, s soha nem tall r a valban optimlis
tra a (1,2), (1,3), (2,3) llapotokon keresztl. Ezt moh gensnek (greedy agent) nevezzk. Ismtelt ksrletek
azt mutattk, hogy a moh gens ebben a krnyezetben nagyon ritkn tallja meg az optimlis stratgit, s
idnknt borzalmas stratgikhoz konvergl.
Hogyan trtnhet meg, hogy optimlis cselekvseket vlasztva szuboptimlis eredmnyhez jutunk? A vlasz
abban rejlik, hogy a megtanult modell nem azonos az igazi krnyezettel, teht az, ami optimlis a megtanult
modellben, szuboptimlis lehet az igazi krnyezetben. Sajnlatos mdon az gens nem tudja, hogy milyen a
valdi krnyezet, gy nem kpes az igazi krnyezetre nzve optimlis cselekvst meghatrozni. Mit kell akkor
tennnk?
21.6. bra - Annak a moh ADP-gensnek a felmutatott teljestmnye, amely

vgrehajtja a tanult modell alapjn optimlisnak tn cselekvst. (a) A kilenc nem
vgllapot alapjn szmolt tlagos RMS-hiba. (b) Az a szuboptimlis stratgia, amely
fel ebben a ksrletsorozatban a moh gens konvergl.
680
Megerstses tanuls
Amit a moh gens nem vett figyelembe, az az, hogy a cselekvsnek tbb funkcija is van annl, mint hogy a
jelenleg megtanult modell alapjn jutalmat hozzon, ezenfell hozzjrul az igazi modell megismershez is a
nyert szlelseken keresztl. A modell javtsa viszont azt eredmnyezheti, hogy az gens tbb jutalomhoz jut a
jvben.3 Ennek megfelelen az gensnek kompromisszumot kell ktnie a kihasznls (exploitation) a
jelenlegi hasznossgbecslsben tkrztt modell alapjn trtn jutalom maximalizls s a felfedezs
(exploration) kztt, ez utbbi a hossz tv eredmnyessget szolglja. Ha csupn a kihasznlsra tr, akkor
azt kockztatja, hogy beragad valamilyen megszokott kerkvgsba. Ha pedig csak a felfedezssel trdik, hogy
tudst bvtse, de soha nem lteti t a tudst a gyakorlatba nem hoz semmilyen hasznot. A val letben
llandan dntennk kell, hogy folytassuk-e knyelmes letnket, vagy vgjunk neki az ismeretlennek, htha
egy j s jobb letet fedeznk fel. Minl tbb mindent rtnk, annl kevesebb felfedezsre van szksgnk.
Tudunk-e ennl kicsit preczebbek lenni? Van egyltaln optimlis felfedezsi stratgia? Kiderlt, hogy ezt a
krdst a statisztikus dntselmlet egy rszterlete az n. rabl problma (bandit problem) kapcsn nagy
mlysgben trgyalta (lsd a bekeretezett rszt).
Br a rablk problmjt rendkvl nehz pontosan megoldani gy, hogy egy optimlis felfedezsi stratgit
nyerjnk, azonban kszthet egy sszer terv, ami vgl az gens optimlis viselkedshez vezet. Minden ilyen
eljrs a vgtelen felfedezs hatrn lehet moh (VFHM) (greedy in the limit of infinite exploration, GLIE).
Egy VFHM-sma alapjn mkd gensnek korltlan szmban ki kell prblnia minden cselekvst az sszes
llapotban. Ezltal kerli el annak veszlyt, hogy egy szokatlanul rossz kimenetel sorozat miatt vges (nem
nulla) valsznsggel nem tall meg egy optimlis cselekvst. Egy ilyen terv alapjn mkd ADP-gens vgl
megtanulja az igazi krnyezeti modellt. Egy VFHM-tervnek vgl mohv kell vlnia, gy az gens cselekvsei
optimliss vlnak a megtanult (azaz itt az igazi) modellre nzve.
Fontos
Rablk s felfedezs
Las Vegasban a flkar rabl egy pnzbedobs jtkautomata. A jtkos bedob egy rmt, meghzza a
kart, s elveszi a nyeremnyt (ha nyer). Egy n kar rablnak (n-armed bandit) n karja van. A
jtkosnak minden rme bedobsakor vlasztania kell, hogy melyik kart hzza meg azt, amelyik
eddig a legjobban fizetett, vagy taln egy olyat, amelyet mg nem prblt?
Az n kar rabl problma a vilg sok, ltfontossg terletn szmos vals feladat formlis
modelljeknt szolglhat, mint pldul az MI kutats-fejleszts ves kltsgvetsnek kialaktsa.
Mindegyik kar egy cselekvsnek felel meg (mint pldul 400 milli forint elklntse MI-tanknyvek
fejlesztsre), s a kar meghzsval jr nyeremny a cselekvs vlasztsa esetn vrhat haszonnak
felel meg (esetnkben risi haszon vrhat). Az ismeretlen terlet feltrsa akr egy j kutatsrl,
akr egy j zletkzpontrl van sz kockzatos, drga, bizonytalan haszonnal jr; msrszt ha
egyltaln nem kutatunk, akkor soha nem fogunk semmilyen rtkes cselekvst felfedezni.
Vegyk szre a 16. fejezetben trgyalt informcirtk-elmlettel fennll kzvetlen analgit.
681
Megerstses tanuls
Ahhoz, hogy a rabl problmt megfelelen formalizljuk, pontosan meg kell hatroznunk, hogy mit
rtnk optimlis viselkedsen. Az irodalomban tallhat legtbb definci azt felttelezi, hogy a cl az
gens lettartama alatt elrhet sszes jutalom vrhat rtknek maximalizlsa. Ezek a defincik
megkvnjk, hogy vrhat rtket kpezznk egyrszt az sszes lehetsges vilg felett, amelybe csak
kerlhet az gens, msrszt brmelyik adott vilg minden egyes lehetsges cselekvsi szekvencija
fltt. Itt a vilgot a T(s, a, s') llapottmenet-modell definilja. Teht ahhoz, hogy az gens
optimlisan cselekedjk, szksge van a lehetsges modellek a priori eloszlsra. Ezen az ton
rendszerint teljesen kezelhetetlen optimalizcis problmkhoz jutunk.
Nhny esetben azonban pldul amikor az egyes gpek nyeremnyei fggetlenek, s lertkelt
jutalmakat hasznlunk minden egyes jtkgpre kiszmthat az gynevezett Gittins-index (Gittins,
1989). Az index csak annak fggvnye, hogy hnyszor vlasztottuk a gpet, s eddig mennyit fizetett
ki. Az index azt jelzi minden egyes gpre, hogy mennyire ri meg tovbbi pnzt bedobnunk, s a
vrhat kifizetsen s az informci vrhat rtkn alapul. A legnagyobb index gp vlasztsa az
optimlis felfedezsi stratgia. Sajnlatos mdon eddig mg nem sikerlt megtallni annak a mdjt,
hogy hogyan kell a Gittins-indexet szekvencilis dntsi problmkra kiterjeszteni.
Az n kar rabl elmlet felhasznlhat arra, hogy bizonytsuk a genetikus algoritmusok szelekcis
stratgijnak sszersgt (lsd 4. fejezet). Tekintsnk az n kar rabl problmban minden egyes kart
egy lehetsges gnfzrnek, tovbb a pnz bedobsa ennl a karnl feleljen meg ezen gnek
reprodukcijnak. Ebben az esetben a genetikus algoritmus optimlisan osztja szt a pnzt akkor, ha
adott a fggetlensgi felttelezsek egy megfelel halmaza.
Szmos VFHM-sma ismert; az egyik legegyszerbb, ha az gens az id 1/t rszben vletlen cselekvst
vlaszt, egybknt pedig moh stratgit kvet. Tny, hogy ez vgl optimlis stratgihoz vezet, de idnknt
rendkvl lassan konvergl. Egy rtelmesebb megkzelts, ha az gens nmi slyt ad azoknak a
cselekvseknek, amelyeket nem hasznlt mg gyakran, mikzben igyekszik elkerlni azokat, amelyeknek a
hasznossgt kicsinek hiszi. Ezt meg tudjuk valstani gy, ha gy mdostjuk a (21.4) knyszeregyenletet,
hogy nagyobb hasznossgot tulajdontson a relatve kiprblatlan llapot-cselekvs proknak. Lnyegben egy
optimista priort hoz ltre, az gens kezdetben gy viselkedik, mintha hatalmas jutalmak lennnek sztszrva a
helysznen. Jellje U+(s) az s llapot hasznossgnak (teht a htralev jutalom vrhat rtknek) optimista
becslst, N(a, s) pedig azt a szmot, ahnyszor az s llapotban az a cselekvst vlasztottuk. Tegyk fel, hogy az
ADP-tanulst vgz gens rtkitercit vgez, ez esetben a frisstsi egyenletet [(17.6) egyenlet] t kell rnunk
gy, hogy az az optimista becslst tartalmazza. A kvetkez sszefggs ezt megvalstja:
Itt f (u, n) az gynevezett felfedezsi fggvny (exploration function). Ez hatrozza meg a mohsg (a magas
u rtkek preferencija) s a kvncsisg (az alacsony n rtkek preferencija cselekvsek, amelyeket mg
nem alkalmaztunk nagyon gyakran) kztti kompromisszumot. Az f (u, n) fggvnynek u-ban nvekvnek, nben cskkennek kell lennie. Nyilvnvalan sok lehetsges fggvny megfelel ennek a felttelnek. Egy
klnsen egyszer fggvnydefinci:
ahol R+ a tetszleges llapotban kaphat legnagyobb jutalom optimista becslse, mg Ne egy rgztett paramter.
Ennek alkalmazsval az gens minden llapot-cselekvs prt legalbb Ne alkalommal kiprbl.
Az, hogy a (21.5) egyenlet jobb oldaln nem U, hanem U+ szerepel, nagyon fontos. Ahogy a felfedezs folyik, a
startllapot krnyki llapotok s cselekvsek j nhnyszor kiprblsra kerlhetnek. Ha U-t a pesszimistbb
becslst hasznltuk volna, akkor az gens hamar elveszthetn a szabad terletek felfedezse irnti vonzalmt.
Az U+ szerepeltetse azt jelenti, hogy a felfedezshez kapcsolt jutalom visszaterjed a felfedezetlen terlet
hatrrl. gy nem csupn a szokatlan cselekvseket preferljuk, hanem a felrtkeljk azokat a cselekvseket,
amelyek a felfedezetlen terletek fel fogjk vinni az genst. Ennek a felfedezsi stratginak a hatsa jl lthat
a 21.7. brn, gyors konvergencit ltunk az optimlis teljestmnyhez, ellenttben a moh gensnl ltottakkal.
Az optimlishoz nagyon kzeli stratgit tall mindssze 18 ksrlet utn. Vegyk szre, hogy maguk a
hasznossgrtk-becslsek nem konverglnak ilyen gyorsan. Ennek az az oka, hogy az gens meglehetsen
682
Megerstses tanuls
hamar felhagy az llapottr jutalmat nem eredmnyez rszeinek felfedezsvel, oda mr csak vletlenszeren
tved. Mindamellett teljesen sszer az gens rszrl, hogy nem sokat trdik azon llapotok hasznossgnak
pontos rtkvel, amelyekrl tudja, hogy nemkvnatosak s elkerlhetk.
21.7. bra - A felfedez ADP-gens teljestmnye, R+ = 2 s Ne = 5 esetn. (a) Nhny

kivlasztott llapot hasznossgnak becslse az id fggvnyben. (b) A
hasznossgrtkek RMS-hibja, s az ehhez kapcsolhat, a stratgibl szrmaz
vesztesg.
3.2. Egy cselekvsrtk-fggvny tanulsa

Most, hogy mr van egy aktv ADP-gensnk, nzzk meg, hogy mi mdon tudunk egy aktv idbeli klnbsg
tanul genst ltrehozni. A legszembetnbb eltrs a passzv esethez kpest, hogy az gensnek tbb nem ll
rendelkezsre egy rgztett stratgia, teht ha megtanul valamilyen U hasznossgfggvnyt, akkor meg kell
tanulnia egy modellt is, hogy egy U-n alapul egylpses elretekint keretben cselekvst tudjon vlasztani. A
modellkialakts problmja ugyanaz az IK-gensnl, mint az ADP-gensnl. Mi a helyzet magval az IK
frisstsi szabllyal? Taln meglep, de a (21.3) IK frisstsi szably vltozatlan marad. Ez furcsnak tnhet a
kvetkez okbl: tegyk fel, hogy az gens olyan lpst vlaszt, ami norml esetben j clhoz vezet, de a
krnyezet nemdeterminisztikus volta miatt az gens valamilyen katasztroflis llapotban vgzi. Az IK frisstsi
szably ezt ppoly komolyan veszi, mintha ez a kimenetel a cselekvs norml kvetkezmnye lenne, pedig csak
egy pech volt, s nem kellene sokat aggdnia miatta. Valjban az ilyen valszntlen kimenetel csak ritkn
fordul el egy nagy tantsorozat-halmazban, gy remnyeink szerint hossz tvon a valsznsgvel arnyosan
kap slyt a hatsa. Ismt azt mondhatjuk, hogy az IK-gens ugyanazokhoz az rtkekhez fog tartani, mint az
ADP-gens, ahogy a tantsorozatok szma tart a vgtelenhez.
Van egy alternatv IK-mdszer, amit Q-tanulsnak (Q-learning) hvunk, ez cselekvsrtk-reprezentcit
tanul, nem hasznossgot. Q(a, s)-sel fogjuk jellni annak az rtkt, ha az s llapotban az a cselekvst
vlasztjuk. A Q-rtkek kzvetlenl sszekapcsolhatk a hasznossgrtkekkel a kvetkez sszefggs
alapjn:
Fontos
A Q-fggvny gy tnhet, mintha csupn a hasznossginformci trolsnak egy eltr mdja lenne,
de van egy nagyon fontos tulajdonsga: egy Q-fggvnyt tanul IK- gensnek nincs szksge sem a
tanuls, sem a cselekvs kivlaszts modelljre. Ezrt a Q-tanulst modellmentes (model-free)
mdszernek is nevezik. ppgy, mint a hasznossgoknl, felrhatunk egy egyenslyi egyenletet,
amelyet a korrekt Q-rtkeknek ki kell elgtenik:
683
Megerstses tanuls
Az ADP-tanulst vgz genssel azonos mdon itt is felhasznlhatjuk ezt az egyenletet egy itercis
eljrsban arra, hogy egy becslt modell alapjn pontos Q-rtkeket szmoljunk. Ez viszont azt
kvnn meg, hogy a modellt is megtanuljuk, hiszen az egyenlet hasznlja a T(s, a, s')-t. Msrszrl
viszont az IK-megkzelts nem ignyel modellt. gy a Q-rtkekre vonatkoz IK frisstsi
sszefggs:
amely mindig kiszmtsra kerl, amikor az s llapotban az a cselekvst vlasztottuk, amely az s'
llapotba vitt.
A 21.8. bra mutatja be az IK-mdszert hasznl, felfedez Q-tanul gens teljes programjt. Vegyk szre,
hogy ugyanazt az f felfedezsi fggvnyt hasznlja, mint amit a felfedez ADP-gens is hasznlt ezrt van
szksg a vgrehajtott cselekvsek gyakorisgi statisztikira (az N tblra). Ha egy egyszerbb felfedezsi
stratgit hasznlnnk mondjuk a lpsek egy rszben vletlenszer mkdst iktatva be, ahol ez rszarny
az idvel cskken , akkor mellzhetnnk ezt a statisztikt.
A Q-tanul gens megtanulja a 4 3-as vilgra az optimlis stratgit, de ezt sokkal lassabban teszi, mint az
ADP-gens. Ennek oka, hogy az IK nem knyszert modellje alapjn konzisztencit az rtkekre. Ez az
sszehasonlts felvet egy ltalnos krdst: mi a jobb: egy modellt s egy hasznossgfggvnyt tanulni, vagy
egy cselekvsrtkfggvnyt? Ms szavakkal, mi a legjobb mdja egy gensfggvny reprezentlsnak? Ez a
mestersges intelligencia alapjait rint krds. Mint az 1. fejezetben kijelentettk, az MI legnagyobb rszben
kulcsfontossg trtneti rksg a (gyakran ki nem mondott) ragaszkods a tudsalap (knowledge-based)
megkzeltshez. Ez vezet ahhoz a feltevshez, hogy az gensfggvny reprezentcijnak legjobb mdja, ha
valamilyen szempontbl az genst krlvev krnyezet modelljt ptjk meg.
21.8. bra - Egy felfedez Q-tanul gens. Egy aktv tanul, amely megtanulja minden
cselekvsnek minden egyes llapotban a Q(a, s) rtkt. Ugyanazt az f felfedezsi
fggvnyt hasznlja, amelyet a felfedez ADP-gens is hasznlt, de elkerli az
llapottmenet-modell tanulst, mivel az llapot Q-rtkt kzvetlenl a szomszdos
llapotok Q-rtkeihez tudja kapcsolni.
Nhny kutat ugyanakkor mind az MI-kzssgen bell, mind azon kvl azt lltja, hogy a modellmentes
mdszerek, mint pldul a Q-tanuls lte azt mutatja, hogy a tudsalap megkzelts nem szksges.
Mindamellett nem sok egyb van e krds eldntsre, mint az intucink. A mi intucink szerint, ahogy a
krnyezet komplexebb vlik, a tudsalap megkzelts elnyei egyre nyilvnvalbb vlnak. Ez mg a
jtkokban mint a sakk, a dmajtk s az ostblajtk (lsd kvetkez alfejezet) is gy jelentkezik, a
modellalap kirtkel fggvnyek tanulsra fordtott erfesztsek tbb sikert hoztak, mint a Q-tanul
mdszerek.
4. A megerstses tanuls ltalnost-kpessge

684
Megerstses tanuls
Az eddigiekben azt feltteleztk, hogy az gens ltal megtanult hasznossgfggvnyek s a Q-fggvnyek

tblzatos formban reprezentltak, amelyben minden egyes bemeneti vektornak egy-egy kimeneti rtk felel
meg. Ez a megkzelts kis llapotterekre jl mkdik, de a konvergencia ideje, valamint egy-egy itercis
lps ideje (ADP esetn) gyorsan n, ahogy a tr egyre nagyobb lesz. Alaposan kzben tartott kzelt ADPmdszerekkel kezelhet lehet 10 000 llapot vagy annl valamivel tbb. Ez kielgt a ktdimenzis tveszt
jelleg problmk esetn, de relisabb problmk szba sem jhetnek. A sakk s az ostblajtk a vals vilg
apr rszei csupn, mgis llapotterk 105010120 llapotot tartalmaz. Az teljesen abszurd felttelezs, hogy
mindezeket az llapotokat be kell jrnunk ahhoz, hogy megtanuljuk a jtkot!
Ezeknek a problmknak egy lehetsges kezelsi mdja, ha fggvnyapproximcit (function
approximation) hasznlunk, ami egyszeren azt jelenti, hogy a lekpezsnek brmilyen reprezentcijt
hasznlhatjuk, kivve a tblzatos reprezentcit. A reprezentcit kzeltnek tekintjk, mivel nem ll fenn
biztosan, hogy az igazi hasznossgfggvny vagy Q-fggvny reprezentlhat a vlasztott formban. A 6.
fejezetben pldul lertunk egy sakkjtkban hasznlhat kirtkel fggvnyt (evaluation function), amelyet
tulajdonsgok (feature) (vagy bzisfggvnyek (basis function)) f1,, fn halmaznak lineris kombincijval
reprezentltunk:
Megerstses tanuls sorn tanulhatjuk a = 1,, n paramtereket gy, hogy az az igazi

hasznossgfggvnyt kzeltse. Ahelyett, hogy mondjuk 10 120 rtket tartannk egy tblzatban, ez a
fggvnykzelts mondjuk n = 20 rtkkel jellemezhet, ez elkpeszt tmrts! Br senki sem ismeri a
sakkjtk igazi hasznossgfggvnyt, azt senki se hiszi, hogy pontosan jellemezhet lenne 20 szmmal.
Mindamellett, ha az approximci kielgten j, az gens mg mindig kpes lehet kivlan sakkozni. 4
Fontos
A fggvnyapproximci tulajdonsgai lehetv teszik, hogy praktikusan felhasznlhat legyen nagy
llapotterek hasznossgfggvnyeinek reprezentlsra, de nem ez az alapvet elnyk. A
fggvnyapproximtorokkal elrt tmrts lehetv teszi a tanul gens szmra az ltalnostst
azokrl az llapotokrl amelyeket bejrt, azokra az llapotokra, amelyeket nem jrt be. Azaz a
fggvnyapproximci legfontosabb aspektusa nem az, hogy kevesebb helyet ignyel, hanem az, hogy
lehetv teszi az induktv ltalnostst a bemeneti llapottrben. Hogy nmi fogalmat alkothassunk
ennek a hatsnak az erejrl: a lehetsges ostblajtk llapotok kzl csupn minden 10 44-edik
llapotnak a vizsglata alapjn megtanulhat olyan hasznossgfggvny, amely kpess tehet egy
programot, hogy olyan jl jtsszon, mint egy ember (Tesauro, 1992).
Az remnek termszetesen van msik oldala is: lehet, hogy a kivlasztott hipotzistrben egyltaln nincs olyan
fggvny, amely kielgten approximln az igazi hasznossgfggvnyt. Mint az induktv tanulsnl minden
esetben, itt is kompromisszum van a hipotzistr mrete s a fggvny megtanulshoz szksges id kztt.
Egy nagyobb hipotzistr valsznbb teszi, hogy j approximcit lehet tallni, de azt is jelenti, hogy a
konvergencia valsznleg lassabb lesz.
Kezdjk a legegyszerbb esettel, a kzvetlen hasznossgbecslssel (lsd 21.2. alfejezet).
Fggvnyapproximci esetn ez nem ms, mint a felgyelt tanuls (supervised learning) egy esete. Tegyk
fel pldul, hogy a 4 3 vilg hasznossgrtkeit egy egyszer lineris fggvnnyel reprezentljuk. A
ngyzetek jellemzi egyszeren az x s y koordintik, teht:
Teht ha (0, 1, 2) = (0,5, 0,2, 0,1), akkor

. Adott ksrlethalmaz esetn egy sor rtket
nyernk az rtkekre, s megtallhatjuk a mondjuk ngyzetes rtelemben legjobb illesztst, standard lineris
regresszit hasznlva (lsd 20. fejezet).
Tudjuk, hogy az igazi hasznossgfggvny reprezentlhat egy- vagy ktoldalnyi Lisp, Java vagy C++ kddal. Azaz reprezentlhat egy
programmal, ami pontosan oldja meg a jtkot, valahnyszor meghvjuk. Mi csak olyan fggvnyapproximtorokban vagyunk rdekeltek,
amelyek sszer szmtsi mennyisget vgeznek. Valjban jobb lehet, ha egy nagyon egyszer fggvnyapproximtort tanulunk meg, s
kombinljuk valamilyen lpsszm elretekint keresssel. A szksges kompromisszumok mindamellett egyelre nem jl ismertek.
4
685
Megerstses tanuls
Megerstses tanuls esetn jobbnak tnik online tanulst alkalmazni, amely minden egyes ksrlet utn frissti
a paramtereket. Tegyk fel, hogy lefuttatunk egy ksrletet, s a teljes jutalom (1, 1)-bl indulva 0,4. Ez arra
utal, hogy az
jelenlegi rtk tl nagy, s cskkenteni kell. Hogyan kell a paramtereket
mdostani, hogy ezt elrjk? ppgy, mint a neurlis hl tanulsnl, egy hibafggvnyt runk fel, s felrjuk a
paramterekre vonatkoz gradienst. Ha uj(s) a j-edik ksrlet sorn az s llapotbl kiindulva gyjttt teljes
megfigyelt jutalom, akkor a hibt a jsolt s a tnyleges teljes jutalom ngyzetnek klnbsgeknt
(tulajdonkppen annak feleknt) definiljk:
. Az egyes i paramterek
vltozsnak hatsra a hiba vltozsnak sebessgt a Ej/i adja meg. gy, ha a paramtert abban az irnyba
akarjuk vltoztatni, hogy a hibt cskkentse, akkor azt akarjuk, hogy:
Ezt WidrowHoff-szablynak (Widrow-Hoff rule) vagy delta-szablynak (delta rule) nevezzk, s az online
legkisebb ngyzetes hibra vonatkozik. A (21.9) egyenletben felrt lineris fggvnyapproximtorra a kvetkez
hrom egyszer frisstsi szablyt kapjuk:
Alkalmazhatjuk ezeket a szablyokat arra az esetre, amikor U(1,1) = 0,8 s uj(1, 1) = 0,4. Ekkor 0, 1 s 2
mindegyike 0,4-val cskken, ami mind cskkenti az (1, 1)-beli hibt. Vegyk szre, hogy a i-k vltoztatsa az
sszes tbbi llapotra is megvltoztatja U rtkt! Ezt rtettk azon, amit mondtunk: a fggvnyapproximci
lehetv teszi a megerstses tanulst vgznek, hogy ltalnostson a tapasztalataibl.
Azt vrjuk, hogy az gens gyorsabban fog tanulni, ha fggvnyapproximtort hasznl, feltve, hogy a
hipotzistr nem tl nagy, de van benne nhny olyan fggvny, amely kielgten illeszkedik az igazi
hasznossgfggvnyre. A 21.7. feladatban azt vrjuk az olvastl, hogy rtkelje a kzvetlen
hasznossgbecslst mind a fggvnyapproximci felhasznlsval, mind anlkl. A 4 3-as vilgban a javuls
rzkelhet, de nem drmai, mivel nagyon kicsi az llapottr, amivel dolgozni kell. A javuls sokkal nagyobb a
10 10-es vilgban, ha +1 jutalom van a (10, 10) mezn. Ez a vilg jl illeszthet a lineris
hasznossgfggvnyhez, mivel az igazi hasznossgfggvny sima s kzel lineris (lsd 21.10. feladat). Ha a
jutalmat az (5, 5) mezre tesszk, akkor az igazi hasznossgfggvny piramis jelleg, s a (21.9) egyenletben
felvett fggvnyapproximtor sznalmas kudarcot vall. Mindamellett nem veszett el minden! Emlkezznk
vissza, hogy a lineris fggvnyapproximcinl az szmt, hogy a fggvny paramtereiben legyen lineris a
hasznlt tulajdonsgok nmagukban az llapotvltozk tetszleges nemlineris fggvnyei lehetnek. Teht
hasznlhatunk egy
tpus tagot, amely a cltl val tvolsgot mri.
Ugyanilyen jl alkalmazhatjuk ezeket az elveket az idbeli klnbsg alapjn tanulkra is. Mindssze annyit
kell tennnk, hogy a paramtereket gy mdostjuk, hogy az egymsra kvetkez llapotok idbeli klnbsgt
cskkenteni prbljuk. A (21.3) s (21.8) IK- s Q-tanulsi egyenleteink j vltozata:
a hasznossgfggvnyre, s
686
Megerstses tanuls
a Q-rtkekre. Megmutathat, hogy ezek a frisstsi szablyok a paramtereiben lineris fggvnyapproximtor

esetn az igazi fggvny lehet legkzelebbi5 approximcijhoz konverglnak. Szerencstlen mdon mindez
nem ll meg, ha nemlineris fggvnyeket hasznlunk mint amilyenek pldul a neurlis hlk. Nagyon
egyszer pldk tallhatk, amelyeknl a paramterek a vgtelenhez tartanak, pedig j megoldsok tallhatk a
hipotzistrben. Vannak kifinomultabb algoritmusok, amelyek elkerlik ezeket a problmkat, de napjainkban a
megerstses tanuls ltalnos fggvnyeket hasznl fggvnyapproximtorral megmaradt a magas
mvszet szintjn.
A fggvnyapproximci a krnyezet modelljnek tanulsban is nagyon hasznos lehet. Emlkezznk r, hogy
egy megfigyelhet krnyezet modelljnek tanulsa ellenrztt tanulsi feladat, mivel a kvetkez szlels
megadja a kvnt kimeneti llapotot. A 18. fejezetben ismertetett brmely ellenrztt tanulsi mdszer
hasznlhat, megfelel mdostsokkal. Ugyanis itt nem egy logikai vltoz vagy egyetlen vals rtk
predikcijrl van sz, hanem komplett llapotlersokrl. Ha pldul az llapot n logikai vltozval adhat
meg, akkor n logikai fggvnyt kell megtanulnunk, hogy az sszes vltozt megjsolhassuk. Sokkal nehezebb a
tanulsi problma rszlegesen megfigyelhet krnyezet esetn. Ha tudjuk, hogy melyek a rejtett vltozk, s
tudjuk, hogy milyen oksgi viszonyban llnak egymssal s a megfigyelhet vltozkkal, akkor a 20. fejezetben
lertak szerint rgzthetnk egy megfelel Bayes-hlstruktrt, s hasznlhatjuk az EM-algoritmust a
paramterek tanulsra. A rejtett vltozk bevezetse, illetve a modellstruktra tanulsa jelenleg megoldatlan
problmk.
Nzzk most a megerstses tanuls komolyabb alkalmazsait. Ltni fogjuk, hogy azokban az esetekben,
amelyekben a hasznossgfggvnyt (s ezzel egytt a modellt) hasznljuk, ott felttelezzk, hogy a modell
adott. Pldul az ostblajtk kirtkel fggvnynek tanulsa sorn ltalban feltesszk, hogy a leglis
lpsek s azok hatsa elzetesen ismert.
4.1. Alkalmazsok a jtkok terletn

A megerstses tanuls els fontos alkalmazsa Arthur Samuel dmajtk programja volt (Samuel, 1959; 1967)
egyben ez volt a tanul programok sszes vlfaja kzt is az els jelentsebb. Samuel elszr egy legfeljebb 16
tag slyozott lineris llskirtkel fggvnyt hasznlt. A (21.11) egyenlet egy varinst alkalmazta frisstsi
szablyknt. Mindamellett volt nhny lnyeges eltrs az programja s a jelenleg hasznlt mdszerek kzt.
Az els az, hogy a jelen llapot s a keressi fban vgrehajtott teljes elretekintses keress ltal adott rtk
kzti klnbsg alapjn frisstette a slyokat. Ez nagyon jl mkdik, mert ahhoz vezet, hogy az llapotteret
klnbz felbontssal lssuk. A msodik klnbsg, hogy a programja nem hasznlt semmilyen megfigyelt
jutalmat! Teht a vgllapot rtkt figyelmen kvl hagyta. Ez azt jelenti, hogy knynyen elkpzelhet, hogy
Samuel programja nem konvergl, vagy ha konvergl, akkor a nyer helyett a veszt stratgihoz tart. Samuel
ezt oly mdon kerlte el, hogy ragaszkodott ahhoz, hogy az anyagi elnyhz tartoz sly pozitv legyen.
rdekes mdon ez elegend volt ahhoz, hogy programjt a slyok ternek olyan rszbe irnytsa, amely j
dmajtkot eredmnyezett.
Gerry Tesauro TD-Gammon rendszere (Tesauro, 1992) jl mutatja a megerstses tanulsi technikk erejt.
Korbbi munkjban (Tesauro s Sejnowski, 1989) Tesauro megksrelte a Q(a, s) fggvny neurlis
reprezentcijnak tanulst kzvetlenl humn szakemberek ltal relatv rtkekkel cmkzett lpsek alapjn.
Ez a megkzelts nagyon fraszt volt a szakembereknek. Az eredmnyl kapott NEUROGAMMON nev program a
szmtgpes programok kzt ers jtkos volt ugyan, de nem volt versenykpes a humn szakemberekkel. A
TD-Gammon projekt az nmagban val tanuls egy ksrlete volt. A TD-Gammon csupn az egyes jtszmk
vgn adott egyetlen jutalomjelet. A kirtkel fggvny reprezentcijt egy teljesen sszekttt, egyetlen 40
elembl ll rejtett rteggel felptett neuronhlval oldotta meg. A (21.11) egyenlet szimpla ismtelt
alkalmazsval a TD-Gammon lnyegesen jobban megtanult jtszani, mint a Neurogammon annak ellenre,
hogy a bemeneti reprezentci a szmtott tulajdonsgok nlkli nyers tblalls volt. Ez krlbell 200 000
jtkot s kt ht szmtgpes futst ignyelt. Br ez hatalmas mennyisg jtknak tnhet, de valjban az
llapottrnek csak egy elhanyagolhatan kis rszt fedi le. Amikor a bemeneti reprezentcit szmtott
tulajdonsgokkal bvtettk, akkor egy 80 rejtett rtegbeli elemmel felptett neurlis hl 300 000 tant
jtszma utn kpes volt olyan szinten jtszani, mint a vilg hrom legersebb jtkosa. Kit Woolsey, az egyik
lvonalbeli jtkos s szakr azt nyilatkozta: Ktsgtelen, hogy a pozcimegtlsben sokkal jobb nlam.
4.2. Robotirnytsi alkalmazsok

5
A hasznossgfggvnyek kzti tvolsg defincija csak technikai krds, lsd (Tsitsiklis s Van Roy, 1997).
687
Megerstses tanuls
A hres rd-egyenslyozsi (cart-pole) feladat, amelyet inverz ingnak (inverted pendulum) is neveznek, a
21.9. brn lthat. A feladat a kocsi x pozcijnak vezrlse gy, hogy a rd nagyjbl flfel lljon ( /2),
mikzben a kocsi a plya kijellt hatrai kztt marad. A megerstses tanuls s a szablyozselmlet
terletn tbb mint 2000 cikket publikltak errl a ltszlag egyszer feladatrl. A rd-egyenslyozsi problma
annyiban klnbzik az eddigiekben trgyaltaktl, hogy az llapotvltozi
folytonosak. A cselekvs
ltalban diszkrt: lks jobbra vagy lks balra, az gynevezett bang-bang szablyozs (bang-bang control).
21.9. bra - A mozg kocsi tetejn ll hossz rd egyenslyozsnak vizsglatra

szolgl berendezs. A kocsit az
llapotvltozkat megfigyel szablyz jobbra
vagy balra lkheti.
Az els ezen problma tanulst clz munkt Michie s Chambers vgezte (Michie s Chambers, 1968). Az
BOXES nev algoritmusuk mindssze 30 prblkozs utn kpes volt a rudat tbb mint egy rig egyenslyban
tartani. Radsul, sok ksbbi rendszertl eltren, a BOXES egy valdi kocsit s rudat hasznlt, nem
szimulcit. Az algoritmus elszr is kvantlta, azaz tartomnyokra (dobozokra) bontotta a ngydimenzis
llapotteret, innen jtt az algoritmus neve is. Ezek utn addig vgeztek egy-egy ksrletet, amg a rd leesett
vagy a kocsi elrte a plya vgt. Negatv megerstst rendeltek az utols llapottr-tartomnyban az utols
cselekvshez, s ezt terjesztettk vissza a megelz szekvencira. Azt talltk, hogy a kvantls akkor okoz
bizonyos problmkat, ha a berendezst ms pozcibl indtottk, mint amiket a tants sorn hasznltak, ami
arra utal, hogy az ltalnosts nem volt tkletes. Jobb ltalnostkpessg s gyorsabb tanuls rhet el, ha
egy olyan algoritmust hasznlunk, amely adaptvan osztja rszekre az llapotteret, a jutalom megfigyelt
vltozsainak megfelelen. Manapsg egy hromszoros invertlt inga egyenslyozsa kznsges feladatnak
szmt ez mr a legtbb ember gyessgt messze meghaladja.
5. Stratgiakeress
688
Megerstses tanuls
A megerstses tanulssal kapcsolatos, utols ltalunk trgyalt megkzelts stratgiakeress (policy search)
nven ismert. Bizonyos rtelemben a stratgiakeress a legegyszerbb a fejezet sszes mdszere kzt. Az
alaptlet annyi, hogy engedjk vltozni a stratgit, amg javul, s utna lltsuk le a vltozst.
A vizsglatot kezdjk magval a stratgival. Emlkezznk vissza, hogy a stratgia egy olyan fggvny,
amely llapotokat kpez le cselekvsekre. Mi elssorban olyan paramterezet stratgik vizsglatban
vagyunk rdekeltek, amelyeknek sokkal kevesebb paramtere van, mint ahny llapot tallhat az llapottrben
(ppgy, mint az elz alfejezetben). Pldul paramterezett Q-fggvnyekkel reprezentlhatjuk a stratgit,
egy-egy Q-fggvnyt rendelve minden cselekvshez, s azt a cselekvst vlasztjuk, amely a legnagyobb jsolt
rtket adja:
Fontos
Minden egyes Q-fggvny lehet a paramterek lineris fggvnye, mint a (21.9) egyenletben, vagy
lehet nemlineris fggvny, mint pldul egy neurlis hl. A stratgiakeress ezek utn a
paramtereket vltoztatja oly mdon, hogy javtsa a stratgit. Vegyk szre, hogy ha a stratgit Qfggvnyekkel reprezentljuk, akkor a stratgiakeress egy Q-fggvny tanulsi eljrst eredmnyez.
Ez a folyamat azonban nem azonos a Q-tanulssal! A fggvnyapproximcit hasznl Q-tanulsban
az algoritmus egy olyan -t keres, amelyre a
kzel van Q*-hoz, az optimlis Q-fggvnyhez. A
stratgiakeress ezzel szemben olyan -t keres, amely j mkdst eredmnyez, az eredmnyl kapott
rtkek alapveten eltrhetnek.6 Egy msik nyilvnval plda a kt dolog klnbsgre az az eset,
amikor a (s) stratgit gy szmtjuk, hogy 10 lps mlysgben elretekint keresst vgznk egy
kzelt
hasznossgfggvny alapjn. A j eredmnyt ad messze lehet attl, amely az
igazi hasznossgfggvnyhez hasonlv teszi.
-t az
A (21.13) egyenletben bemutatott stratgiareprezentci egyik problmja, hogy diszkrt cselekvsek esetn a
stratgia a paramterek nemfolytonos fggvnye.7 Azaz lesznek olyan rtkek, amelyeknl vgtelen kis
vltozs a -ban azt eredmnyezi, hogy a stratgia egyik cselekvsrl a msikra vlt. Ez azt is jelenti, hogy a
stratgia rtke is vltozhat nemfolytonos mdon, ami nehzz teszi a gradiensalap eljrsok alkalmazst.
Emiatt a stratgiakeressi eljrsok gyakran hasznljk a (s, a) sztochasz-tikus stratgia (stochastic policy)
reprezentcit, amely az s llapotban az a cselekvs vlasztsnak valsznsgt specifiklja. Egy npszer
reprezentci a szoftmax fggvny (softmax function):
A szoftmax fggvny kzel determinisztikuss vlik, ha az egyik cselekvs sokkal jobb, mint a tbbi, de mindig
differencilhat szerint; gy a stratgia rtke (amely folytonos mdon fgg a cselekvsvlasztsi
valsznsgtl) differencilhat fggvnye lesz -nak.
Nzznk most mdszereket a stratgia javtsra. Kezdjk a legegyszerbb esettel: determinisztikus stratgia,
determinisztikus krnyezetben. Ebben az esetben a stratgia rtkelse trivilis: egyszeren vgrehajtjuk a
stratgit, s megfigyeljk az sszegyjttt jutalmat, ez adja szmunkra a stratgia rtkt (policy value), ()t. A stratgia javtsa ezek utn egy standard optimalizcis problma, ilyeneket a 4. fejezetben trgyaltunk.
Kvethetjk a stratgiagradiens (policy gradient) vektort, ()-t, feltve, hogy () differencilhat. Msik
lehetsg, ha az empirikus gradienst (empirical gradient) kvetjk hegymsz mdszerrel azaz kirtkeljk
a stratgit minden egyes paramter kis megvltozsa esetre. A szoksos felttelek esetn ez a stratgiatr egy
loklis optimumhoz fog konverglni.
Ha a krnyezet (vagy a stratgia) sztochasztikus, akkor a helyzet nehezebb vlik. Tegyk fel, hogy hegymsz
mdszert prblunk alkalmazni, ami azt kvnja, hogy sszehasonltsuk ()-t ( + )-val valamilyen kis
esetn. Az a problma, hogy a teljes jutalom nagyon nagyokat vltozhat ksrletrl ksrletre, gy a kisszm
ksrletbl szmtott stratgiartk nagyon megbzhatatlan lesz kt ilyen becsls sszehasonltsa pedig mg
6
7
Trivilis, hogy a
kzelt Q-fggvny optimlis teljestmnyt ad, br egyltaln nincs kzel Q*-hoz.
Folytonos cselekvsi terekre a stratgia a paramterek sima fggvnye lehet.
689
Megerstses tanuls
megbzhatatlanabb. Egy lehetsges megolds, ha egyszeren sok ksrletet futtatunk le, s a minta variancjval
mrjk, hogy elegend ksrletet futtattunk-e mr ahhoz, hogy megbzhatan jelezni tudjuk a () javtsnak
irnyt. Sajnlatos mdon ez sok vals problma esetn nem praktikus, mert az egyes ksrletek drgk,
idignyesek s esetleg veszlyesek lehetnek.
A (s, a) sztochasztikus stratgia esetn lehetsgnk van arra, hogy a -ban vgrehajtott ksrletek eredmnyei
alapjn a () gradiens torztatlan becslst lltsuk el -ban. Az egyszersg kedvrt a becslst arra az
egyszer esetre vezetjk le, amikor nem szekvencilis krnyezetben kzvetlenl az s0 startllapotbeli cselekvs
utn megkapjuk a jutalmat. Ebben az esetben a stratgiartk egyszeren a jutalom vrhat rtke, teht:
Most egy egyszer trkkt alkalmazunk, hogy ezt az sszegzst approximlni tudjuk a (s, a) ltal
meghatrozott valsznsg-eloszlsbl generlt mintkkal. Tegyk fel, hogy sszesen N ksrletnk van, s a jedik ksrletben az aj cselekvst vlasztottuk. Ekkor
Teht a stratgia igazi gradienst egy szummval kzeltettk, ahol a tagok az egyes ksrletek
cselekvsvlasztsi valsznsgeinek gradienst tartalmazzk. A szekvencilis esetre ez a kvetkezkpp
ltalnosthat:
minden egyes bejrt s llapotra. Itt aj a j-edik ksrlet sorn az s llapotban vlasztott cselekvs, s Rj(s) a j-edik
ksrlet sorn az s llapotbl kiindulva gyjttt sszes jutalom. Az eredmnyl kapott algoritmust REINFORCEnak neveztk el (Williams, 1992). Rendszerint sokkal hatkonyabb, mint a minden egyes -ban sok ksrletet
hasznl hegymsz eljrs. Viszont sajnos mg mindig sokkal lassabb annl, mint amire szksgnk lenne.
Fontos
Vizsgljuk a kvetkez feladatot: adott kt blackjack8 program, dntsk el, hogy melyik a jobb! Egyik
lehetsg, ha egy kzs bank ellen jtszatjuk ket egy adott szm krtyaleosztsban, s megnzzk,
hogy melyik nyert tbbet. Ezzel az a problma mint lttuk , hogy mindegyik program nyeresgei
nagy fluktucit fognak mutatni annak fggvnyben, hogy milyen lapokat kapott. Egy kzenfekv
megolds erre, ha elre generlunk egy sor leosztst, egy leosztshalmazt. Ezzel elkerljk a
klnbz krtyaleosztsok okozta mrsi hibt. Ez a PEGASUS algoritmus tletnek alapja (Ng s
Jordan, 2000). Az algoritmus olyan terleteken alkalmazhat, ahol rendelkezsnkre ll egy
szimultor, ezltal a vletlen ksrlet kimenetelek megismtelhetv vlnak. Az algoritmus N
vletlen szmsorozatot generl elre, mindegyik felhasznlhat arra, hogy egy tetszleges stratgia
alapjn ksrletet futtassunk vele. A stratgiakeresst gy hajtjuk vgre, hogy mindegyik
stratgiajelltet az alapjn rtkelnk, hogy ugyanazt a vletlen sorozat halmazt hasznlja a ksrletek
kimeneti rtkeinek meghatrozshoz. Megmutathat, hogy az sszes stratgia rtknek j
becslshez szksges vletlen sorozatok szma csak a stratgiatr komplexitstl fgg, s egyltaln
nem fgg a mgttes terlet komplexitstl. A PEGASUS algoritmussal szmos terleten (pldul az
autonm helikoptervezets terletn) tbb hatkony stratgit fejlesztettek ki (lsd 21.10. bra).
21.10. bra - Idben eltolt kpek egymsra msolsa tjn kapott ered kp, amelyen
egy nagyon bonyolult krberepls orral a kr kzppontja fele manvert hajtanak
vgre. A helikoptert egy Pegasus stratgiakeres algoritmussal fejlesztett stratgival
vezrlik. Egy szimultormodellt fejlesztettek a vals helikopter egyes vezrlsi
8
21-es jtkknt is ismert.
690
Megerstses tanuls
beavatkozsokra adott vlaszainak vizsglatra. Ezek utn egsz jszaka futtattk az

algoritmust a szimultoron. Egy sor vezrlt fejlesztettek ki klnbz manverekre.
Minden esetben, amikor tvirnytst hasznltak, messze jobb volt az eredmny, mint a
kpzett humn piltk. (A kpet Andrew Ng engedlyvel kzljk.)
6. sszefoglals
Ebben a fejezetben a megerstses tanulssal foglalkoztunk: azzal, hogy egy ismeretlen krnyezetben mkd
gens hogyan vlhat gyakorlott pusztn megfigyelsei, valamint az esetenknt kapott jutalmak
felhasznlsval. A megerstses tanuls a teljes MI-tmakr mikrovilgnak is tekinthet, amelyet azonban az
elrehalads rdekben egy sor egyszerst felttel mellett trgyaltunk. A kvetkez fontosabb
megllaptsokat tettk:
Az gens teljes felptse hatrozza meg azt, hogy milyen informcit kell megtanulni. A trgyalt hrom f
felptsi lehetsg: egyrszt a modellalap, amely a T modellt s az U hasznossgfggvnyt hasznlja;
msrszt a modell nlkli felpts, amely a Q cselekvsrtk-fggvnyt hasznlja, s a reflexszer, amely a
stratgit hasznlja.
A hasznossgrtkek hromfle megkzelts alapjn tanulhatk:
1. A kzvetlen hasznossgbecsls (direct utility estimation), amely a megfigyelt htralv jutalmat
hasznlja egy-egy llapot esetn, mint a hasznossg tanulsnak kzvetlen jellemzjt.
2. Az adaptv dinamikus programozs (ADP) (adaptive dynamic programming) megfigyelsei alapjn
egy modellt s egy jutalomfggvnyt tanul, ezek utn rtk- vagy stratgiaitercit hasznl ahhoz, hogy az
llapotok hasznossgbecslshez vagy az optimlis stratgihoz eljusson. Az ADP optimlisan hasznlja
fel a krnyezetnek a szomszdos llapotokra vonatkoz struktrjbl add loklis knyszereket.
3. Az idbeli klnbsg (IK) (temporal-difference, TD) megkzelts gy mdostja a
hasznossgbecslseket, hogy megfeleljenek az adott llapotot kvet llapotokra vonatkoz becslseknek.
Tekinthetjk egyszeren az ADP megkzelts olyan approximcijnak is, amely a tanulshoz nem
ignyel modellt. Mindamellett, ha a megtanult modellt pszeudotapasztalatok generlsra hasznljuk,
gyorsabb tanulshoz juthatunk.
A cselekvsrtk-fggvnyek vagy Q-fggvnyek ADP- vagy IK-megkzeltssel tanulhatk. IK esetn a Qtanuls sem a tanuls, sem a cselekvs kivlasztsnak fzisban nem ignyli modell hasznlatt. Ez
691
Megerstses tanuls
egyszersti a tanulsi feladatot, de potencilisan korltozhatja a bonyolult krnyezetben val tanulsi

kpessget, mivel az gens nem kpes szimullni a lehetsges cselekvssorozatok eredmnyt.
Ha a tanul gens a tanuls sorn a cselekvsek kivlasztsrt is felels, akkor kompromisszumot kell ktnie
a vlasztott cselekvs jelenlegi hasznossga s hasznos j informci tanulsnak lehetsge kztt. A
felfedezsi problma egzakt megoldsa kezelhetetlen, de nhny egyszer heurisztika elg j megoldsra
vezet.
Nagy llapotterek esetn a megerstses tanul algoritmusnak kzeltfggvnyreprezentcit kell
hasznlnia az llapotok feletti ltalnostkpessg rdekben. Az idbeli klnbsg jel kzvetlenl
felhasznlhat a neurlis hl jelleg reprezentcik paramtereinek frisstsre.
A stratgiakeressi mdszerek kzvetlenl a stratgia reprezentcijt hasznljk, a megfigyelt teljestmny
alapjn prblva meg javulst elrni. Slyos problmt okoz sztochasztikus terleteken a teljestmnyben
mutatkoz nagy variancia. Szimulcival vizsglhat terleteken ez megoldhat gy, hogy elre rgztjk a
vletlen hatsokat.
A vezrlsi stratgit biztost program kzi kdolsnak elkerlhetsge miatt a megerstses tanuls a gpi
tanuls egyik legaktvabban mvelt terlete. A robotikai alkalmazsok klnsen rtkesnek grkeznek, de
ezek folytonos, sokdimenzis, csak rszlegesen megfigyelhet krnyezetek kezelsre kpes mdszereket
ignyelnek, radsul a sikeres mkdshez tbb ezer vagy akr milli elemi cselekvsre is szksg lehet.

Turing javasolta a megerstses tanuls megkzeltst, br nem volt teljesen meggyzdve annak
hatkonysgrl (Turing, 1948; 1950). Azt rta: A bntets s jutalmazs legjobb esetben is csak egy rsze
lehet a tantsi folyamatnak. Arthur Samuel munkja volt valsznleg az els sikeres kutats a gpi tanuls
terletn (Samuel, 1959). Br munkja nem volt formlisan megfogalmazva, s szmos hinyossga volt, mgis
a megerstses tanuls legtbb modern gondolatt tartalmazta, belertve az idbeli klnbsgkpzst s a
fggvnyekkel trtn approximcit. Krlbell ugyanebben az idben az adaptv szablyozsok terletvel
foglalkoz kutatk (Widrow s Hoff, 1960), Hebb munkjra ptve (Hebb, 1949), egyszer hlkat tantottak a
delta-szably segtsgvel. (A neurlis hlk s a megerstses tanuls ezen korai kapcsolata vezethetett ahhoz
a flrertshez, hogy ez utbbi az elbbinek rszterlete.) Michie s Chambers rdegyenslyozs-vezrlsi
kutatsa szintn egy fggvnyapproximcival trtn megerstses tanulsi mdszernek tekinthet (Michie s
Chambers, 1968). A megerstses tanulssal foglalkoz pszicholgiai irodalom sokkal rgebbi, Hilgard s
Bower j ttekintst adnak errl (Hilgard s Bower, 1975). A mhek nektrgyjtsi szoksainak kutatsa
kzvetlen bizonytkokat szolgltatott a megerstses tanuls mkdsre llatoknl. Nyilvnval neurlis
kapcsolat van a jutalomjellel. Ennek formja egy nagy neurlis lekpezs a nektr bevitelt rzkel
szenzoroktl a motoros kregig (Montague s trsai, 1995). A sejtszint emlkezssel kapcsolatban folytatott
kutatsok azt sugalljk, hogy a femlsk agyban a dopamin rendszer valami olyasmit valst meg, ami a
fggvnytanulsra emlkeztet (Schultz s trsai, 1997).
A megerstses tanuls s a Markov dntsi folyamatok kzti kapcsolatra elszr Werbos mutatott r (Werbos,
1977), de a megerstses tanuls MI-n belli fejlesztse a University of Massachusetts falain bell kezddtt az
1980-as vek elejn (Barto s trsai, 1981). Sutton rsa j trtneti ttekintst ad (Sutton, 1988). Ennek a
fejezetnek a (21.3) egyenlete egy specilis, a = 0 melletti esete Sutton ltalnos IK() algoritmusnak. Az
IK() egy sorozat sszes llapotnak rtkt frissti oly mdon, hogy a mltban t idlps tvolsgra lv
tmenetekhez egy t szerint cskken faktor vezet. Az IK(1) azonos a WidrowHoff- vagy delta-szabllyal.
Bradtke s Barto rvelsre (Bradtke s Barto, 1996) ptve Boyan azt lltja, hogy az IK() s a hozz
kapcsolhat algoritmusok nem hasznljk ki hatkonyan a tapasztalatokat (Boyan, 2002). Szerinte ezek
lnyegben online regresszis algoritmusok, amelyek sokkal lassabban konverglnak, mint az offline regresszi.
Az LSTD() algoritmusa egy olyan online regreszszi, ami az offline regresszival azonos eredmnyt ad.
Az idbeli klnbsg tanulsnak s a szimulcis tapasztalatok modellbzis generlsnak kombinlst
Sutton a DYNA architektrban javasolta (Sutton, 1990). A prioritsos vgigsprs tlett egymstl fggetlenl
Moore s Atkeson (Moore s Atkeson, 1993), illetve Peng s Williams (Peng s Williams, 1993) vetettk fel. A
Q-tanulst Watkins dolgozta ki PhD-disszertcijban (Watkins, 1989).
A rabl problematikt, amely a nemszekvencilis dntsek terletn trtn felfedezst modellezi, rszletesen
Berry s Fristedt tanulmnyoztk (Berry s Fristedt, 1985). Szmos helyzetben optimlis felfedezsi stratgia
nyerhet a Gittins-index segtsgvel (Gittins, 1989). Barto s munkatrsai a szekvencilis dntsi
692
Megerstses tanuls
problmkban alkalmazott felfedezsi mdszerek szmos vltozatt trgyaljk (Barto s trsai, 1995). Kearns s
Singh, valamint Brafman s Tennenholtz olyan algoritmusokat rnak le (Kearns s Singh, 1998; Brafman s
Tennenholtz, 2000), amelyek ismeretlen krnyezet felfedezst vgzik, s bizonytott, hogy polinomilis id
alatt konverglnak kzel-optimlis stratgikhoz.
A megerstses tanuls terletn a fggvnyapproximci alkalmazsa Samuel munkjig vezethet vissza, aki
mind lineris, mind nemlineris kirtkel fggvnyeket alkalmazott, tovbb a tulajdonsgok ternek
cskkentsre tulajdonsgszelekcis algoritmusokat is hasznlt. A ksbbiekben bevezetett mdszerek kz
tartozik a CMAC (Cerebellar Model Articulation Controller) (Albus, 1975), amely lnyegben tlapold
loklis kernelfggvnyek sszegbl, s a Barto s trsai ltal bevezetett asszociatv neurlis hlkbl ll (Barto
s trsai, 1983). Napjainkban a neurlis hlk a legnpszerbb fggvnyapproximtorok. A legismertebb
alkalmazs az ebben a fejezetben bemutatott TD-Gammon (Tesauro, 1992, 1995). A neurlis hlkkal
megvalstott IK-tanulknak slyos problmja az, hogy hajlamosak elfelejteni korbbi tapasztalataikat. Ez
klnsen igaz azokra trrszekre, amelyeket a szakrtelmk megszerzse utn elkerlnek. Ez katasztroflis
kvetkezmnyekkel jrhat, ha helyzetek jra jelentkeznek. A pldnyalap tanuls (instance-based learning)
alkalmazsval ez a problma elkerlhet (Ormoneit s Sen, 2002; Forbes, 2002).
A fgvnyapproximcit hasznl megerstses tanuls konvergencija kimondottan technikai krds. Lineris
approximl fggvnyek alkalmazsa esetn az IK tanulsi eredmnyek folyamatosan javulnak (Sutton, 1988;
Dayan, 1992; Tsitsiklis s Van Roy, 1997), de nemlineris fggvnyek esetn szmos divergencit mutat
pldt talltak (a jelensg trgyalst lsd a (Tsitsiklis s Van Roy, 1997)-ben). Papavassiliou s Russell a
megerstses tanuls j formjt adtk (Papavassiliou s Russell, 1999), amely tetszleges struktrj
fggvnyapproximtor esetn konvergl, feltve, hogy tallhat a megfigyelt adatokra egy legjobban illeszked
approximci.
A stratgiakeressre Williams hvta fel a figyelmet (Williams, 1992), volt az, aki kifejlesztette a REINFORCE
algoritmuscsaldot. A ksbbi munkk megerstettk s ltalnostottk a stratgiakeress konvergencijra
vonatkoz eredmnyeket: (Marbach s Tsitsiklis, 1998; Sutton s trsai, 2000; Baxter s Bartlett, 2000). Ng s
Jordan (2000) alkottk meg a PEGASUS algoritmust (Ng s Jordan, 2000), br hasonl technikk mr Van Roy
PhD-disszertcijban is megtallhatk (Van Roy, 1998). Mint a fejezetben emltettk, a sztochasztikus
stratgik teljestmnye a paramtereik folytonos fggvnye, ami elsegti a gradiensalap technikk
alkalmazhatsgt. Nem ez az egyetlen elnyk: Jaakkola s trsai amellett rvelnek, hogy rszlegesen
megfigyelhet krnyezetben a sztochasztikus stratgik jobban mkdnek, mint a determinisztikusok, ha
mindkt stratgia esetn a cselekvs pusztn a jelenlegi szlelsen alapul (Jaakkola s trsai, 1995). (Ennek
egyik oka, hogy a sztochasztikus algoritmusok kevsb hajlamosak beragadni", ha valamilyen eddig mg nem
ltott akadly jelentkezik.) A 17. fejezetben rmutattunk, hogy rszlegesen megfigyelhet MDF-ekben az
optimlis stratgik inkbb a hiedelemllapot determinisztikus fggvnyei, mint az aktulis megfigyelsek.
Ennek megfelelen mg jobb eredmnyeket vrnnk, ha a 15. fejezetben trgyalt szrsi (filtering)
mdszerekkel nyomon kvetnnk a hiedelemllapot alakulst. Sajnlatos mdon a hiedelemllapot-terek
sokdimenzisak s folytonosak, s az eddigiekben nem sikerlt hatkony mdszereket kifejleszteni a
hiedelemllapotok megerstses tanulsra.
A vals krnyezetekre az is jellemz, hogy gyakran rengeteg elemi cselekvsi lpsre van szksg ahhoz, hogy
jelents jutalomhoz jussunk. Pldul ha egy robot focizik, akkor szzezer elemi lbmozdulatot is tehet, mieltt
glt l. Egy szoksos mdszer erre a jutalomalakts (reward shaping), melyet eredetileg az llatok
tantsnl alkalmaztak. Ennek rsze, hogy tovbbi jutalmakat adunk az gensnek, ha az haladst r el. A foci
esetn pldul jutalmat adhatunk, ha hozzr a labdhoz vagy a kapu fel l. Ezeket a jutalmakat rendszerint
nagyon egyszer kialaktani, s rendkvl felgyorsthatjk a tanulst, de megvan az a veszlye, hogy az gens a
tanuls sorn a pszeudojutalmak maximlst vgzi el, nem az igazi jutalmakt. A foci tanulsa esetn pldul
a labdhoz val kzelsg s a labdval val sok-sok rintkezs, a vibrls, lehet ennek az eredmnye. Ng s
trsai megmutattk, hogy az gens gy is megtanulja az optimlis stratgit, ha az F(s, a, s') pszeudojutalom
kielgti az F(s, a, s') = (s') (s) egyenletet, ahol az llapot tetszleges fggvnye (Ng s trsai, 1999).
A -t gy alkothatjuk meg, hogy az llapot valamely kvnatos vonsait tkrzze, pldul valamilyen rszcl
elrst vagy a clllapottl val tvolsgot.
Az sszetett viselkeds kialaktst hierarchikus megerstses tanulsi (hierarchical reinforcement
learning) mdszerekkel segthetjk el, amelyek tbb absztrakcis szinten igyekeznek megoldani a problmt,
a 12. fejezetben ismertetett HFH-tervksztshez (HTN planning) hasonlan. Pldul a gllvs
sztbonthat labdaszerzs, a kapu fel cselezs s lvs rszekre, s ezek mind tovbb bonthatk
alacsonyabb szint mozgsokra. Ezen a terleten Forestier s Varaiya rtek el alapvet eredmnyt (Forestier s
Varaiya, 1978). Bebizonytottk, hogy tetszleges bonyolultsg alsbb szint viselkeds egyszeren elemi
693
Megerstses tanuls
cselekvsnek tekinthet az t kivlt magasabb szint viselkeds szempontjbl (br az alsbb szint viselkeds
ltal megvalstott cselekvsek eltr idt vehetnek ignybe). Parr s Russell, Dietterich, Sutton s trsai,
valamint Andre s Russell jelen kutatsaikban erre az eredmnyre ptettek: olyan mdszereket fejlesztettek,
amelyek rszprogrammal (partial program) ltjk el az genst, ezzel viselkedst valamilyen specilis
hierarchikus struktrba szortva (Parr s Russell, 1998; Dietterich, 2000; Sutton s trsai, 2000; Andre s
Russell, 2002). A megerstses tanulst ezek utn arra hasznljk, hogy a rszprogrammal konzisztens legjobb
viselkedst tantsk. A fggvnyapproximci, a jutalomalakts s a hierarchikus megerstses tanuls
sszekombinlsa lehetv teheti, hogy nagy bonyolultsg problmk megoldst ksreljk meg a siker
remnyben.
Az irodalom ttekintshez j kiindulpontot ad Kaelbling tanulmnya (Kaelbling s trsai, 1996). A terlet kt
ttrjnk, Suttonnak s Bartnak a publikcija az architektrkra s algoritmusokra koncentrl, megmutatva,
hogy a megerstses tanuls sszekti a tanuls, a tervezs s a cselekvs elveit (Sutton s Barto, 1998).
Bertsekas s Tsitsiklis inkbb technikai rszletekkel foglalkoz munkja a dinamikus programozs s a
sztochasztikus konvergencia elmletnek precz megalapozst nyjtja (Bertsekas s Tsitsiklis, 1996). A
Machine Learning, illetve a Journal of Machine Learning Research folyiratok, tovbb az International
Conferences on Machine Learning s a Neural Information Processing Systems rendezvnyek kiadvnyai
kzlnek gyakran megerstses tanulssal foglalkoz cikkeket.
6.2. Feladatok
21.1.
Egy a 4 3-as vilghoz hasonl egyszer krnyezetben valstson meg egy passzv tanul genst!
Hasonltsa ssze a kzvetlen hasznossgbecslst, az IK-t s az ADP-t elzetesen nem ismert krnyezeti
modellek esetn! Vgezze el az sszehasonltst az optimlis stratgira s tbb, vletlen mdon generlt
stratgira! Melyikre konverglnak gyorsabban a hasznossgbecslsek? Mi trtnik, ha nveli a krnyezet
mrett? (Vizsgljon plykat akadlyokkal s azok nlkl!)
21.2.
A 17. fejezetben gy definiltuk az MDF szmra megfelel stratgit (proper policy), mint ami biztosan elri
a vgllapotot. Mutassa meg, hogy egy passzv ADP-gens kpes egy olyan llapottmenet-modell
megtanulsra, amelyre nzve stratgija nem megfelel, mg ha megfelel is az igazi MDF-re; az ilyen
modellekkel = 1 esetben az rtkmeghatrozsi lps meghisulhat! Mutassa meg, hogy ez a problma nem
jelentkezik, ha az rtkmeghatrozst csak a ksrlet vgeztvel alkalmazzuk a megtanult modellre.
21.3.
Induljon ki egy passzv ADP-gensbl, s mdostsa gy, hogy a fejezetben lert kzelt ADP-algoritmust
kapja! Kt lpsben oldja meg a feladatot:
a. ptsen fel egy prioritssort a hasznossgbecslsek mdostsra! Valahnyszor llapotmdostsra kerl, az
t megelz llapotok is potencilisan mdostandk, teht be kell lltani ket a sorba. A sor inicializlst
annak az llapotnak a felhasznlsval vgezzk, amelybl a legutols tmenet trtnt. Csak rgztett szm
mdostst engedjen meg!
b. Ksrletezzen a prioritssor rendezsnek klnbz heurisztikival, vizsglja meg a tanuls sebessgre s a
szmtsi idre gyakorolt hatsukat!
21.4.
A 21.2. alfejezetben bemutatott kzvetlen hasznossgbecslsi mdszerek elklntett vgllapotokat hasznltak
a ksrlet vgnek jelzsre. Hogyan mdosthatk vgllapottal nem rendelkez, lertkelt jutalmakat hasznl
krnyezetekre?
21.5.
Hogyan hasznlhat az rtkmeghatrozsi algoritmus gy, hogy egy U hasznossgbecsls-halmazt s egy M
becslt modellt hasznl gensnek a helyes rtkeket hasznl genshez kpesti vrhat vesztesgt szmtsa?
21.6.
694
Megerstses tanuls
Adaptlja a 2. fejezetben bemutatott porszvvilgot megerstses tanulsra! Az gens kapjon jutalmat minden
felszvott szemtrt, a helyre val visszarskor s kikapcsolskor! Megfelel szlelsekkel tegye
megfigyelhetv a vilgot! Ksrletezzen klnbz megerstses tanulst vgz gensekkel! Szksg van-e
fggvnyapproximcira a siker rdekben? Milyen approximtor mkdik erre az alkalmazsra?
21.7.
Valstson meg egy felfedez megerstses tanul genst, amely kzvetlen hasznossgbecslst vgez.
Ksztsen kt vltozatot, az egyik tblzatos reprezentcit hasznljon, a msik a (21.9) egyenlet
fggvnyapproximtort. Hasonltsa ssze teljestmnyket az albbi hrom klnbz krnyezetben:
a. A fejezetben lert 4 3-as vilg.
b. Egy 10 10-es vilg, amelyben nincsenek akadlyok, s a (10, 10) mezn van +1 jutalom.
c. Egy 10 10-es vilg, amelyben nincsenek akadlyok, s az (5, 5) mezn van +1 jutalom.
21.8.
rja fel az IK-tanuls paramterfrisstsi egyenlett a kvetkez esetre:
21.9.
Talljon ki megfelel jellemzket a sztochasztikus ngyzetrcsvilgra (a 4 3-as vilg ltalnostsa), amely
vilg tbb akadlyt s tbb (+1, illetve 1 jutalommal jellemezhet) vgllapotot tartalmaz!
21.10.
Szmtsa ki a vals hasznossgfggvnyt s az x, y fggvnyben felrhat legjobb lineris approximcit
(ppgy, mint a (21.9) egyenletben tettk) a kvetkez krnyezetekre:
a. Egy 10 10-es vilg, amelyben a (10, 10) az egyetlen +1 vgllapot mez.
b. Mint (a), de a (10, 1)-en van egy tovbbi 1 vgllapot.
c. Mint (b), de tegyen 10 vletlen mdon vlasztott mezre akadlyt.
d. Mint (b), de vegyen fel egy falat (5, 2)-tl (5, 9)-ig.
e. Mint (a), de a vgllapot legyen az (5, 5).
A cselekvsek a ngy lehetsges irnyba val determinisztikus lpsek. Minden esetben hromdimenzis
brkat hasznlva vgezze el az sszehasonltst! Mindegyik krnyezetben adjon javaslatot tovbbi olyan
tulajdonsgokra (x-en s y-on tl), amelyek javthatjk az approximcit, majd brzolja az eredmnyeket!
21.11.
Terjessze ki a standard jtkkrnyezetet (6. fejezet) gy, hogy tartalmazzon jutalomjelet is! Helyezzen kt
genst ebbe a krnyezetbe (termszetesen osztozhatnak az gensprogramon), s jtszassa egyms ellen ket!
Alkalmazza az ltalnostott IK frisstsi szablyt (21.11 egyenlet) a kirtkel fggvny frisstsre. Lehet,
hogy rdemes egy egyszer slyozott lineris kirtkel fggvnnyel kezdeni, s egy egyszer jtkkal, mint a 3
3-as amba (tic-tac-toe).
21.12.
Valstsa meg a REINFORCE s PEGASUS algoritmusokat a 4 3-as vilgra, s alkalmazza egy sajt maga ltal
vlasztott stratgiacsaldra! rtkelje az eredmnyeket!
21.13.
695
Megerstses tanuls
Olvasnival. Vizsglja meg a megerstses tanuls elveinek humn, illetve llati viselkedsre val
alkalmazst!
21.14.
Olvasnival. Alkalmas absztrakt modellje-e az evolcinak a megerstses tanuls? Milyen kapcsolat van ha
van egyltaln a beptett jutalomjelek s az evolcis rtermettsg kzt?
696
22. fejezet - Kommunikci

Ebben a fejezetben megltjuk, hogy az gensek mirt akarhatnak informcit tartalmaz zeneteket kldeni
egymsnak, illetve azt, hogy ezt hogyan tehetik meg.
Alkonyodik az Amboseli Nemzeti Park szavanns erdsgben, kzel a Kilimandzsr tvhez. A fehrbarkj
cerkfmajom vagy grivet (Cercopithecus aethiops a ford.) egy csoportja pp lelem utn kutat, amikor az
egyik grivet hangos kilt hvst hallat. A csoport tbbi tagja felismeri, hogy ez egy leoprdra figyelmeztet
felhvs (amely klnbzik a sasra figyelmeztet rvid khintstl vagy a kgykra vonatkoz sziszegstl), s
a fkra sietnek. A grivet sikeresen kommuniklt a csoporttal.
A kommunikci (communication) az informci szndkolt tadsa kzs jelrendszerbl vlasztott jel
ltrehozsa s szlelse ltal. Az llatok tbbsge hasznl jelzseket fontos zenetek kifejezsre: itt van lelem,
ragadoz a kzelben, gyere kzelebb, vonulj vissza, prosodjunk. Egy rszlegesen megfigyelhet vilgban a
kommunikci segt az genseknek sikeresnek lenni, mivel megfigyelhetnek msok ltal szlelt vagy
kikvetkeztetett informcit.
Az embereket a nyelvknt (language) ismert, strukturlt zenetekbl ll sszetett rendszer klnbzteti meg
ms llnyektl, amely lehetv teszi szmunkra, hogy a vilgrl szl ismereteink nagy rszt tadhassuk
egymsnak. Br a csimpnzok, delfinek s ms emlsk tbb szz jeles szkinccsel rendelkeznek, s van
valamifle hajlamuk ezek sszekapcsolsra, az ember az egyedli faj, amely minsgileg klnbz zenetek
korltlan szmt kpes megbzhatan tadni.
Termszetesen vannak ms tulajdonsgok, amelyek egyedlllan emberiek: egyetlen ms faj sem visel ruht,
kszt mvszeti alkotsokat vagy nz naponta hrom rn t televzit. Azonban amikor Turing a tesztjt
javasolta (lsd 1.1. alfejezet), a nyelvre alapozta azt, mivel a nyelv benssges kapcsolatban ll a
gondolkodssal. Ebben a fejezetben elmagyarzzuk, hogyan mkdik egy kommunikl gens, s bemutatjuk az
angol nyelv egy egyszerstett rszlett.
1. A kommunikci mint cselekvs

Egy gens szmra a beszd ltrehozsa lehetsges cselekvseinek egyike. Ezt szlsaktusnak (speech act)
nevezzk. A beszdet olyan rtelemben hasznljuk, mint szabad kzlst, nem mint beszlgetst, gy az
elektronikus levelezs, a mutogats s a jelbeszd hasznlata mind szlsaktusnak szmt. Az angol nyelvben
nincs ltalnos sz a beszdet ltrehoz gensre, amely beszl, r vagy mskpp fejezi ki magt. A beszl
(speaker), a hallgat (listener) s a megnyilatkozs (utterance) kifejezseket hasznljuk a kommunikci
brmilyen mdjnak ltalnos lersra. A sz (word) kifejezst hasznljuk mindenfle szoksos
kommunikcis jelre.
Mirt foglalkozna egy gens szlsaktus ltrehozsval, amikor hagyomnyos cselekvst is vgrehajthat? A
12. fejezetben lttuk, hogy tbbgenses krnyezetekben az gensek hasznlhatjk a kommunikcit annak
rdekben, hogy kzs tervet alaktsanak ki. Pldul a wumpus vilgot felfedez gensek egy csoportja egytt
(egyni vagy csoportos) elnyhz jut, ha kpes a kvetkezket megtenni:
Megkrdezik (query) egymst a vilg klnfle terleteirl. Ezt tipikusan krdsek feltevsvel vgzik:
rezted a wumpus bzt valahol?
rtestik (inform) egymst a vilgrl. Ezt kijelentsekkel teszik meg: Szell van itt, a [3, 4]-en. Egy krds
megvlaszolsa egy msik fajta rtests.
Krnek (request) ms genseket cselekvsek vgrehajtsra: Krlek segts az aranyat vinni! Nha egy
indirekt szlsaktus (indirect speech act) (egy kijelents vagy krds formj krs) udvariasabbnak
szmt: Hasznlni tudnk egy kis segtsget ennek a cipelsben. Egy fennhatsggal rendelkez gens adhat
parancsokat (Alfa jobbra menj; Bravo s Charlie balra), s egy hatalommal rendelkez gens fenyegethet
(Ide nekem az aranyat, vagy). Ezen szlsaktusokat egytt direktvknak (directives) nevezik.
Tudomsul veszik (acknowledge) a krseket: Rendben.
Meggrnek (promise) vagy hozzjrulnak egy tervhez: n lelvm a wumpust; te megragadod az aranyat.
697
Kommunikci
Minden szlsaktus befolysolja a vilgot a levegmolekulk rezgetsvel (vagy ekvivalens hatssal ms

mdiumban), s ily mdon megvltoztatja ms gensek mentlis llapott, valamint vgs fokon a jvbeli
cselekedeteiket is. Bizonyos szlsaktusok informcit juttatnak a hallgathoz, felttelezve, hogy a hallgat
dntshozatalt megfelelen befolysolja az informci. Msok sokkal clzottabban ksztetik a hallgatt
valamilyen cselekvs vghezvitelre. A szlsaktusok tovbbi osztlya a deklaratv (declarative), amely
sokkal kzvetlenebb hatst gyakorol a vilgra: frjnek s felesgnek nyilvntom nket vagy Harmadik tallat,
n kiesett. Termszetesen a hatst az rintett gensek mentlis llapotai komplex hlzatnak ltrehozsa vagy
tudomsulvtele ri el: hzasnak lenni vagy kiesni, olyan llapotok, amelyeket megllapodsok rgztenek s
nem a vilg fizikai jellemzi.
A kommunikl gens feladata annak eldntse, hogy mikor van szksg egy szlsaktusra, s hogy melyik a
helynval az sszes lehetsges kzl. A szlsaktusok megrtsnek problmja hasonlatos ms megrtsi
(understanding) problmkhoz, mint pldul a kpek megrtse vagy a betegsgek diagnosztizlsa. Kapunk
egy halmazt tbbrtelm bemenetekkel, amikbl visszafel haladva azt kell eldntennk, hogy a vilg mely
llapota hozhatta ltre ket. Azonban mivel a beszd tervezett cselekvs, a megrts magban foglalja a
tervfelismerst is.
1.1. A nyelv alapjai

A formlis nyelvet (formal language) karakterfzrek (strings) (lehetsges, hogy vgtelen) halmazaknt
definiljuk. Minden egyes fzr az gynevezett zr (vagy terminlis) szimblumok (terminal symbols)
amelyeket nha szavaknak hvunk szszekapcsolt sorozata. Pldul az elsrend logikban a zr
szimblumok kztt van a s a P, s egy tipikus fzr a P Q. A P Q fzr nem rsze a nyelvnek. A
formlis nyelvek, mint pldul az elsrend logika vagy a Java, szigor matematikai defincikkal
rendelkeznek. Ezzel ellenttben a termszetes nyelvek (natural languages), mint pldul a knai, a dn s az
angol, nem rendelkeznek szigor defincival, hanem beszlk egy kzssge hasznlja. Ebben a fejezetben a
termszetes nyelveket megprbljuk formlis nyelveknek tekinteni, br tisztban vagyunk azzal, hogy az
illeszkeds nem lesz tkletes.
A nyelvtan (grammar) a nyelvet meghatroz szablyok vges halmaza. A formlis nyelveknek mindig van
egy hivatalos nyelvtana, amelyet kezelsi tmutatkban vagy knyvekben hatroznak meg. A termszetes
nyelveknek nincs hivatalos nyelvtana; br a nyelvszek trekszenek a nyelv tulajdonsgainak felfedezsre
tudomnyos vizsglatokkal, majd ezen felfedezsek rgztsre egy nyelvtanban. Eddig egyetlen nyelvsz sem
jrt teljes sikerrel. Figyeljk meg, hogy a nyelvszek tudsok, akik a nyelvet gy prbljk definilni, ahogy az
ltezik. Vannak olyan elr nyelvszek is, akik megprbljk diktlni, hogy a nyelvnek milyennek kellene
lennie. Olyan szablyokat alkotnak, mint pldul a hasznld az ikes ragozst, amelyeket nha megjelentetnek
stlustmutatkban, de kevs valdi hatsuk van a beszlt nyelvre.
Mind a formlis, mind a termszetes nyelvek jelentst, avagy szemantikt (semantics) rendelnek minden egyes
rvnyes fzrhez. Pldul az aritmetika nyelvn lenne egy szablyunk, hogy ha X s Y kifejezsek, akkor
X + Y szintn kifejezs, amelynek a szemantikja X s Y sszege. Termszetes nyelvekben hasonlan fontos a
fzrek pragmatikjt (pragmatics) is megrteni: a fzr aktulis jelentst, ahogy az elhangzik egy adott
szituciban. A jelents nemcsak a szavakban rejlik, hanem a szavak in situ rtelmezsben.
A legtbb nyelvtani szably formalizmus a kifejezsstruktra (phrase structure) tletre pl azaz arra,
hogy a fzrek kifejezseknek (phrases) nevezett, klnbz kategribl szrmaz rszfzrekbl llnak
ssze. Pldul a wumpus, a kirly s a sarokban lev gens1 kifejezsek mind az gynevezett fnvi
kifejezs (noun phrase) (vagy rviden NP) kategria pldi. Kt ok ltezik arra, hogy a kifejezseket ilyen
mdon megklnbztessk. Az egyik, hogy a kifejezsek ltalban termszetes szemantikus elemeknek felelnek
meg, amelyekbl a kijelents jelentse megalkothat; pldul a fnvi kifejezsek a vilg objektumaira
vonatkoznak. A msik, hogy a kifejezsek kategorizlsa segt a nyelv megengedett fzreinek lersban. Azt
mondhatjuk, hogy a fnvi kifejezsek brmelyike kombinlhat egy igei kifejezssel (verb phrase) (VP), mint
pldul is dead (halott), hogy kzsen egy olyan kifejezst formljanak, amelyik a mondat (sentence) (S)
A fejezetben hozott pldk fordtsakor a kvetkezkppen jrtunk el: az olyan angol kifejezseket, amelyek magyarul is szemlletesek az
adott mondanival szempontjbl, magyar fordtsban adjuk meg. A kifejezsek s rszletesebb pldk tbbsgnl ez nem kvethet,
mivel a szerz az angol nyelv sajtossgaihoz illeszti a fejezet ismeretanyagnak s pldinak megfogalmazst, gy a fordts lnyegi
vltozst hozott volna a fejezet tartalmban is. Ezeken a rszeken a magyar vltozatban is meghagyjuk az eredeti angol kifejezseket,
szksg esetn rvid magyar fordtsukkal kiegsztve. A szerzk ltrehozzk az angol nyelv egy formlis rszhalmazt, amin bemutatjk a
fejezetben ismertetett mdszerek alkalmazst. Ezt is vltozatlan formban helyezzk t a magyar nyelv kiadsba. Ezen rszek magyar
fordtst sem ksztjk el, mivel a fordts a mondanival szempontjbl lnyegtelen. (A ford.)
1
698
Kommunikci
kategriba tartozik. A fnvi s igei kifejezs kzbls fogalma nlkl sokkal bonyolultabb lenne
elmagyarzni, hogy mirt j mondat a the wumpus is dead s mirt nem a wumpus the dead is.
Fontos
Generlkpessg
A nyelvtani formalizmusok osztlyozhatk generlkpessgk (generative capacity) szerint:
azoknak a nyelveknek a halmaza szerint, amelyeket kpesek reprezentlni. Chomsky a nyelvtani
formalizmusok ngy osztlyt rta le, amelyek csak az tr szablyok formjban klnbznek
(Chomsky, 1957). Az osztlyok hierarchiba rendezhetk, ahol minden osztly felhasznlhat az
sszes olyan nyelv lersra, ami lerhat egy nla gyengbb osztllyal, s mg nhny tovbbi nyelvre
is. Itt most felsoroljuk a hierarchit, a legersebbel kezdve.
A rekurzvan felsorolhat nyelvtanok (recursively enumerable grammars) korltozs nlkli
szablyokat hasznlnak: az tr szablyok mindkt oldala tetszleges szm zr s nem zr
szimblumot tartalmazhat, mint pldul az A B C szably. Ezen nyelvtanok kifejezereje
megegyezik a Turing-gpvel.
A krnyezetrzkeny nyelvtanok (context-sensitive grammars) csak olyan rtelemben
korltozottak, hogy a jobb oldalnak legalbb annyi szimblumot kell tartalmaznia, mint a bal oldalnak.
A krnyezetrzkeny (krnyezetfgg) elnevezs abbl a tnybl ered, hogy egy A S B A X B
szably azt mondja, hogy egy S trhat X-re egy megelz A s egy kvet B krnyezetben. A
krnyezetrzkeny nyelvtanok lerhatnak pldul olyan nyelvet, mint az anbncn (a-k n hosszsg
sorozata, amelyet ugyanannyi b s c kvet).
A krnyezetfggetlen nyelvtanok (context-free grammars) (vagy CFG-k) esetben a bal oldal
egyetlen nem zr szimblumot tartalmaz. gy minden egyes szably megengedi a nem zr
szimblum trst a jobb oldalra tetszleges krnyezetben. A CFG-k npszerek a termszetes s
programozsi nyelvek nyelvtanai krben, br ma mr szles krben elfogadott, hogy ltezik legalbb
nhny olyan termszetes nyelv, mely tartalmaz olyan szerkezeteket, melyek nem rhatk le
krnyezetfggetlen nyelvtannal (Pullum, 1991). A krnyezetfggetlen nyelvtanok kpesek
reprezentlni anbn-t, de nem anbncn-t.
A regulris nyelvtanok (regular grammars) a legkorltozottabb osztly. Minden szablynak van
egyetlen nem zrja a bal oldaln, s egy zr szimblum a jobb oldalon, amit opcionlisan kvethet
egy nem zr. A regulris nyelvtanok a vges automatval ekvivalens erejek. Gyengn alkalmasak
programozsi nyelvek szmra, pldul nem kpesek nyit s bezr zrjelek egyenslyt ler
szerkezetek brzolsra (az anbn nyelv egy vltozata). Ehhez legkzelebb a*b* reprezentlsval
juthatnak, amely tetszleges szm a sorozatt kvet tetszleges szm b.
A hierarchiban fentebb helyezked nyelvtanoknak nagyobb a kifejezereje, de a kapcsold
algoritmusok kevsb hatkonyak. Az 1980-as vek kzepig a nyelvszek a krnyezetfggetlen s
krnyezetrzkeny nyelvtanokkal foglalkoztak. Azta nagyobb hangslyt fektetnek regulris
nyelvtanokra, amelyeket az elektronikusan elrhet szvegek mega- s gigabjtjainak gyors, mg a
kevsb teljes analzis rn is trtn feldolgozsi ignye hvott letre. Ahogy Fernando Pereira
mondta: Minl regebb leszek, annl lentebb megyek a Chomsky-hierarchin. Hogy lssuk, mit rtett
ezen, vesse ssze (Pereira s Warren, 1980; Mohri, Pereira s Riley, 2002)
Az NP, a VP s az S kategrik gynevezett nem zr szimblumok (nonterminal symbols). A nyelvtanok
tr szablyok (rewrite rules) segtsgvel definiljk a nem zr szimblumokat. Az tr szablyok
lersra a BackusNaur-formt (BNF) fogjuk tvenni, amelyet a B) fggelkben runk le az 1. szakasz - B1.
Nyelvek definilsa BackusNaur-Formban (BNF) rszben. Ezen jells szerint egy
S NP VP
szably jelentse az, hogy egy S egy tetszleges NP kategrij kifejezsbl s az azt kvet tetszleges VP
kategrij kifejezsbl ll.
1.2. A kommunikcit alkot lpsek

699
Kommunikci
Egy tipikus kommunikcis epizd, amikor S beszl P lltst szeretn tadni H hallgatnak W szavakkal, ht
folyamatbl ll:
Szndk (intention). S beszl valahogy eldnti, hogy van egy P propozci, amit rdemes elmondani H
hallgatnak. A pldnkban a beszlnek az a szndka, hogy a hallgat tudomsra hozza, hogy a wumpus mr
nem l.
Ltrehozs (generation). A beszl megtervezi, hogy P propozcit hogyan alaktsa t olyan kijelentss,
amely valsznv teszi, hogy a hallgat, fogadva a kijelentst a jelenlegi szituciban, kikvetkeztetheti P
jelentst (vagy egy hozz kzelit). Ttelezzk fel, hogy a beszl kpes a kvetkez szavakat ltrehozni: The
wumpus is dead (A wumpus halott), s jelljk ezt W-vel.
Szintzis (synthesis). A beszl ltrehozza W szavak fizikai realizcijt, W'-t. Ezt teheti tintval papron,
rezgsekkel levegben vagy valamilyen ms mdiumon. A 22.1. brn egy olyan genst mutatunk, amely a 6.
szakasz - Beszdfelismers rszben definilt fonetikus bcvel lert W' hangfzr szintzist vgzi:
[thaxwahmpaxsihzdehd]. A szavak egybefolytak, ami tipikus a gyorsan beszlt nyelv esetben.
szlels (perception). H szleli a W' fizikai megvalsulst, mint W'2-t, s W2 szavakknt dekdolja. Amikor a
mdium a beszd, az szlelsi lpst beszdfelismersnek (speech recognition) nevezzk; amikor az rs,
akkor optikai karakter felismersnek (optical character recognition). Mindkett elmozdult az elvont lttl a
mindennapi elforduls irnyba a kilencvenes vekben, fknt az asztali szmtgpek jelents mrtkben
nvekv teljestmnynek ksznheten.
22.1. bra - A kommunikciban rszt vev ht folyamat, a The wumpus is dead

mondat felhasznlsval
Analzis (analysis). H kikvetkezteti, hogy W2-nek P1, , Pn lehetsges jelentse van. Az analzist hrom f
rszre osztjuk: szintaktikai elemzsre (parsing), szemantikai rtelmezsre s pragmatikus rtelmezsre. Az
elemzs (parsing) egy bemeneti fzrhez tartoz elemzsi, ms szval levezetsi fa (parse tree) ptsnek a
folyamata, ahogy a 22.1. brn lthat. Az elemzsi fa bels csompontjai kifejezseket reprezentlnak, mg a
levelek szavakat jelkpeznek. A szemantikus rtelmezs (semantic interpretation) az a folyamat, amelynek
sorn kinyerjk egy kijelents jelentstartalmt valamilyen reprezentcis nyelven. A 22.1. brn kt lehetsges
szemantikai rtelmezst mutatunk be: azt, hogy a wumpus nem l, s azt, hogy fradt (a dead egy kznyelvi
jelentse). A tbb lehetsges rtelmezssel rendelkez kijelentseket tbbrtelmnek (ambiguous) mondjuk. A
pragmatikus rtelmezs (pragmatic interpretation) figyelembe veszi azt a tnyt, hogy ugyanazon szavaknak
ms jelentse lehet eltr helyzetekben. Mg a szintaktikai rtelmezs egy egy argumentummal, a fzrrel
700
Kommunikci
rendelkez fggvny, addig a pragmatikus rtelmezs a kijelentst s annak krnyezett vagy szitucijt
figyelembe vev fggvny. A pldban a pragmatikus elemzs kt dolgot tesz: a Now konstans rtket kicserli
az S3 konstanssal, ami a jelenlegi szitucit jelenti, illetve a Wumpus-t kicserli Wumpus1-re, ami arra az
egyetlen Wumpusra utal, amelyrl tudott, hogy a barlangban van. ltalnossgban a pragmatikus elemzs a
kijelents vgs rtelmezshez sokkal tbbel jrulhat hozz; gondoljunk csak pldul arra, amikor a A
gymntra nzek elhangzik egy kszersz, illetve egy baseballjtkos szjbl. 2 A 22.7. alfejezetben ltni
fogjuk, hogy a pragmatikus elemzs segt rtelmezi az It is dead kijelentst gy, hogy a wumpus halott, ha egy
olyan szituciban vagyunk, amikor a wumpus ll a figyelem kzppontjban.
A tbbrtelmsg feloldsa (disambiguation). H kikvetkezteti, hogy S Pi-t szndkozott kzlni (ahol idelis
esetben Pi = P). A beszlk tbbsge nem szndkosan tbbrtelm, de a legtbb kijelentsnek tbb
megengedett rtelmezse van. A kommunikci azrt mkdik, mivel a hallgat elvgzi azt a munkt, hogy
rjjjn, hogy melyik az az rtelmezs, amit a beszl valsznleg kzlni akart. Vegyk szre, hogy ez az els
alkalom, amikor a valsznleg szt hasznltuk, s a tbbrtelmsg feloldsa az els eljrs, ami erteljesen
valsznsgi kvetkeztetsen alapul. Az analzis lehetsges rtelmezseket llt el; ha egynl tbb rtelmezst
tall, akkor a tbbrtelmsg feloldsa vlasztja ki a legjobbat.
Bepts (incorporation). H eldnti, hogy elhiszi Pi-t (vagy nem). Egy teljesen naiv gens mindent elhihet, amit
hall, de egy kifinomultabb gens gy kezeli a szlsaktust, mint egy Pi-t altmaszt tnyt, s nem mint annak a
megerstst.
Mindezeket sszerakva a 22.2. brn lthat gensprogramot kapjuk. Itt az gens robotszolgaknt mkdik,
amit egy gazda irnythat. A szolga minden lpsben megvlaszolja a gazda krdst, illetve vgrehajtja a
parancst, s a szolga minden, a gazda ltal kijelentett lltst elhisz. Ezenkvl megllaptst tesz az aktulis
szitucira (csak egyszer), ha nincs ms tennivalja, s megtervezi sajt akcijt, ha magra hagyjk. me, egy
tipikus prbeszd:
ROBOTSZOLGA
GAZDA
Szellt rzek.
Menj 1, 2-re!
Semmi sincs itt.
Menj szaknak!
Szellt s bzt rzek, valamint csillogst Ragadd meg az aranyat!

ltok.
22.2. bra - Egy kommunikl gens, amely elfogad parancsokat, krdseket s

lltsokat. Az gens lerhatja az aktulis llapotot, valamint vgrehajthat
hagyomnyos, nem szlsaktus cselekvst is, ha nincs mit mondania.
A baseballplya angol elnevezse diamond, mivel alakjval a gymntra hasonlt. (A ford.)
701
Kommunikci
2. formlis nyelvtan az angol nyelv egy tredkre

Ebben a fejezetben definilunk egy nyelvtant az angol nyelv egy kis tredkre, ami megfelel a wumpus
vilgrl szl kijelentsekhez. Ezt a nyelvet 0-nak nevezzk. A ksbbi rszek javtani fognak az 0-n, hogy
valamelyest jobban hasonltson a beszlt angolra. Igen valszntlen, hogy valaha is megszerkesztjk az angol
nyelv teljes nyelvtant, mr csak azrt sem, mivel nincs kt ember, aki teljesen megegyezne abban, mit is tekint
rvnyes angolnak.
2.1. Az 0 szkincse
Elszr definiljuk a szkincset (lexicon), azaz a megengedett szavak listjt. A szavakat a sztrhasznlk
szmra ismers mdon csoportostjuk kategrikba, avagy beszdrszekbe: fnevek, nvmsok s nevek
dolgok elnevezsre, igk esemnyek jellsre, jelzk a fnevek mdostsra s hatrozszk az igk
mdostsra. Egyes olvask szmra kevss ismertek lehetnek a kvetkez kategrik: nvelk (articles)
(pldul a the), elljrszavak (prepositions) (pldul in) s ktszk (conjunctions) (pldul and). A 22.3.
bra mutat egy kis szkincset.
Minden egyes kategria -tal vgzdik annak jelzsre, hogy vannak ms szavak is a kategriban. Azt is meg
kell jegyeznnk azonban, hogy kt klnll ok van a szavak hinyra. A fnevek, az igk, a jelzk s a
nvmsok esetben elmletileg sem lehetsges az sszes felsorolsa. Nemcsak azrt, mert minden osztlynak
ezernyi vagy tzezernyi tagja lehet, hanem azrt is, mivel folyamatosan hozzaddnak jak, mint pldul az
MP3 vagy az anime. Ezt a ngy kategrit nyitott osztlyoknak (open classes) nevezzk. A tbbi kategrit
(nvmsok, nvelk, elljr- s ktszk) lezrt osztlyoknak (closed classes) hvjuk. Mindegyikben kevs
szm sz van (nhnytl pr tucatig), amelyek elmletileg teljesen felsorolhatk. A lezrt osztlyok
vszzadok folyamn vltoznak, nem hnapok alatt. Pldul a thee s a thou a 17. szzadban elterjedt
nvmsok voltak, hanyatlban voltak a 19. szzadban, s manapsg csak versekben s egyes rgik
dialektusban lehet tallkozni velk.
22.3. bra - 0 szkincse
702
Kommunikci
2.2. Az 0 nyelvtana
A kvetkez lps a szavak kifejezsekk trtn kombinlsa. t nem zr szimblumot fogunk hasznlni a
klnbz tpus kifejezsek definilsra: mondat (S), fnvi kifejezs (NP), igei kifejezs (VP), elljri
kifejezs (PP) s relatv klz (RelClause).3 A 22.4. bra 0 szmra mutat egy nyelvtant, minden egyes tr
szablyra pldt adva. Az 0 j angol mondatokat generlt, mint amilyenek pldul a kvetkezk:
John is in the pit
The wumpus that stinks is in 2 2
Mary is in Boston and John stinks
Sajnlatos mdon a nyelvtan tlgenerl (overgenerates) elllt olyan mondatokat, amelyek nyelvtanilag
helytelenek , mint pldul a Me go Boston s az I smell pit gold wumpus nothing east. Alul is generl
(undergenerates): sok olyan angol mondat van, amit elutast, mint pldul a I think the wumpus is smelly.
(Egy msik htrnya, hogy a nyelvtan nem nagybetvel kezdi a mondatokat, s nem rak pontot a vgkre. Ez
azrt van, mivel elssorban beszdre terveztk, s nem rsra.)
22.4. bra - Az 0 nyelvtana, minden egyes szablyra plda kifejezst adva
Egy relatv klz fnvi kifejezst kvet s mdost. (A klz a nyelvszetben egy alrendelt mellkmondat a ford.) Egy relatv nvmsbl
(mint a who s a that) s egy azt kvet igei kifejezsbl ll. (Egy msik tpus relatv klz a 22.12. feladatban szerepel.) Plda egy
relatv klzra a that stinks a The wumpus that stinks is in 2 2 mondatban.
3
703
Kommunikci
3. Szintaktikai analzis (elemzs)

Mr definiltuk az elemzst (parsing) mint az adott bemeneti fzrhez tartoz levezetsi fa megtallsnak
folyamatt. Azaz a PARSE fggvny meghvsa, mint pldul a
Parse(the wumpus is dead, 0, S)
olyan ft kell visszaadnia, amelynek gykerben S ll, levelei a the wumpus is dead s bels csompontjai az
0 nyelvtan nem zr szimblumai. A 22.1. brn lthattunk egy ilyen ft. Folytonos szvegknt a
kvetkezkppen rhatjuk:
[S: [NP: [Article: the] [Noun: wumpus]]
[VP: [Verb: is][Adjective: dead]]]
Fontos
Az elemzs tekinthet egy levezetsi fa megkeressnek folyamataknt. A keressi tr
meghatrozsnak kt szlssges (s sok kzbls) mdja van. Az egyik szerint kiindulhatunk az S
szimblumbl, s kereshetnk egy olyan ft, amely leveleiben tartalmazza a szavakat. Ez az
gynevezett fentrl lefel elemzs (top-down parsing) (mivel S-et a fa tetejre helyezzk). Msrszt
kiindulhatunk a szavakbl, s kereshetnk egy ft, ahol S a gykrcsompont. Ez a lentrl felfel
elemzs (bottom-up parsing).4 A fentrl lefel trtn elemzs pontosan definilhat a kvetkez
keressi problmaknt:
A kezdeti llapot (initial state) egy elemzsi fa, amelynek S a gykrcsompontja, s egy
ismeretlen gyerekcsompontja van: [S: ?]. ltalnossgban a keressi trben minden llapot egy
levezetsi fa.
Az llapottmenet-fggvny (successor function) kivlasztja azt a legszls csompontot bal
oldalon a fban, amelynek ismeretlen gyereke van. Ezek utn a nyelvtanban olyan szablyokat keres,
amelyek ezt a csompontot tartalmazzk gykrelemknt. Minden ilyen szablyra generl egy
kvetkez llapotot, ahol a ? szimblumot felcserli a szably jobb oldalnak megfelel listval.
szrevehet, hogy a fentrl lefel s a lentrl felfel trtn elemzs hasonl az elre-, illetve htrafel kvetkeztetshez, amiket a 7.
fejezetben rtunk le. Hamarosan ltni fogjuk, hogy ez az analgia pontos.
4
704
Kommunikci
Pldul az 0 nyelvtanban kt szably van S-re, gy az [S: ?] ft a kvetkez kt szrmaztatottal
cserli le:
[S: [S: ?] [Conjunction: ?] [S: ?]]
[S: [NP: ?] [VP: ?]]
A msodiknak ht szrmaztatottja lesz, minden NP trsi szablyhoz egy.

A clteszt (goal test) ellenrzi, hogy a levezetsi fa levelei pontosan megfelelnek-e a bemeneti
fzrnek, nincsenek-e ismeretlenek s lefedetlen bemenetek.
A fentrl lefel trtn elemzs egyik nagy problmja az gynevezett bal-rekurzv szablyok (leftrecursive rules) kezelse, melyek X X alakak. Mlysgi keresssel egy ilyen szably vgtelen
ciklusban X-et [X: X ]-ra cserln. Szlessgi keress esetn sikeresen megtalljuk az rvnyes
mondatok elemzseit, de rvnytelen mondatok esetben egy vgtelen keressi trben ragadnnk le.
A lentrl felfel trtn elemzs keressknt trtn formalizlsa a kvetkez:
A kezdeti llapot (initial state) a bemeneti fzrben tallhat szavak listja, mindegyiket egy olyan
levezetsi faknt brzolva, melynek csak egy levele van, pldul: [the, wumpus, is, dead].
ltalnossgban a keress minden llapota levezetsi fk egy listja.
Az llapottmenet-fggvny (successor function) megvizsgl minden i pozcit a fk listjban a
nyelvtan szablyainak minden lehetsges jobb oldaln. Ha a lista i pozcijban kezdd
rszsorozata illeszkedik a jobb oldalra, akkor a rszsorozatot lecserli egy j fra, amelynek
kategrija a szably bal oldala, s amelynek gyerekei a rszsorozat. Illeszkeds alatt azt rtjk,
hogy a csompont kategrija megegyezik a jobb oldal elemnek kategrijval. Pldul az Article
the szably illeszkedik a [the, wumpus, is, dead] els csompontjbl ll rszsorozatra, gy a
kvetkez llapot az [[Article: the], wumpus, is, dead] lenne.
A clteszt (goal test) egy olyan llapotot keres, ahol egyetlen fa van, melynek gykere az S.
A 22.5. bra bemutat egy pldt a lentrl felfel trtn elemzsre.
22.5. bra - A the wumpus is dead lentrl felfel trtn elemzsi lpsei. A szavakat
tartalmaz csompontok listjval kezdnk. Ezek utn egy szably jobb oldalra
illeszked rszsorozatokat felcserlnk egy j csomponttal, amelynek gykere a
szably bal oldala. Pldul a harmadik sorban az Article s Noun csompontokat
lecserljk egy NP csompontra, amelynek e kt csompont lesz a gyereke. A fentrl
lefel elemzs hasonl lpseket eredmnyezne, de pp a fordtott irnyban.
A lentrl felfel s a fentrl lefel trtn elemzs is lehet kevss hatkony azon mdok szmossga miatt,
ahogy klnbz kifejezsekhez tbbfle elemzs rendelhet. Mindkett elpazarolhatja az idt a keressi tr
irrelevns rszeinek vizsglatval. A fentrl lefel keress generlhat olyan kzbls csompontokat, amelyek
sosem zrhatk le szavakkal, s a lentrl felfel keress generlhat olyan rszleges elemzseket a szavakhoz,
amelyek nem fordulhatnak el egy S-ben sem.
705
Kommunikci
Mg ha lenne is egy tkletes heurisztiknk, amely lehetv tenn az irrelevns kitrk nlkli keresst, ezek az
algoritmusok akkor sem lennnek hatkonyak, mivel bizonyos mondatoknak exponencilisan sok levezetsi fja
van. A kvetkez alfejezet megmutatja, hogy mit kezdhetnk ezzel a problmval.
3.1. Hatkony elemzs

Vizsgljuk meg a kvetkez kt mondatot:
Have the students in section 2 of Computer Science 101 take the exam.
Have the students in section 2 of Computer Science 101 taken the exam?
Br az els 10 szavuk kzs, teljesen klnbz levezetsk van, mivel az els egy felszlts, a msodik egy
krds. Egy balrl jobbra elemz algoritmusnak tippelnie kellene, hogy az els sz egy felszlts vagy egy
krds rsze-e, s nem tudn megmondani, hogy a tipp helyes-e egszen a tizenegyedik szig: take vagy taken.
Ha az algoritmus rosszul tippelt, egszen az els szig kellene visszalpnie. Az ilyen tpus visszalps
elkerlhetetlen, de ha azt szeretnnk, hogy az algoritmusunk hatkony legyen, akkor el kell kerlnie a the
students in section 2 of Computer Science 101 NP-knt trtn jraelemzst minden alkalommal, amikor
visszalp.
Fontos
Ebben a rszben egy olyan algoritmust alaktunk ki, amely ezt a hatkonysgi problmt kezelni tudja.
Az alaptlet a dinamikus programozs (dynamic programming) egy pldja: minden alkalommal,
amikor egy rszfzrt elemznk, trold az eredmnyt, gy ksbb majd nem kell jraelemeznnk.
Pldul ha egyszer rjttnk, hogy a the students in section 2 of Computer Science 101 egy NP, ezt
eltrolhatjuk egy diagramnak (chart) nevezett adatstruktrban. Az gy mkd algoritmusokat
diagramelemzknek (chart parsers) nevezik. Mivel krnyezetfggetlen nyelvtanokkal foglalkozunk,
a keressi tr egy gnak kontextusban tallt tetszleges kifejezs ppgy szerepelhet a keressi tr
brmilyen ms gban is.
Egy n szbl ll mondat diagramja n + 1 csompontbl (vertex) s szmos, ezeket sszekt lbl (edges) ll.
A 22.6. brn lthatunk egy diagramot hat csomponttal (krk) s hrom llel (vonalak). Pldul a
[0, 5, S NP VP ]
cmkj l azt jelenti, hogy egy NP-t egy VP kvet, s egytt alkotnak egy S-et, mely a 0-tl 5-ig terjed
karaktersorozatot fedi le. Egy lben tallhat jel elvlasztja a mr megtalltat a mg keresettl.5 A jellel
zrd leket teljes leknek (complete edges) nevezik. A
[0, 2, S NP VP]
l szerint egy NP lefedi a 0-tl 2-ig terjed karaktersorozatot (az els kt sz), s ha tudunk tallni egy ezt
kvet VP-t, akkor lenne egy S-nk. Az ilyen lek, ahol a pont a vgk eltt van, gynevezett befejezetlen (nem
teljes) lek, s azt mondjuk, hogy az l egy VP-t vr.
22.6. bra - A The agent feels a breeze mondat diagramjnak egy rszlete. Mind a hat
csompont lthat, de csak hrom l szerepel azok kzl, melyek teljes elemzst
eredmnyeznnek.
A miatt nevezik az leket nha pontozott szablyoknak (dotted rules).
706
Kommunikci
A 22.7. bra a diagramelemz algoritmust szemllteti. A lnyege a fentrl lefel s a lentrl felfel legjobb
tulajdonsgainak tvzse. A JSL eljrs fentrl lefel mkdik: olyan bejegyzseket helyez el a diagramban,
amelyek megmondjk, hogy milyen szimblumok milyen helysznen elvrtak. A SZKENNER egy lentrl felfel
eljrs, amely a szavakbl indul ki, de egy szt csak egy meglev diagrambejegyzs kiegsztsre hasznl fel.
Hasonlkppen a KITERJESZT a komponenseket lentrl felfel pti, de csak egy meglev diagrambejegyzst
egszt ki.
Egy trkkt alkalmaztunk a teljes algoritmus elindtshoz: hozzadtunk egy [0, 0, S' S] let a diagramhoz,
ahol S a nyelvtan kezdeti szimbluma, S' pedig egy ltalunk most kitallt j szimblum. Az L-HOZZAD
meghvsa azt eredmnyezi, hogy a JSL leket ad az olyan szablyokhoz, melyek S-t eredmnyezhetnek, azaz
[S NP VP]. Ezek utn megvizsgljuk ezen szably els alkotelemt, NP-t, s mindenfle mdon olyan
szablyokat adunk hozz, melyek NP-t eredmnyeznek. Vgs soron a JSL fentrl lefel mdon minden
lehetsges lt hozzad, ami felhasznlhat a vgs S megalkotsban.
22.7. bra - A diagramelemz algoritmus. S a kezd szimblum s S' egy j nem zr

szimblum, diagram[j] pedig azon lek listja, melyek a j csompontban vgzdnek. A
grg bc beti nulla vagy tbb szimblumbl ll fzrekre illeszkednek.
707
Kommunikci
Amikor S' jslja kszen van, belpnk egy ciklusba, amely meghvja a SZKENNER-t a mondat minden egyes
szavra. Ha a j pozciban ll sz egy B kategria tagja, amit valamelyik l keres a j pozciban, akkor
kiterjesztjk azt az let megjellve a szt, mint B egy pldnyt. Vegyk szre, hogy a SZKENNER minden egyes
meghvsa vgzdhet a JSL s a KITERJESZT rekurzv meghvsval, ily mdon tvzve a fentrl lefel s a
lentrl felfel feldolgozst.
A msik lentrl felfel komponens, a KITERJESZT6 vesz egy teljes lt, amelynek bal oldaln B van, s
felhasznlja a diagramban lev brmely nem teljes szably kiterjesztsre, amely ott vgzdik, ahol a teljes l
kezddik, ha a nem teljes szably egy B-re vr.
A 22.8. s 22.9. brk mutatjk az I feel it mondat (amely a Do you feel a breeze? krdsre adott vlasz)
diagramjt s elemzsi lpseit. Tizenhrom l (am jelekkel elltva) szerepel a diagramon, melyek kzl t
teljes (a diagram verticei csompontjai felett) s nyolc befejezetlen (alattuk). Vegyk szre a JSL, SZKENNER
s KITERJESZT akcik ciklust. Pldul a Jsl felhasznlja azt a tnyt, hogy az a l egy S-t vr ahhoz, hogy
megellegezze egy NP (b l) s egy Pronoun (c l) jslatt. Ezek utn a SZKENNER felismeri, hogy van egy
Pronoun a megfelel helyen (d l), s a KITERJESZT kombinlja a b nem teljes lt a d teljes llel, gy
ellltva egy j lt, e-t.
22.8. bra - Az 0 I 1 feel 2 it 3 mondat diagramelemzse. Az m:S jells azt jelenti, hogy
az m lnek egy S ll a jobb oldaln, mg az f:VP/Verb azt, hogy az f lnek VP van a bal
A KITERJESZT eljrsunkat tradicionlisan TELJESS-TEV-nek hvtk. Ez a nv flrevezet, mivel az eljrs nem fejez be
leket: bemenetknt vesz egy teljes lt, s kiterjeszt nem teljes leket.
6
708
Kommunikci
oldaln, de egy Verb-et vr. t teljes l van a csompontok felett, s nyolc hinyos
alattuk.
A diagramelemz algoritmus elkerli az lek nagy halmaznak ptst, amit az egyszer lentrl felfel eljrs
vgigvizsglt volna. Vegyk a The ride the horse gave was wild mondatot. Egy lentrl felfel elemzs
megjelln a ride the horse-t mint egy VP-t, majd elvetn az elemzsi ft, amint rjnne, hogy nem illeszkedik
egy nagyobb S-be. Azonban az 0 nem engedi meg, hogy egy VP a the-t kvesse, gy a diagramelemz
algoritmus sosem jsol VP-t ezen a ponton, gy elkerli ott a VP szerkezet idpocskol ptst. Azokat az
algoritmusokat, melyek balrl jobbra mkdnek, s elkerlik ezen lehetetlen szerkezetek felptst, balsarokelemzknek (left-corner parsers) nevezzk, mivel egy olyan elemzsi ft ptenek fel, amely a nyelvtan kezd
szimblumval indul, s a mondat legszln balra (a bal sarokban) ll sz fel terjeszkednek. Egy lt csak
akkor adnak a diagramhoz, ha ezen elemzsi fa kiterjesztst szolglhatja (pldaknt lsd 22.10. bra).
22.9. bra - Az 0 I 1 feel 2 it 3. elemzsi lpsei. Az am lek mindegyikre megmutatjuk

azt az eljrst, amit az l ms, a diagramon mr szerepl lekbl trtn
szrmaztatsra hasznltunk. Bizonyos leket a rvidsg rdekben elhagytunk.
709
Kommunikci
22.10. bra - Egy balsarok-elemz algoritmussal elkerlhet a ride szval kezdd VP

jslsa, de jsolni fog egy was szval kezdd VP-t, mivel a nyelvtan egy NP-t kvet
VP-t vr. A the horse gave feletti hromszg azt jelenti, hogy a szavaknak van egy
RelCause elemzsk, amihez azonban kzvetlenl tovbbi rszek kapcsoldnak, amik
nem lthatk.
A diagramelemz csak polinomilis id- s trigny. O(kn2) helyet ignyel az lek trolsra, ahol n a
mondatban lev szavak szma s k egy, a nyelvtantl fgg konstans. Amikor mr nem tud tbb lt pteni,
megll, gy tudjuk, hogy az algoritmus befejezdtt (mg akkor is, ha vannak bal-rekurzv szablyok).
Valjban O(n3) idt ignyel legrosszabb esetben, ami a legjobb, amit elrhetnk krnyezetfggetlen
nyelvtanokra. A DIAGRAMELEMZ szk keresztmetszete a KITERJESZT, amelynek meg kell prblnia
kiterjeszteni a j-ben vgzd O(n) nem teljes l mindegyikt az ugyanott kezdd O(n) teljes l mindegyikvel,
j lehetsges n + 1 klnbz rtkre. Ezeket sszeszorozva kapjuk O(n3)-at. Ez egyfajta paradoxont ad a
szmunkra: hogyan tud egy O(n3) algoritmus visszaadni egy vlaszt, amely exponencilis szmossg elemzsi
ft tartalmazhat? Vegynk egy pldt: a
710
Kommunikci
Fall leaves fall and spring leaves spring

mondat tbbrtelm, mivel minden egyes sz (az and kivtelvel) lehet fnv s ige is, valamint a fall s a
spring lehet mellknv is. Ennek a mondatnak mindsszesen ngy elemzse van:7
[S: [S: [NP: Fall leaves] fall] and [S: [NP: spring leaves] spring]
[S: [S: [NP: Fall leaves] fall] and [S: spring [VP: leaves spring]]
[S: [S: Fall [VP: Fall leaves] fall] and [S: [NP: spring leaves] spring]
[S: [S: Fall [VP: Fall leaves] fall] and [S: spring [VP: leaves spring]]
Ha n tbbrtelm sszekapcsolt rszmondatunk lett volna, akkor 2n mdon vlaszthatnnk elemzst a

rszmondatokra.8 Hogyan kerli el a diagramelemz az exponencilis feldolgozsi idt? Kt vlaszt is adhatunk
a krdsre. Elszr is, a DIAGRAMELEMZ algoritmus maga valjban egy felismer, nem egy elemz. Ha van
egy [0, n, S ] alak teljes l a diagramon, akkor felismertnk egy S-t. Az elemzsi fa ellltst ebbl az
lbl nem tekintjk a DIAGRAMELEMZ feladatnak, de elvgezhet. Vegyk szre, hogy a KIBVT utols
sorban -t lek eB listjaknt ptjk fel, nemcsak kategria nevek listjaknt. gy egy l elemzsi fv trtn
talaktshoz egyszeren az sszetev leket kell rekurzv mdon vgignzni, minden egyes [i, j, X ] lt
egy [X : ] fv talaktva. Ez egyenes/kzvetlen mdszer, de csak egy elemzsi ft ad.
A msodik vlasz szerint ha minden lehetsges elemzst szeretnnk, akkor mlyebbre kell snunk a diagramban.
Mikzben az [i, j, X ] lt egy [X : ] fv talaktjuk, azt is megvizsgljuk, hogy van-e msik, [i, j, X
] alak l. Amennyiben van, ezek az lek tovbbi elemzsi fkat generlnak. gy kapjuk azt a vlasztsi
lehetsget, hogy mit is kezdjnk velk. Felsorolhatjuk az sszes lehetsget, ami azt jelenti, hogy a paradoxont
feloldannk, s exponencilisan sok idre lenne szksgnk az sszes elemzs felsorolshoz. Vagy
tovbbvihetjk a rejtlyt egy kicsit s az elemzseket egy tmrtett erd (packed forest) nev struktrval
reprezentlhatjuk, amely a kvetkezkppen nz ki:
A lnyeg az, hogy minden csompont lehet egy hagyomnyos elemzsi fa csompont, illetve csompontok egy
halmaza is. Ez lehetv teszi szmunkra, hogy exponencilis szm elemzst reprezentljunk polinomilis
idben s trhelyen. Termszetesen n = 2 esetn nincs sok klnbsg 2n s 2n kztt, de nagy n-ekre egy ilyen
reprezentci jelents megtakartst eredmnyez. Sajnlatos mdon ez az egyszer tmrtett erd megkzelts
nem kezeli az sszes O(n!) lehetsget a kapcsoldsok sszerendelsre. Maxwell s Kaplan (1995)
megmutatja, hogy egy, az igazsg-karbantart rendszerek alapelveire pl, sszetettebb reprezentci ezeket a
fkat mg jobban sszetmrtheti.
4. Kiterjesztett nyelvtanok
A 22.2. alfejezetben lttuk, hogy az 0 egyszer nyelvtana ellltja az angol nyelv I smell a stench s sok
ms mondatt. Sajnos azonban sok nem megengedett mondatot is elllt, mint pldul a Me smell a stench.
Ezen problma elkerlse rdekben a nyelvtanunknak tudnia kellene, hogy a me nem rvnyes NP akkor,
amikor a mondat alanya. A nyelvszek azt mondjk, hogy az I nvms alanyeset, mg a me trgyeset. 9 Ha
figyelembe vesszk az eseteket, akkor rjvnk, hogy az 0 nem krnyezetfggetlen: nem igaz az, hogy minden
NP minden mssal egyenrtk, fggetlenl a krnyezettl. A problma megoldsra bevezethetnk olyan j
kategrikat, mint az NPS s NPO a trgyas s alanyi fnvi kifejezsekre. Ezenkvl kett kellene bontanunk a
Pronoun kategrit a PronounS-re (amelyik tartalmazza az I-t) s PronounO-ra (amelyik tartalmazza a me-t).
A 22.11. bra fels rsze megmutatja az esetegyeztets teljes BNF nyelvtant; az gy kapott nyelvet 1-nek
Az [S: Fall [VP: leaves fall]] elemzs megegyezik az Autumn abandons autumn mondattal.
Emellett a komponensek sszekapcsoldsnak O(n!) szm rtelmezse lenne pldul (X s (Y s Z)), illetve ((X s Y) s Z). De ez mr
egy msik trtnet, amelyet Church s Patil (1982) igen jl mesl el.
9
Az angolban az alanyesetre a subjective case mellett alkalmanknt a nominative case kifejezst is hasznljk. Hasonlkppen a
trgyesetre az objective case mellett az accusative case is hasznlatos esetenknt. Sok nyelvnek van rszes esete is az indirekt trgy
pozciban ll szavakra.
7
8
711
Kommunikci
nevezzk. Vegyk szre, hogy az sszes NP szablyt meg kell kettznnk, egyszer az NPS, msszor az NPO
esetre.
22.11. bra - Fell: Az 1 egy BNF nyelvtana, amely kezeli az alanyi s a trgyas esetet a
fnvi kifejezsekben, s ezrt annyira nem is generl tl. Az 1 nyelvtanval
megegyez rszeket elhagytuk. Lent: Az 1 egy definit klz nyelvtana (DCG).
Sajnos az 1 mg mindig tlgenerl. Az angol s sok ms nyelv megkveteli az alany s a mondat f igjnek
egyeztetst (agreement). Pldul ha I az alany, akkor az I smell nyelvtanilag helyes, mg az I smells
nem. Ha it az alany, akkor fordtva igaz. Az angolban az egyeztetsbl szrmaz klnbsgek minimlisak: a
legtbb ignek egy alakja van egyes szm harmadik szemly alanyokra (he, she vagy it), s egy msik alakja
az egyes s tbbes szm s a szemlyek minden ms kombincijra. Egy kivtel van: az I am / you are / he is
hrom formval rendelkezik. Ha kombinljuk ezt a hrom klnbsgttelt az NPS s NPO klnbsgttellel,
akkor NP hat alakjt kapjuk. Ahogy tovbbi klnbzsgeket fedeznk fel, vgl egy exponencilis sokasgot
kapunk.
Az alternatv megkzelts a nyelvtan ltez szablyainak kiterjesztse (augmenting) j szablyok bevezetse
helyett. Elszr megmutatjuk egy pldn keresztl, hogy hogyan szeretnnk, hogy a kiterjesztett szablyok
kinzzenek (a 22.11. bra als fele), azutn formlisan megadjuk, hogyan kell ilyen szablyokat rtelmezni. A
kiterjesztett szablyok nem zr kategrik esetben megengedik paramterek alkalmazst. A 22.11. bra
megmutatja, hogyan rhatjuk le az 1 nyelvtant kiterjesztett szablyokkal. Az NP s Pronoun kategrik
rendelkeznek egy olyan paramterrel, amely lerja az esetket. (A fnevek nem rendelkeznek esettel az
angolban, br sok ms nyelvben igen.) Az S-re vonatkoz szablyban az NP-nek alanyi esetnek kell lennie,
mg a VP s PP szablyokban trgyasnak. Az NP szably egy vltozt fogad paramterknt, az eset-et. A
szndk az, hogy az NP tetszleges eset lehet, de ha trjuk Pronoun-ra, akkor ugyanolyan esetnek kell
lennie. Egy vltoz ilyen hasznlata elkerlve a dntst, amikor a klnbsgttel nem fontos visszatartja a
szablyhalmaz mretnek a tulajdonsgok szmval arnyosan exponencilis nvekedst.
A kiterjeszts ezen formalizmust definit klz nyelvtannak (definite clause grammar) vagy DCG-nek hvjuk,
mivel minden nyelvtani szably rtelmezhet a Horn-logikban szerepl definit klzknt.10 Elsknt azt
mutatjuk meg, hogy egy normlis, kiterjeszts nlkli szably hogyan rtelmezhet definit klzknt. Minden
kategriajelet karaktersorozatra vonatkoz prediktumnak tekintnk, gy az NP(s) igaz, ha az s karaktersorozat
egy NP-t forml. Az
S NP VP
CFG-szably a kvetkez definit klz rvidtse:

NP(s1) VP(s2) S(s1 + s2)
Idzze fel, hogy a definit klz, amit ha implikcis formban runk, pontosan egy atomot tartalmaz a kvetkezmny rszben, s nulla
vagy tbb atom konjunkcijt a felttel rszben. Kt plda az A B C, illetve nmagban a C.
10
712
Kommunikci
Fontos
Itt s1 + s2 kt karaktersorozat sszefzst jelenti, gy ez a szably azt mondja, hogy ha van egy s1 fzr,
ami egy NP s egy s2 fzr, ami egy VP, akkor az sszekapcsolsukkal keletkez fzr egy S, ami
pontosan megegyezik azzal, ahogy a CFG-szablyt korbban rtelmeztk. Fontos szrevennnk, hogy
a DCG-k lehetv teszik szmunkra, hogy az elemzsrl mint logikai kvetkeztetsrl beszljnk. Ez
lehetv teszi, hogy nyelvek s karaktersorozatok felett sok klnbz mdon kvetkeztessnk.
Pldul ez azt jelenti, hogy egy lentrl felfel elemzst elrefel kvetkeztetssel, egy fentrl lefel
elemzst pedig htrafel kvetkeztetssel vgezhetnk el. Azt is ltni fogjuk, hogy ez azt is jelenti,
hogy ugyanazt a nyelvtant elemzsre s generlsra is hasznlhatjuk.
A DCG-megkzelts igazi haszna az, hogy kiterjeszthetjk a kategriaszimblumokat a karakterfzreken kvl
tovbbi argumentumokkal. Pldul a
NP(eset) Pronoun(eset)
szably a kvetkez definit klz rvidtse:

Pronoun(eset, s1) NP(eset, s1)
Eszerint ha az s1 fzr az eset vltoz ltal meghatrozott eset Pronoun, akkor s1 egy ugyanolyan eset NP is.
ltalnossgban egy kategriaszimblumot tetszleges szm argumentummal kiterjeszthetnk, s az
argumentumok egyben paramterek, amelyek a szoksos Horn-klz kvetkeztets egyestsnek trgyai.
Van ra is ennek a knyelemnek: a nyelvtan rjt elltjuk a ttelbizonytk teljes erejvel, gy feladjuk a
szintaktikai elemzk ltal garantlt O(n3)-at; a kiterjesztsekkel kiegsztett elemzs lehet NP-teljes, vagy akr
eldnthetetlen, a kiterjesztsektl fggen.
Nhny tovbbi trkk szksges ahhoz, hogy a DCG mkdjn; pldul szksgnk van egy mdszerre, hogy
zr szimblumokat adhassunk meg, s knyelmes egy olyan mdszert is alkalmaznunk, amely nem engedi az
automatikus karaktersorozat-argumentum hozzadst. Mindent sszerakva, a definit klz nyelvtant a
kvetkezkppen definilhatjuk:
Az X Y Z jells fordtsa Y(s1) Z(s2) X(s1 + s2 + )
Az X Y | Z | jells fordtsa Y(s) Z(s) X(s)
Mindkt megelz szablyban brmelyik Y nem zr szimblum egy vagy tbb argumentummal
kiterjeszthet. Brmely argumentum lehet vltoz, konstans vagy argumentumok fggvnye. A fordtsban
ezen argumentumok megelzik a karakterfzr argumentumot (pldul az NP(eset) fordtsa NP(eset, s1)).
A {P()} jells szerepelhet egy szably jobb oldaln, s vltozs nlkl talakul P()-v. Ez lehetv teszi
a nyelvtan rja szmra, hogy egy P()-re vonatkoz tesztet anlkl elhelyezzen, hogy ahhoz
automatikusan hozzaddjon a karakterfzr-argumentum.
Az X word jells fordtsa X([word]).
Az alanyige egyeztetse szintn kezelhet kiterjesztssel, de ezt a 22.2. feladatra halasztjuk. Helyette egy
nehezebb problmval foglalkozunk: az igk alkategrikba osztsval.
4.1. Igk alkategrikba osztsa

Az 1 nyelv fejlettebb az 0-hoz kpest, de mg ez is tlgenerl. Az egyik problma abban a mdban rejlik,
ahogy az igei kifejezseket sszefzi. El akarjuk fogadni a give me the gold s a go to 1,2 jelleg igs
kifejezseket. Ezek mindegyike ltezik az 1-ben, de sajnos ppgy ltezik a go me the gold s a give to 1,2
is. Az 2 nyelv megsznteti ezeket a VP-ket gy, hogy egyrtelmen megadja, melyik igt melyik kifejezs
kvetheti. Ezt az igk alkategria (subcategorization) listjnak hvjuk. Az elkpzels az, hogy a Verb
kategrit alkategrikra bontjuk egy a trggyal nem rendelkezk igk szmra, egy az egyetlen trggyal
rendelkezkre s gy tovbb.
Az tlet megvalstshoz minden egyes ighez rendelnk egy alkategria-listt (subcategorization list),
amely a kiegsztit (complements) tartalmazza. A kiegszt olyan ktelez kifejezs, amely az igei
713
Kommunikci
kifejezsen bell kveti az igt. Azaz a give the gold to me-ben az NP a the gold s a to me PP a give
kiegsztje.11 Ezt lerhatjuk gy:
Verb([NP, PP]) give | hand |
Lehetsges, hogy egy ighez tbb, klnbz alkategrira bonts ltezik, csakgy, mint ahogy egy sz szmra
is lehetsges, hogy tbb, klnbz kategriba tartozzon. Valjban a give rendelkezik az [NP, NP]
alkategria-listval is, mint a Give me the gold mondatban. Ezt ugyangy kezelhetjk, mint minden ms
tbbrtelmsget. A 22.12. bra ad pr pldt igkre s alkategria-listikra (angolul rviden subcat).
22.12. bra - Pldk igkre az alkategria-listikkal egytt
Hrom dolgot tesznk az igei alkategrik nyelvtanba illesztshez. Az els lps a VP kategria kiterjesztse
egy alkategria-argumentummal, VP(subcat), amely felsorolja azokat a komponenseket, amikkel teljes VP
formlhat. Pldul a give teljes VP-v tehet [NP, PP] hozzadsval, give the gold teljess tehet [PP]
hozzadsval, s a give the gold to me mr teljes; alkategria-listja res, []. Ez a kvetkez szablyokat adja
VP-re:
VP(subcat)
Verb(subcat)
VP(subcat
NP(Objective)
VP(subcat
Adjective
[Adjective])
VP(subcat + [PP]) PP
[NP])
Az utols sor gy olvashat: Adott subcat alkategria-listval rendelkez VP formlhat egy begyazott VPbl, amit egy PP kvet, akkor, ha a begyazott VP rendelkezik egy olyan alkategria-listval, ami a subcat lista
elemeivel kezddik s PP-vel folytatdik. Pldul egy VP([])-t egy VP([PP]) s az azt kvet PP alkot. Az
els sor szerint egy VP, amely subcat alkategria-listval rendelkezik, formlhat egy ugyanolyan alkategrialistval rendelkez Verb segtsgvel. Pldul a VP([NP]) ltrehozhat egy Verb([NP]) ltal. Egy plda ilyen
igre a grab, teht a grab the gold egy VP([]).
Ez a kiegszt (complement) egyik defincija, de vannak ms terminolgit hasznl szerzk is. Egyesek szerint az ige alanya is egy
kiegszt. Msok szerint csak az elljri kifejezs kiegszt, s a fnvi kifejezst egy rvelsnek (argument) kell hvni.
11
714
Kommunikci
A msodik lps az S-re vonatkoz szably megvltoztatsa gy, hogy szksgess tegyen egy igei kifejezst,
melynek sszes kiegsztse megvan, s gy [] alkategria-listja van. Ez azt jelenti, hogy az I grab the gold
rvnyes mondat, de a You give nem az. Az j szably,
S NP(Subjective) VP([])
a kvetkezkppen olvashat: Egy mondatot sszellthatunk egy alanyi esetben ll NP-bl s az azt kvet,
res alkategria-listj VP-bl. A 22.13. bra bemutat egy elemzsi ft, amelyik ezt a nyelvtant hasznlja.
22.13. bra - A You give me the gold (Ideadod nekem az aranyat) elemzsi fja, amely
bemutatja az ige s az igei kifejezs alkategriit
A harmadik lpsben gondolunk arra, hogy a kiegsztsek mellett az igei (s egyb) kifejezsek segdszavakat
(adjuncts) is kaphatnak, melyek nem egy ighez ktd kifejezsek, hanem mindenfle igei kifejezsben
feltnhetnek. Az idt s helyet jelkpez kifejezsek segdszavak, mivel szinte minden cselekvs vagy esemny
rendelkezhet idponttal s helysznnel. Pldul a now hatrozsz az I smell a wumpus now mondatban s
az on Tuesday PP a give me the gold on Tuesday-ban segdszavak. me, kt szably a segdszavak
megengedshez:
VP(subcat)
|
VP(subcat) PP
VP(subcat) Adverb
4.2. Kiterjesztett nyelvtanok generlkpessge

Minden kiterjesztett szably egy szablysma (rule schema), mely a szablyok egy olyan halmazt jelenti, amit
a kiterjesztett alkotrszek rtkeinek minden lehetsges kombincijval lltunk el. A kiterjesztett
715
Kommunikci
nyelvtanok generlkpessge a kombincik szmtl fgg. Ha vges szm van, akkor a kiterjesztett nyelvtan
ekvivalens egy krnyezetfggetlen nyelvtannal: a szablysma felcserlhet egyedi krnyezetfggetlen
szablyokkal. Azonban ha vgtelen szm van, akkor a kiterjesztett nyelvtanok nem krnyezetfggetlen
nyelveket is lerhatnak. Pldul az anbncn krnyezetfgg nyelv lerhat a kvetkez kiterjesztett nyelvtannal:
S(n) A(n) B(n) C(n)
A(1) a A(n + 1) a
A(n)
B(1) b B(n + 1) b
B(n)
C(1) c C(n + 1) c
C(n)
5. Szemantikai rtelmezs
Eddig csak a nyelv szintaktikai analzist vizsgltuk. Ebben a fejezetben rtrnk a szemantikra (semantics)
a megnyilatkozs (utterance) jelentsnek kinyersre. Ebben a fejezetben az elsrend logikt hasznljuk
reprezentcis nyelvknt, gy a szemantikai rtelmezs egy FOL kifejezs s egy nyelvi kifejezs
sszerendelsnek a folyamata. Intuitv mdon kzeltve, a the wumpus kifejezs jelentse az a nagy, szrs
szrnyeteg, amit a logikban a Wumpus1 logikai kifejezssel jelznk, s a the wumpus is dead jelentse a
Dead(Wumpus1) logikai llts. Ez a fejezet ezt az intucit pontostja. Egy egyszer pldval kezdnk: a
ngyzethl helyszneit ler szabllyal:
NP Digit Digit
Kiterjesztjk a szablyt gy, hogy minden sszetevhz egy argumentumot illesztnk, amely az sszetev
szemantikjt reprezentlja. A kvetkezt kapjuk:
NP([x, y]) Digit(x) Digit(y)
E szerint egy karaktersorozat, amely egy x szemantikj szmjegybl s egy azt kvet y szemantikj
szmjegybl ll, egy [x, y] szemantikval rendelkez NP-t forml, amely a hl egy ngyzetre alkalmazott
jellsnk.
Vegyk szre, hogy a teljes NP szemantikja nagymrtkben az sszetevinek szemantikjn alapszik. Mr
lttuk a kompozcis szemantika (compositional semantics) ezen tlett korbban: a logikban a P Q
jelentst P, Q s hatrozzk meg; az aritmetikban az x + y jelentst x, y s a + hatrozzk meg. A 22.14.
bra megmutatja, hogy a DCG jellsrendszer hogyan hasznlhat egy aritmetikai kifejezseket ler nyelvtan
szemantikval trtn kiterjesztsre, s a 22.15. bra mutatja a 3 + (4 2) ezen nyelvtan alapjn kapott
elemzsi fjt. Az elemzsi fa gykere Exp(5), egy kifejezs, melynek szemantikai rtelmezse 5.
22.14. bra - Szemantikval kibvtett nyelvtan az aritmetikai kifejezsekre. Minden xi

vltoz egy szszetev szemantikjt reprezentlja. Vegye szre, hogy a {teszt} jellst
hasznljuk olyan logikai prediktumok definilsra, amelyeket ki kell elgteni, de
nem sszetevk!
716
Kommunikci
22.15. bra - A 3 + (4 2) fzr elemzsi fja szemantikai rtelmezsekkel
5.1. Az angol nyelv egy rszletnek szemantikja

Most mr kszen llunk arra, hogy az angol nyelv egy kis rszhalmazra megrjuk a szemantikai kibvtst. Els
lpsknt azzal kezdnk, hogy melyik kifejezshez milyen szemantikai rtelmezseket akarunk rendelni. A
John loves Mary egyszer mondatot fogjuk vizsglni. A John NP szemantikus rtelmezse a John logikai
term kell legyen, s a mondatnak, mint egsznek, a Loves(John, Mary) logikai llts kell a szemantikai
rtelmezse legyen. Ennyi vilgosnak ltszik. A bonyolultabb rsz a loves Mary VP. Ezen kifejezs
szemantikai rtelmezse se nem logikai term, se nem teljes logikai mondat. Intuitv mdon kezelhetjk gy,
hogy a loves Mary egy lers, ami lehet, hogy egy adott szemlyre vonatkozik, de lehet, hogy nem. (Jelen
esetben Johnra vonatkozik.) Ez azt jelenti, hogy a loves Mary egy prediktum (predicate), amit ha egy
szemlyt reprezentl termmel kombinlunk (a szemly, aki szeret), akkor egy teljes logikai mondatot llt el.
A jellsrendszert hasznlva (lsd 7.2. alfejezet) a loves Mary-t a kvetkez prediktumknt
reprezentlhatjuk:
x Loves(x, Mary)
Ezutn szksgnk van egy szablyra, amely szerint egy obj szemantikj NP, melyet egy rel szemantikj VP
kvet, egytt egy olyan mondatot eredmnyez, amelynek szemantikja a rel alkalmazsa az obj-ra:
S(rel(obj)) NP(obj) VP(rel)
A szably szerint a John loves Mary szemantikai rtelmezse

(x Loves(x, Mary))(John)
ami megfelel a Loves(John, Mary)-nek.
22.16. bra - Egy nyelvtan, amely kpes egy elemzsi fa s szemantikai rtelmezs
levezetsre a John loves Mary (s hrom msik) mondat szmra
717
Kommunikci
22.17. bra - A John loves Mary fzr elemzsi fja szemantikai rtelmezsekkel
A szemantika htralev rsze az eddigi vlasztsainkbl egyenesen kvetkezik. Mivel a VP-ket prediktumknt
reprezentljuk, j tlet konzisztens mdon az igket is prediktumknt brzolni. A loves ige reprezentcija
y x Loves(x, y) prediktum, ami pldul egy Mary argumentum esetn x Loves(x, Mary) prediktummal tr
vissza.
A VP Verb NP szably alkalmazza az ige szemantikai rtelmezsbl kapott prediktumot az NP
(szemantikai) rtelmezsbl kapott objektumra a teljes VP szemantikai rtelmezsnek kinyersre. Vgl a
22.16. brn lthat nyelvtant s a 22.17. brn tallhat elemzsi ft kapjuk.
5.2. Id s igeid
Most tegyk fel, hogy a John loves Mary s a John loved Mary kztti klnbsget szeretnnk
reprezentlni. Az angol igeidket (past [mlt], present [jelen] s future [jv]) hasznl egy esemny relatv
idejnek jelzsre. Egy j vlaszts az esemnyek idejnek reprezentlsra a 10.3. alfejezet esemnykalkulus
jellsrendszere. Az esemnykalkulussal a kt mondatunk a kvetkezkppen rtelmezhet:
e Loves(John, Mary) During(Now, e)
e Loves(John, Mary) After(Now, e)
Eszerint a loves s loved szavakra vonatkoz kt lexikai szablyunk a kvetkez lehet:

Verb(y x e Loves(John, Mary) During(Now, e)) loves
Verb(y x e Loves(x, y) After(Now, e)) loved
718
Kommunikci
E vltozstl eltekintve a nyelvtannal kapcsolatban minden ms vltozatlan marad, ami sztnz hr; azt
sugallja, hogy helyes ton jrunk, ha ilyen knnyedn bonyolthatjuk pldul az igeidvel (br csak rintettk az
idre s igeidre vonatkoz teljes nyelvtan felsznt). E bemelegtsknt elrt sikerrel kszen llunk egy sokkal
nehezebb reprezentcis problma kezelsre.
5.3. Kvantifikls
Nzzk a kvetkez pldt: Every agent smells a wumpus. A mondat valjban tbbrtelm: a javasolt
rtelmezs szerint az gensek klnbz wumpusokat szlelhetnek, de egy alternatv jelents szerint csak egy
wumpus van, akit mindenki rez.12 A kt interpretcit a kvetkez mdon brzolhatjuk:
a a Agents w w Wumpuses e e Smell(a, w) During(Now, e)
w
w Wumpuses a a Agents e e Smell(a, w) During(Now, e)
A tbbrtelmsg problmjt elhalasztjuk ksbbre, most csak az els rtelmezst vizsgljuk. Megprbljuk az
sszetevi szerint elemezni, NP s VP komponensekre bontva:
Every agent NP(a a Agents P)
smells a wumpus VP(w w Wumpuses e (e Smell(a, w) During(Now, e))
Mris kt nehzsg tmadt. Elszr is, a teljes mondat szemantikja, gy tnik, megegyezik az NP
szemantikjval, melyben a VP tlti ki a P rsz szemantikjt. Ez azt jelenti, hogy a mondat szemantikjt nem
formlhatjuk rel(obj) segtsgvel. Megtehetjk obj(rel) ltal, ami (legalbbis els rnzsre) kicsit klnsnek
tnik. A msodik problma az, hogy az a vltozt a Smell relci argumentumaknt kell megkapnunk. Ms
szavakkal, a mondat szemantikja a VP szemantikjnak megfelel NP argumentumrekeszbe val illesztsvel
addik, mikzben az NP-ben tallhat a vltozt is betesszk a VP szemantika megfelel
argumentumrekeszbe. gy tnik, mintha kt funkcionlis kompozcink lenne, s ez azt sugallja, hogy
meglehetsen knny lesz sszezavarodni. A bonyolultsg abbl a tnybl ered, hogy a szemantikai struktra
nagyon klnbz a szintaktikaitl.
Hogy elkerljk ezt a zrzavart, sok modern nyelvtan ms mdszert vlaszt. Definilnak egy kzbls formt
(intermediate form) a szintaxis s a szemantika kztti kzvettsre. A kzbls formnak kt
kulcstulajdonsga van. Egyrszt strukturlisan hasonl a mondat szintaxishoz, gy knnyen elllthat
kompozcis eszkzkkel. Msrszt elg informcit tartalmaz, s gy lefordthat egy regulris elsrend
logikai mondatt. Mivel a szintaktikai s a logikai alak kztt helyezkedik el, nha kvzilogikai formnak
(quasi-logical form)13 nevezik. A fejezetben egy kvzilogikai formt hasznlunk, mely a teljes elsrend logikt
tartalmazza, lambdakifejezssekkel s egy j konstrukcival kiegsztve, amit kvantifiklt termnek
(quantified term) neveznk. Az every agent szemantikai rtelmezst jelent kvantifiklt term a
kvetkezkppen rhat:
[a
a Agents]
Ez olyan, mint egy logikai mondat, de ugyanolyan mdon hasznljuk, mint a logikai termeket. Az Every agent
smells a wumpus kvzilogikai rtelmezse:
e (e Smell([a a Agents], [w w Wumpuses]) During(Now, e))
A kvzilogikai alak generlshoz szablyaink kzl sok vltozatlan marad. Az S-re vonatkoz szably S
szemantikjt mg mindig rel(obj) segtsgvel adja meg. Bizonyos szablyok vltoznak; az a szra
vonatkoz lexikai szably a kvetkez:
Article() a
mg a nvel s fnv kombincijnak szablya:

NP([q x sem(x)]) Article(q) Noun(sem)
Ha ez az rtelmezs valszntlennek tnik, akkor vizsglja meg az Every Protestant believes in a just God mondatot.
Egyes kvzilogikai formkra jellemz az is, hogy olyan tbbrtelmsgek tmr kifejezsre is alkalmasak, amelyeket logikai formban
csak hossz diszjunkcik segtsgvel lehetne kifejezni.
12
13
719
Kommunikci
E szerint az NP szemantikja egy kvantifiklt term ahol a kvantifiklst a nvel hatrozza meg egy j x
vltozval s egy propozcival, amely a fnv szemantikjt az x vltozra alkalmazza. Az NP-re vonatkoz
tovbbi szablyok hasonlk. A 22.18. bra mutatja be a szemantikai tpusokat, s pldt ad minden egyes
szintaktikai kategrira a kvzilogikai brzols szerint. A 22.19. bra az Every agent smells a wumpus e
megkzelts szerinti elemzst mutatja, a 22.20. pedig a teljes nyelvtant.
Ezek utn t kell alaktanunk a kvzilogikai formt valdi elsrend logikaiv a kvantifiklt termek igazi termm alaktsval. Ezt egy egyszer szabllyal tesszk meg: minden egyes QLF kvzilogika formn belli [q x
P(x)] kvantifiklt termet a cserljk ki x-re, s cserljk a QLF-et q x P(x) op QLF formra, ahol az op opertor
akkor, ha a q , s , amennyiben a q vagy !. Pldul az Every dog has a day (Minden kutynak van
egy napja) mondat a kvetkez kvzilogikai formval rendelkezik:
e (e Has([d d Dogs], [a a Days], Now))
Nem specifikltuk, hogy a kt kvantifiklt term melyikt kell elsknt elvenni, gy valjban kt lehetsges
rtelmezs van:
d
d Dogs a a Days e e Has(d, a, Now)
a a Days d d Dogs e
e Has(d, a, Now)
22.18. bra - Minden szintaktikai kategria kvzilogikai formj kifejezsnek tpust

mutat tbla. A t r jells egy fggvnyt takar, amely egy t tpus argumentumot
fogad, s r tpus eredmnnyel tr vissza. Pldul a Preposition szemantikai tpusa
object2 sentence, ami azt jelenti, hogy az elljrsz szemantikja egy fggvny,
amelyet ha kt logikai objektumra alkalmazunk, akkor egy logikai mondatot
eredmnyez.
22.19. bra - Az Every agent smells a wumpus mondat elemzsi fja, amely mind a
szintaktikai struktrt, mind a szemantikai rtelmezseket mutatja
720
Kommunikci
22.20. bra - Szemantikval elltott nyelvtan kvzilogikai formban
Az els szerint minden kutynak megvan a maga napja, mg a msodik szerint van egy klnleges nap, ami
minden kutyra ugyanaz. A kett kztti vlaszts a tbbrtelmsg feloldsnak feladata. A kvantifiklt termek
balrl jobbra sorrendje gyakran illeszkedik a kvantifiklk balrl jobbra sorrendjre, de ms tnyezk is
szmtanak. A kvzilogikai alak elnye az, hogy tmren reprezentlja az sszes lehetsget. A htrnya pedig
az, hogy nem segti a vlasztst kzttk; amihez szksgnk van a tbbrtelmsg feloldsnak teljes erejre
az sszes tnyt felhasznlva.
5.4. Pragmatikus rtelmezs

Megmutattuk, hogy egy gens hogyan kpes szlelni egy szfzrt, s hogyan kpes egy nyelvtant hasznlni a
lehetsges szemantikai rtelmezsek halmaznak ellltsra. Most annak a problmjt vizsgljuk, hogy az
721
Kommunikci
rtelmezs hogyan tehet teljess az egyes jelltek rtelmezshez az adott szitucit ler kontextusfgg
informcik hozzadsval.
A gyakorlati informcira legnyilvnvalbban a referencilis indexek (indexicals) feloldshoz van szksg,
amelyek kzvetlenl az adott szitucira utal kifejezsek. Pldul az I am in Boston today (Ma Bostonban
vagyok) mondatban az I s today referencilis indexek rtelmezse attl fgg, hogy ki s mikor ejtette ki a
mondatot. A referencilis indexeket konstansokkal (mint pldul a Speaker) reprezentljuk, amelyek
valjban vltoz dolgok (fluents) azaz a szitucitl fggnek. A hallgatnak, aki szleli a szlsaktust, azt is
szlelnie kell, hogy ki a beszl, s felhasznlja ezt az informcit a referencilis indexek feloldsra. Pldul a
hallgat tudhatja, hogy T((Speaker = AgentB), Now).
Egy felszlts, mint pldul a go to 2, 2 implicit mdon a hallgatra vonatkozik. Eddig az S nyelvtanunk csak
deklaratv mondatokat rt le. Knnyen kiterjeszthetjk felszltsok kezelsre.14
A felszltst olyan VP segtsgvel formlhatjuk, ahol az alany implicit mdon a hallgat. Meg kell
klnbztetnnk a felszltsokat az lltsoktl, ezrt megvltoztatjuk az S-re vonatkoz szablyokat a
szlsaktus tpusnak beillesztsvel a kvzilogikai formba:
S(Statementl(Speaker, rel(obj))) NP(obj) VP(rel)
S(Command(Speaker, rel(Hearer))) VP(rel)
gy a go to 2, 2 kvzilogikai alakja:15
Command(e e Go(Hearer, [2, 2]))
5.5. Nyelv generlsa DCG-kkel

Eddig egy nyelv elemzsvel foglalkoztunk, nem a generlsval. A generls hasonlan gazdag tma. A
megfelel megnyilatkozs kivlasztsa egy llts kifejezsre sok hasonl vlasztst von maga utn, mint egy
megnyilatkozs elemzse.
Emlkezznk vissza, hogy a DCG egy logikai programozsi rendszer, amely knyszereket hatroz meg egy
karaktersorozat s annak elemzse kztt. Tudjuk, hogy az Append prediktum logikai programozsi defincija
felhasznlhat annak kzlsre is, hogy az Append([1, 2], [3], x) esetben x = [1, 2, 3], s arra is, hogy
felsoroljuk azon x s y rtkeket, melyek az Append(x, y, [1, 2, 3]) kifejezst igazz teszik. Hasonlkppen
rhatunk egy defincit S-re, amely ktflekppen hasznlhat: az elemzshez megkrdezzk, hogy S(sem,
[John, Loves, Mary]), s azt kapjuk vissza, hogy sem = Loves(John, Mary); a generlshoz azt krdezzk, hogy
S(Loves(John, Mary), words), s azt kapjuk vissza, hogy words = [John, Loves, Mary]. Tesztelhetnk egy
nyelvtant az S(sem, words) krdssel, visszakapva azokat a [sem, words] prok sorozatt vlaszknt, melyeket a
nyelvtan generlt.
Ez a mdszer a fejezetben bemutatott egyszer nyelvtanokra mkdik, de nagyobb nyelvtanokra trtn
felsklzs sorn lehetnek problmk. A logikai kvetkeztet gp ltal hasznlt keressi stratgia nagyon fontos;
a mlysgi keressi stratgik vgtelen ciklusokhoz vezethetnek. Figyelmet kell fordtani a szemantikai alak
pontos rszleteire is. Elfordulhat, hogy egy adott nyelvtan nem tudja kifejezni az X Y logikai alakot az X s Y
bizonyos rtkeire, de ki tudja fejezni Y X-et; ez azt sugallja, hogy szksgnk lesz valamilyen mdszerre a
szemantikai alakok kanonizlsra, vagy ki kell terjesztennk az egyest eljrst gy, hogy az X Y s az Y
X egyesthet legyen.
Komolyabb generlsi feladatok bonyolultabb modelleket hasznlnak, melyek klnbznek az elemzs
nyelvtantl, s pontosabban szablyozzk, hogy a szemantikai komponenseket pontosan hogyan fejezzk ki. A
Egy teljes kommunikl gens megvalstshoz szksgnk lenne a krdsek nyelvtanra is. A krdsek kezelse kvl esik e knyv
terletn, mivel sszetevk kztti hossz tv fggsgeket (long-distance dependecies) vonzanak magukkal. Pldul a Whom did the
agent tell you to give the gold to? mondatban a zr to elemzsnek hinyz NP-j PP-nek kell lennie; a hinyz NP-t a mondat els
szava, a who helyettesti. Kiterjesztsek egy komplex rendszere biztostja, hogy a hinyz NP-k sszeillesztdjenek a helyettest
szavakkal.
15
Vegyk szre, hogy egy felszlts kvzilogikai formja nem foglalja magban az esemny idejt (azaz a During(Now, e)-t)! Ez azrt van,
mert a go valjban a sz igeid nlkli vltozata, nem a jelen idej. Nem lehet megllaptani a klnbsget a go esetben, de figyelje
meg a Be good! felszlts helyes alakjt (a be igeid nlkli alakjt hasznlva), amely nem Are good!. Annak biztostsra, hogy a
helyes igeidt hasznljuk, kiegszthetnnk a VP-ket egy igeid kiterjesztssel, s a felszltsok szablynak jobb oldalra ezt rhatnnk:
VP(rel, untensed).
14
722
Kommunikci
szisztematikus nyelvtan egy olyan megkzelts, amely knnyv teszi, hogy a szemantikai alak legfontosabb
rszeire nagyobb hangslyt helyezznk.
6. Tbbrtelmsg s feloldsa
Bizonyos esetekben a hallgatk tudatban vannak egy megnyilatkozs tbbrtelmsgnek. me, nhny plda a
napilapok szalagcmeibl:
Squad helps dog bite victim.
Helicopter powered by human flies.
Once-sagging cloth diaper industry saved by full dumps.
Portable toilet bombed; police have nothing to go on.
British left waffles on Falkland Islands.
Teacher strikes idle kids.
Milk drinkers are turning to powder.
Drunk gets nine months in violin case.
(A mondatok fordtst s rtelmezst az olvasra hagyjuk a ford.)
Fontos
Azonban legtbb esetben a beszd, amit hallunk, egyrtelmnek tnik. Ezrt amikor a kutatk elszr
kezdtek a nyelv elemzsre szmtgpeket hasznlni a hatvanas vekben, igen meglepdve
tapasztaltk, hogy majdnem minden megnyilatkozs ersen tbbrtelm, br az alternatv rtelmezsek
egy anyanyelvi beszl szmra lehet, hogy nem nyilvnvalk. Egy nagy nyelvtannal s szkinccsel
rendelkez rendszer rtelmezsek ezreit tallhatja egy teljesen tlagos mondatra. Vegyk pldul a
The batter hit the ball mondatot, amelynek ltszlag egy egyrtelm rtelmezse van, miszerint a
baseballjtkos megt egy baseball-labdt. De klnbz rtelmezst kapunk, ha az ezt megelz
mondat ez: The mad scientist unleashed a tidal wave of cake mix towards the ballroom. Ez a plda a
lexiklis tbbrtelmsgen (lexical ambiguity) alapszik, amikor egy sznak egynl tbb jelentse
van. A lexiklis tbbrtelmsg igen gyakori: a back lehet hatrozsz (go back), mellknv (back
door), fnv (the back of the room) s ige (back up your files). A Jack lehet nv, fnv (krtya,
hatszg fm jtkdarab, hajzsi zszl, hal, hm szamr, dugasz vagy nehz objektumok emelsre
szolgl eszkz), illetve lehet ige (felemelni egy autt, fnnyel vadszni vagy ersen megtni a
baseball-labdt).
A szintaktikai tbbrtelmsg (syntactic ambiguity) (avagy strukturlis tbbrtelmsg (structural
ambiguity)) a lexiklis tbbrtelmsggel egytt vagy nlkle is elfordulhat. Pldul az I smelled a wumpus
in 2,2 fzrnek kt rtelmezse lehet: az egyikben az in 2,2 prepozcis kifejezs a fnevet mdostja, a
msikban az igt. A szintaktikai tbbrtelmsg szemantikai tbbrtelmsghez (semantic ambiguity) vezet,
mivel az egyik rtelmezs szerint a wumpus a 2,2-n van, a msik szerint a szaga van a 2,2-n. Ebben az esetben a
rossz rtelmezs hallos tveds lehet.
A szemantikai tbbrtelmsg mg olyan kifejezsekben is feltnhet, ahol nincs lexiklis vagy szintaktikai
tbbrtelmsg. Pldul a cat person fnvi kifejezs takarhat olyasvalakit, aki szereti a macskaflket, vagy
az Attack of the Cat People (A macskaemberek tmadsa) c. film szalagcmt is. Egy coast road lehet olyan
t, ami a partvonalat kveti, s olyan, amelyik a partra vezet.
Vgezetl lehet tbbrtelmsg a sz szerinti s az tvitt rtelm jelentsek kztt. A jelkpes beszd fontos a
kltszetben, de meglepen gyakori a mindennapi beszdben is. A metonmia (metonymy) egy olyan jelkpes
beszd, amikor az egyik objektum helyre egy msikat lltunk. Amikor azt halljuk, hogy Chrysler announced
a new model, nem rtelmezzk akknt, hogy a cgek beszlni tudnak; inkbb azt rtjk ezalatt, hogy a cget
kpvisel szviv tette a bejelentst. A metonmia gyakori, s az emberi hallgatk gyakran szrevtlenl
interpretljk. Sajnlatos mdon a nyelvtanunk abban a formban, ahogy lertuk, nem ennyire rugalmas. Ahhoz,
723
Kommunikci
hogy a metonmia szemantikjt megfelelen kezelni tudjuk, a tbbrtelmsg teljesen j szintjt kell
bevezetnnk. Ezt gy tesszk meg, hogy kt objektumot hasznlunk a mondat minden kifejezsnek
szemantikai rtelmezsnl: egyet arra az objektumra, amelyre a kifejezs sz szerint vonatkozik (Chrysler),
mg egy msikkal utalunk a fogalomcserre (szviv). Ezek utn meg kell mondanunk, hogy sszefggs van a
kett kztt. Jelenlegi nyelvtanunkban a Chrysler announced rtelmezse a kvetkez:
x, e x = Chrysler e Announce(x) After(Now, e)
Ezt a kvetkezre kell megvltoztatnunk:

m, x, e x = Chrysler e Announce(m) After(Now, e) Metonymy(m, x)
E szerint van egy olyan x entits, amely azonos a Chryslerrel, s van egy msik m entits, amelyik a bejelentst
tette, s a kett metonmiai relciban ll egymssal. A kvetkez lps annak meghatrozsa, hogy milyen
metonmiarelcik fordulhatnak el. A legegyszerbb eset az, amikor nincs semmilyen metonmia az x sz
szerinti objektum s az m metonmiai objektum azonos:
m, x (m = x) Metonymy(m, x)
A Chrysler pldnl helynval ltalnosts az, hogy egy vllalat llhat a szvivje helyn:
m, x x Organizations Spokesperson(m, x) Metonymy(m, x)
Tovbbi fogalomcserk lehetnek a szerz a munkkra (I read Shakespeare), vagy ltalban a ltrehoz az
alkotsra (I drive a Honda) s a rsz az egszre (The Red Sox need a strong arm). A metonmia egyes pldi,
mint a The ham sandwich on Table 4 wants another beer jszerbbek, s az adott szitucinak megfelelen
rtelmezik ket.
Az itt vzolt szablyok lehetv teszik a szmunkra, hogy a Chrysler announced a new model mondat
magyarzatt elksztsk, de a magyarzat nem logikai kvetkeztets tjn jn ltre. Valsznsgi vagy
nemmonoton kvetkeztetst kell hasznlnunk ahhoz, hogy magyarzatjelltekkel lljunk el.
Egy metafora (metaphor) olyan jelkpes beszd, amikor egy adott sz szerinti jelentssel br kifejezst
hasznlunk egy msik jelents sugalmazsra analgia segtsgvel. A legtbb ember gy gondol a metaforra,
mint a kltk eszkzre, mely nem jtszik nagy szerepet a mindennapi szvegekben. Mindazonltal nagyon sok
alapvet metafort olyan gyakran hasznlunk, hogy mg azt sem vesszk szre, hogy azok metafork. Egy ilyen
metafora annak a gondolata, hogy a tbb felfel van. Ez a metafora lehetv teszi szmunkra annak kzlst,
hogy az rak emelkedtek, felmsztak vagy rakta mdjra szrnyalnak, hogy a hmrsklet cskken vagy esik,
hogy a bizalom valakiben cskken, illetve hogy egy sztr npszersge megugrott vagy szrnyal.
Az ilyen metafork megkzeltsnek kt mdja lehetsges. Az egyik az, hogy a metafora teljes tudst
beptjk a sztrba j jelentseket adunk az emelkedik, esik, mszik stb. szavakhoz, melyek gy rjk le ket,
hogy mindenfle mrtkre vonatkozhatnak, nem csak a magassgra. Ez a mdszer sok alkalmazs szmra
elegend, de nem ragadja meg a metafora azon generlkpessgt, amely az emberek szmra lehetv teszi j
kifejezsek hasznlatt mint pldul az albukik vagy a kirobbantja a tett anlkl hogy flrertstl
tartannak. A msik mdszer a gyakori metaforkrl explicit tudst illeszt be a rendszerbe, s ezeket hasznlja
az j kifejezsek olvass kzbeni megrtshez. Pldul tegyk fel, hogy egy rendszer ismeri a tbb felfel
van metaforjt. Azaz tudja, hogy az olyan logikai kifejezsek, melyek egy fggleges skln rtelmezett
pontra vonatkoznak, rtelmezhetk egy mennyisgi skla megfelel pontjaira vonatkozknt. Ezek utn az
eladsok magasak kifejezshez tartozna egy Altitude(Sales, High) sz szerinti rtelmezs, amit metafora
segtsgvel Quantity(Sales, Much)-knt rtelmezhetnk.
6.1. A tbbrtelmsg feloldsa

Fontos
Ahogy korbban mondtuk, a tbbrtelmsg feloldsa diagnzis krdse. A beszl szndka a
kommunikcira a megnyilatkozsban szerepl szavak nem megfigyelt oka, s a hallgat dolga, hogy a
szavakbl s a szitucirl val tudsbl kiindulva visszafel ellltsa a beszl legvalsznbb
szndkt. Ms szavakkal, a hallgat a kvetkezt oldja meg:
724
Kommunikci
ahol a Likelihood lehet valsznsg vagy a preferencik brmilyen szmszer mrtke. Valamilyen
preferencira szksg van, mivel a szintaktikai s szemantikai rtelmezsi szablyok nmagukban nem
tudnak a kifejezshez vagy mondathoz egyetlen helyes rtelmezst meghatrozni. Ezrt rszekre
bontjuk a munkt: a szintaktikai s szemantikai rtelmezs felels a lehetsges rtelmezsek
halmaznak ellltsrt, a tbbrtelmsg feloldsnak folyamata pedig kivlasztja a legjobbat.
Vegyk szre, hogy a szlsaktus szndkrl, s nem csak a beszl ltal kimondott aktulis kijelentsrl
beszlnk. Pldul ha azt halljuk egy politikustl, hogy I am not a crook, akkor lehet, hogy csak 50%
valsznsget adunk annak, hogy a politikus nem bnz, ugyanakkor 99,999%-ot annak, hogy a beszl nem
egy kamps psztorbot (a crook msik jelentse a ford.). Mgis nagyobb valsznsget rendelnk ahhoz az
rtelmezshez, hogy
Assert(Speaker, (Speaker Criminals)
mivel ez a valsznbb dolog, amit mond.

Vizsgljuk ismt az I smelled a wumpus in 2,2. tbbrtelm pldt! Egy preferenciaheurisztika a jobbra
asszocici (right association), amely szerint amikor el kell dntennk, hogy az in 2,2 PP-t hova helyezzk
el az elemzsi fban, akkor azt preferljuk, hogy a jobb szlen elhelyezked sszetevhz csatoljuk, ami jelen
esetben az a wumpus NP. Termszetesen ez csak egy heurisztika; az I smelled a wumpus with my nose
mondatra a heurisztikt fellbrln az a tny, hogy az a wumpus with my nose NP nem valszn.
A tbbrtelmsg feloldsa a tnyek kombinlsval oldhat meg, felhasznlva a knyvben eddig ltott
tudsbrzolsra s bizonytalansg melletti kvetkeztetsre alkalmas minden technikt.
A tudst ngy modellre bonthatjuk:
1. A vilg modell (world model): annak valsznsge, hogy egy llts elfordul a vilgban.
2. A mentlis modell (mental model): annak valsznsge, hogy a beszl ltrehozza azt a szndkt, hogy
egy adott tnyt a hallgatval kzljn, feltve, hogy az bekvetkezik. Ez annak modelljt kombinlja, amit a
beszl hisz azzal, amit a beszl hisz arrl, amit a hallgat hisz s gy tovbb.
3. A nyelvi modell (language model): annak valsznsge, hogy szavak egy bizonyos fzre lesz kivlasztva,
azt felttelezve, hogy a beszlben ltezik egy adott tny elmondsnak szndka. A fejezetben ismertetett
CFG- s DCG-modellek a valsznsgre logikai (igaz/hamis) modellt hasznlnak: egy fzrnek vagy lehet
egy adott rtelmezse, vagy nem. A kvetkez fejezetben a CFG olyan valsznsgi vltozatt ltjuk majd,
amely a tbbrtelmsg feloldsra egy jobban informlt nyelvi modellt kszt.
4. Az akusztikai modell (acoustic model): annak valsznsge, hogy hangok egy adott sorozata keletkezik
azt feltve, hogy a beszl szavak egy adott sorozatt vlasztotta. A beszdfelismerst a 15.6. alfejezet
trgyalta.
7. Szvegrts
Egy szveg (discourse) a nyelv tetszleges karaktersorozata tipikusan olyan, amelyik hosszabb, mint egy
mondat. A jegyzetek, a regnyek, az idjrs-jelentsek s a prbeszdek mind szvegek. Eddig teljesen
figyelmen kvl hagytuk a szvegek problmit, a nyelv nll mondatokra bontst helyeztk eltrbe,
melyeket in vitro tanulmnyozhattunk. Ez a fejezet a mondatokat termszetes krnyezetkben tanulmnyozza.
Kt rszproblmt fogunk vizsglni: az utalsfeloldst s a koherencit.
7.1. Utalsfelolds
725
Kommunikci
Az utalsfelolds (reference resolution) egy olyan nvms vagy hatrozott fnvi kifejezs rtelmezse, amely
a vilg egy objektumra utal.16 A felolds a vilgrl szl tudson s a szveg korbbi rszein alapszik.
Vizsgljuk a kvetkez szakaszt:
John flagged down the waiter. He ordered a ham sandwich.
Annak megrtshez, hogy a he a msodik mondatban Johnra utal, meg kellett rtennk, hogy az els mondat
kt szemlyt emlt, valamint azt, hogy John jtssza a vendg szerept, s ezrt valsznleg rendel, mg a pincr
nem. ltalban az utalsfelolds egy hivatkozott kivlasztsa a jelltek listjrl, de nha magban foglalja j
jelltek ltrehozst is. Vegyk pldul a kvetkez mondatot:
After John proposed to Marsha, they found a preacher and got married. For the honeymoon, they went to
Hawaii. (Miutn John megkrte Marsht, talltak egy papot, s sszehzasodtak. Hawaiira mentek nsztra.)
Itt a honeymoon hatrozott fnvi kifejezs egy olyan dologra utal, amire csak implicit mdon utal a
married ige. A they nvms egy olyan csoportra utal, amit explicit mdon nem emltettek eltte: John s
Marsha (de nem a pap).
A legjobb hivatkozott dolog kivlasztsa egy olyan tbbrtelmsg feloldsi folyamat, amely tbbfle
szintaktikai, szemantikai s pragmatikus rtelmezsi informci kombinlsn alapszik. Bizonyos
nyomravezetk knyszerek formjban adottak. Pldul a nvmsoknak nemben s szmossgban egyeznik
kell a hivatkozottakkal: a he pldul utalhat Johnra, de nem Marshra; a they utalhat egy csoportra, de nem
egyetlen szemlyre. A nvmsoknak a reflexivits szintaktikai knyszereinek is meg kell felelnik. Pldul a
he saw him in the mirror mondatban a kt nvmsnak kt klnbz emberre kell vonatkoznia, mg a he saw
himself kifejezsben ugyanarra az emberre kell utalniuk. Vannak a szemantikai konzisztencira vonatkoz
knyszerek is. A he ate it kifejezsben a he nvmsnak olyan dologra kell utalnia, ami eszik, mg az it
olyanra, amit megehetnek.
Bizonyos vezrfonalak olyan preferencik, amik nem llnak mindig fenn. Pldul amikor egyms utni
mondatoknak prhuzamos struktrja van, olyankor elnys, ha a nvmsi utalsok kvetik ezt a struktrt. gy
a
Marsha flew to San Francisco from New York. John flew there from Boston.
mondatokban azt preferljuk, hogy a there San Franciscra utal, mivel az ugyanazt a szintaktikai szerepet tlti
be. Prhuzamos struktra hinyban az alanyt preferljuk a trgy ellenben. gy a
Marsha gave Sally the homework assignment. Then she left.
szvegben Marsha az els mondat alanya, gy a she preferlt elzmnye. Egy msik preferencia annak az
entitsnak az eltrbe helyezse, amelynek a trgyalsa a legnyilvnvalbb. Ha a kvetkez mondatprt
nllan vizsgljuk
Dana dropped the cup on the plate. It broke.
akkor felmerl egy problma: nem vilgos, hogy az it a pohrra vagy a tnyrra utal. Azonban egy nagyobb
kontextusban a tbbrtelmsg felolddik:
Dana was quite fond of the blue cup. The cup had been a present from a close friend. Unfortunately, one day
while setting the table, Dana dropped the cup on the plate. It broke.
Itt a pohr van a figyelem kzppontjban, ezrt ez a preferlt hivatkozott dolog.
Sokfle utalsfelold algoritmust talltak ki. Az egyik els (Hobbs, 1978) figyelemre mlt, mivel egy olyan
mrtk statisztikai ellenrzst vgeztek rajta, ami abban az idben szokatlan volt. Hrom klnbz
szvegfajtt hasznlva Hobbs 92%-os pontossgot mutatott ki. A mdszer azt felttelezte, hogy egy elemz egy
helyes elemzst ksztett, ami azonban nem llt rendelkezsre, ezrt Hobbs kzzel ksztette el az elemzseket.
A Hobbs algoritmus keressknt mkdik: az aktulis mondattl indulva visszafel keres a mondatokban. Ez a
technika biztostja, hogy a legutbbi jellteket vizsglja elszr. Egy mondaton bell szlessgi keresst vgez,
A nyelvszetben az utalst egy olyan dologra, ami mr szerepelt, anafornak (anaphoric reference) nevezzk. Az utalst egy ksbb
szerepl dologra katafornak (cataphoric reference) nevezzk, mint pldul a he nvms a When he won his first tournament, Tiger
was 20.
16
726
Kommunikci
balrl jobbra haladva. Ez azt biztostja, hogy az alanyokat a trgyak eltt vizsglja. Az algoritmus kivlasztja az
els jelltet, amely a most vzolt knyszereknek eleget tesz.
7.2. Egy koherens szveg struktrja

Nyissa fel ezt a knyvet tzszer vletlenszeren, s msolja le az els mondatot minden oldalrl. Az eredmny
szksgszeren inkoherens lesz. Hasonlkppen, ha vesznk egy koherens, tz mondatbl ll szveget, majd
permutljuk a mondatokat, az eredmny inkoherens lesz. Ez azt demonstrlja, hogy a termszetes nyelv
szvegek mondatai nagyon klnbznek a logika lltsaitl. A logikban, brmilyen sorrendben is KZLJK
az A, B, s C lltsokat egy tudsbzissal, az A B C konjukcit kapjuk. Termszetes nyelvben a mondatok
sorrendje szmt; vegyk pldul a Go two blocks. Turn right s a Turn right. Go two blocks szvegek
kztti klnbsget.
A szvegek mondatok feletti struktrval rendelkeznek. Ezt a struktrt a szveg kvetkez nyelvtannak
segtsgvel vizsglhatjuk meg:
Segment(x) S(x)
Segment(CoherenceRelation(x, y)) Segment(x) Segment(y)
E nyelvtan szerint a szveg szegmensekbl ll, ahol minden szegmens vagy egy mondat, vagy mondatok egy
csoportja, s a szegmenseket koherenciarelcik (coherence relations) ktik ssze. A Go two blocks. Turn
right szvegben a koherenciarelci az, hogy az els mondat engedlyezi a msodikat: a hallgatnak akkor kell
jobbra fordulnia, miutn ment kt hztmbnyit. Klnbz kutatk koherenciarelcik klnbz kszlett
javasoltk; a 22.21. bra felsorol egy reprezentatv halmazt. Most vizsgljuk meg a kvetkez trtnetet:
1. A funny thing happened yesterday.
2. John went to a fancy restaurant.
3. He ordered the duck.
4. The bill came to $50.
5. John got a shock when he realized he had no money.
6. He had left his wallet at home.
7. The waiter said it was all right to pay later.
8. He was very embarrassed by his forgetfulness.
Itt, az (1) mondat az Evaluation relciban ll a szveg htralev rszvel; (1) a beszl megjegyzse a
szveghez. A (2) mondat engedlyezi a (3)-at, s a (23) pr egytt
okozza (4)-et, azzal az implicit kztes llapottal, hogy Jnos megette a kacst. Ezek utn (24) szolgl a szveg
htralev rsznek alapjul. A (6) mondat az (5) magyarzata, s (56) engedlyezi (7)-et. Vegyk szre, hogy
ez egy Enable, nem Cause, mivel a pincrnek lehetett volna ms reakcija is. Az (57) egytt okozza (8)-at. A
22.13. feladat arra kri majd, hogy rajzolja fel e szveg elemzsi fjt.
22.21. bra - Koherenciarelcik listja (Hobbs, 1990) alapjn. Mindegyik relci kt,
egymst kvet szvegrszlet, S1 s S2 kztt ll fenn.
727
Kommunikci
A koherenciarelcik szolglnak egy szveg sszektsre. Vezetik a beszlt annak eldntsben, hogy mit
mondjon s mit tekintsen magtl rtetdnek, s segtik a hallgatt a beszl szndknak megrtsben. A
koherenciarelcik a mondatok tbbrtelmsgnek szrjeknt szolglhatnak: nllan a mondatok lehetnek
tbbrtelmek, de ezen tbbrtelm rtelmezsek tbbsge nem illeszthet ssze egy koherens szvegg.
Eddig az utalsfeloldst s a szvegstruktrt kln vizsgltuk. Azonban a kett valjban sszefgg. Grosz s
Sidner (1986) elmlete pldul azzal foglalkozik, hogy a beszl s hallgat figyelme mire koncentrl a szveg
sorn. Elmletk tartalmaz egy vermet, amely fkusztereket (focus spaces) tartalmaz. Bizonyos
megnyilvnulsok a fkusz elmozdulst okozzk egy elem verembe helyezsvel vagy kivtelvel. Pldul az
ttermi trtnetben a John went to a fancy restaurant mondat j fkuszt helyez a verem tetejre. Ezen a
fkuszon bell a beszl egy hatrozott NP-t hasznlhat a the waiter-re trtn utalsra (az a waiter
ltalnos NP helyett). Ha a trtnet folytatdna egy John went home mondattal, akkor a fkuszteret kivenn a
verem tetejrl, s a szveg nem utalhatna tovbb a pincrre a the waiter vagy a he kifejezsekkel.
8. A nyelvtan indukcis tanulsa

A nyelvtan indukcis tanulsa (grammar induction) annak feladata, hogy adatokbl nyelvtant tanuljunk.
Nyilvnval, hogy meg kell ksrelni, hiszen bebizonyosodott, hogy nagyon nehz egy nyelvtant kzzel
elkszteni, s az interneten mintaknt hasznlhat kijelentsek millirdjai llnak ingyenesen rendelkezsre. Ez
egy nehz feladat, mivel a lehetsges nyelvtanok tere vgtelen, s azrt is, mivel annak ellenrzse, hogy egy
adott nyelvtan generlja-e a mondatok egy adott halmazt, szmtsignyes feladat.
Egy rdekes modell a SEQUITUR-rendszer (Nevill-Manning s Witten, 1997). Nincs szksge ms bemenetre,
csak egy szvegre (amit nem szksges elzetesen mondatokra bontani). Egy nagyon specializlt formtum
nyelvtant llt el: egy olyan nyelvtant, amely csak egy karakterfzrt generl, nevezetesen az eredeti szveget.
Mskpp tekintve a SEQUITUR pp csak arra elegend nyelvtant tanul, hogy a szveget elemezze. me, itt van az
a zrjelezs, amit egy nagyobb, hreket tartalmaz szvegben lev mondatra felfedezett:
[Most Labour] [sentiment [[would still] [favor the] abolition]] [[of [the House]] [of
Lords]]
Helyesen vlasztott ki olyan sszetevket, mint pldul az of the House of Lords PP, br a tradicionlis
elemzssel ellenttesen dolgozik akkor pldul, amikor a the-t a megelz igvel s nem a kvet fnvvel
csoportostja.
A SEQUITUR azon az tleten alapszik, hogy egy j nyelvtan egyben tmr is. A kvetkez kt knyszer betartsa
a legfontosabb: (1) Egymst kvet szimblumok egyetlen prja sem szerepelhet egynl tbbszr a
nyelvtanban. Ha az A B szimblumpr tbb szably jobb oldaln is szerepel, akkor ki kell cserlnnk a prt egy
j, nem zr szimblummal, amit C-nek neveznk, s egy j szablyt kell bevezetnnk, miszerint C A B. (2)
728
Kommunikci
Minden szablyt legalbb ktszer kell hasznlni. Ha egy C nem zr, csak egyszer szerepel a nyelvtanban, akkor
trlnnk kell a C-re vonatkoz szablyt, s fel kell cserlnnk egyetlen elfordulst a szably jobb oldalval.
Ezt a kt knyszert egy moh keress alkalmazza, amely a berkez szveget balrl jobbra vgignzi, menet
kzben inkrementlisan pti a nyelvtant, s alkalmazza a knyszereket, amint lehetsges. A 22.22. bra mutatja
az algoritmus mkdst az abcdbcabcd szvegen. Az algoritmus egy optimlisan tmr nyelvtant hatroz
meg a szveghez.
A kvetkez fejezetben tovbbi nyelvtant tanul algoritmusokat is ltni fogunk, amelyek valsznsgi alap,
krnyezetfggetlen nyelvtanokkal mkdnek. Most azonban egy olyan nyelvtan tanulsnak problmjt
vizsgljuk meg, amelyet szemantikval terjesztettnk ki. Mivel egy kiterjesztett nyelvtan egyben Horn-klz
logikai program is, ezrt az induktv logikai programozs techniki megfelelk lesznek. A CHILL (Zelle s
Mooney, 1996) egy induktv logikai programozs (ILP), amely pldkbl megtanul egy nyelvtant s egy arra
specializlt elemzt. A clterlet termszetes nyelv adatbzis-lekrdezsek. A tant pldk szfzrek, s a
nekik megfelel lekrdezsek prjait tartalmazzk pldul:
What is the capital of the state with the largest population?
Answer(c, Capital(s, c) Largest(p, State(s) Population(s, p)))
A CHILL feladata, hogy megtanuljon egy Parse(words, query) prediktumot, amely konzisztens a pldkkal, s
remlhetleg ms pldkra is jl ltalnost. Az ILP kzvetlen alkalmazsa ezen prediktum megtanulsra
gyenge teljestmnyt hoz: a kikvetkeztetett elemz csak krlbell 20%-os pontossg. Szerencsre az ILP
tanul algoritmusok fejleszthetk tuds bevitelvel. Ebben az esetben a Parse prediktum nagy rszt logikai
programknt definiltk, s a CHILL feladatt a vezrl szablyok kikvetkeztetsre redukltk, amelyek
segtik az elemzt a klnbz elemzsek kztti vlasztsban. Ezzel a hozzadott httrtudssal a CHILL 70
85% kztti pontossgot r el klnbz adatbzis-lekrdezsi feladatokon.
22.22. bra - Az abcdbcabcd bemeneti szveget elemz nyelvtant tartalmaz Sequiturrendszer futsi lpsei. Egy S-re vonatkoz szablybl indulunk ki, s ezen szably
vghez sorban minden egyes szimblumot hozzadunk. Miutn a hatodik szimblumot
is hozzadtuk, megkapjuk egy ismtld pr els elfordulst: bc. Ezrt a bc mindkt
elfordulst lecserljk egy j nem zrra, A-ra, s egy j szablyt vesznk fel: A
bc. Miutn hrom jabb szimblumot hozzraktunk a bemenethez, a kilencedik a bc
egy jabb ismtlst eredmnyezi, gy jra A-val helyettestjk. Ez az aA kt
elfordulshoz vezet, ezrt egy j nem zrval, B-vel helyettestjk. Miutn a tizedik,
utols szimblumot is hozzraktuk, Bd kt elfordulst kapjuk, ezrt lecserljk ket
egy j nem zrval, C-vel. De B immr csak egyszer szerepel, a C szably jobb oldaln,
ezrt B-t a neki megfelel bvtssel, aA-val cserljk le.
729
Kommunikci
9. sszefoglals
A termszetes nyelv megrtse az MI egyik legfontosabb rszterlete. tleteket mert a filozfibl s a
nyelvszetbl, valamint a logikai programozs, valsznsgi tudsreprezentci s a kvetkeztets terletnek
technikibl is. Ms MI-terletektl eltr mdon a termszetes nyelv megrtse a tnyleges emberi viselkeds
empirikus vizsglatt ignyli amely komplexnek s rdekesnek bizonyul.
Az gensek jelzseket kldenek egymsnak bizonyos clok elrse rdekben: informlni, figyelmeztetni,
segtsget szerezni, tudst megosztani vagy meggrni valamit. A jelzsek ily mdon val kldst
szlsaktusnak (speech act) nevezzk. Vgs soron minden szlsaktus ksrlet arra, hogy egy msik gens
elhiggyen vagy megtegyen valamit.
A nyelv megllapodson alapul jelzsekbl (signs) ll, melyek jelentst kzvettenek. Sok llat hasznl ilyen
rtelemben jelzseket. Az ember tnik az egyetlen llatnak, aki nyelvtant (grammar) hasznl strukturlt
zenetek vgtelen szm variciinak ellltsra.
A kommunikci hrom lpst ignyel a beszltl, a szndkot egy elkpzels tadsra, a szavak mentlis
ellltst s a szavak fizikai szintzist. Ezek utn a hallgatnak ngy lpst kell vgrehajtania: szlels,
analzis, tbbrtelmsg feloldsa s a jelents beptse. Minden nyelvhasznlat begyazott (situated)
abban az rtelemben, hogy a megnyilatkozsok jelentse fgghet attl a szitucibl, amiben elllnak.
A formlis nyelvszet s a kifejezsstruktra (phrase structure) nyelvtanok (klnsen a
krnyezetfggetlen nyelvtan (context-free grammar)) hasznos eszkzk a termszetes nyelv egyes
aspektusainak kezelsre.
Krnyezetfggetlen nyelv mondatai O(n3) idben elemezhetk a diagramelemz (chart parser)
segtsgvel.
Kzenfekv egy nyelvtan kiterjesztse (augment) annak rdekben, hogy olyan problmkat kezeljnk, mint
az alanyige egyeztetse vagy a nvmsi esetek. A definit klz nyelvtan (definite clause grammar, DCG)
egy olyan formalizmus, amely lehetv teszi a kiterjesztseket. A DCG segtsgvel az elemzs s
szemantikai rtelmezs (st mg a generls is) logikai kvetkeztets segtsgvel elvgezhet.
A szemantikus rtelmezs (semantic interpretation) szintn kezelhet egy kiterjesztett nyelvtannal. Egy
kvzilogikai forma j kzvett lehet a szintaktikai fk s a szemantika kztt.
730
Kommunikci
A tbbrtelmsg (ambiguity) nagyon fontos problma a termszetes nyelv megrtsben; a mondatok

tbbsgnek tbb lehetsges rtelmezse van, de ltalban csak egy megfelel. A tbbrtelmsg feloldsa a
vilgrl, az adott szitucirl s a hasznlt nyelvrl szl tudson alapszik.
A legtbb nyelv tbb mondat kontextusban ltezik, nem csak egyben. A szvegrts (discourse) a
kapcsold szvegek vizsglata. Lttuk, hogyan oldjunk fel mondatok kztti nvmsi utalsokat, s a
mondatok hogyan kapcsoldnak koherens szegmensekk.
A nyelvtan indukcis (grammar induction) tanulsa pldkbl tud nyelvtant tanulni, br vannak hatrai
annak, hogy a nyelvtan milyen jl ltalnost.

A jelek s szimblumok mint nyelvi elemek tanulmnyozst John Locke (1690) jeltudomnynak (semiotics)
nevezte, br a 20. szzadig nem mveltk (Peirce, 1902; De Saussure, 1993). A legutbbi ttekint munkk
kztt van Eco (Eco, 1979) s Cobley (Cobley, 1997) mve.
A nyelv mint cselekvs tlete a 20. szzadi nyelvszeti belltottsg filozfibl ered (Wittgenstein, 1953;
Grice, 1957; Austin, 1962), leginkbb a Speech Acts c. knyvbl (Searle, 1969). A szlsaktus tletnek
elfutra Protagorasz ngyfle mondatkategrija volt: ima, krds, vlasz s tlet (kb. i. e. 430-bl). A
szlsaktusok tervalap modelljt elszr Cohen s Perrault (Cohen s Perrault, 1979) javasolta. A nyelv
cselekvshez kapcsolst tervfelismers segtsgvel trtnetek megrtshez Wilensky tanulmnyozta
(Wilensky, 1983). Cohen, Morgan s Pollack (Cohen, Morgan s Pollack, 1990) gyjt ssze jabb munkkat e
terleten.
A szemantikus hlkhoz hasonlan a krnyezetfggetlen nyelvtanok (amelyek kifejezsstruktra
nyelvtanokknt is ismertek) a ssztra szanszkrit nyelvet tanulmnyoz si indiai nyelvszek (klnsen Pnini,
kb. i. e. 350) ltal hasznlt technika feleleventsei (Ingerman, 1967). A modern idkben Noam Chomsky
fedezte fel jra ket az angol szintaxis elemzsre (Chomsky, 1956), s tle fggetlenl John Backus az Algol58 szintaxis analzisre hasznlta. Naur kiterjesztette Backus jellsrendszert (Naur, 1963), ma pedig hozz
rendelik az N bett a BNF-ben, ami eredetileg a Backus Norml Forma volt (Backus Normal Form)
(Backus, 1996). Knuth egyfajta kiterjesztett nyelvtant definilt, amelyet attribtumnyelvtannak (attribute
grammar) neveznk, s programozsi nyelvek esetn hasznos (Knuth, 1968). A definit klz nyelvtanokat
Colmerauer vezette be (Colmerauer, 1975), majd Pereira s Warren fejlesztette tovbb s npszerstette
(Pereira s Warren, 1980). A Prolog programozsi nyelvet Alain Colmerauer tallta ki, elssorban a francia
nyelv elemzsnek problmjra. Colmerauer voltakppen kidolgozott egy metamorfzis-nyelvtannak
(metamorphosis grammar) nevezett formalizmust, amely tovbbment a definit klzoknl, de a DCG hamarosan
kvette.
Szmos ksrlet volt termszetes nyelvek formlis nyelvtannak lersra, mind a tiszta, mind a szmtgpes
nyelvszetben. A gpek szmra kszlt nyelvtanok kztt van a New York University Linguistic String
projektje (Sager, 1981) s a University of Pennsylvania XTAG projektje (Doran s trsai, 1994). A modern
DCG-rendszerek j pldja a Core Language Engine (Alshawi, 1992). Tbb tfog, de nem formlis nyelvtan
ltezik az angol nyelvrl (Jespersen, 1965; Quirk s trsai, 1985; McCawley, 1998; Huddleston s Pullum,
2002). A nyelvszetrl szl j jegyzetek kztt van a (Sag s Wasow, 1999) bevezetse a szintaxisba, valamint
a (Chierchia s McConnell-Ginet, 1990; Heim s Kratzer, 1998) szemantikrl szl jegyzetek. McCawley
nyelvszek szmra szl anyaga a logikra koncentrl (McCawley, 1993).
A nyolcvanas vek kzeptl ltez trend szerint egyre tbb informcit tesznek a szkincsbe s kevesebbet a
nyelvtanba. A lexikai-funkcionlis nyelvtan (lexical-functional grammar), avagy LFG (Bresnan, 1982) volt az
els jelents nyelvtani formalizmus, amihez nagy szkincset gyjtttek. Ha a szlssgig fokozzuk a
lexikalizlst, akkor a kategorikus nyelvtant (categorial grammar) kapjuk, amelyben lehet, hogy csak kt
nyelvtani szably van, vagy a fggsgi nyelvtant (dependency grammar) (Melcuk s Polguere, 1988),
amelyben nincsenek kifejezsek/frzisok, csak szavak. Sleator s Temperley ler egy fggsgi nyelvtant
hasznl npszer elemzt (Sleator s Temperley, 1993). A TAG, avagy Tree-Adjoining Grammar (Joshi, 1985)
nem szigoran lexiklis, de n a npszersge lexikalizlt alakban is (Schabes s trsai, 1988). A Wordnet
(Fellbaum, 2000) egy krlbell 100 000 szt s kifejezst tartalmaz szabadon elrhet sztr, melyet a beszd
rszei szerint kategorizltak, s olyan szemantikai relcikkal egsztettek ki, mint pldul a szinonima,
antonima s rsze.
731
Kommunikci
Az els gpestett elemz algoritmusokat Yngve mutatta be (Yngve, 1955). Hatkony algoritmusokat a hatvanas
vek vgn fejlesztettek ki, nhny kisebb jtssal azta (Kasami, 1965; Younger, 1967; Graham s trsai,
1980). A diagramelemznk Early rendszerhez ll a legkzelebb (Early, 1970). Egy j sszefoglal Aho s
Ullman elemzsrl s fordtsrl szl tanulmnyban tallhat (Aho s Ullman, 1972). Maxwell s Kaplan
mutatja meg, hogy a kiterjesztett diagramelemz algoritmus hogyan tehet hatkonny az tlagos esetekben
(Maxwell s Kaplan, 1993). Church s Patil foglalkozik a szintaktikai tbbrtelmsg feloldsval (Church s
Patil, 1982).
A termszetes nyelvek formlis szemantikai rtelmezse a filozfibl s a formlis logikbl ered, s
klnsen szorosan kapcsoldik Alfred Tarskinak a formlis nyelvek szemantikjrl szl munkjhoz
(Tarski, 1935). Bar-Hillel volt az els, aki a pragmatikai elemzs problmjt ttekintette, s azt javasolta, hogy
formlis logikval kezeljk. Pldul bevezette C. S. Pierce referencilis index (indexical) fogalmt a
nyelvszetben (Bar-Hillel, 1954). Richard Montague esszje, az English as a formal language a nyelv logikai
analzisnek egyfajta manifesztuma (Montague, 1970), azonban Dowty s trsainak knyve (Dowty s trsai,
1991), valamint Lewis cikke (Lewis, 1972) sokkal olvasmnyosabb. Thomason szerkesztette Montague
munkinak teljes kollekcijt (Thomason, 1974). A mestersges intelligenciban McAllester s Givan munkja
folytatja a montague-i hagyomnyt sok j technikai rszlet megvilgtsval (McAllester s Givan, 1992).
Egy kzbls, avagy kvzilogikai forma tlete a kvantorok rvnyessgi krhez hasonl problmk kezelsre
Woodsig nylik vissza (Woods, 1978), s sok jelenlegi rendszerben is megtallhat (Alshawi, 1992; Hwang s
Schubert, 1993).
Az els valdi feladatot megold NLP-rendszer valsznleg a BASEBALL krdsvlaszol rendszer volt (Green
s trsai, 1961), amely baseball-statisztikk adatbzisval kapcsolatos krdseket kezelt. Nem sokkal utna
kvetkezett Woods LUNAR rendszere, amely az Apoll program ltal visszahozott kvekkel kapcsolatos
krdseket vlaszolt meg (Woods, 1973). Robert Schank s hallgati tbb programot is ksztettek (Schank s
Abelson, 1977; Wilensky, 1978; Schank s Riesbeck, 1981; Dyer, 1983), amelyek mindegyiknek a nyelv
megrtse volt a feladata. A hangsly azonban kevsb volt magn a nyelven, sokkal inkbb a reprezentcin s
kvetkeztetsen. A problmk kztt volt a sztereotip szitucik reprezentlsa (Cullingford, 1981), az emberi
memriaszervezs lersa (Rieger, 1976; Kolodner, 1983), valamint tervek s clok megrtse (Wilensky,
1983).
A termszetes nyelv generlst az tvenes vekben, a gpi fordts legels napjaitl kezdve figyelembe vettk,
de a hetvenes vekig nem merlt fel egynyelv problmaknt. Simmons s Slocum (Simmons s Slocum, 1972),
valamint Goldman (Goldman, 1975) munkja reprezentatv. A PENMAN (Bateman s trsai, 1989) volt az els
teljes generl rendszer, amely a Szisztematikus Nyelvtanra (Systematic Grammar) (Kasper, 1988) plt. A
kilencvenes vekben kt fontos szabadon elrhet generl rendszer vlt elrhetv, a KPML (Bateman, 1997)
s a FUF (Elhadad, 1993). A generlsrl szl fontos knyvek kztt szerepel (McKeown, 1985; Hovy, 1988;
Patten, 1988; Reiter s Dale, 2000).
A tbbrtelmsg feloldsval foglalkoz egyik legkorbbi munka Wilks elmlete a preferenciaszemantikrl
(preference semantics) (Wilks, 1975), amelyik azokat az rtelmezseket prblta megtallni, amik
minimalizljk a szemantikai anomlik szmt. Hirst egy olyan hasonl cl rendszert r le, amelyik kzelebb
van a fejezetben ismertetett kompozcis szemantikhoz (Hirst, 1987). Hobbs s trsai a szintaktikai s
szemantikai reprezentci minsgt mr kvantitatv keretrendszert rnak le (Hobbs s trsai, 1993). Azta a
Bayes-hlk hasznlata vlt elterjedtebb (Charniak s Goldman, 1992; Wu, 1993). A nyelvszetben az
optimalits elmlete (Kager, 1999) a puha knyszerek nyelvtanba ptsn alapszik, amely termszetes slyt ad
az rtelmezseknek ahelyett, hogy a nyelvtan az sszes lehetsget egyforma sllyal generln. Norvig trgyalja
azokat a problmkat, amelyek egy maximlisan valszn rtelmezs helyett tbb prhuzamos rtelmezs
figyelembevtelbl addnak (Norvig, 1988). Az irodalmi kritika nem egyrtelm a tekintetben, hogy a
tbbrtelmsg megoldand problma vagy dvzlend dolog (Empson, 1953; Hobbs, 1990).
Nunberg a metonmia (metonymy) formlis modelljt vzolja (Nunberg, 1979). Lakoff s Johnson az angol
nyelv gyakori metaforit katalogizlja s magval ragad mdon elemzi (Lakoff s Johnson, 1980). Ortony
metaforrl szl cikkgyjtemnyt mutat be (Ortony, 1979); Martin a metafora rtelmezsnek szmtgpes
megkzeltst adja meg (Martin, 1990).
Az utalsfelolds ltalunk bemutatott kezelse a (Hobbs 1978)-at kveti. A (Lappin s Leass, 1994) ltal
bemutatott sszetettebb megolds egy kvantitatv pontozsi mdszeren alapszik. jabb munkk (Kehler, 1997;
Ge s trsai, 1998) gpi tanulst hasznlnak a kvantitatv paramterek hangolsra. Az utalsfeloldsrl szl
kt kitn ttekints Hirst s Mitkov knyvei (Hirst, 1981; Mitkov, 2002).
732
Kommunikci
1758-ban David Hume Enquiry Concerning the Human Understanding c. mve amellett rvelt, hogy a nyelvi
szvegeket hrom, az elgondolsok kztti kapcsolatokat ler elv kti/fogja ssze, nevezetesen a Hasonlsg,
az id- vagy trbeli sszefggs s az Ok vagy Okozat. gy kezddtt a koherenciarelcik meghatrozsnak
hossz trtnete. Hobbs (Hobbs, 1990) adja meg neknk a fejezetben hasznlt halmazt; Mann s Thompson
(Mann s Thompson, 1983) egy jobban kifejtett halmazt nyjt, amely magban foglalja a kvetkezket:
megolds-sszetartozs, bizonytk, igazols, motivci, kvetkeztets, sorozat, engedlyezs, kidolgozs,
jrafogalmazs, felttel, krlmny, ok, engedmny, httr, valamint tzis-antitzis. Ez a modell fejldtt a
retorikai struktra elmlett (rhetorical structure theory, RST), amely valsznleg napjaink legkiemelkedbb
elmlete (Mann s Thompson, 1988). Ez a fejezet tvesz egyes pldkat (Jurafsky s Martin, 2000) Andrew
Kehler ltal rt fejezetbl.
Grosz s Sidner bemutat egy fkuszeltolson alapul szvegkoherencia-elmletet (Grosz s Sidner, 1986), s a
(Grosz s trsai, 1995) egy kzppontba lltson alapul hasonl elmletet knl. Joshi, Webber s Sag fontos
korai munkkat gyjt ssze a szvegrtsrl (Joshi, Webber s Sag, 1981). Webber bemutatja olyan szintaxiss szvegknyszerek egymssal kapcsolatban ll modelljt, amely knyszerek a szveg egy adott pontjn
llthat dolgokra vonatkoznak (Webber, 1983), tovbb bemutatja az igeidk s a szveg klcsnhatsi
mdjnak modelljt (Webber, 1988).
Az els fontos eredmny a nyelvtan indukcis (grammar induction) tanulsnak terletn egy negatv
eredmny volt: Gold (Gold, 1967) megmutatta, hogy nem lehetsges megbzhatan egy helyes
krnyezetfggetlen nyelvtan megtanulsa annak szvegei alapjn. Az tlet lnyege szerint ha adott egy s1, s2,
sn fzrhalmaz, akkor a helyes nyelvtan lehet a mindent magba foglal (S word*), vagy a bemenet msolata,
az (S s1 | s2 | | sn), vagy brmi a kett kztt. Jeles nyelvszek, mint pldul Chomsky (Chomsky, 1957;
1980) s Pinker (Pinker, 1989; 2000) felhasznltk Gold eredmnyeit annak megmutatsra, hogy lennie kell
egy rkltt univerzlis nyelvtannak (universal grammar), amellyel minden gyermek szletsnl fogva
rendelkezik. Az gynevezett Ingerszegnysg (Poverty of the Stimulus) rvels szerint a gyerekeknek nincs ms
nyelvi pldjuk, mint pozitv: szleik s trsaik nyelvk legtbbszr pontos pldit lltjk el, s igen ritkn
javtanak ki hibkat. Ezrt, mivel Gold bebizonytotta, hogy pozitv pldkbl nem lehet CFG-t tanulni, a
gyerekeknek mr tudniuk kell a nyelvtant, s pusztn ezen rkltt nyelvtan paramtereit lltjk, illetve a
szkszletet tanuljk. Br ez az rvels mg befolyssal br a Chomskyt kvet nyelvszek krben, egyes
nyelvszek (Pullum, 1996; Elman s trsai, 1997) s a legtbb szmtstudomnnyal foglalkoz elvetette. Igen
hamar, mr 1969-ben Horning megmutatta, hogy meg lehet tanulni PAC rtelemben egy valsznsgi
krnyezetfggetlen nyelvtant. Azta szmos meggyz, kizrlag pozitv pldkbl tanul empirikus
demonstrci jelent meg, mint pldul Mooney, illetve Muggleton s De Raedt ILP-munki (Mooney, 1999;
Muggleton s De Raedt, 1994), valamint Schtze s de Marcken emlkezetes PhD-rtekezsei (Schtze, 1995;
de Marcken, 1996). Ms nyelvtani formalizmusok, mint pldul a regulris nyelvek (Oncina s Garcia, 1992;
Denis, 2001), regulris fa nyelvek (Carrasco s trsai, 1998), valamint a vges automatk (Parekh s Honavar,
2001) tanulsa is lehetsges.
A SEQUITUR-rendszert Nevill-Manning s Witten ksztette (Nevill-Manning s Witten, 1997). rdekes, hogy
k, valamint de Marcken is megjegyezte, hogy nyelvtant kikvetkeztet megoldsaik tmrtsre is jl
hasznlhatk. Ez sszhangban van a minimlis ler hosszsg kdolsnak elvvel: egy j nyelvtan olyan,
amely minimalizl kt mretet: a nyelvtan s a szvegek elemzsi fjnak nagysgt.
A nyelv tanulsra szolgl induktv logikai programozsi munkk kztt van a CHILL rendszer (Zelle s
Mooney, 1996), valamint Mooney s Califf programja (Mooney s Califf, 1995), amely jobban tanult igk mlt
idej alakjra vonatkoz szablyokat, mint a korbbi neurlis hlk s a dntsi fa rendszerek. Cussens s
Deroski tbb cikkgyjtemnyt is szerkesztett, amelyek a nyelvtanulsrl szltak a logikban (Cussens s
Dzeroski, 2000).
Az Association for Computational Linguistics (ACL) rendszeresen rendez konferencikat, s kiadja a
Computational Linguistics folyiratot. Ezenkvl van egy nemzetkzi konferencia a tmban, az International
Conference on Computational Linguistics (COLING). A Readings in Natural Language Processing (Grosz s
trsai, 1986) a terlet sok fontos korai cikkt tartalmaz antolgia. A (Dale s trsai, 2000) az NLP-rendszerek
ptsre szolgl gyakorlati eszkzkre helyezi a hangslyt. Jurafsky s Martin jegyzete alapos bevezett nyjt
a terlethez (Jurafsky s Martin, 2000). Az (Allen, 1995) egy kicsit rgebbi munka. Pereira s Sheiber, valamint
Covington Prolog-implementcikon alapul tmr ttekintst ad (Pereira s Sheiber, 1987; Covington, 1994).
Az Encyclopedia of AI-ben sok hasznos cikk tallhat a terletrl; kiemelend a Computational Linguistics s
a Natural Language Understanding.
733
Kommunikci
9.2. Feladatok
22.1.
Olvassa el az albbi szveget egyszer, s prbljon meg amennyit csak lehet megjegyezni belle. Ksbb lesz
egy teszt.
Az eljrs valjban igen egyszer. Elszr klnbz csoportokba rendezi a dolgokat. Termszetesen egy
halom elegend lehet attl fggen, hogy mennyi teend van. Ha valahova mshova kell mennie a felszerels
hinya miatt, akkor az a kvetkez lps, klnben mr nagyjbl elkszlt. Fontos, hogy ne vigye tlzsba a
dolgot. Ez azt jelenti, hogy jobb egyszerre kevesebbel foglalkozni, mint tbbel. Rvid tvon ez nem tnhet
fontosnak, de knnyen jelentkezhetnek komplikcik. A hiba is kltsges. Els rnzsre a teljes eljrs
bonyolultnak tnik. Azonban hamarosan az let megszokott dolgv vlik. Nehz a feladat szksgessgnek
brmilyen elmlst is elre ltni, de sosem lehet tudni. Miutn az eljrs befejezdtt, ismt klnbz
csoportokba kell rendezni az anyagokat. Ezek utn a megfelel helykre pakolhatk a dolgok. Vgs soron jra
hasznlni fogjk ket, s a teljes ciklust meg kell majd ismtelni. Mindazonltal, ez az let velejrja.
22.2.
rjon egy nyelvtant a DCG-jellsrendszerrel, amely ugyanolyan, mint az 1, azzal a kivtellel, hogy
kiknyszerti a mondat alanya s igje kztti egyeztetst, gy nem lltja el az I smells the wumpus-t!
22.3.
Terjessze ki az 1 nyelvtant gy, hogy kezelje a nvel-fnv egyeztetseket! Azaz biztostsa, hogy az agents
NP, de az agent s az an agents nem az!
22.4.
Foglalja ssze a legfontosabb klnbsgeket a Java (vagy brmely ms szmtgpes nyelv, amelyet ismer) s a
magyar kztt, megjegyezve a megrts problmjt mindkettre! Gondoljon olyan dolgokra, mint a
nyelvtan, a szintaxis, a szemantika, a pragmatikus elemzs, az sszettelek, a krnyezetfggsg, a lexiklis
tbbrtelmsg, a szintaktikai tbbrtelmsg, az utalsok megtallsa (a nvmsokat is idertve), a httrtuds
s leginkbb arra, hogy mit is jelent megrteni.
22.5.
Melyek indokoljk a kvetkezk kzl a kvzilogikai forma bevezetst?
a. Knnyebben lerhat egyszer sszetteles nyelvtani szablyok.
b. A szemantikai ler nyelv kifejezkpessgnek kiterjesztse.
c. A kvantorok rvnyessgi kre tbbrtelmsgnek (tbbek kztt) tmr formban trtn brzolsa.
d. A szemantikai egyrtelmsts egyszerbb ttele.
22.6.
Hatrozza meg, hogy az ebben a fejezetben tallhat nyelvtan alapjn milyen szemantikai rtelmezs adhat a
kvetkez mondatokhoz:
a. It is a wumpus.
b. The wumpus is dead.
c. The wumpus is in 2,2.
J tlet lenne az It is a wumpus szemantikai rtelmezsnek egyszeren a x x Wumpuses? Fontoljon meg
alternatv mondatokat, mint pldul az It was a wumpus.
22.7.
734
Kommunikci
Anlkl hogy megnzn a 22.1. feladatot, vlaszolja meg a kvetkez krdseket:

a. Mi a ngy emltett lps?
b. Melyik lps maradt ki?
c. Mi az az anyag, amit a szveg emlt?
d. Milyen hiba lenne drga?
e. Jobb tl keveset, vagy tl sokat tenni? Mirt?
22.8.
Ez a gyakorlat nagyon egyszer nyelvek nyelvtanaival foglalkozik.
a. rjon egy krnyezetfggetlen nyelvtant az anbn nyelv szmra!
b. rjon egy krnyezetfggetlen nyelvtant a tkrmondatok (palindroma) szmra: az sszes olyan fzrre,
amelyek msodik fele pp az els fl tkrkpe!
c. rjon egy krnyezetfgg nyelvtant a duplz nyelv szmra: az sszes olyan fzrre, amelyek msodik fele
megegyezik az els felvel.
22.9.
Vizsglja meg a Someone walked slowly to the supermarket (Valaki lassan a szupermarkethez stlt)
mondatot s az albbi szkincset:
Pronoun
someone
V walked
Adv slowly
Prep to
Det the
Noun
supermarket
A kvetkez tr szablyhalmazok melyike lltja el a fenti mondatot az elbbi szkincset hasznlva? Adja
meg a megfelel elemzsi f(ka)t!
(A):
(B):
(C):
S NP VP
S NP VP
S NP VP
NP
Pronoun
NP Pronoun NP
Pronoun
NP Det
Noun
NP Noun
NP Det
NP
VP VP PP
NP Det NP
VP V Adv
VP VP Adv VP V Vmod
Adv
Adv Adv
Adv
VP V
Vmod Adv
Vmod
Adv PP
PP Prep
NP
Vmod Adv
PP Prep
NP
735
Kommunikci
NP Noun
Adv PP
NP Noun
PP Prep NP
rjon hrom szintaktikailag helyes s hrom helytelen angol mondatot, amelyet a hrom elbbi nyelvtan llt
el! Lnyegben klnbzzenek egymstl, legalbb hat sz hosszak legyenek, s egy teljesen j szkincsre
kell plnik (amit lehetleg n hatrozzon meg). Javasoljon mindhrom nyelvtanra olyan jtst, amely
elkerli a nem helyes mondatok ellltst!
22.10.
Valstsa meg a diagramelemz algoritmus egy olyan vltozatt, amely a teljes bemenetet lefed sszes l
tmrtett fjt adja vissza!
22.11.
Valstsa meg a diagramelemz algoritmus egy olyan vltozatt, amely a leghosszabb bal oldali l tmrtett
fjt adja vissza, s amennyiben ez az l nem fedi le a teljes ft, folytatja az elemzst annak az lnek a vgn!
Mutassa meg, hogy mirt lesz szksg a PREDICT eljrs meghvsra a folytats eltt! A vgeredmny
tmrtett fk egy olyan listja, ahol a teljes lista lefedi a bemenetet.
22.12.
(Barton s trsai, 1987) alapjn. Ez a gyakorlat az ltalunk Buffalon-nek nevezett nyelvvel foglalkozik, ami
nagyon hasonlatos az angolhoz (legalbbis az 0-hoz), azzal a kivtellel, hogy a szkincsben csak egy sz
tallhat: a buffalo. me, kt mondat a nyelvbl:
Buffalo buffalo buffalo Buffalo buffalo.
Buffalo Buffalo buffalo buffalo buffalo Buffalo buffalo.
Arra az esetre, ha nem hinn el, hogy ezek mondatok, lljon itt kt angol mondat ugyanezzel a szintaktikai
struktrval:
Dallas cattle bewilder Denver cattle.
Chefs London critics admire cook French food.
rjon egy nyelvtant a Buffalon szmra! A lexiklis kategrik a vros, a tbbes szm fnv s a (tranzitv) ige,
s egy szablynak kell lennie a mondat, egynek az igei kifejezs s hromnak a kvetkez fnvi kifejezsek
szmra: tbbes szm fnv, fnvi kifejezs, amelyet a vros mint mdost elz meg, s fnvi kifejezs,
amelyet reduklt relatv klz kvet. A reduklt relatv klz egy olyan klz, amelybl hinyzik a relatv nvms.
Emellett a klz egy alanyi fnvi kifejezst kvet trgy nlkli igbl ll. Egy plda a reduklt relatv klzra a
London critics admire a fenti pldban. Foglalja tblzatba a Buffalon lehetsges elemzseinek szmt n =
110-re! Kln pontrt: Carl de Marcken kiszmolta, hogy 121 030 872 213 055 59 681 184 485 olyan
Buffalon mondat van, amely 200 hossz (az ltala hasznlt nyelvtanra). Hogyan csinlta?
22.13.
Rajzolja fel a 7.2. szakasz - Egy koherens szveg struktrja rszben tallhat John egy elegns tterembe
megy trtnet szvegelemzsi fjt! Hasznlja a Segment-re vonatkoz kt szablyt, megadva a helyes
CoherenceRelation-t mindent egyes csompontra! (Nem kell az egyes mondatok elemzseit megmutatnia.)
Most tegye meg ugyanezt egy n ltal vlasztott tetszleges 510 mondat hosszsg szvegre!
22.14.
Elfelejtettk megemlteni, hogy a 22.1. feladat szvegnek cme: Ruhamoss. Olvassa jra a szveget, s
vlaszolja meg a 22.7. feladat krdseit jra! Ezttal jobban ment? Bransford s Johnson (1973) ezt a szveget
hasznlta egy jobban ellenrztt ksrletben, s azt tapasztalta, hogy a cm sokat segtett. Mit mond ez nnek a
szvegrtsrl?
736
23. fejezet - Valsznsgi nyelvfeldolgozs

Ebben a fejezetben megltjuk, hogyan lehet egyszer, statisztikailag tantott nyelvi modelleket szavak milliinak
feldolgozsra hasznlni ahelyett, hogy csak egyes mondatok feldolgozsra hasznlnnk
A 22. fejezetben lttuk, hogyan kpes egy gens kommuniklni egy msik (szoftver vagy emberi) genssel
kzs nyelvi megnyilatkozsok segtsgvel. A megnyilatkozsok teljes szintaktikai s szemantikai elemzse
szksges a jelentsk teljes kinyershez, ami azrt lehetsges, mert a megnyilatkozsok rvidek s
krlhatrolt trgyterletre korltozottak.
Ebben a fejezetben a nyelvmegrts korpuszalap (corpus-based) megkzeltst trgyaljuk. A korpusz egy
nagy szveggyjtemny, pldul az a tbb millird oldal, ami a vilghlt pti fel. A szvegeket emberek rjk
embereknek, s a szoftverek feladata az, hogy megknnytsk az embereknek az informcikeresst. Ez a
megkzelts magban foglalja statisztikk s tanuls hasznlatt a korpusz kihasznlsra, s jellemzen olyan
valsznsgi nyelvi modelleket von maga utn, amelyek az adatokbl tanulhatk, s amelyek egyszerbbek,
mint a 22. fejezet kibvtett DCG-i. A legtbb feladat esetn az adatmennyisg krptol azrt, hogy egyszerbb
nyelvi modellt hasznlunk. Hrom specifikus feladatot fogunk ttekinteni: az informcikeresst (information
retrieval) (23.2. alfejezet), az informcikinyerst (information extraction) (23.3. alfejezet) s a gpi
fordtst (machine translation) (23.4. alfejezet). Elsknt azonban a valsznsgi nyelvi modelleket
(probabilistic language model) mutatjuk be rviden.
1. Valsznsgi nyelvi modellek

A 22. fejezet a nyelv logikai modelljt adta meg: CFG-ket s DCG-ket hasznltunk, hogy egy adott
karakterfzrrl eldntsk, eleme-e vagy sem egy nyelvnek. Ebben az alfejezetben szmos valsznsgi
modellt vezetnk be. A valsznsgi modellek szmos elnnyel rendelkeznek. Knyelmesen tanthatk adatok
alapjn: a tanuls mindssze az elfordulsok megszmllsbl ll (nmi trssel a kis mintamret okozta
hibk miatt). Tovbb robusztusabbak (mivel brmely karakterfzrt elfogadnak, habr kis valsznsggel),
visszatkrzik azt a tnyt, miszerint nem a beszlk 100%-a rt egyet abban, hogy mely mondatok rszei a
nyelvnek; valamint alkalmasak a tbbrtelmsg feloldsra: a valsznsgre tmaszkodva kivlaszthat a
legvalsznbb rtelmezs.
A valsznsgi nyelvi modell (probabilistic language model) valsznsgi eloszlst definil egy (esetleg
vgtelen) karakterfzr-halmaz felett. Pldaknt llhatnak a 15.6. alfejezetben beszdmegrtsre hasznlt bi- s
trigram nyelvi modellek. Az unigram modell P(w) valsznsget rendel a szkincs minden egyes szavhoz. A
modell felttelezi, hogy a szavak fggetlenl lettek kivlasztva, azaz a karakterfzr valsznsge egyszeren a
szavak valsznsgnek szorzata:
. A kvetkez hszszavas szekvencit vletlen mdon generltuk,
a knyv szavainak unigram modellje alapjn:1
logical are as confusing a may right tries agent goal the was diesel more object then information-gathering
search is
A bigram modell egy P(wi|wi1) valsznsget rendel minden egyes szhoz, adott elz sz esetn. A 15.21.
bra nhny bigram-valsznsget mutatott be. A knyv bigram modellje a kvetkez vletlen szekvencit
generlja:
planning purely diagnostic expert system are very similar computational approach would be represented
compactly using tic tac toe a predicate
ltalnosan, egy n-gram modell az elz n 1 sz alapjn szabja meg a P(wi|wi(n1)wi1) valsznsget. A
knyv trigram modellje ezt a vletlen szekvencit generlja:
Mivel nem lett volna rtelme lefordtani magyarra az egyes szavakat, ezrt meghagytuk az eredeti angol nyelv pldt. (A ford.)
737
Valsznsgi nyelv-feldolgozs
planning and scheduling are integrated the success of naive bayes model is just a possible prior source by the
time
Mg a fenti kis plda alapjn is lthatnak kell lennie, hogy a trigram modell jobb, mint a bigram (amely pedig
jobb, mint az unigram), mind az angol nyelv, mind egy MI-tanknyv tmjnak kzeltsben. A modellek
maguk is egyetrtenek ezzel: a trigram modell a vletlen mdon generlt sztringjhez 10 10 valsznsget
rendel, a bigram 1029-et, az unigram pedig 1059-et.
Ez a knyv flmilli szavval nem tartalmaz elg adatot ahhoz, hogy j minsg bigram modellt lehessen
ellltani belle, nem is beszlve a trigram modellrl. A knyv szkincse krlbell 15 ezer klnbz szt
tartalmaz, teht a bigram modell 15 0002 = 225 milli szprt tartalmaz. Vilgos, hogy a szprok legalbb
99,8%-a 0 gyakorisg, de nem akarjuk, hogy a modell azt lltsa, hogy ezek a szprok lehetetlenek.
Szksgnk van valamilyen simtsra (smoothing) a nulla gyakorisgok felett. A legegyszerbb megolds az
adj-hozz-egyet simts (add-one smoothing): minden lehetsges bigram gyakorisghoz hozzadunk egyet.
Azaz amennyiben a korpuszban N sz s B lehetsges bigram tallhat, akkor minden c gyakorisg bigramhoz
egy (c + 1)/(N + B) rtk valsznsg-becslt rendelnk. Ez a mdszer megsznteti a nulla valsznsg ngramok problmjt, de az a kvetelmny, hogy minden gyakorisgot pontosan eggyel kell nvelni, ktsges, s
rossz becslsekhez vezethet.
A msik megkzelts a lineris interpolcin alapul simts (linear interpolation smoothing), ami
linerisan kombinlja a trigam, bigram s unigram modelleket. A valsznsg-becslt a kvetkezkppen
definiljuk:
ahol c3 + c2 + c1 = 1. A ci paramterek lehetnek rgztettek vagy EM algoritmussal tanthatk. Az is lehetsges,

hogy a ci rtkeket az n-gram gyakorisgoktl fggnek vlasztjuk, azaz nagyobb slyt adunk azoknak a
valsznsgi becslknek, amelyeket nagyobb gyakorisgokbl szmtunk.
A nyelvi modell egyik lehetsges kirtkelsi mdja a kvetkez: elszr vlasszuk szt a korpuszt egy tant s
egy teszthalmazra. Hatrozzuk meg a modell paramtereit a tant halmaz alapjn. Ezutn szmtsuk ki a
valsznsget a teszthalmazra a modell alapjn; minl nagyobb a valsznsg, annl jobb. A megkzelts
egyik problmja az, hogy hossz karakterfzrek esetn a P(szavak) nagyon kicsi; a kis szmok lebegpontos
alulcsordulst okozhatnak, vagy egyszeren tl nehz lenne elolvasni ket. Teht a valsznsg helyett a
modell sszetettsgt (perplexity) szmthatjuk ki a teszt karakterfzren:
ahol N a szavak szma. Minl kisebb az sszetettsg, annl jobb a modell. Az az n-gram modell, amely minden
szhoz 1/k valsznsget rendel, k sszetettsg; az sszetettsget gy is lehet rtelmezni, mint tlagos
elgazsi tnyezt.
Pldaknt arra, hogy mire kpesek az n-gram modellek, vegyk a szegmentci (segmentation) feladatt, ami
szhatrok megtallsa szkz nlkli szvegben. Ez a feladat elengedhetetlen a japn s knai nyelv esetn;
ezek olyan nyelvek, amelyek nem raknak szkzt a szavak kz, felttelezzk azonban, hogy a legtbb
olvasnak az angol nyelv2 jobban megfelel. Az
Itiseasytoreadwordswithoutspaces3
mondatatot tnyleg knny elolvasni. Az olvas arra gondolhat, hogy ezt az teszi lehetv, hogy teljesen
ismerjk az angol szintaktikt, szemantikt s pragmatikt. Meg fogjuk mutatni, hogy a mondatot egy egyszer
unigram modellel is knnyen dekdolni lehet.
Korbban lthattuk, hogy a Viterbi algoritmus (15.9) hogyan hasznlhat a legvalsznbb szekvencia
megtallsra egy sz-valsznsgi hlban. A 23.1. brn lthat a Viterbi algoritmus olyan vltozata,
amelyet specifikusan a szegmentcis problma megoldsra terveztnk. Bemenete a P(sz) unigram
valsznsgi eloszls s egy karakterfzr. Ezutn az algoritmus a karakterfzr minden egyes i pozcijra a
Mivel nem lehetett volna hasonl magyar pldt valsznsgekkel egytt elkszteni, ezrt meghagytuk az eredeti angol nyelv pldt. (A
ford.)
3
Knnyszavakatszkzknlklolvasni (A ford.)
2
738
legjobb[i] elemben eltrolja a legvalsznbb i-ig tart karakterfzr valsznsgt. Emellett a szavak[i]
elemben eltrolja azt az i-edik pozciban vgzd szt, ami a legnagyobb valsznsget adta. Miutn
felptette a legjobb s a szavak tmbket dinamikus programozsi mdon, htrafel mozogva feldolgozza a
szavak tmbt, hogy megtallja a legjobb utat. Ebben az esetben, a knyv unigram modellje alapjn a legjobb
szekvencia tnylegesen az It is easy to read words without spaces, 4 1025 valsznsggel. A szekvencia
rszeinek sszehasonltsa sorn lthat, hogy az easy unigram valsznsge 2,6 10 4, mikzben az
alternatv e as y5 valsznsge sokkal kisebb, 9,8 1012 annak ellenre, hogy a knyv kpleteiben viszonylag
gyakran elfordul az e s az y. Hasonlkppen:
P(without) = 0,0004
P(with) = 0,005; P(out) = 0,0008
P(with out) = 0,005 0,0008 = 0,000004
Ennek kvetkeztben az unigram modell szerint a without szzszor nagyobb valsznsg, mint a with
out.6
23.1. bra - Viterbi-alap szszegmentl algoritmus. Egy szkzket nem tartalmaz

szfzrt feldolgozva megadja a legvalsznbb szavakra trtn szegmentcit.
Ebben a bekezdsben a szavak feletti n-gram modellekrl rtekeztnk, azonban az n-gram modelleket szmos
egyb egysg pldul karakterek vagy beszdrszek (parts of speech) felett is lehet rtelmezni.
1.1. Valsznsgi krnyezetfggetlen nyelvtanok

Az n-gram modellek a korpuszon belli kzs elfordulsi statisztikt hasznljk ki, azonban nincs semmilyen
informcijuk a nyelvtanrl n-nl nagyobb tvolsgra. A valsznsgi krnyezetfggetlen nyelvtan PCFG7
(probabilistic context-free grammar) egy alternatv nyelvi modell, ami egy olyan CFG, melyben minden
Knny szavakat szkzk nlkl olvasni (A ford.)
easy knny; as mint (A ford.)
6
without nlkl; with vele; out kint (A ford.)
7
A PCFG-k msik megnevezse a sztochasztikus krnyezetfggetlen nyelvtan (stochastic context-free grammar), avagy SCFG.
4
5
739
trsi szablyhoz valsznsget rendelnk. Az azonos bal oldallal rendelkez szablyok valsznsgnek
sszege 1. A 23.2. brn az 0 nyelvtan egy rszletnek PCFG-je lthat.
23.2. bra - Az 0 nyelvtan egy rszletnek valsznsgi krnyezetfggetlen nyelvtana

(PCFG) s szkincse. A szgletes zrjelben lev szm jelzi a valsznsgt annak,
hogy az adott bal oldali szimblumot a megfelel szably szerint rjuk t
23.3. bra - A Minden wumpus bzlik mondat elemzsi fja, megadva minden egyes
rszfa valsznsgt. A teljes fa valsznsge 1,0 0,5 0,05 0,15 0,60 0,10 =
0,000225. Mivel a mondatnak ez az egyetlen elemzse, ezrt ennyi a mondat
valsznsge is.
A PCFG-modellben egy karakterfzr valsznsge a P(szavak) egyszeren az elemzsi fi

valsznsgeinek sszege. Egy adott fa valsznsge a fa csompontjait felpt szablyok valsznsgeinek
740
szorzata. A 23.3. bra bemutatja, hogyan lehet kiszmtani egy mondat valsznsgt. A valsznsg
kiszmthat egy CFG diagramelemz alkalmazsval, amely megadja az sszes lehetsges elemzst, majd
egyszeren ssze kell adni a valsznsgeket. Azonban ha csak a legvalsznbb elemzs rdekel minket,
akkor a nem valszn elemzsek meghatrozsa pazarls. A legvalsznbb elemzs hatkony megtallsra
hasznlhatunk egy Viterbi algoritmus varicit vagy egy legjobbat-elszr keressi technikt (mint pldul az
A*-ot).
A PCFG-vel az a problma, hogy krnyezetfggetlen. Ez azt jelenti, hogy a klnbsg a P(eat a banana) s a
P(eat a bandanna)8 kztt mindssze a P(banana) s P(bandanna) kzti klnbsgtl fgg, s nem az
enni ige s a megfelel objektumok kzti kapcsolattl. Hogy megkapjuk ezt a kapcsolatot, szksg van
valamilyen krnyezetfgg modellre, mint pldul a szkinccsel elltott PCFG-re (lexicalized PCFG),
amelyben a kifejezs feje9 szerepet jtszhat a kifejezs valsznsgnek meghatrozsban. Elegend tant
adat esetn a VP VP NP szably kondicionlhat a begyazott VP fejre (enni) s az NP fejre (bann).
Ezltal a szkinccsel elltott PCFG-k kpesek az n-gram modellek kzs elfordulsi megszortsai egy
rsznek a megragadsra, megtartva a CFG-modellek nyelvtani megszortsait.
A PCFG msik problmja az, hogy ersen preferlja a rvid mondatokat. Egy olyan korpuszban, mint a Wall
Street Journal, az tlagos mondathossz krlbell 25 sz. Azonban egy PCFG ltalban gy vgez, hogy
viszonylag magas valsznsget rendel olyan szablyokhoz, mint az S NP VP, az NP Pronoun s a VP
Verb. Ez azt jelenti, hogy a PCFG viszonylag nagy valsznsget fog rendelni sok rvid mondathoz, mint pl.
aludt, azonban a Journalban sokkal valsznbben tallkozunk olyan mondatokkal, mint Egy megbzhat
kormnyzati forrs jelentse szerint az az llts, hogy aludt, hihet. gy tnik, hogy a Journal mondatai
igazbl nem krnyezetfggetlenek, hanem az rknak van elkpzelsk az elvrt mondathosszrl, amit fel is
hasznlnak lgy globlis knyszerknt a mondatok rsakor. Ezt nehz visszatkrzni egy PCFG-ben.
1.2. PCFG-valsznsgek tanulsa

Egy PCFG-modell ltrehozshoz a CFG konstrukcijnak sszes nehzsgvel szembeslnk, ehhez
hozztevdik mg az egyes szablyok valsznsggel val elltsa. Ez azt sugallja, hogy a nyelvtan adatokbl
val tanulsa (learning) hasznosabb lehet, mint a tudsmrnki megkzelts. Csakgy, mint a beszdmegrts
esetn is, ktfle adat ll rendelkezsre: elemzett s nem elemzett. A feladat sokkal egyszerbb, ha az adatok
elemzsi fjt nyelvszek (vagy legalbbis kpzett anyanyelvi beszlk) ksztettk el. Egy ilyen korpusz
elksztse risi feladat, a legnagyobb korpuszok mindssze krlbell egymilli szt tartalmaznak. Az
elemzsi fa korpusz alapjn a PCFG-t egyszeren szmllssal (s simtssal) ksztjk el: minden egyes nem
zr szimblumra megnzzk az sszes olyan csompontot, amelynek ez a szimblum a gykere, s ellltjuk
a csompontok gyermekeinek sszes klnbz kombinciit ler szablyokat. Pldul ha az NP szimblum
100 000-szer fordul el, s ebbl 20 000 esetben a gyermekek listja [NP, PP], akkor a kvetkez szablyt
lltjuk el:
NP NP PP [0,20]
A feladat sokkal nehezebb, ha csak elemzetlen szveggel rendelkeznk. Elszr is kt problmval

szembeslnk: a nyelvtani szablyok struktrjnak s az egyes szablyok valsznsgnek megtanulsval.
(Ugyanezt a megklnbztetst tesszk neurlis hlzatok, valamint Bayes-hlk tanulsa esetn is.)
Pillanatnyilag felttelezzk, hogy a szablyok struktrja adott, s csak a valsznsgeket prbljuk
megtanulni. Alkalmazhatunk egy vrhatrtk-maximalizls (expectation maximization, EM) mdszert,
gy, mint az RMM-ek tanulsnl. A paramterek amelyeket tanulni prblunk a szably-valsznsgek. A
rejtett vltozk az elemzsi fk: nem tudjuk, hogy a wiwj szavakbl ll karakterfzrt tnylegesen az X
szably generlja-e, vagy sem. Az E lps megbecsli az egyes rszszekvencik egyes szablyok ltal trtn
generlsnak valsznsgt. Ezutn az M lps megbecsli az egyes szablyok valsznsgt. Az egsz
szmtst el lehet vgezni dinamikus programozsi mdon, az n. belskls (insideoutside) algoritmussal,
ami a HMM tanuls elrehtra algoritmusnak analgija.
A belskls algoritmus varzslatosnak tnik, hiszen elemzetlen szvegekbl llt el nyelvtant. Azonban
szmos htrnnyal rendelkezik. Elszr is lass: ahol n a mondatbeli szavak, t pedig a nem zr szimblumok
szma. Msodsorban, a valsznsgi hozzrendelsek tere nagyon nagy, s a tapasztalatok alapjn a loklis
maximumokban val bennragads slyos problma. Alternatv mdszerek pldul szimullt lehts
8
9
egy bannt eszik egy selyemkendt eszik (A ford.)

A kifejezs feje a legfontosabb sz, pldul a fnv a fnvi szerkezetben.
741
megprblhatk ugyan, de ezek mg nagyobb szmtsignyek. Harmadsorban, a kapott nyelvtanok ltal

elvgzett elemzsek gyakran nehezen rthetk, s nem elgtik ki a nyelvszeket. Ez megnehezti a manulisan
ellltott tuds kombinlst az automatikus indukcival.
1.3. PCFG-szablystruktrk tanulsa

Most pedig ttelezzk fel, hogy a nyelvtani szablyok struktrja nem ismert. Az els problma, amivel
szembeslnk, az, hogy a lehetsges szablyhalmazok tere vgtelen, azaz nem tudjuk, hogy hny szablyt
vegynk figyelembe, s azt sem, hogy az egyes szablyok milyen hosszak lehetnek. A problma egyik
lehetsges megkerlse az, hogy a nyelvtani szablyokat Chomsky norml alakban (Chomsky normal form)
tanuljuk, ami azt jelenti, hogy minden szably a kvetkez kt alak egyike lehet:
X Y Z
X t
ahol X, Y s Z nem zr, mg t zr szimblum. Minden krnyezetfggetlen nyelvtant t lehet rni Chomsky
norml alakra, amely pontosan ugyanazt a nyelvet fogadja el. Ezutn nhatalmlag n nem zr szimblumra
szortkozhatunk, ezltal n3 + nv szablyt kapunk, ahol v a zr szimblumok szma. A gyakorlatban ez a
mdszer csak kis nyelvtanok esetn bizonyult hatkonynak. A bayesi modellsszevons (Bayesian model
merging) alternatv megkzelts hasonl a SEQUITUR modellhez (lsd 22.8. alfejezet). A mdszer
mondatonknti loklis modellek (nyelvtanok) ptsvel kezd, majd a minimlis lerhossz felhasznlsval
sszevonja a modelleket.
2. Informcikeress
Az informcikeress (information retrieval) feladata olyan dokumentumok megtallsa, amelyek relevnsak
a felhasznl informciignyre nzve. Az informcikeres rendszerek legjobban ismert pldi a vilghl
keresgpei. A felhasznl megadhat egy lekrdezst mint pldul [MI-knyv] a keresgpnek, majd
megnzheti a relevns oldalak listjt. Ebben az alfejezetben bemutatjuk, hogyan plnek fel ezek a rendszerek.
Egy informcikeres (ezentl IR-) rendszer a kvetkez mdokon jellemezhet:
Dokumentumgyjtemny. Minden rendszernek el kell dntenie, hogy mit kezel dokumentumknt: egy
bekezdst, egy oldalt vagy egy tbboldalas szveget.
Lekrdeznyelven megadott krds. A lekrdezs (query) rja le, hogy a felhasznl mit szeretne
megtudni. A lekrdeznyelv (query language) lehet egyszeren szavak listja (pl. [MI-knyv]); vagy meg
lehet adni egyms mellett ll szavakbl ll kifejezst (pl. [MI-knyv]); logikai opertorokat tartalmazhat
(pl. [MI S knyv]), nem logikai opertorokat (pldul [MI KZELBEN knyv] vagy [MI knyv
CM:www.aaai.org]) foglalhat magban.
Eredmnyhalmaz. Ez a dokumentumok azon rszhalmaza, amit az IR a keress alapjn relevnsnak
(relevant) tl. Relevnson azt rtjk, hogy valsznleg hasznos lesz a krdst feltev szemly szmra, arra
a bizonyos informciignyre, amelyet a lekrdezsben fogalmazott meg.
Az eredmnyhalmaz megjelentse. Ez lehet olyan egyszer, mint a dokumentumcmek rendezett rangsorolt
listja, vagy olyan bonyolult, mint az eredmnyhalmaz hromdimenzis trbe vettett, forg sznes trkpe.
Az elz fejezet elolvassa utn gondolhatunk arra, hogy egy informcikeres rendszert gy is felpthetnk,
hogy a dokumentumhalmazt elemzs utn lekpezzk logikai mondatok tudsbzisba, majd elemezzk a
krdseket, s MEGKRDEZ-zk a tudsbzist, hogy a vlaszokat megkapjuk. Sajnos senkinek sem sikerlt gy
mkd, nagymret IR-rendszert ksztenie. Egyszeren tl bonyolult olyan szkincset s nyelvtant pteni,
amely kpes nagy dokumentumhalmazokat lefedni, gy minden IR-rendszer egyszerbb nyelvi modellt hasznl.
A legkorbbi IR-rendszerek a Boole-kulcssz modell (Boolean keyword model) szerint mkdtek. A
dokumentumgyjtemny minden egyes szavt gy kezelik, mint egy Boole-tulajdonsgot, amely igaz, ha a sz
elfordul a dokumentumban, s hamis, ha nem. Azaz a visszakeress tulajdonsg igaz erre a fejezetre, de
hamis a 15. fejezetre. A lekrdeznyelv a tulajdonsgok feletti logikai kifejezsek nyelve. Pldul az
[informcikeress S lekrdezs] lekrdezs igaz erre a fejezetre, de nem igaz a 15. fejezetre.
742
Ez a modell rendelkezik azzal az elnnyel, hogy knny elmagyarzni s megvalstani. Azonban rendelkezik
nhny htrnnyal is. Elszr, a dokumentum relevancija egyetlen bit, gy nincs semmilyen irnymutats arra,
hogy hogyan rendezzk a megjelents sorn a relevns dokumentumokat. Msodszor, a logikai kifejezsek
szokatlanok lehetnek a nem programoz vagy nem logikval foglalkoz felhasznlk szmra. Harmadszor,
mg egy gyakorlott felhasznl szmra is nehz lehet a megfelel lekrdezst megfogalmazni. Ttelezzk fel,
hogy az [informcikeress S modellek S optimls] krdst tesszk fel, s res eredmnyhalmazt kapunk
vissza. Megprblhatjuk az [informcikeress VAGY modellek VAGY optimls] lekrdezst, azonban ha tl
sok eredmnyt ad vissza, akkor nehz megmondani, mit kell utna kiprblni.
A legtbb IR-rendszer a szavak elfordulsi statisztikjra (s esetleg ms alacsony szint jellemezkre) pt.
Bemutatunk egy valsznsgi keretrendszert, amely jl illeszkedik a trgyalt nyelvi modellekhez. Az alaptlet
az, hogy egy adott lekrdezshez meg akarjuk tallni azokat a dokumentumokat, amelyek relevnsak. Ms
szavakkal, ki akarjuk szmolni a:
P(R = igaz|D, Q)
rtket, amelyben D a dokumentum, Q a lekrdezs, R pedig egy vletlen logikai vltoz, amely a relevancit
fejezi ki. Ha meghatroztuk ezt az rtket, alkalmazhatjuk a valsznsgi rendezsi elvet, amely szerint
amennyiben be kell mutatnunk az eredmnyhalmazt, akkor azt cskken valsznsg relevancia szerint kell
tennnk.
Szmos lehetsg ltezik a P(R = igaz|D, Q) egyttes eloszls dekomponlsra. Itt az n. nyelvi modellezs
(language modeling) megkzeltst fogjuk bemutatni, amely minden egyes dokumentumra egy nyelvi modellt
becsl, majd az adott dokumentum nyelvi modellje alapjn minden egyes lekrdezsre kiszmtja a lekrdezs
valsznsgt. Az R = igaz rtk jellsre r-t hasznlva, a kvetkez alakra rhatjuk t a valsznsget:
P(r|D, Q) = P(D, Q|r)P(r)/P(D, Q) (a Bayes-szably alapjn)
= P(Q, D|r)P(D|r)P(r)/PP(D, Q) (a lncszably alapjn)
= P(Q|D,r)P(r|D)/P(D, Q) (a Bayes-szably alapjn, rgztett D-re)
Azt mondtuk, hogy a P(r|D, Q) rtkt akarjuk maximalizlni, azonban ezzel ekvivalens, ha a P(r|D, Q)/P(r|D,
Q) valsznsgi arnyt maximalizljuk. Azaz a dokumentumokat a kvetkez pontszm alapjn
rangsorolhatjuk:
Ennek az az elnye, hogy kikszbli a P(D, Q) tagot. Most pedig felttelezzk, hogy az irrelevns
dokumentumokra a dokumentum fggetlen a lekrdezstl. Ms szavakkal, amennyiben egy dokumentum
irrelevns egy adott lekrdezsre, akkor a dokumentum ismerete nem fog segteni a lekrdezs
meghatrozsban. Ezt a lekrdezst a kvetkez egyenlet rja le:
P(D, Q|r) = P(D|r)P(Q|r)
Ezzel a felttelezssel azt kapjuk, hogy:
A P(r|D)/P(r|D) tnyez a dokumentum relevancijnak lekrdezsfggetlen valsznsge. Ez a dokumentum

minsgnek mrtke: egyes dokumentumok brmely lekrdezshez relevnsak, mert a dokumentum
egyszeren magas sznvonal. Akadmiai krnyezetben szletett folyiratcikkek esetn a relevancia a
hivatkozsok szma alapjn becslhet, mg weboldalak esetn az oldalra mutat hiperhivatkozsok szmt
hasznlhatjuk. Minden esetben nagyobb slyt adhatunk azoknak a hivatkozsoknak, amelyek maguk is magas
sznvonalak. A dokumentum kora szintn szerepelhet a lekrdezsfggetlen relevancia becslsben.
Az els tnyez a P(Q|D, r) a lekrdezs valsznsge, feltve egy adott relevns dokumentumot. Hogy
megbecslhessk ezt a valsznsget, egy nyelvi modellt kell vlasztanunk, amely megadja, hogy milyen
kapcsolatban llnak a lekrdezsek a relevns dokumentumokkal. Az egyik npszer vlaszts a dokumentumok
743
unigram szmodellel trtn reprezentlsa. Ez az informcikeressben gy is ismert, mint a szzsk (bag of

words) modell, mivel a szavak dokumentumon belli elfordulsi gyakorisga az, ami szmt, nem a
sorrendjk. Ebben a modellben a man bites dog s a dog bites man (nagyon rvid) dokumentumok
azonosan fognak viselkedni.10 Vilgos, hogy eltr jelentsek, azonban az is igaz, hogy mindketten relevnsak
a kutykat s a harapsokat tartalmaz lekrdezsekre. Ezek utn, hogy kiszmolhassuk egy lekrdezs
valsznsgt egy adott dokumentum esetben, egyszeren ssze kell szoroznunk a lekrdezsben tallhat
szavak valsznsgeit a dokumentum unigram modellnek megfelelen. Ez a lekrdezs naiv Bayes- (naive
Bayes) modellje. Qj-vel jellve a lekrdezs j-edik szavt, azt kapjuk, hogy:
Ez lehetv teszi a kvetkez egyszerstst:
Vgre kszen llunk, hogy ezeket a matematikai modelleket egy pldra alkalmazzuk. A 23.4. bra a [Bayes
informational retrieval model] ([Bayes informcikeress modell]) lekrdezs szavainak ennek a knyvnek t
kivlasztott fejezetbl ll dokumentumgyjtemny feletti unigram statisztikjt adja meg. Feltesszk, hogy a
fejezetek azonos minsgek, gy csak azt kell kiszmolnunk, hogy mennyi a lekrdezs valsznsge az adott
dokumentum esetn, minden egyes dokumentumra. Kt alkalommal tesszk ezt meg, egyszer egy Di simtatlan
maximum-likelihood becslvel, majd egy
adj-hozz-egyet simt becslj modellel. Azt tteleznnk fel,
hogy egy ilyen keressnl ez a fejezet lesz elsnek rangsorolva, s valban ez gy is van mindkt modell
szerint.
23.4. bra - A [Bayes information retrieval model] lekrdezs-valsznsgi IR-modellje

a knyv els t fejezett tartalmaz dokumentumgyjtemny felett. Megadjuk a
szgyakorisgot mindegyik dokumentum-sz prra, s a szavak szmt (N) az sszes
dokumentumra. Kt dokumentummodellt alkalmazunk, Di az i-edik dokumentumon
alapul simtatlan unigram szmodell, mg D'i ugyanaz a modell adj-hozz-egyet
simtssal, majd kiszmtjuk a lekrdezs valsznsgt minden dokumentumra
mindkt modellel. A jelen (23.) fejezet az egyrtelm gyztes, mindkt modell esetn
tbb mint ktszzszor valsznbb, mint brmely ms dokumentum.
A simtott modell rendelkezik azzal az elnnyel, hogy kevsb rzkeny a zajra, s hogy nemzrus relevanciavalsznsget kpes rendelni olyan dokumentumokhoz, amelyek nem tartalmazzk az sszes szt. A simtatlan
modellnek az az elnye, hogy knny sok dokumentumot tartalmaz gyjtemnyekre kiszmolni: ha
elksztnk egy olyan indexet, amely megadja, hogy az adott szt mely dokumentumok tartalmazzk, akkor
gyorsan el tudjuk lltani az eredmnyhalmazt ezeknek a listknak a metszeteknt, s a P(Q|Di) rtkeket csak
a metszetben szerepl dokumentumokra kell kiszmolni, nem pedig mindegyikre.
10
Egy kutya megharapott egy embert, illetve egy ember megharapott egy kutyt, jellemz jsgcmstlus. (A ford.)
744
2.1. Az IR-rendszerek rtkelse

Honnan tudjuk, hogy egy IR-rendszer jl teljest? Elvgznk egy ksrletet, amelyben a rendszer kap egy
lekrdezshalmazt, az eredmnyhalmazokat pedig pontozzuk az emberi relevanciamegtls szerint.
Tradicionlisan kt mrtket hasznlunk a pontozsra: a felidzst (recall) s pontossgot (precision). Ezeket
egy pldn keresztl fogjuk bemutatni. Kpzeljk el, hogy egy IR-rendszer visszaadott egy eredmnyhalmazt
egy olyan lekrdezsre, amelyre tudjuk, hogy egy 100 dokumentumot tartalmaz korpuszbl mely
dokumentumok relevnsak, s melyek nem. Az egyes kategrikba tartoz dokumentumok szmt az albbi
tblzat adja meg:
A pontossg az eredmnyhalmaz dokumentumai kzl a tnylegesen relevnsak arnyt mri. A pldnkban a

pontossg 30/(30 + 10) = 0,75. A hamis pozitv arny 1 0,75 = 0,25. A felidzs a gyjtemny relevns
dokumentumaibl az eredmnyhalmazban megjelen hnyadt mri. A pldnkban a felidzs 30/(30 + 20) =
0,60. A hamis negatv arny 1 0,60 = 0,40. Egy nagyon nagy dokumentumgyjtemnyben, mint pldul a
vilghln, a felidzs nehezen szmthat, mivel nincs egyszer mdszer a web sszes oldalnak a relevancia
szempontjbl trtn elemzsre. A legjobb, amit tehetnk, a felidzs becslse mintavtelezssel, vagy pedig
teljesen figyelmen kvl hagyjuk a felidzst, s csak a pontossg alapjn tlnk.
A rendszer kompromisszumot kthet a pontossg s felidzs kztt. Extrm esetben a rendszer visszaadhatja az
sszes dokumentumot a dokumentumgyjtemnybl az eredmnyhalmazban, 100%-os felidzst garantlva,
azonban a pontossga kicsi lesz. Alternatvaknt, a rendszer visszaadhat egyetlen dokumentumot, gy a felidzs
alacsony lesz, azonban trhet eslye van 100%-os pontossgra. A kompromisszum sszefoglalsnak egyik
lehetsges mdja az ROC-grbvel (ROC curve) trtnhet. Az ROC a vev mkdsi karakterisztika
(receiver operating characteristics) rvidtse (ami nem tlzottan felvilgost nv). Ez egy olyan grafikon,
amely a hamis negatv arnyt mri az y tengelyen s a hamis pozitv arnyt az x tengelyen, brzolva az egyes
kompromisszumos pontokat. A grbe alatti terlet az IR-rendszer hatkonysgnak sszefoglalsa.
A felidzst s pontossgot akkor definiltk, amikor az IR-keresseket elsdlegesen knyvtrosok vgeztk,
akik alapos, pontos tallatokban voltak rdekeltek. Manapsg a legtbb (napi tbb szzmilli) lekrdezst az
internetfelhasznlk vgzik, akik kevsb rdekeltek az alapossgban, sokkal inkbb abban, hogy azonnal
vlaszt kapjanak. Szmukra j mrtk az els relevns tallat tlagos reciprokrangja (reciprocal rank). Azaz,
amennyiben a rendszer els tallata relevns, 1-es pontszmot kap a lekrdezsre, s amennyiben az els kett
nem relevns, de a harmadik az, akkor 1/3-ot. Egy alternatv mrtk a vlaszid (time to answer), ami azt mri,
hogy mennyi ideig tart a felhasznlnak a problmra kvnt vlaszt megtallni. Ez kerl a legkzelebb ahhoz,
amit mrni szeretnnk, azonban azzal a htrnnyal rendelkezik, hogy minden egyes ksrlethez j emberi
tesztalanycsoportra van szksg.
2.2. Az IR-rendszerek tovbbfejlesztse

Az unigram modell az sszes szt fggetlenknt kezeli, azonban mi tudjuk, hogy bizonyos szavak korrelltak: a
dvny kzeli kapcsolatban ll mind a dvnyok-kal, mind a kanap-val. Szmos IR-rendszer prblja
figyelembe venni ezeket a korrelcikat.
Pldul, amennyiben a lekrdezs [dvny], gyalzatos lenne kihagyni az eredmnyhalmazbl azokat a
dokumentumokat, amelyek a DVNY vagy a dvnyok szavakat tartalmazzk, de a dvny-t nem. A
legtbb IR-rendszer kisbet-nagybet konverzit (case folding) alkalmaz, hogy a DVNY-t dvny
alakk alaktsa, szmos rendszer pedig sztvest (stemming) algoritmusokat, hogy a dvnyok alakot a
dvny sztre reduklja. Ez tipikusan a felidzs kismrtk nvekedst eredmnyezi (az angol nyelv esetn
kb. 2%-ot). Azonban ronthatja a pontossgot. Pldul a stocking sztvestse stock 11 alakra valsznleg
cskkenteni fogja a ruhzati, valamint pnzgyi eszkzkre irnyul lekrdezsek pontossgt, azonban
nvelheti a raktrozsra irnyul lekrdezsek felidzst. Szablyalap sztvestk (pldul az -ing
vgzds eltvoltsa az angolban) nem kpesek megkerlni ezt a problmt, de a sztrakon alapul jabb
11
Harisnya, illetve raktrkszlet. (A ford.)
745
algoritmusok igen (nem kell eltvoltani az -ing kpzt, ha a sz mr szerepel a sztrban). Br az angol nyelv
esetn a sztvestsnek csak kis hatsa van, sokkal fontosabb ms nyelvek esetn. A nmet nyelvben gyakran
tallkozhatunk olyan szavakkal, mint Lebensversicherungsgesellschattsangestellter (letbiztost cg
alkalmazottja). Az olyan nyelvek, mint a finn, a trk, az inuit vagy a jupik rekurzv morfolgiai szablyokkal
rendelkeznek, amelyek elmletileg korltlan hosszsg szavakat generlnak.
A kvetkez lps a szinonimk (synonyms) felismerse, mint amilyen a dvny s a kanap. A
sztvestshez hasonlan ez is a felidzs kismrtk nvekedst eredmnyezheti, azonban a pontossgot
veszlyezteti, ha tl agresszven alkalmazzuk. Akik Tim Couch futballistra kvncsiak, nem szeretnnek
tvergdni a kanapkrl (couch kanap) szl dokumentumokon. Az a problma, hogy a nyelv ugyangy
irtzik az abszolt szinonimktl, mint ahogy a termszet retteg a vkuumtl (Cruse, 1986). Azaz, amennyiben
kt sz azonos dolgot jelent, a nyelv beszli trekednek a jelents mdostsra, hogy megszntessk a
zrzavart.
Szmos IR-rendszer bizonyos mrtkig sz bigramokat hasznl, azonban csak nhnyuk valst meg egy teljes
valsznsgi bigram modellt. A helyesrs-javt (spelling correction) eljrsok alkalmazhatk mind a
dokumentumok, mind a lekrdezsek hibinak javtsra.
Vgs finomtsknt az IR-rendszerek tkletesthetk metaadatok (metadata) figyelembevtelvel, amelyek a
dokumentum szvegn kvl ll adatok, mint pldul emberek ltal megadott kulcsszavak vagy
dokumentumok kztti hypertext-hivatkozsok.
2.3. Az eredmnyhalmaz prezentlsa

A valsznsgi rendezsi elv szerint vegynk egy eredmnyhalmazt, s a relevancia valsznsgnek
megfelelen sorba rendezve prezentljuk a felhasznlnak. Ennek akkor van rtelme, ha a felhasznl az sszes
relevns dokumentum minl hamarbb trtn megtallsban rdekelt. Azonban bajba kerl, mert nem veszi
figyelembe a hasznossgot. Pldul ha a legrelevnsabb dokumentum kt pldnyban szerepel a
gyjtemnyben, akkor az els megnzse utn a msodik azonos relevancij, de zrus hasznossg. Szmos
IR-rendszer rendelkezik mechanizmusokkal, amelyek eliminljk az elz tallatokhoz tlzottan hasonlt
eredmnyeket.
Az IR-rendszerek teljestmnynvelsnek egyik leghatkonyabb mdja a relevancia-visszacsatols (relevance
feedback), amely a felhasznl visszajelzse, hogy az eredeti eredmnyhalmazbl mely dokumentumok voltak
relevnsak. A rendszer ezutn egy msodik eredmnyhalmazt prezentlhat, amelynek dokumentumai hasonlk a
megadottakhoz.
Egy msik lehetsges megkzelts az eredmnyhalmaznak egy rendezett lista helyett egy cmkzett faknt
trtn prezentlsa. A dokumentumosztlyozs (document classification) sorn az eredmnyeket egy elre
definilt tmakr-taxonminak megfelelen osztlyozzuk. Pldul jsghrekbl ll gyjtemnyt a kvetkez
kategrikba lehet sorolni: klfldi, belfldi, zleti hrek, szrakozs s sport. Dokumentumklaszterezs
(document clustering) esetn minden eredmnyhalmazra teljesen j kategriafa kszl. Az osztlyozs akkor
hasznlhat, ha a gyjtemnyben kevs szm tmakr tallhat, mg a klaszterezst a vilghlhoz hasonl
szles kr gyjtemnyek esetn rdemes hasznlni. Mindkt esetben, miutn a felhasznl megad egy
lekrdezst, az eredmnyhalmazt a kategriknak megfelel mappkba rendezve kapja meg.
Az osztlyozs felgyelt tantsi problma, s mint ilyen, a 18.
fejezetben
ismertetett
brmelyik
mdszerrel megtmadhat. Az egyik npszer megkzelts a dntsi fk alkalmazsa. Amennyiben
rendelkeznk a megfelel kategrikkal cmkzett dokumentumokbl ll tant halmazzal, pthetnk egyetlen
dntsi ft, amelynek levelei a dokumentumot a megfelel kategrihoz rendelik. Ez akkor mkdik jl, ha
mindssze nhny kategria van; nagyobb kategriahalmazok esetn minden egyes kategrira kln dntsi ft
ptnk, amelynek a levelei megadjk, hogy a dokumentum az adott kategriba tartozik-e vagy sem. ltalban
az egyes csompontokban tesztelt tulajdonsgok egyedi szavak. Pldul a Sport kategriban az egyik
csompont tesztelheti a kosrlabda sz megltt. Javtott teljestmny dntsi fk, naiv Bayes-modellek,
valamint szupport vektor gpek mindegyikt hasznltk szvegosztlyozsra, sok esetben a hitelessg 9098%os volt binris osztlyozs esetn.
A klaszterezs egy felgyelet nlkli tantsi mdszer. A 20.3. alfejezetben lthattuk, hogy hogyan alkalmazhat
az EM algoritmus a klaszterezs eredeti becslsnek javtsra, Gauss-modellek keverkt hasznlva. A
dokumentumok klaszterezse nehezebb feladat, mert nem tudjuk, hogy az adatokat egy bartsgos Gauss-
746
modell generlta-e, s mert egy sokkal tbb dimenzis trrel kell elbnnunk. Szmos megkzeltst dolgoztak
ki.
Az agglomeratv klaszterezs (agglomerative clustering) klaszterekbl ll ft pt, lemenve egszen az
egyedi dokumentumok szintjre. A fa brmely szinten nyeshet, hogy kevesebb kategrit kapjunk, de ezt az
algoritmuson kvl vesszk figyelembe. Az elejn minden dokumentumot kln klaszternek tekintnk. Ezutn
megkeressk azt a kt klasztert, melyek egy bizonyos tvolsgmrtk szerint legkzelebb llnak egymshoz, s
sszevonjuk ket. Addig ismteljk a folyamatot, amg csak egy klaszter marad. A kt dokumentum tvolsgt
meghatroz mrtk a dokumentumok szavai kzti tfeds valamilyen mrtke. Pldul reprezentlhatjuk a
dokumentumot szgyakorisgok vektoraknt, ahol a tvolsgot a kt vektor euklideszi tvolsgaknt
rtelmezzk. Kt klaszter tvolsga a klaszterek medinjainak tvolsgaknt rtelmezhetjk, vagy a klaszterek
elemeinek tlagos tvolsgt vehetjk figyelembe. Az agglomeratv klaszterezs idignye O(n2), ahol n a
dokumentumok szma.
A k-kzp klaszterezs (k-means clustering) pontosan k darab kategria halmazt lltja el. A kvetkez
elven mkdik:
1. Vegynk vletlenszeren k dokumentumot a k kategria reprezentlsra.
2. Rendeljnk minden dokumentumot a legkzelebbi kategrihoz.
3. Szmoljuk ki minden egyes kategria tlagt, s hasznljuk a k tlagot a k kategrik j rtkeinek
reprezentlsra.
4. Ismteljk a 2-es s 3-as lpseket, amg konverglnak.
A k-kzp mdszer O(n) idigny, ez az egyetlen elnye az agglomeratv klaszterezshez kpest. ltalban
kevsb pontos, mint az agglomeratv klaszterezs, br egyesek szerint majdnem olyan hatkony (Steinbach s
trsai, 2000).
Az alkalmazott klaszterezsi mdtl fggetlenl van mg egy feladat, amit el kell vgeznnk, mieltt a
klaszterezst az eredmnyhalmaz bemutatsra hasznlhatjuk: a klaszter j lersnak megtallsa. Az
osztlyozs esetn a kategrik elre definiltak (pldul jvedelmek), mg a klaszterezs esetn ki kell
tallnunk a kategrianeveket. Az egyik vlaszts a klaszter szempontjbl reprezentatv szavak listjnak
hasznlata. A msik lehetsg a klaszter kzppontjhoz kzel lev egyik dokumentum cmnek a hasznlata.
2.4. Az IR-rendszerek megvalstsa

Az eddigiekben csupn absztrakt mdon definiltuk az IR-rendszerek mkdst, azonban nem magyarztuk el,
hogy hogyan lehet olyan hatkonny tenni ket, hogy egy webes keresgp visszaadhassa a legfels tallatokat
egy tbb millird oldalas gyjtemnybl egytized msodperc alatt. Minden IR-rendszer szmra kt
kulcsfontossg adatstruktra szksges: a szkincs, amely felsorolja a dokumentumok szavait, s az invertlt
index, amely megadja, hogy az egyes szavak hol szerepelnek a dokumentumgyjtemnyben.
A szkincs (lexicon) egy olyan adatstruktra, amely egy mveletet tmogat: megadja, hogy egy adott sz hol
szerepel az invertlt indexben, amely a sz elfordulsait trolja. Egyes megvalstsok esetn azt is visszaadja,
hogy sszesen hny dokumentum tartalmazza a szt. A szkincset hash-tbla vagy valamilyen hasonl
adatstruktrval ajnlott megvalstani, amely lehetv teszi a gyors kikeresst. Egyes esetekben kis
informcitartalm gyakori szavakat kihagynak a szkincsbl. Ezek a tiltlists szavak (stop words) (pldul
a, egy, ez stb.) helyet foglalnak az indexben, s nem javtjk az eredmny rangsorolst. Az egyetlen j
indok arra, hogy mgis megtartsuk ket a szkincsben a kifejezslekrdezst tmogat rendszerek esetn ll
fenn: a tiltlists szavak szkincsbeli trolsa szksges olyan lekrdezsek kiszolglsra, mint pl. a to be or
not to be.12
Az invertlt index13 (inverted index), a knyvnk vgn tallhat szjegyzkhez hasonlan, tallati listk (hit
lists) halmazbl az egyes szavak elfordulsi helyeibl ll. A Boole-kulcssz modell esetn a tallati lista
nem ms, mint a dokumentumok listja. Az unigram modell esetn egy (dokumentum, gyakorisg) prokat
lenni vagy nem lenni (A ford.)

Az invertlt index kifejezs redundns, sokkal jobb lenne egyszeren az index kifejezst hasznlni. Azrt invertlt, mert ms
sorrendben van, mint a szveg szavai, de ilyen minden index. Azonban az invertlt index a hagyomnyos IR-kifejezs.
12
13
747
tartalmaz lista. A kifejezslekrdezs tmogatshoz a tallati listnak az adott sz minden egyes

dokumentumon belli elfordulsi helyeit is tartalmaznia kell.
Amennyiben a lekrdezs egyetlen sz (Silverstein szerint ilyen az esetek 26%-a (Silverstein s trsai, 1998)),
akkor a feldolgozs igen gyors. Egyszeren kikeressk a szt a szkincsbl, hogy megkapjuk a tallati lista
cmt, majd egy res prioritsi sort hozunk ltre. Ezutn egyesvel vgigmegynk a tallati lista
dokumentumain, s megnzzk a sz gyakorisgt a dokumentumban. Amennyiben a prioritsi sor R-nl
kevesebb elemet tartalmaz (ahol R az eredmnyhalmaz elvrt mrete), akkor hozzadjuk a (dokumentum,
gyakorisg) prt a sorhoz. Ellenkez esetben, ha a gyakorisg nagyobb, mint a prioritsi sor legkisebb elemnek
gyakorisga, akkor trljk a legkisebb elemet, s hozzadjuk az j (dokumentum, gyakorisg) prat. Ezltal a
lekrdezs megvlaszolsa O(H + R log R) idt vesz ignybe, ahol H a tallati lista dokumentumainak szma.
Amennyiben a lekrdezs n szt tartalmaz, akkor n tallati listt kell sszevonni, ami O(nH + R log R) idt vesz
ignybe.
Azrt mutattuk be az IR-rendszerek elmlett a valsznsgi modellen keresztl, mert ez a modell hasznostja
azokat az tleteket, amelyeket ms tmkban is alkalmaztunk. A jelenlegi gyakorlati IR-rendszerek sokkal
inkbb egy msik megkzeltst alkalmaznak, amelyet vektortr modellnek (vector space model) hvunk. Ez a
modell ugyangy a szzsk-megkzeltst alkalmazza, mint a valsznsgi modell. Minden egyes
dokumentumot unigram szgyakorisgok vektoraknt brzolunk. A lekrdezst is gy brzoljuk, pldul a
[Bayes information retrieval model] lekrdezst a
[0, , 1, 0, , 1, 0, , 1, 0, , 1, 0, ]
vektor rja le, amelyben az tlet az, hogy minden egyes szhoz kln dimenzi tartozik, s a lekrdezs
vektorban minden dimenzi 0 rtk, kivve azt a ngy szt, amely a lekrdezsben elfordul. A relevns
dokumentumokat gy kapjuk meg, hogy megkeressk azokat a dokumentumokat, amelyek a lekrdezs
vektornak legkzelebbi szomszdai a vektortrben. A hasonlsg egyik lehetsges mrtke a lekrdezs- s
dokumentumvektor skalris szorzata: minl nagyobb ez a szorzat, annl kzelebb van egymshoz a kt vektor.
Algebrailag ez a mrtk nagy pontszmot ad azoknak a szavaknak, amelyek mind a dokumentumokban, mind a
lekrdezsben gyakran elfordulnak. Geometriailag a kt vektor skalris szorzata az ltaluk bezrt szg
koszinusza, azaz ha kt ilyen vektor koszinuszt maximalizljuk (amennyiben azonos kvadrnsban tallhatk),
akkor az ltaluk bezrt szg nullhoz kzeli lesz.
A vektortr modell ennl sokkal tbbre kpes. A gyakorlatban szmos jellemzvel, finomtssal, javtssal s
kiegsztssel lett kibvtve. Az az alaptlet, miszerint a dokumentumokat a vektortrbeli hasonlsguk alapjn
lehet rangsorolni, lehetv teszi, hogy j tleteket ptsnk be a numerikus sorrendez rendszerbe. Egyesek azt
lltjk, hogy a valsznsgi modell ezeket a mdostsokat sokkal tisztbb elvi alapokon llva tenn lehetv,
azonban az IR-kutatk nem fognak vltani, amg nem ltnak egyrtelm teljestmnyjavulst a msik modellhez
kpest.
Hogy egy tlagos IR-feladat indexelsi problmjnak nagysgrendjt rzkeltessk, vegynk egy szabvnyos
TREC (Text REtrieval Conference Szveg-visszakeressi Konferencia) dokumentumgyjtemnyt, amely 750
ezer dokumentumot tartalmaz, szszesen 2 GB (gigabjt) szveggel. A szkincs krlbell 500 ezer szt
tartalmaz, sztvests s kisbet-nagybet konverzi utn; ennyi sz trolsa 7 s 10 MB kztti trterletet
ignyel. Az invertlt index a (dokumentum, gyakorisg) prokkal 324 MB terletet ignyel, br tmrtsi
technikk alkalmazsval csak 83 MB-ot. A tmrts trhelyet takart meg, a feldolgozsi kvetelmnyek
kismrtk nvelse rn. Azonban ha a tmrts lehetv teszi, hogy az egsz indexet a memriban s nem
httrtron troljuk , akkor jelents ered teljestmnynvekedst kapunk. A kifejezslekrdezs tmogatsa a
trignyt 1200 MB-ra nveli tmrtetlen, illetve 600 MB-ra tmrtett esetben. A webes keresgpek
hromezerszer ekkora feladattal dolgoznak. A legtbb problma az esetkben is hasonl, azonban nem praktikus
terabjtnyi mennyisg adatot kezelni egyetlen szmtgpen, ezrt az indexet k szegmensre vgjk, s minden
szegmenst kln szmtgp trol. A lekrdezst mindegyik szmtgp megkapja, majd a k eredmnyhalmazt
egy eredmnyhalmazba vonjk ssze, amelyet megjelentenek a felhasznl szmra. A webes keresgpeknek
radsul msodpercenknt tbb ezer lekrdezst kell kiszolglniuk, gy a k szmtgp n msolatra van
szksg. Az id folyamn k s n folyamatosan nvekszik.
3. Informcikinyers
Az informcikinyers (information extraction) adatbzis-bejegyzsek ellltsnak a folyamata, amely
sorn egy szveget egy adott osztlyba tartoz objektum vagy esemny elfordulsait, valamint az objektumok
s esemnyek kzti relcikat keresve tfutunk. Megprblhatjuk konkrt cmek kinyerst weboldalakrl,
748
adatbzismezkkel az utca, az llam s az irnytszm szmra, vagy konkrt viharok adatainak a kinyerst
idjrs-jelentsekbl, mezkkel a hmrsklet, a szlsebessg s a csapadk szmra. Az informcikinyer
rendszerek flton llnak az informcikeres rendszerek s a teljes nyelvi elemzk kztt, hiszen tbbet kell
tennik, mint egyszeren szzsknak tekinteni a dokumentumot, de kevesebbet, mint minden egyes mondat
teljes nyelvtani elemzst.
Az informcikinyer rendszerek legegyszerbb tpust attribtumalap (attribute-based) rendszernek
nevezzk, mert felttelezi, hogy a teljes szveg egy objektumrl szl, s a feladat ezen objektum
attribtumainak kinyerse. Pldul a 10.5. alfejezetben megemltettk a 17 hvelykes SXGA Monitor
mindssze 249,99 $-rt szvegbl az albbi adatbzis-relci kinyersnek problmjt:
m m SzmtgpMonitorok Mret(m, Hvelyk(17)) r(m, $(249,99))
Felbonts(m, 1280 1024)
Ennek az informcinak egy rsze regulris kifejezsekkel (regular expression) kezelhet, amelyek regulris
nyelvtant definilnak egy karakterfzrben. Regulris kifejezseket hasznlnak olyan Unix-parancsokban, mint
a grep, olyan programozsi nyelvekben, mint a Perl, valamint olyan szvegszerkesztkben, mint a Microsoft
Word. A rszletek eltrk az egyes eszkzkben, s legjobban a megfelel tmutatbl tanulhatk meg,
azonban itt bemutatjuk, hogyan lehet regulris kifejezseket pteni dollrban megadott rakra, bemutatva a
kzs rszkifejezseket:
[0-9] megfelel brmely 0 s 9 kzti szmjegynek
[0-9] + megfelel egy vagy tbb szmjegynek
.[0-9] [0-9] megfelel szmjegyek ltal kvetett pontnak
(.[0-9] [0-9]) ? megfelel szmjegyek ltal kvetett pontnak vagy
res fzrnek
$[0-9] + (.[0-9][0-9])? megfelel 249,99 $-nak, vagy 1,23 $-nak, vagy
1 000 000 $-nak, vagy
Az attribtumalap informcikinyer rendszerek regulris kifejezsek sorozatbl pthetk fel, ahol minden
egyes attribtumhoz egy regulris kifejezs tartozik. Ha a regulris kifejezs pontosan egyszer illeszkedik a
szvegre, akkor kivehetjk a szveg illeszked rszt, amely az attribtum rtke lesz. Ha nincs illeszkeds,
akkor nem tudunk mit tenni, azonban ha tbb illeszkeds is van, akkor szksgnk van egy eljrsra, hogy
hogyan vlasszunk kzlk. Az egyik megolds szerint minden egyes attribtumhoz tbb regulris kifejezst
rendelnk, priorits szerint sorba rendezve. Pldul a legnagyobb priorits rra vonatkoz regulris kifejezs a
dollrjel eltti r: karakterfzrre kereshet, ha ezt nem tallja meg, akkor tlpnk egy kevsb megbzhat
regulris kifejezsre. Egy msik stratgia az sszes tallat kinyerse, majd valamilyen mdon vlasztani
kzlk. Pldul vehetjk azt a legalacsonyabb rat, amely a legnagyobbnak legalbb fele. Ez a megolds
kezelni tudja az olyan szvegeket, mint a Listar 99,00 $, akcis r 78,00 $, szllts 3,00 $.
Az attribtumalap rendszereknl eggyel sszetettebbek a relcis alap informcikinyer rendszerek,
amelyeknek tbb mint egy objektummal kell foglalkozniuk, radsul a kztk lev relcikat is figyelembe kell
vennik. Azaz, amikor egy ilyen rendszer a 249,99 $ szveget ltja, akkor nem csak azt kell megllaptania,
hogy ez egy r, hanem azt is, hogy mely objektumnak az ra. A FASTUS egy tipikus relcis alap
informcikinyer rendszer, amely cgegyeslsekrl s felvsrlsokrl szl hreket kpes kezelni. El tudja
olvasni a kvetkez hrt:
Bridgestone Sports Co. said Friday it has set up a joint venture in Taiwan with a local concern and a Japanese
trading house to produce golf clubs to be shipped to Japan. 14
s egy a kvetkezhz hasonl adatbzisrekordot tud ltrehozni:
e VegyesVllalat Termk(e, Golftk) Dtum(e, Pntek)
A Bridgestone Sports Vllalat pnteken azt nyilatkozta, hogy vegyes vllalatot hozott ltre egy helyi konszernnel s egy japn
kereskedhzzal Tajvanon, hogy Japnba sznt golftket gyrtsanak. A golf club ktrtelm, itt golft. (A ford.)
14
749
Entits(e, Bridgestone Sports Co.) Entits(e, egy helyi konszern)
Entits(e, egy japn kereskedhz)
Relcis informcikinyer rendszereket gyakran ptenek kaszkdostott vges llapot talaktk

(cascaded finite-state transducer) segtsgvel. Ez azt jelenti, hogy egy sor vges llapot automatbl
(finite-state automaton, FSA) ll, ahol minden egyes automata egy szveget kap bemenetknt, amelyet talakt
egy ms formba, majd tovbbadja a kvetkez automatnak. Ez azrt megfelel, mert az egyes vges
automatk hatkonyak lehetnek, s egytt kpesek lehetnek a szksges informci kinyersre. A FASTUS
egy tipikus rendszer, amely a kvetkez t fokozatbl ll:
1. Tokenizls
2. Komplex szavak kezelse
3. Alapcsoport-kezels
4. Komplex kifejezsek kezelse
5. Struktra-sszevons
A FASTUS els lpse a tokenizls (tokenization), amely a karakterfzreket tokenekbe (szavak, szmok s
rsjelek) szegmentlja. Az angol nyelv esetn a tokenizls elg egyszer lehet, pusztn a szkzk (white
space) vagy rsjelek mentn trtn szegmentls viszonylag j hatkonysg. A japn nyelv esetn a
tokenizlsnak szegmentlst kell vgeznie, valami olyasmit hasznlva, mint a Viterbi algoritmus (lsd 23.1.
bra). Egyes tokenizlk az olyan jellnyelveket is kezelik, mint a HTML, az SGML s az XML.
A msodik lps komplex szavak (complex words) kezelse, idertve az olyan szkapcsolatokat, mint a set
up s a joint venture, valamint olyan tulajdonneveket, mint a Prime Minister Tony Blair s a Bridgestone
Sports Co..15 Ezeket sztrbejegyzsek s vges llapot nyelvtani szablyok kombincijaknt ismeri fel.
Pldul egy cgnevet a kzvetkez szabllyal lehet felismerni:
NagybetvelKezddSz + (Company | Co | Inc | Ltd)
A szablyokat gondosan kell megalkotni, majd ellenrizni kell a felidzst s a pontossgot. Az egyik
kereskedelmi rendszer az Intel Chairman Andy Grove16 szveget szemly helyett helyknt ismerte fel, az
egyik szably miatt:
NagybetvelKezddSz + (Grove | Forest | Village | )
A harmadik lps az alapcsoportok (basic groups) kezelse, amelyek fnvi s igei csoportokat jelentenek. A
lps lnyege, hogy ezeket darabokra kell vgni, hogy a ksbbi lpsek kezelhessk ket. A fnvi csoport a
fejszerepet betlt fnvbl ll, amelyet opcionlisan megelzhetnek nvelk s egyb mdostk. Mivel a
fnvi csoport nem tartalmazza az NP 1-beli teljes komplexitst, ezrt nincs szksg rekurzv
krnyezetfggetlen nyelvtani szablyokra, a vges automatk ltal megengedett regulris nyelvtanok is
elgsgesek. Az igei csoport az igbl s a hozz kapcsold segdigkbl, valamint hatrozkbl ll, azonban
nem tartalmazza a kzvetlen s kzvetett trgyakat s az elljri kifejezseket. Az elbbi pldamondat a
kvetkez mdon kerlne ki ebbl a lpsbl:
1 NG: Bridgestone Sports 10 NG: a local concern
Co.
2 VG: said
11 CJ: and
3 NG: Friday
12 NG:
house
4 NG: it
13 VG: to produce
15
16
Japanese
trading
vegyes vllalat, Tony Blair Miniszterelnk, Bridgestone Sports Vllalat (A ford.)

Az Intel elnke, Andy Grove a grove magyarul ligetet jelent. (A ford.)
750
5 VG: has set up
14 NG: golf clubs
6 NG: a joint venture
15 VG: to be shipped
7 PR: in
16 PR: to
8 NG: Taiwan
17 NG: Japan
9 PR: with
Az NG fnvi csoportot, a VG igei csoportot, a PR elljrszt, a CJ pedig ktszt jelent.

A negyedik lps az alapcsoportokat komplex kifejezsekk (complex phrases) kombinlja. Ismt az a cl,
hogy vges llapot szablyokat hasznljunk a gyors feldolgozs rdekben, s a szablyok olyanok legyenek,
hogy (kzel) egyrtelm kimeneti kifejezseket kapjunk. A kombincis szablyok egyik tpusa
trgyterletfgg esemnyekkel foglalkozik. Pldul a
Cg + VegyesVllalatLtrehozsa (with Vllalat+)?
szably a vegyes vllalat ltrehozsnak egyik lehetsges lersa. A kaszkdban ez az els lps, amely
eredmnyt nemcsak a kimenetre, hanem adatbzissmkba is elhelyezi.
Az utols lps az elz lps ltal felptett struktrkat vonja ssze (merges structures). Amennyiben a
kvetkez mondat azt lltja, hogy A vegyes vllalat janurban kezdi meg a termelst, akkor ez a lps
felismeri, hogy kt hivatkozs trtnt a vegyes vllalatra, amelyeket ssze kellene vonni.
ltalnossgban az informcikinyers jl mkdik egy olyan korltozott trgyterlet esetn, amelyben a
trgyalt tmkat elre meg lehet llaptani, tovbb azt is lehet tudni, hogy hogyan rnak rluk. Szmos
trgyterleten hasznlhatnak bizonyult ez a technika, azonban nem lehet a teljes termszetes nyelvi elemzs
helyettestje.
4. Gpi fordts
A gpi fordts (machine translation) egy termszetes nyelv szveg egyik nyelvrl (forrs) egy msik nyelvre
(cl) trtn automatikus fordtsa. Ez a folyamat szmos feladatra alkalmasnak bizonyult, belertve a
kvetkezket:
1. Nyersfordts (rough translation), amelyben a cl pusztn az, hogy egy passzus lnyegt megkapjuk.
Nyelvtanilag helytelen s nem elegns mondatokat is elfogadunk, mindaddig, amg a jelents vilgos.
Pldul a webszrfzs sorn a felhasznl gyakran rl az idegen nyelv weboldal nyersfordtsnak. Az
esetek egy rszben egy egynyelv ember utlagosan szerkesztheti a kimenetet, az eredeti szveg
elolvassnak szksgessge nlkl. A gppel tmogatott fordts ezen tpusa azrt takart meg pnzt, mert az
ilyen szerkesztknek kevesebbet kell fizetni, mint a ktnyelv fordtknak.
2. Korltozott forrs fordtsa (restricted-source translation), amelyben a forrsszveg tmja s
formtuma szigoran korltozott. Az egyik legsikeresebb plda a TAUM-METEO rendszer, amely idjrsjelentseket fordt angolbl francira. Azrt mkdik, mert az idjrs-jelentsek nyelvezete ersen stilizlt
s regulris.
3. Elre szerkesztett fordts (preedited translation), amelyben egy ember gy szerkeszti meg elre a
forrsdokumentumot, hogy megfeleljen az angol nyelv (vagy brmely forrsnyelv) egy korltozott
rszhalmaznak. Ez a megkzelts klnsen akkor kltsghatkony, amikor egyetlen dokumentumot sok
nyelvre kell lefordtani, mint pldul jogi szvegeket az Eurpai Kzssgnl, vagy olyan vllalatok esetn,
amelyek ugyanazt a termket sok orszgban rtkestik. A korltozott nyelveket nha Caterpillar-angolnak
nevezik, mert a Caterpillar vllalat volt az els, amelyik az tmutatit ilyen formban prblta megrni. A
Xerox olyan nyelvet definilt a javtsi tmutatk szmra, amely annyira egyszer volt, hogy gppel le
lehetett fordtani minden olyan nyelvre, amellyel a Xerox rintkezsbe kerl. Tovbbi haszonknt az eredeti
angol nyelv tmutatk is vilgosabb vltak.
751
4. Irodalmi fordts (literary translation), amely a forrsszveg legkisebb rnyalatt is megrzi. Ez jelenleg
tlmutat a legmodernebb gpi fordtk kpessgn is.
A nyersfordts pldjaknt lljon itt jelen fejezetnk els bekezdsnek a SYSTRAN fordt szolgltats ltal
trtnt fordtsa elbb olaszra, majd vissza angolra:17
A fordts azrt nehz, mert ltalban a szvegek mly megrtst ignyli, amihez pedig a kzlt szituci mly
megrtse szksges. Ez mg nagyon egyszer szvegek esetn is fennll, st egyszavas szvegek esetn is.
Vegyk a Open szt egy zlet ajtajn.18 Ez azt az informcit kzvetti, hogy az zlet pillanatnyilag fogad
vevket. Most vegyk ugyanezt a szt egy jonnan felptett zleten tallhat hatalmas transzparensen. Ez azt
jelenti, hogy az zlet megnylt, de az olvask nem reznk becsapva magukat, ha jszaka a transzparens
eltvoltsa nlkl lenne zrva a bolt. A kt felirat ugyanazt a szt hasznlja klnbz jelentsek kzvettsre.
Nmet nyelv orszgban a felirat az ajtn Offen, mg a transzparensen Neu erffnet lenne. 19
Az a problma, hogy az egyes nyelvek eltr mdon kategorizljk a vilgot. Pldul a francia doux sz
jelentsek szles krt fogja t, amely megkzeltleg a kvetkez angol szavakkal adhat meg: soft, sweet,
gentle.20 Hasonlkppen az angol hard sz gyakorlatilag a nmet hart sz sszes jelentst (fizikailag
ellenll, durva) lefedi, emellett a schwierig (nehz, fradsgos, bonyolult rtelemben) sz nhny
jelentst is magban foglalja. A nmet heilen (meggygyt) ige az angol cure (gygyt) sz orvosi
hasznlatt fedi le, tovbb a heal (meggygyul) tranzitv s intranzitv jelentseit. Emiatt az adott mondat
jelentsnek brzolsa sokkal nehezebb a fordts, mint az egynyelvi megrts esetn. Egy egynyelv
elemzrendszer hasznlhatna olyan prediktumokat, mint Open(x), azonban a fordts cljbl a reprezentcis
nyelvnek esetleg tbb megklnbztetst kellene tennie, pldul az Offen jelentst reprezentl Open1(x)
prediktummal s a Neu erffnet jelentst reprezentl Open2(x) prediktummal. Azt a reprezentcis nyelvet,
amely a lefedett nyelvekhez szksges sszes megklnbztetst lehetv teszi, kztes nyelvnek (interlingua)
nevezzk.
Folykony fordtshoz az szksges, hogy a fordt (ember vagy gp) elolvassa az eredeti szveget, megrtse a
szitucit, amirl szl, s talljon egy megfelel szveget a clnyelvben, amely jl lerja ugyanazt, vagy egy
hasonl szitucit. Ez gyakran vlasztst jelent. Pldul amennyiben az angol you sz egy szemlyre
vonatkozik, akkor vagy a magyar hivatalos n vagy a kzvetlen te alakra fordthat. Egyszeren nem lehet
a you fogalomrl beszlni magyarul anlkl, hogy eldntennk, hogy hivatalos vagy kzvetlen mdon
szeretnnk hasznlni. A fordtk (mind a gpi, mind az emberi) nha nehezen tudjk ezt a dntst meghozni.
4.1. Gpi fordt rendszerek

A gpi fordt rendszerek ersen klnbznek abban, hogy milyen szinten elemzik a szveget. Egyes
rendszerek a bemeneti szveget egszen a kztes nyelv szintjig prbljk elemezni (mint ahogy azt a 22.
fejezetben tettk), majd a clnyelven ezen reprezentci alapjn generlnak mondatokat. Ez azrt nehz, mert
rszproblmaknt tartalmazza a teljes nyelvi megrts problmjt, amihez mg a kztes nyelv kezelsbl
A fejezet els bekezdsnek eredeti angol szvege: In Chapter 22, we saw how an agent could communicate with another agent (human
or software), using utterances in a common language. Complete syntactic and semantic analysis of the utterances is necessary to extract the
full meaning of the utterances, and is possible because the utterances are short and restricted to a limited domain. Lthat, hogy a kt angol
nyelv szveg kztt jelents eltrsek vannak, azonban a gpi fordts eredmnyeknt kapott szveg nagyjbl rthet. (A ford.)
18
Martin Kay pldja.
19
Nyitva Kinyitottunk (A ford.)
20
doux des, enyhe, lgy, soft lgy, sweet des, gentle finom, gyengd (A ford.)
17
752
fakad nehzsgek is hozzaddnak. A megkzelts azrt trkeny, mert ha az elemzs sikertelen, akkor nincs
kimenet. Azonban az az elnye, hogy a rendszerben nincs olyan komponens, amelynek kt (termszetes) nyelvet
egyszerre kell ismernie. Ez azt jelenti, hogy kztes nyelv hasznlatval n nyelv kzti fordts O(n) s nem O(n2)
nehzsg.
Ms rendszerek az tvitelen (transfer) alapulnak. Fordtsi szablyok (vagy pldk) adatbzist tartalmazzk,
s amikor egy szably (vagy plda) illeszkedik, akkor kzvetlenl fordtanak. Az tvitel lexikai, szintaktikai
vagy szemantikai szinten trtnhet. Pldul egy szigoran szintaktikai szably az angol [Mellknv Fnv]
szekvencit a francia [Fnv Mellknv] szekvenciba kpezi le. Egy kevert szintaktikai s lexikai szably a
francia [S1 et puis S2] szekvencit az angol [S1 and then S2] szekvenciba kpezi le.21 Azt az tvitelt, amely
egy mondatot kzvetlenl egy msikba visz t, memriaalap fordtsnak (memory-based translation)
neveznk, mivel nagyszm (angol, francia) pr memorizlsra tmaszkodik. Az tviteli mdszer robusztus,
mert minden esetben generl valamilyen kimenetet, s legalbb a szavak egy rsze felttlenl helyes. A 23.5.
bra bemutatja az egyes tviteli pontokat.
23.5. bra - Egy gpi fordt rendszer vlasztsi lehetsgeit brzol sematikus
diagram. A fenn tallhat angol szveggel kezdjk. A kztes nyelven alapul rendszer a
folytonos vonalakat kveti, az angol szveget elszr szintaktikai elemzsnek veti al,
majd szemantikai s kztes nyelvi reprezentcit llt el, vgl szemantikai,
szintaktikai s lexikai formkon keresztl francia szveget llt el. Az tvitelalap
rendszerek a szaggatott vonalak ltal jellt rvidzrakat hasznljk. Az egyes
rendszerek eltr szinteken vgzik az tvitelt, egyes rendszerek tbb szinten is.
4.2. Statisztikai gpi fordts

Az 1960-as vek elejn nagy remnyeket fztek ahhoz, hogy a szmtgpek kpesek egyik termszetes
nyelvbl a msikba fordtani csakgy, mint ahogy Turing projektje kpes volt kdolt nmet zeneteket rtelmes
nmet szvegbe fordtani. 1966-ra vilgoss vlt, hogy a folykony fordts ignyli az zenet jelentsnek a
megrtst, mg a kdfejts nem.
Az elmlt vtizedben elmozduls volt megfigyelhet a statisztikai alap gpi fordt rendszerek irnyba.
Termszetesen, a 23.5. bra brmely lpsnek javra szolglnnak statisztikai adatok, valamint egy olyan
egyrtelm valsznsgi modell hasznlata, amely megadja, hogy mi egy j analzis vagy tvitel. Azonban a
statisztikai gpi fordts az egsz fordtsi problma olyan megkzeltsnek a megnevezsv vlt, amely a
mondat legvalsznbb fordtsnak ktnyelv korpuszon alapul megtallst jelenti. A ktnyelv korpuszok
egyik pldja a Hansard,22 amely parlamenti vitk naplja. Kanada, Hongkong s ms orszgok ktnyelv
Hansardokat tesznek kzz, az Eurpai Uni 11 nyelven23 publiklja hivatalos dokumentumait, mg az Egyeslt
Nemzetek Szervezete tbbnyelv dokumentumokat ad ki. Ezek a statisztikai gpi fordts szmra
felbecslhetetlenl rtkes forrsoknak bizonyultak.
Mindkt esetben magyarul [S1 s utna S2] (A ford.)

William Hansard utn elnevezve, aki 1811-ben elsknt publiklta a brit parlamenti vitkat.
23
Az angol nyelv kiads idejn. (A ford.)
21
22
753
Egy angol nyelv mondat (E) pldul francia24 (F) mondatra trtn fordtsnak problmjt a Bayes-szably
kvetkez alkalmazsaknt rhatjuk le:
argmaxF P(F|E)
= argmaxF P(E|F)P(F)/P(E)
= argmaxF P(E|F)P(F)
Ez a szably azt lltja, hogy minden lehetsges F francia mondatot figyelembe kell vennnk, s azt kell
vlasztanunk, amelyik maximalizlja P(E|F)P(F)-t. A P(E) tnyezt nem kell figyelembe venni, hiszen minden
F esetn azonos. A P(F) tnyez a francia nyelvi modell (language model), azt adja meg, hogy milyen
valsznsg egy adott francia mondat. A P(E|F) a fordtsi modell (translation model), azt adja meg, hogy
milyen valsznsg egy adott angol mondat, mint az adott francia mondat fordtsa.
Az gyes olvask bizonyra csodlkoznak, hogy mit nyertnk a P(F|E) definilsval a P(E|F) segtsgvel. A
Bayes-szably ms alkalmazsainl azrt tettk ezt, mert kauzlis modellt akartunk hasznlni. Pldul a
P(Szimptmk|Betegsg) kauzlis modellt hasznltuk P(Betegsg|Szimptmk) kiszmolsra. A fordts
esetben azonban egyik irny sem kauzlisabb, mint a msik. Jelen esetben a Bayes-szably alkalmazsnak az
az oka, hogy azt hisszk, kpesek lesznk egy olyan P(F) nyelvi modellt megtanulni, amely pontosabb, mint a
P(E|F) fordtsi modell (s pontosabb, mint P(F|E) kzvetlen becslse). Lnyegben a problmt kt rszre
osztottuk: elszr a P(F|E) fordtsi modellt alkalmazzuk, hogy olyan francia mondatokat talljunk, amelyek
visszaadjk az angol mondat lnyegt, de amelyek nem felttlenl folykony francia mondatok, majd a P(F)
nyelvi modellt (amelyre sokkal jobb valsznsgi becslsnk van) hasznljuk a legjobb jellt kivlasztsra.
A P(F) nyelvi modell brmilyen olyan modell lehet, amely egy mondathoz valsznsget rendel. Nagyon nagy
korpusz esetn P(F)-et kzvetlenl becslhetnnk az egyes mondatok korpuszbeli elfordulsi szma alapjn.
Pldul ha a webrl sszegyjtnk 100 milli francia mondatot, s a Clique ici 25 mondat 50 ezerszer fordul
el, akkor P(Clique ici) = 0,0005. Azonban mg 100 milli plda esetn is a legtbb mondat elfordulsi szma
nulla lenne.26 Emiatt az ismert bigram modellt fogjuk alkalmazni, amelyben az f1fn szavakbl ll francia
nyelv mondat valsznsge:
Ismernnk kell az olyan bigram valsznsgeket, mint pldul a P(Eiffel|tour) = 0,02.27 Ez a szintaxis
mindssze nagyon loklis jellemzit kpes lerni, ahol a sz csak az t megelz sztl fgg. A
nyersfordtshoz azonban tbbnyire ez is elegend.28
A P(E|F) fordtsi modellt (translation model) nehezebb meghatrozni. Egyrszt nem ll rendelkezsnkre
(angol, francia) mondatprokbl ll ksz gyjtemny, amely alapjn tanthatnnk. Msrszt a modell
komplexitsa nagyobb, mivel mondatok keresztszorzatra, s nem pedig klnll mondatokra alapul. Egy
tlzottan leegyszerstett fordtsi modellel fogunk kezdeni, s felptnk valamit, ami az IBM Model 3-at
(Brown s trsai, 1993) kzelti, ami tovbbra is a vgletekig leegyszerstettnek tnik, azonban az esetek
krlbell felben elfogadhat fordtsokat generlt.
A vgletekig leegyszerstett modell arrl szl, hogy a mondat fordtshoz egyszeren fordtsuk le a szavakat
egyesvel s egymstl fggetlenl, balrl jobbra. Ez egy unigram szvlasztsi modell. Lehetv teszi, hogy
egyszeren kiszmtsuk egy fordts valsznsgt:
Nhny esetben ez a modell jl mkdik. Vegyk pldul a kvetkezt:

Ebben a bekezdsben az angolrl francia nyelvre trtn fordts problmjval foglalkozunk. Ne zavarja az olvast, hogy a Bayesszably alkalmazsa a P(E|F), s nem a P(F|E) figyelembe vtelhez vezet, ami annak tnik, mintha francirl fordtannk angolra.
25
Kattints ide (A ford.)
26
Amennyiben csak 100 ezer sz fordulna el a lexikonban, akkor az sszes lehetsges hromszavas mondatok 99,99999%-nak
elfordulsi szma nulla lenne a 100 millis korpuszban. Hosszabb mondatok esetn mg rosszabb a helyzet.
27
Eiffel-torony (A ford.)
28
Vilgos, hogy a fordts finomabb rszleteihez P(fi|fi1) nem elegend. Hres pldaknt lljon itt Marcel Proust 3500 oldalas regnye, a A
la rcherche du temp perdu, amely ugyanazzal a szval kezddik s vgzdik, gy egyes fordtk gy dntttek, hogy ugyanezt teszik, azaz
egy sz fordtst egy olyan szra alapoztk, amely durvn 2 milli szval korbban fordult el.
24
754
P(the dog|le chien) = P(the|le) P(dog|chien)
Brmely elfogadhat valsznsgi rtkhalmaz esetn a the dog29 lenne a le chien maximum-likelihood
becslje. A legtbb esetben azonban a modell megbukik. Az egyik problma a szrend. Franciban a dog
megfelelje a chien, a brown- a brun, azonban a brown dog- a chien brun.30 A msik problma az,
hogy a szvlaszts nem egy az egyes lekpezs. Az angol home szt gyakran la maison-nak31 fordtjk,
ami egy hrmas lekpezs (illetve hrom az egybe a msik irnyban). Ezen problmk ellenre az IBM Model 3
makacsul ragaszkodik az alap unigram modellhez, br, hogy javtson rajta, hozztesz nhny kiegsztst.
A modell, hogy kpes legyen kezelni azt a tnyt, hogy a szavakat nem egy az egyben fordtjuk, bevezeti a sz
termkenysgnek (fertility) fogalmt. Egy n termkenysg szt n-szer lemsolja, s az n msolat mindegyike
fggetlenl fordtdik. A modell az sszes francia szra tartalmazza a P(termkenysg = n|sz) paramtereket.
Az la maison home-ra trtn fordtshoz a modell 0 termkenysget vlasztana az s la
szavakra,32 mg egyet a maison-ra, s utna az unigram modellt alkalmazn a maison sz home-ra trtn
fordtshoz. Ez elgg indokoltnak tnik, az s a la kis informcitartalm szavak, amelyeket sszer
res karakterfzrr fordtani. A msik irnyba trtn fordts mr ktsgesebb. A home szhoz hrmas
termkenysget rendelne a modell, home home home szekvencit kapva. Az els home -ra, a msodik
la-ra, mg a harmadik maison-ra fordulna. A fordtsi modell szempontjbl az la maison s a maison
la pontosan azonos valsznsget kapna. (Pont ez a ktsges rsz.) A nyelvi modellre lenne bzva, hogy
eldntse, melyik a jobb. rtelmesebbnek tnhet a home-ot kzvetlenl la maison-ra fordtani, mint
kzvetett mdon a home home home-on keresztl, azonban ehhez sokkal tbb paramterre lenne szksg,
amelyeket nehz lenne a rendelkezsre ll korpuszbl meghatrozni.
A fordtsi modell vgs rsze a szavak megfelel sorrendbe trtn permutlsa. Ez egy eltolsi modellel
trtnik, amely sorn a sz az eredeti pozcijbl a vgleges pozciba mozog. Pldul a chien brun brown
dog-ra trtn fordtsa sorn a brown sz +1 eltolsi rtket kap (azaz jobbra egy pozcit mozog), mg a
dog 1 rtket. Az olvas elkpzelheti, hogy az eltolsnak fggnie kellene a sztl: az olyan mellknevek,
mint a brown tbbnyire pozitv eltolsi rtkkel rendelkeznnek, mert a francia nyelv ltalban a fnv utn
helyezi el a mellkneveket. Azonban az IBM Model 3 gy dnttt, hogy a sztl fgg eltols tl sok
paramtert ignyelne, ezrt az eltols fggetlen a sztl, s csak a mondatbeli pozcitl s a mondat mindkt
nyelvbeli hossztl fgg. Azaz a modell a kvetkez paramtereket becsli:
P(Eltols = o|Pozci = p, AngolHossz = m, FranciaHossz = n)
Azaz a brown sz brown dog-beli eltolsnak meghatrozshoz megnzzk a P(Eltols|1,2,2) rtkt,

amely mondjuk +1 rtket adna 0,3, s 0 rtket 0,7 valsznsggel. Az eltolsi modell mg ktsgesebbnek
ltszik, olyan, mintha egy olyan szemly agyalta volna ki, aki sokkal jobban rt a mgnesbetk htn trtn
tologatshoz, mint a valdi termszetes nyelven trtn beszdhez. Rvidesen bemutatjuk, hogy nem azrt
terveztk ilyen mdon, mert jl modellezi a termszetes nyelvet, hanem azrt, mert a rendelkezsre ll adatokat
sszeren hasznostja. Mindenesetre arra szolgl, hogy lnken emlkeztessen bennnket arra, hogy egy
kzpszer fordtsi modellt meg lehet menteni egy j francia nyelvi modellel. me, egy plda egy mondat
fordtsnak lpseire.33
Most mr tudjuk, hogyan kell kiszmtani a P(F|E) valsznsget brmely (francia, angol) mondatprra.
Azonban amit igazbl tenni akarunk az az, hogy egy adott angol mondat esetn megtalljuk azt a francia
mondatot, amely maximalizlja ezt a valsznsget. Nem sorolhatunk fel egyszeren mondatokat: 10 5 francia
sz esetn 105n n hosszsg mondat lehetsges, s szmos sszerendels mindegyikre. Mg ha csak a 10
leggyakoribb sz-sz fordtst tekintjk minden egyes szra, s csak 0 s 1 eltolst vesznk figyelembe, akkor
a kutya (A ford.)
barna kutya (A ford.)
31
home otthon, la maison otthon lenni, haza menni rtelemben (A ford.)
32
nagyjbl a magyar -ban, -ben, -ba, -be ragoknak felel meg, la nnem hatrozott nvel (A ford.)
33
A barna kutya nem ment haza. (A ford.)
29
30
755
is 2n/210n mondatot kapunk, ami azt jelenti, hogy n = 5 esetn mg fel tudnnk ket sorolni, de n = 10 esetn
mr nem. Ehelyett meg kell keresnnk a legjobb megoldst. Az A* keress hatkonynak bizonyult a feladatra
(Germann s trsai, 2001).
4.3. Valsznsgek tanulsa gpi fordtshoz

Krvonalaztunk egy olyan P(F|E) modellt, amely ngy paramterhalmazt tartalmaz:
Nyelvi modell: P(szi|szi1)
Termkenysgi modell: P(Termkenysg = n|szF)
Szvlasztsi modell: P(szE|szF)
Eltolsi modell: P(Eltols = o|pozci, hosszE, hosszF)
Ennek a modellnek mg egy 1000 szt tartalmaz, szerny szkincs esetn is paramterek milliira van
szksge. Nyilvnvalan adatokbl kell megtanulnunk ket. Felttelezzk, hogy az egyetlen rendelkezsnkre
ll adat egy ktnyelv korpusz. Lssuk a felhasznlsi mdjt:
Mondatokra trtn szegmentci: a fordtsi egysg a mondat, teht a korpuszt mondatokra kell trdelnnk.
A pont a mondatvg jellemz indiktora, de vegyk a Dr. J. R. Smith of Rodeo Dr. megrkezett. pldt,
amelyben csak az utols pont jelenti a mondat vgt. A mondatokra trtn szegmentcit krlbell 98%-os
pontossggal lehet elvgezni.
A P(szi|szi1) francia nyelvi modell becslse: vegyk a korpusz francia nyelv rszt, szmoljuk meg a
szprok elfordulsi gyakorisgt, s vgezznk simtst, hogy megkapjuk a P(szi|szi1) becsljt. Pldul
megkaphatjuk, hogy P(Eiffel|tour) = 0,02.
Mondatok illesztse: minden egyes angol nyelv mondatra hatrozzuk meg az(oka)t a francia nyelv
mondato(ka)t, amely(ek) megfelel(nek) neki a francia vltozatban. ltalban a szvegben kvetkez angol
mondat megfelel a kvetkez francia mondatnak 1:1 megfeleltetssel, azonban nha elfordulnak varicik: az
egyik nyelv mondatot 2:1 megfeleltetsbe vgjuk, vagy kt mondat sorrendjt felcserljk, 2:2 megfeleltetst
kapva. Mindssze a mondathosszakat tekintve lehetsges az illesztsk (1:1, 1:2, 2:2 stb.) 90% s 99% kztti
pontossggal, a Viterbi szegmentcis algoritmus (lsd 23.1. bra) megfelel varicijval. Mg jobb
illeszkeds is elrhet amennyiben olyan irnypontokat hasznlunk, amelyek mindkt nyelvben kzsek, mint
pldul szmok, tulajdonnevek, illetve olyan szavak, melyeknek egy ktnyelv sztr alapjn tudjuk, hogy
egyrtelm a fordtsuk.
A P(Termkenysg = n|szF) kezdeti termkenysgi modell becslse: legyen adott egy m hosszsg francia
mondat, amely egy n hosszsg angol mondathoz illeszkedik, ekkor vegyk ezt annak altmasztsaknt, hogy
mindegyik (a mondatban elfordul) francia sz termkenysge n/m. Vegyk figyelembe ezeket az sszes
mondatra az egyes szavak termkenysgi eloszlsnak meghatrozshoz.
A P(szE|szF) kezdeti szvlasztsi modell becslse: vegyk az sszes olyan mondatot, amely tartalmazza
pldul a brun szt. Azok a szavak, amelyek a leggyakrabban fordulnak el az illeszked angol mondatokban,
valsznleg a brun sz-sz fordtsai.
A P(Eltols = o|pozci, hosszE, hosszF) kezdeti eltolsi modell becslse: most, hogy rendelkeznk egy
szvlasztsi modellel, hasznljuk fel azt az eltolsi modell becslsre. Egy n hosszsg angol mondat esetn,
amely egy m hosszsg francia mondathoz illeszkedik, vegyk minden egyes francia szt (i pozciban) s
minden olyan angol szt (j pozciban), amely valszn vlaszts lenne a francia szra, s vegyk ezt P(Eltols
= i j|i, n, m) bizonytkul.
A becslsek javtsa: hasznljuk az EM (elvrsmaximalizl) algoritmust a becslsek javtsra. A rejtett
vltoz az illeszked mondatprok kzti szilleszkedsi vektor (word alignment vector). A vektor megadja
minden egyes angol szra a megfelel francia sz francia mondatbeli pozcijt. Pldul megkaphatjuk a
kvetkezt:
756
Elszr a paramterek aktulis becslit hasznlva elksztjk a szilleszkedsi vektort mindegyik mondatprra.
Ez jobb becsl megalkotst fogja szmunkra lehetv tenni. A termkenysgi modellt az alapjn becsljk,
hogy a szilleszkedsi vektor egy adott tagja hnyszor kpzdik le tbb szra, vagy egyetlenegyre sem. A
szvlasztsi modellnek a mondat sszes szava helyett most mr csak olyan szavakat kell figyelembe vennie,
amelyek egymshoz lettek illesztve. Az eltolsi modell a mondat egyes pozciinak elmozdulst vizsglja a
szilleszkedsi vektornak megfelelen. Sajnos nem tudjuk, hogy mi a helyes illeszkeds, s tl sok van bellk
ahhoz, hogy mindet felsoroljuk. Emiatt arra vagyunk knyszertve, hogy megkeressnk nhny nagy
valsznsg illeszkedst, s a valsznsgkkel slyozzuk ket, mikzben bizonytkot gyjtnk az j
paramterbecslkhz. Mindssze ennyire van szksgnk az EM algoritmushoz. A kezdeti paramterek alapjn
illeszkedseket szmolunk, majd az illeszkedsek alapjn javtjuk a paramterbecslket. Ismteljk, amg
konvergl.
5. sszefoglals
A fejezet fbb pontjai a kvetkezk:
Az n-gram alap valsznsgi nyelvi modellek meglep mennyisg informcit kpesek visszaadni egy
nyelvrl.
A CFG-ket ki lehet egszteni valsznsgi CFG-kre, knnyebb tve az adatok alapjn trtn tanulsukat
s a ktrtelmsgek feloldst.
Az informcikeres (information retrieval) rendszerek egy nagyon egyszer, szzskokra pl nyelvi
modellt hasznlnak, ennek ellenre j felidzsi (recall) s pontossgi (precision) mutatkkal rendelkeznek
nagyon nagy korpuszokon.
Az informcikinyer (information extraction) rendszerek bonyolultabb modellt alkalmaznak, amely
korltozottan figyelembe veszi a szintaxist s a szemantikt. Gyakran vges automatk kaszkdjval
valstjk meg ket.
A gpi fordt (machine translation) rendszereket klnbz technikk alkalmazsval valstottk meg, a
teljes szintaktikai s szemantikai analzistl kezdve egszen a szgyakorisgon alapul statisztikai
mdszerekig.
Egy statisztikai nyelvi rendszer ptse sorn az a legjobb, ha olyan rendszert gondolunk ki, amely a
rendelkezsre ll adatokat jl hasznostja, mg akkor is, ha a modell a vgletekig leegyszerstettnek tnik.

Az n-gram betmodelleket nyelvi modellezsre Markov javasolta (Markov, 1913). Claude Shannon generlt
elsknt n-gram szmodelleket az angol nyelvre (Shannon s Weaver, 1949). Chomsky mutatta meg a vges
llapot modellek korltait a krnyezetfggetlen modellekhez kpest, az albbi kvetkeztetst levonva:
Valsznsgi modellek nem adnak rszletes bepillantst a szintaktikai struktrk egyes alapvet problmiba
(Chomsky, 1956; 1957). Ez igaz, azonban figyelmen kvl hagyja azt a tnyt, hogy a valsznsgi modellek
lehetv teszik a bepillantst nhny ms alapvet problmba, olyanokba, amelyekkel a CFG-k nem
foglalkoznak. Chomsky szrevteleinek olyan sajnlatos hatsa volt, hogy kt vtizeden keresztl sokakat
elijesztett a statisztikai modellektl egszen addig, mg ezek a modellek jra megjelentek a beszdfelismersben
(Jelinek, 1976).
Az adj-hozz-egyet simts Jeffreystl szrmazik (Jeffreys, 1948), mg a trlt interpolcis simts Jelinektl s
Mercertl, akik beszdfelismersre hasznltk (Jelinek s Mercer, 1980). Tovbbi technikkra plda a Witten
Bell-simts (WittenBell, 1991) s a GoodTuring-simts (Church s Gale, 1991). Az utbbit gyakran
hasznljk bioinformatikai problmknl is. A biostatisztika s a valsznsgi termszetes nyelv feldolgozs
(NLP) kzelednek egymshoz, mivel mindkett alkotelemek bcjbl felpl hossz, strukturlt
szekvencikkal foglalkozik.
757
Az egyszer n-gram bet- s szmodellek nem az egyetlen lehetsges valsznsgi modellek. Blei s trsai
lerjk a rejtett Dirichlet-allokcinak (latent Dirichlet allocation) nevezett valsznsgi szvegmodellt,
amely a szvegeket tmk keverknek tekinti, amelyben mindegyik tma sajt szeloszlssal rendelkezik (Blei
s trsai, 2001). Ez a modell a rejtett szemantikai indexels (latent semantic indexing) modell (Deerwester s
trsai, 1990) (lsd mg (Papadimitriou s trsai, 1998)) kibvtsnek s racionalizlsnak tekinthet, valamint
Sahami s trsai tbbszrs okkeverk (cause mixture) modelljhez is ktdik (Sahami s trsai, 1996).
A valsznsgi krnyezetfggetlen nyelvtanok (PCFG) megvlaszoljk Chomsky valsznsgi modellekkel
kapcsolatos sszes ellenvetst, s a CFG-khez kpest elnykkel rendelkeznek. A PCFG-ket Booth (Booth,
1969) s Salomaa (Salomaa, 1969) vizsgltk. Jelinek bemutatja a veremdekdol algoritmust, amely a Viterbikeress olyan varicija, amely arra hasznlhat, hogy megtallja egy PCFG-vel a legvalsznbb elemzst
(Jelinek, 1969). Baker vezette be a belskls algoritmust (Baker, 1979), Lari s Young lerta hasznlhatsgt
s korltait (Lari s Young, 1990). Charniak (Charniak, 1996), valamint Klein s Manning (Klein s Manning,
2001) a treebank nyelvtanokkal trtn elemzst trgyaljk. Stolcke s Omohundro megmutattk, hogyan lehet
nyelvtani szablyokat tanulni Bayes-modellek egyestsvel (Stolcke s Omohundro, 1994). Tovbbi PCFGalgoritmusokat mutatott be Charniak (Charniak, 1993), valamint Manning s Schtze (Manning s Schtze,
1999). Collins a terlet ttekint tanulmnyt knlja, tovbb az egyik legsikeresebb statisztikai
elemzprogram magyarzatt (Collins, 1999).
Sajnos a PCFG-k rosszabbul teljestenek, mint az egyszer n-gram modellek szmos feladat esetn, mert a
PCFG-k nem kpesek reprezentlni az egyes szavakhoz trsul informcikat. Hogy kijavtsk ezt a
hinyossgot, szmos szerz (Collins, 1996; Charniak, 1997; Hwa, 1998) bevezettk a szkinccsel elltott
valsznsgi nyelvtanok (lexicalized probabilistic grammar) klnbz verziit, amelyek kombinljk a
krnyezetfggetlen s a szalap statisztikkat.
A Brown-korpusz volt az els prblkozs, hogy tapasztalati nyelvszeti clokra kiegyenslyozott korpuszt
gyjtsn (Francis s Kucera, 1967). Krlbell egymilli szt tartalmazott, szfaji informcival elltva.
Eredetileg 100 ezer lyukkrtyn troltk. A Penn treebank krlbell 1,6 milli sz gyjtemnye, kzi
elemzssel fkba rendezve. Elfr egy CD-n. A brit nemzeti korpusz (British National Corpus) kibvti ezt 100
milli szra (Leech s trsai, 2001). A vilghl tbb mint egybilli szt tartalmaz, tbb mint 10 milli
szerveren troldik.
Az informcikeress (informational retrieval) terlete irnti rdeklds jra n, amelyet az internetes
keress szles kr elterjedse inspirl. Robertson egy korai ttekintst ad, s bevezeti a valsznsgi
rangsorolsi elvet (Robertson, 1977). Manning s Schtze az NLP statisztikai megkzeltsnek kontextusban
trgyalja rviden az IR-t (Manning s Schtze, 1999). Baeza-Yates s Ribeiro-Neto ltalnos cl ttekintst ad
(Baeza-Yates s Ribeiro-Neto, 1999), helyettestve az olyan rgi klasszikusokat, mint Salton s McGill (Salton
s McGill, 1983), valamint Frakes s Baeza-Yates (Frakes s Baeza-Yates, 1992). A Gigabjtok kezelse
(Managing Gigabytes) c. knyv pont azt teszi, amit a cme mond: elmagyarzza hogyan lehet hatkonyan
indexelni, tmrteni s lekrdezni gigabjtos mret korpuszokat (Witten s trsai, 1999). Az amerikai
kormny Nemzeti Szabvnygyi s Technolgiai Intzete (National Institute of Standards and Technology,
NIST) ltal szervezett TREC konferencia minden vben megrendezi az IR-rendszerek versenyt, s
kiadvnyban publiklja az eredmnyeket. A verseny els ht vben a rszt vev rendszerek teljestmnye
krlbell megduplzdott.
A legnpszerbb IR-modell a vektortr modell (vector space model) (Salton s trsai, 1975). Salton munkja
uralta a terlet korai veit. Kt alternatv valsznsgi modell ltezik. Mi a Ponte s Croft munkjn alapult
mutattuk be (Ponte s Croft, 1998). A P(D, Q) kzs valsznsgi eloszlst P(Q|D) segtsgvel modellezi.
Egy alternatv modell (Maron s Kuhns, 1960; Robertson s Sparck Jones, 1976) a P(D|Q)-t hasznlja. Lafferty
s Zhai megmutatta, hogy a modellek ugyanazon a kzs valsznsgi eloszlson alapulnak, azonban a
modellvlasztsnak kvetkezmnyei vannak a paramtertantsra (Lafferty s Zhai, 2001). Az ltalunk
bemutatottak az munkjukon alapul. Turtle s Croft sszehasonltjk a klnfle IR-modelleket (Turtle s
Croft, 1992).
Brin s Page lerjk egy vilghln keres gp implementcijt, taglalva a PAGERANK algoritmust is, mely a
dokumentumok minsgnek weblinkek elemzsn alapul lekrdezsfggetlen mrtke (Brin s Page, 1998).
Kleinberg lerja, hogyan lehet hiteles forrsokat tallni a weben hivatkozselemzssel (Kleinberg, 1999).
Silverstein s trsai megvizsgltak egy egymillird webkeresst tartalmaz logot (Silverstein s trsai, 1998).
Kukich felmrte a helyesrsi hibk javtsnak irodalmt (Kukich, 1992). Porter lerja a klasszikus szablyalap
sztvest algoritmust (Porter, 1980), mg Krovetz egy sztralap verzit r le (Krovetz, 1993).
758
Manning s Schtze a dokumentumosztlyozs s klaszterezs alapos ttekintst adjk (Manning s Schtze,

1999). Joachims statisztikai tanulsi elmletet s szupport vektor gpeket alkalmazott annak elmleti
vizsglatra, hogy mikor sikeres egy osztlyozs (Joachims, 2001). Apt s trsai a Reuters-hrek Jvedelmek
kategriba trtn osztlyozsnl 96%-os pontossgot publiklt (Apt s trsai, 1994). Koller s Sahami 95%os pontossgot rt el egy naiv Bayes-osztlyozval, s akr 98,6%-ot is, ha olyan Bayes-osztlyozt
alkalmazott, amely bizonyos jellemzk kzti sszefggseket is figyelembe vett (Koller s Sahami, 1997).
Lewis ttekinti a Bayes-osztlyozk negyvenves alkalmazst szvegosztlyzsra s visszakeressre (Lewis,
1998).
Az Information Retrieval jsg s az ves SIGIR konferenciakiadvnyai a terlet friss fejlemnyeit fedik le.
A korai informcikinyer programok kz tartozik a GUS (Bobrow s trsai, 1977) s a FRUMP (DeJong, 1982).
A modern informcikinyer rendszerek egyes tervezsi rszletei az 19701980-as vekbeli szemantikai
nyelvtanokkal foglalkoz kutatsokra vezethetk vissza. Pldul egy szemantikai nyelvtanokon alapul
replgp-foglal rendszer interfsze olyan kategrikkal rendelkezne, mint a Hely s a Repl, az NP-k s a VPk helyett. Birnbaum s Selfridge munkja egy szemantikai nyelvtanon alapul rendszer megvalstst mutatja
be (Birnbaum s Selfridge, 1981).
Az jabb kelet informcikinyerssel foglalkoz munkkat az amerikai kormny ltal szponzorlt Message
Understand Conference (MUC) konferencik mozgattk. A Fastus-rendszert Hobbs s trsai ksztettk (Hobbs
s trsai, 1997), s az a publikcigyjtemny, amely bemutatja, tovbbi vges llapot modelleket alkalmaz
rendszereket is felsorol (Roche s Schabes, 1997).
Az 1930-as vekben Petr Troyanskii beadott egy fordtgpre vonatkoz szabadalomkrelmet, azonban mg
nem llt rendelkezsre szmtgp tleteinek megvalstsra. 1947 mrciusban a Rockefeller Alaptvnynak
dolgoz Warren Weaver az rta Norbert Weinernek, hogy a gpi fordts megvalsthat lehet. A kriptogrfiai s
informcielmleti munkkra alapozva Weaver azt rta, hogy: Amikor egy orosz nyelv cikket nzek, azt
mondom, hogy Ezt igazbl angolul rtk, azonban furcsa szimblumokkal kdoltk. Most pedig nekillok a
dekdolsnak. A kvetkez vtizedben a kzssg ilyen mdon prblta a dekdolst. Az IBM 1954-ben
bemutatott egy kezdetleges rendszert. Bar-Hillel (Bar-Hillel, 1960), valamint Locke s Booth (Locke s Booth,
1955) lertk az ebben az idszakban meglv lelkesedst. A gpi fordtsbl val ksbbi kibrndulst
Lindsay rta le, aki a gpi fordts nhny olyan akadlyt is bemutatta, amelyek a szintaxis s a szemantika
kzti klcsnhatshoz s a vilg ismeretnek szksgessghez ktdnek (Lindsay, 1963). Az amerikai
kormny csaldott az elrehalads hinya miatt, ezt egy jelents akknt sszegezte, hogy a gpi fordtsnak
nincs kzvetlen vagy megjsolhat jvje (ALPAC, 1966). Ennek ellenre korltozottan ugyan, de folytatdott
a munka, s az amerikai lgier 1970-ben hadrendbe lltotta a SYSTRAN-rendszert, mg az Eurpai Kzssg
1976-ban kezdte azt hasznlni. A TAUM-METEO idjrsjelents-fordt rendszer hasznlata szintn 1976-ban
indult (Quinlan s OBrien, 1992). Az 1980-as vekben a rendelkezsre ll szmtsi teljestmny eljutott arra a
szintre, ahol az ALPAC megllaptsai mr nem voltak helyesek. Voorhees bemutat nhny Wordneten alapul,
kzelmltbeli fordtsi alkalmazst (Voorhees, 1993). Bevezet tanknyvet Hutchins s Somers rt (Hutchins s
Somers, 1992).
A statisztikai gpi fordts Weaver 1947-es megjegyzsig nylik vissza, azonban csak az 1980-as vekre jutott
el gyakorlati szintre. Az ltalunk bemutatottak Brown s kollginak IBM-beli munkin alapulnak (Brown s
trsai, 1988; 1993). Nagyon komoly matematikt alkalmaznak, ezrt a Kevin Knight ltal rt ksr oktatanyag
sokat segt a megrtsben (Knight, 1999). A mg frissebb statisztikai gpi fordts terletn vgzett munkk
tovbblpnek a bigram modellen, s olyan modelleket hasznlnak, amelyek valamennyi szintaxist is figyelembe
vesznek (Yamada s Knight, 2001). A mondatszegmentci tern Palmer s Hearst vgeztk a korai munkkat
(Palmer s Hearst, 1994). Michel s Plamondon a ktnyelv mondatillesztsrl rtekezik (Michel s Plamondon,
1996).
Kt kitn knyv szl a valsznsgi nyelvfeldolgozsrl: Charniak knyve rvid s lnyegre tr (Charniak,
1993), mg Manning s Schtze munkja tfog s napraksz (Manning s Schtze, 1999). A gyakorlati
nyelvfeldolgozs tern vgzett munkkat a ktvente megrendezett Applied Natural Language Processing
(ANLP) s az Empirical Methods in Natural Language Processing (EMNLP) konferencik, valamint a Natural
Language Engineering folyirat mutatja be. A SIGIR egy hrlevelet s egy informcikeresst trgyal
venknti konferencit tmogat.
5.2. Feladatok
23.1.
759
(Jurafsky s Martin, 2000) alapjn. Ebben a feladatban szerzsget osztlyoz rendszert fogunk kifejleszteni,
amely egy adott szveg esetn megprblja meghatrozni, hogy a kt plyz szerz kzl melyik rta a
szveget. Szerezznk be szvegeket kt klnbz szerztl. Vlasszuk szt ket tant s teszthalmazokra.
Tantsunk unigram modellt mindkt szerz tant halmaza alapjn. Vgl minden egyes tesztel szvegre
szmtsuk ki mindkt unigram modellre a valsznsget, s rendeljk a legvalsznbb modellhez. Hatrozza
meg a technika pontossgt. Tudn nvelni a pontossgot tovbbi jellemzkkel? A nyelvszet ezen rszterlett
a stlusmrs tudomnynak (stylometry) nevezzk, sikerei kz sorolhat a Federalist Papers (Mosteller s
Wallace, 1964), valamint Shakespeare nhny vitatott munkja (Foster, 1989) szerzjnek meghatrozsa.
23.2.
Ez a feladat az n-gram modellek minsgt mri fel. Keressen vagy hozzon ltre krlbell 100 ezer szavas
egynyelv korpuszt. Trdelje szavakra, s szmtsa ki az egyes szavak elfordulsi gyakorisgt. Hny
klnbz sz tallhat benne? brzolja a gyakorisgot a sorrend (leggyakoribb, msodik leggyakoribb stb.)
fggvnyben loglog skln. Hatrozza meg a bigramok (kt egymst kbvet sz) s trigramok (hrom
egymst kvet sz) gyakorisgt is. Hasznlja ezeket a gyakorisgokat nyelv generlsra: az unigram, bigram
s trigram modell alapjn a gyakorisgnak megfelel vletlen vlasztssal generljon 100 szavas szvegeket.
Hasonltsa ssze ezeket a szvegeket a tnylegesen beszlt nyelvvel. Vgl szmolja ki az egyes modellek
sszetettsgt.
23.3.
Ez a feladat a spam-felismerssel foglalkozik. A spam defincija kretlen tmeges reklm e-mail. A spam
kezelse bosszant elfoglaltsg szmos e-mailez szmra, teht megbzhat eltvoltsuk lds lenne. Hozzon
ltre spam s spam-mentes e-mailekbl ll korpuszt. Elemezze mindkt korpuszt, s llaptsa meg, hogy mely
jellemzk lennnek alkalmasok az osztlyozsra (unigram, brigram, zenethossz, felad, rkezsi id). Ezutn
tantson egy osztlyoz algoritmust (dntsi fa, naiv Bayes vagy ms, n ltal vlasztott algoritmus) egy tant
halmazon, majd rtkelje pontossgt egy teszthalmazon.
23.4.
Ksztsen t lekrdezsbl ll teszthalmazt, majd kldje el hrom nagy webkeresnek. rtkelje mindegyik
pontossgt az els 1, 3 s 10 dokumentumra s az tlagos reciprok rangra. Prblja megmagyarzni az
eltrseket.
23.5.
Prbljon megbizonyosodni arrl, hogy az elbbi feladat keresgpei kzl melyek hasznlnak betkonverzit,
sztvestst, szinonimkat s helyesrsihiba-javtst.
23.6.
Becslje meg, hogy mekkora trterlet szksges egy egymillird weboldalt tartalmaz korpusz indexelshez.
Mutassa be a felttelezseket, amelyekre alapozott.
23.7.
rjon egy regulris kifejezst vagy egy rvid programot vllalatnevek kinyersre. Tesztelje zleti hreket
tartalmaz cikkeken. Adja meg az elrt felidzst s pontossgot.
23.8.
Vlasszon ki t mondatot s kldje el egy internetes fordtszolgltatsnak. Fordtsa le angolrl egy idegen
nyelvre, majd vissza angolra. rtkelje a kapott mondatokat nyelvtani helyessg s a jelents megtartsnak
szempontjbl. Ismtelje meg a folyamatot; az iterci msodik lpse rosszabb vagy azonos eredmnyeket ad?
Befolysolja az eredmny minsgt a kzbens nyelv megvlasztsa?
23.9.
Gyjtsn ssze idre vonatkoz kifejezseket, pldul kt rakor, jflkor, 12:46-kor. Talljon ki olyan
nyelvtanilag helytelen pldkat is, mint huszont rakor vagy flnegyedhromkor. rjon nyelvtant az id
nyelvre.
760
23.10.
(Knight, 1999) alapjn. Az IBM Model 3 gpi fordt felttelezi, hogy miutn a szvlasztsi modell egy
szlistt ajnl, a nyelvi modell kpes kivlasztani a legjobb permutcit. Ez a feladat megvizsglja, hogy
mennyire rtelmes ez a felttelezs. Prblja meghatrozni a kvetkez mondatok szavainak helyes sorrendjt:
a. have programming a seen never I language better
b. loves john mary
c. is the communication exchange of intentional information brought by about the production perception of and
signs from drawn a of system signs conventional shared
Melyik mondat szavait tudta sorrendbe tenni? Milyen tuds alapjn volt erre kpes? Tantson egy bigram
modellt egy tant korpusz alapjn, s hasznlja arra, hogy meghatrozza egy tesztkorpusz mondatainak
legnagyobb valsznsg permutciit. Mutassa meg a modell pontossgt.
23.11.
Amennyiben megnz egy angolfrancia sztrt, a hear ige fordtsa entendre.34 Azonban ha az IBM Model
3-at a kanadai Hansard alapjn tantjuk, akkor a hear legvalsznbb fordtsa Bravo. Magyarzza meg,
hogy mi ennek az oka, s becslje meg, hogy mi lehet a hear termkenysgi eloszlsa. (Segtsg: ha Hansardszvegeket szeretne megnzni, rja be egy webkeresbe a [Hansard hear] lekrdezst.)
34
hall, hallgat (A ford.)
761
24. fejezet - Az szlels

Ebben a fejezetben a szmtgpet a zord, koszos vilghoz csatlakoztatjuk.
Az szlels informcihoz juttatja az genst arrl a vilgrl, amelyben ltezik. Az szlelst az rzkelk
(sensors) kezdemnyezik. Egy rzkel lehet brmi, ami a krnyezet valamelyik aspektust rgzti s tovbbtja
az gensprogram szmra. Ez olyan egyszer is lehet, mint egy egybites rzkel, amely egy kapcsol be s ki
llapott jelzi, de lehet olyan bonyolult is, mint az emberi szem retinja, amely tbb mint szzmilli
fotorzkeny elemet tartalmaz. Ebben a fejezetben a ltsra sszpontostunk, mert a fizikai vilg kezelsben ez
az szlelsfajta messze a leghatsosabb.
1. Bevezets
Egy mestersges gens tbb szlelsi modalitssal is rendelkezhet. Amin az gensek s az emberek is osztoznak,
az tbbek kztt a lts, a halls s a tapints. A hallssal a beszdfelismers tmn bell, a 15.6. alfejezetben
foglalkozunk. A tapints, mskppen a taktilis rzkels (tactile sensing) a 25. fejezet tmja, ahol a kzi
mveleteket vgz genseknl vizsgljuk meg ennek a hasznlatt, a fejezet htralev rsze pedig a ltssal
foglalkozik. Egyes robotok aktv rzkelst (active sensing) vgeznek, azaz kikldenek egy jelet, mint pldul
radar- vagy ultrahangjelet, s ennek a jelnek a krnyezetbl rkez visszaverdst vizsgljk.
Egy gens ktfle mdon hasznlhatja az rzkelseit. A tulajdonsg kinyersi (feature extraction)
megkzelts szerint az gens nhny kevs szm tulajdonsgot szlel az rzkel bemenetein, s ezeket
tovbbtja az gensprogramnak, amely a tulajdonsgoknak megfelelen reagl, vagy kombinlja ket ms
informcikkal. A wumpus gens ily mdon mkdtt, t rzkelvel, amelyek mindegyike egybites
informcit nyert ki. Ma mr ismert, hogy egy lgy az optikai bemenetrl tulajdonsgokat nyer ki, s ezeket
direkt mdon a kanyarodsban segt izmokhoz tovbbtja, lehetv tve, hogy 30 milliszekundumon bell
reagljon, s irnyt vltson.
Az alternatv lehetsg a modellalap (model-based) megkzelts, ahol a szenzoros bemenet alapjn a vilg
egy modellje pl fel. E megkzelts szerint egy f fggvnybl indulunk ki, amely a vilg W llapott az ltala
keltett S ingerletre kpezi le:
S = f (W)
Az f fggvnyt a fizika s az optika hatrozza meg, s viszonylag jl ismerjk. S s egy vals vagy elkpzelt W
vilg ellltsa f-bl a szmtgpes grafika (computer graphics) ltal kezelt problma. A szmtgpes lts
bizonyos rtelemben a szmtgpes grafika fordtottja, ha adott f s S, akkor W-t prbljuk kiszmtani:
W = f
(S)
Sajnos az f-nek nincs jl definilt inverze. Nem lthatunk a sarkon tlra, gy a vilg aktulis llapotnak minden
aspektust az ingerletbl visszalltani nem tudjuk. St az a rsze, amit lthatunk, nagyban bizonytalan:
kiegszt informci nlkl nem tudjuk megmondani, hogy S egy jtk Godzilla-kpe, amint egy hatvan
centimteres modellpletet tarol le, vagy egy valsgos szrnyeteg, amely egy hatvanmteres pletet pusztt
el. Ezen problmk egy rszt kezelhetjk gy, hogy egy vilg megtallsa helyett vilgok valsznsgi
eloszlst hatrozzuk meg:
P(W) = P(W|S)P(S)
Az ilyen modellezs legfontosabb htrnya az, hogy tl nehz problmt ksrel meg megoldani. Gondoljunk
bele, hogy a szmtgpes grafikban tbbrnyi szmtsra lehet szksg egy film egyetlen kockjnak az
ellltshoz, amibl 24 kocka kell msodpercenknt, s f 1 kiszmtsa sokkal bonyolultabb, mint f-. Vilgos,
hogy ez tl sok szmts egy szuperszmtgp szmra, hogy vals idben reagljon, nem is beszlve egy
lgyrl. Szerencsre az gensnek nem kell a fnykph szmtgpes grafikhoz hasonl szint modellel
rendelkeznie a vilgrl. Az gensnek elegend azt tudnia, hogy rejtzkdik-e egy tigris a boztban, s nem kell
tudnia a tigris htn lev minden egyes szrszl pontos elhelyezkedst s irnyt.
A fejezet nagy rszben azt fogjuk ltni, hogy hogyan kell objektumokat pldul tigriseket felismerni,
tovbb olyan mdszereket, amelyek ezt a tigris minden egyes rszletnek reprezentlsa nlkl teszik. A 24.2.
alfejezetben a kpalakts folyamatt tanulmnyozzuk majd, definilva az f(W) fggvny egyes aspektusait.
762
Az szlels
Elszr a folyamat geometrijra tekintnk. Ltni fogjuk, hogy a fny a vilg objektumairl az gens
rzkeljnek kpskjn lv pontokra verdik vissza. Ez a geometria magyarzza meg, hogy egy nagy Godzilla
a tvolban mirt nz ki gy, mint egy kis Godzilla a kzelben. Ezutn a folyamat fotometrijt vizsgljuk, amely
lerja, hogy a tj fnye hogyan hatrozza meg a kp pontjainak fnyessgt. A geometria s a fotometria egytt
egy olyan modellt nyjtanak, amely lerja, hogy a vilg objektumai hogyan kpzdnek le a kppontok
ktdimenzis tmbjre.
Annak megrtse utn, hogy hogyan jnnek ltre a kpek, megvizsgljuk, hogy hogyan dolgozzuk fel ket. A
vizulis feldolgozs folyamata az emberekben s a szmtgpekben is hrom rszre bonthat. Elszr, avagy
az alacsony szint lts sorn (24.3. alfejezet), a feldolgozatlan kpet simtjuk, hogy kiszrjk a zajt, majd a
ktdimenzis kp tulajdonsgait kinyerjk, elssorban a kp rgii kztti leket. A kzps szint ltsban
ezeket sszekapcsolva rgikat hozunk ltre. A magas szint ltsban (24.4. alfejezet) a ktdimenzis rgikat
mint a vilg valsgos objektumait ismerjk fel (24.5. alfejezet). A kpekben megtallhat olyan specilis
informcikat tanulmnyozunk, amelyeket erre a clra felhasznlhatunk, mint pldul a mozgst, a trbeli
informcit,a textrt, az rnyalst s a kontrokat. Az objektumfelismers fontos a vadonban lev gens
szmra, hogy szlelje a tigriseket, s fontos az ipari robotok szmra, hogy megklnbztesse az anykat a
csavaroktl. Vgezetl a 24.6. alfejezet megmutatja, hogy az objektumok felismerse hogyan segthet neknk
olyan hasznos feladatokban, mint pldul a manipulls vagy a navigci. A manipulls azt jelenti, hogy
megragadhatunk s hasznlhatunk szerszmokat, illetve ms trgyakat, a navigci pedig azt, hogy egyik
helyrl tmehetnk egy msikra anlkl, hogy nekimennnk valaminek. Ezeket a feladatokat szben tartva
biztosthatjuk, hogy egy gens csak akkora modellt ptsen, amire cljai elrshez szksge van.
2. Kpalkots
A lts egy jelenet (scene) objektumairl szrd fnyt sszegyjti, majd egy ktdimenzis kpet (image) alkot
egy kpskon. A kpskot fnyrzkeny anyag bortja: a retinban rodopszinmolekulk, a negatv filmen ezsthalogenidek, a digitlis fnykpezgpben pedig egy tltscsatolt eszkz (CCD) lapka. A CCD minden cellja
szszegyjti a fnyelnyels ltal adott id alatt keltett elektronokat. A digitlis fnykpezgpben a kpsk egy
nhny milli kppontbl (pixel) ll ngyzethlra van felosztva. A szem hasonl kppontrccsal rendelkezik,
amely krlbell 100 milli plcikt s 5 milli csapot tartalmaz egy hexagonlis mozaikba rendezve.
A jelenet nagyon nagy, s a kpsk egszen kicsi, teht lennie kell valamilyen mdszernek a fny kpskra
fkuszlshoz. Ezt megtehetjk lencsvel vagy anlkl. Brhogy is tesszk, a lnyeg a geometria
meghatrozsa, hogy megmondhassuk, a jelenet melyik pontja hova kerl a kpskon.
2.1. Lencsk nlkli kpek: a sttkamra

24.1. bra - A kpalkots geometrija a sttkamrban
763
Az szlels
A kpalkots legegyszerbb eszkze a sttkamra, amely egy doboz elejn tallhat kis lyukbl (O) s a doboz
hts rszn lev kpskbl ll (lsd 24.1. bra). Egy hromdimenzis koordinta-rendszert fogunk hasznlni,
amelynek az origja az O pont, a jelenet egy P pontjt pedig az (X, Y, Z) koordintkkal reprezentljuk. A P
pontot egy P' pontra kpezzk le a kpskon, amelynek koordinti (X, Y, Z). Ha f az O pontszer lyuknak a
kpsktl vett tvolsga, akkor a hasonl hromszgek alapjn az albbi egyenleteket tudjuk levezetni:
Ezek az egyenletek egy perspektivikus vetts (perspective projection) nven ismert kpalkotsi eljrst
definilnak. Vegyk szre, hogy a Z az osztban azt jelenti, hogy minl tvolabb van az objektum, annl kisebb
lesz a kpe. Valamint azt is figyeljk meg, hogy a kp, mind a baljobb, mind a felle irnyban fordtott a
jelenethez kpest, amit az egyenletekben a negatv eljel jelez.
A perspektivikus vettsben a prhuzamos vonalak a horizontvonalon lv pontban futnak ssze. Nzzk meg,
mirt szksgszer ez! Az (X0, Y0, Z0) ponton keresztl (U, V, W) irnyban thalad egyenes lerhat, mint az (X0
+ U, Y0 + V, Z0 + W) pontok halmaza, ahol a + s kztt vltozik. Ezen egyenes egy P pontjnak
kpskra vett vetlett az:
adja. Amint vagy ez a pont a p = (fU/W, fV/W) lesz, ha W 0. A p pontot az (U, V, W) irny
egyenesek csaldjval kapcsolatos tvlatpontnak (vanishing point) nevezzk. Az azonos irny egyenesek
tvlatpontja azonos.
Ha a trgy a kamrtl vett tvolsghoz kpest viszonylag lapos, a perspektivikus vettst a sklzott
ortografikus vettssel (scaled orthographic projection) kzelthetjk. Ennek elve a kvetkez. Ha a trgy
pontjainak Z mlysge egy bizonyos Z0 Z tartomnyban vltozik, s Z = Z0, akkor a perspektva f/Z skla
tnyezjt az s = f/Z0 llandval lehet kzelteni. Az (X, Y, Z) jelenet koordintkbl a kpskra trtn vetts
egyenletei az x = sX s az y = sY lesznek. Jegyezzk meg, hogy a sklzott fggleges sk vetts egy kzelts,
amely a jelenet azon rszeire rvnyes, amelyeknek a sajt mlysgvltozsuk elenysz. A globlis
tulajdonsgok tanulmnyozsra ezt a mdszert nem szabad hasznlni. Hogy az vatossg nem rt, erre egy
plda: fggleges sk vettsben a prhuzamos vonalak prhuzamosak maradnak ahelyett, hogy egy
tvlatpontban sszefutnnak.
2.2. Lencserendszerek
A gerincesek szeme s a modern kamerk is lencsket hasznlnak. A lencse a sttkamra nylsnl nagyobb,
gy tbb fnyt enged t. Ennek az az ra, hogy egyidejleg a jelenet minden rsznek az lessgt nem lehet
biztostani. A jelenet egy Z tvolsgban lv pontjnak a kpe a lencstl egy rgztett Z' tvolsgban
keletkezik, s a Z s a Z' kztt az:
relci ll fenn, ahol f a lencse fkusztvolsga. Ha a lencse optikai kzppontja s a kpsk kztti tvolsgot
valamilyen Z'0-nak vlasztjuk, a jelenet azon trgyai, amelyek a Z0 krl egy adott mlysgtartomnyban
fekszenek, ahol Z0 a megfelel trgytvolsg, nagyjbl lesen fognak ltszani. A jelenet ezen mlysgi
tartomnyt mlysglessgnek (depth of field) nevezzk.
Jegyezzk meg, hogy mivel a Z trgytvolsg ltalban sokkal nagyobb, mint a Z' kptvolsg vagy mint az f,
sokszor jogos az albbi kzelts:
Azaz a kptvolsg Z' f. A sttkamra vettsegyenleteit teht egy lencse ltal ltrehozott kp geometrijnak
lershoz is hasznlhatjuk.
764
Az szlels
Ahhoz, hogy a klnbz Z tvolsgban lv trgyakat lesen lssuk, az emberi szem lencsje (lsd 24.2. bra)
vltoztatja az alakjt, a kamera lencsje pedig Z irnyban elmozdul.
24.2. bra - Az emberi szem vzszintes keresztmetszete
2.3. A fny: a kpalkots fotometrija

A fny nlklzhetetlen a ltshoz: nlkle minden kp egyformn stt lenne, fggetlenl attl, mennyire
rdekes a jelenet. A fotometria (photometry) a fny tanulmnyozsa. Sajt cljainkra azt fogjuk modellezni,
hogy a jelenet fnye hogyan kpzdik le az idben a kpsk fnyintenzitsra, amit I(x, y)-nal1 jellnk. A lts
rendszere ezt a modellt visszafel alkalmazza, a kpek intenzitsbl kiindulva a vilg tulajdonsgai fel. A
24.3. bra egy asztalon lv tzgp digitalizlt kpt s a tzgp egy 12 12 kppontbl ll rszlett
mutatja. Egy szmtgpes program, amely rtelmezni prblja a kpet, egy ilyen intenzitsmtrixbl indulna ki.
24.3. bra - (a) Egy asztalon lv tzgp fnykpe. (b) Az (a) egy 12 12 kppontbl
ll, nagytott rszlete. (c) A rszletnek megfelel kpfnyessgrtkek egy 0-tl 255-ig
tart skln.
Ha az idbeli vltozst is vizsgljuk, akkor az I(x, y, t) jellst alkalmazzuk.
765
Az szlels
A kp egy kppontjnak a fnyessge arnyos a jelenet kppontba vettett felleteleme ltal a kamera fel
irnytott fny mennyisgvel. Ez viszont fgg a felletelem fnyvisszaver tulajdonsgaitl s a fnyforrsok
elhelyezstl, valamint eloszlstl a jelenetben. Egy kppont fnyessgbe a jelenet egyb rszeinek
fnyvisszaver tulajdonsgai is beleszlnak, hiszen a jelenet ms felletei indirekt fnyforrsknt szolglnak,
mivel a rjuk es fnyt az adott felletelem fel verik vissza.
Ktfle visszaverdst modellezhetnk. A tkrz visszaverds (specular reflection) azt jelenti, hogy a fny
a trgy kls felletrl verdik vissza, s teljesti azt a knyszert, miszerint a beess s a visszaverds szge
megegyezik. Ilyen a tkletes tkr viselkedse. A diffz visszaverds (diffuse reflection) azt jelenti, hogy a
fny a trgy felsznn bellre hatol, a trgy a fnyt elnyeli s ismtelten kisugrozza. A tkletesen diffz
(avagy Lambert-fle) fellet minden irnyban azonos intenzitssal szrja a fnyt. Az intenzits egyedl a
fnyforrstl rkez fny beessi szgtl fgg: a felletre pontosan merleges fnyforrs esetn lesz a
legnagyobb intenzits a reflexi, mg majdnem prhuzamos fnyforrs esetn a legkisebb. E kt vglet kztt a
viszszaverdst Lambert koszinusztrvnye rja le:
I = kI0cos
ahol s a fnyforrs intenzitsa, a fellet normlisa s a fny beessi irnya kztti szg, k a visszaverdsi
tnyez rtke, amely a fellet visszaversi kpessgeitl fgg, s 0-tl (tkletesen fekete fellet) 1-ig
(tkletesen fehr fellet) vltozik.
A valdi letben a felletek kevert, diffz s tkrs tulajdonsgak. Szmtgpes modellezsk a szmtgpes
grafika f alkalmazsi terlete. A valsgh kpek ellltsa ltalban fnysugr-kvetsi eljrssal trtnik,
amely szimullja azt a fizikai folyamatot, ahogy a fnysugr a forrsnl keletkezik, s a trgyakrl tbbszrsen
visszaverdik.
2.4. Sznek: a kpalkots spektrlis fotometrija

A 24.3. brn egy fekete-fehr kpet mutattunk, nagyban figyelmen kvl hagyva azt a tnyt, hogy a lthat fny
a hullmhosszak egsz tartomnyt leli t a 400 nm-tl kezdve a spektrum ibolyaszn vgnl, egszen a
700 nm-ig a vrs szn vgnl. Bizonyos fny csak egyetlen hullmhosszbl ll, amely a szivrvny egy
sznnek felel meg. De ms fnyek klnbz hullmhosszok keverkei. Azt jelenti ez, hogy az I(x, y)
mrtkre egyetlen szm helyett az rtkek egy keverke kell? Ha a fny fizikjt pontosan akarnnk
reprezentlni, akkor bizony igen. De ha csak utnozni akarjuk az emberek (s ms gerincesek) fnyrzkelst,
akkor kthetnk kompromisszumokat. Ksrletek mutatjk (egszen 1801-tl, Thomas Youngtl), hogy
hullmhosszak brmilyen komplex keverkt is elllthatjuk mindssze hrom szn keversvel. Azaz, ha van
egy fnygenertor, amely kpes linerisan kombinlni hrom hullmhosszt (tipikusan a vrs [700 nm], a zld
[546 nm] s a kk [436 nm] szneket vlasztjuk), akkor az egyes szneket erst, msokat gyengt gombok
csavargatsval brmilyen hullmhossz-kombinci bellthat, legalbbis az emberi rzkels szempontjbl.
Ez a ksrleti tny azt jelenti, hogy a kpek egy olyan vektorral reprezentlhatk, amely kppontokknt csak
hrom intenzitsrtket trol: minden elsdleges hullmhosszra egyet. A gyakorlatban mindegyiket egy bjttal
brzolva a kp igen j minsg reprodukcijt kapjuk. A sznek ezen hromszn szlelse azzal a tnnyel
van sszefggsben, hogy hromfle csap tallhat a retinban, amelyek rzkelsi maximuma 650, 530 s 430
nm, de az sszefggs pontos rszletei az egy az egyben trtn lekpezsnl bonyolultabbak.
3. Elzetes kpfeldolgozsi mveletek

Lttuk eddig, hogy a fny hogyan tkrzdik a jelenet trgyairl egy mondjuk tmilli hrombjtos kppontbl
ll kpet formlva. Mint minden rzkel esetben, most is lesz zaj a kpben, s minden esetben nagyon sok
adattal kell dolgozni. Elsknt a finomts mveleteit nzzk meg, amelyekkel a zaj cskkenthet, majd az
ldetektls mveleteit vizsgljuk. Ezeket elzetes vagy alacsony szint mveleteknek hvjuk, mivel ezek
az elsk egy mveletsorozatban. Az elzetes ltsi mveletekre egyrszt a lokalits jellemz (a kp egy
rszletre vgrehajthatk anlkl, hogy nhny kppontnl messzebb brmit is figyelembe vennnk), msrszt
az ismeretek hinya: anlkl finomthatjuk a kpeket vagy detektlhatunk leket, hogy brmilyen fogalmunk
lenne arrl, milyen objektumok vannak a kpeken. Ez az alacsony szint mveleteket eslyess teszi a
prhuzamos hardveren trtn megvalstsra, akr llnyekben, akr mestersges eszkzkben. Ezek utn a
kzps szinten lev mveletek nzzk majd meg, amelyekkel a kp rgikra bonthat. A mveletek ezen
fzisa mg mindig a kpen dolgozik, nem a jeleneten, de nem helyi feldolgozst ignyel.
766
Az szlels
A 15.2. alfejezetben a simts (smoothing) azt jelentette, hogy egy llapotvltoz rtkt jsoltuk meg
valamilyen mltbeli t idpontra, bizonyos, a t idpontra s tovbbi, egszen a jelenig terjed idpontokra
vonatkoz tnyek ismeretben. Most ugyanezt az tletet alkalmazzuk a trbeli kiterjedsre az idbeli helyett: a
simts egy kppont rtknek jslst jelenti a krnyez kppontok alapjn. Vegyk szre, hogy vilgosan
megklnbztetjk a kppontban mrt megfigyelt rtket s azt a valdi rtket, amit ott mrnnk kellett volna.
Ezek vletlenszer s szisztematikus mrsi hibk (pldul ha a CCD rzkelje elromlott) miatt
klnbzhetnek.
A simts egyik mdszere az, ha minden kpponthoz az t krnyez szomszdok rtkeinek tlagt rendeljk.
Ez az extrm rtkek kihagysa fel mutat megolds. De hny szomszdot kell figyelembe vennnk az egy
kppontnyi tvolsgra vagy a kett esetleg tbb pont tvolsgra lvket? Erre egy vlasz, amely jl mkdik
Gauss-zajok kiszrsre, a Gauss-szrt (Gaussian filter) hasznl slyozott tlag. Emlkezznk a standard
szrssal rendelkez Gauss-fggvnyre:
Egy Gauss-szr alkalmazsa azt jelenti, hogy az I(x0, y0) intenzitst lecserljk a minden (x, y)-ra kiszmolt I(x,
y)G(d) intenzitsok sszegvel, ahol d az (x0, y0) s az (x, y) pontok tvolsga. Az ilyen fajta slyozott sszeg
olyan gyakori, hogy van szmra egy specilis elnevezs s jells. Azt mondjuk, hogy a h fggvny az f s a g
fggvnyek konvolcija (convolution) (amit h = f g alakban runk), ha
Azaz a simtott fggvnyt gy kapjuk, hogy a kpet a Gauss-fggvnnyel konvolvljuk: I G. Egy kppontnyi
kevs zaj kisimtshoz elegend, mg 2 kppontnyi tbb zajt fog elsimtani, de valamilyen mrtk
rszletveszts mellett. Mivel a Gauss-hats a tvolsggal eltnik, a gyakorlatban a a szummkban 3-val
helyettesthet.
3.1. ldetektls
Az elzetes lts kvetkez lpse az lek (edges) detektlsa a kpskon. Az lek olyan egyenes vagy grbe
vonalak a kpskon, amelyekre merlegesen a kp fnyessgben lnyegesen vltozs van. Az ldetektls
vgs clja, hogy eltvolodjunk a bonyolult, tbb megabjtos kptl egy tmrebb, absztrakt reprezentci fel,
mint amilyen a 24.4. brn lthat. Az indtk az, hogy a kp lkontrjai a jelenet fontos kontrjainak felelnek
meg. A kpen hrom mlysgi diszkontinuits plda szerepel 1-gyel cmkzve; a 2-vel cmkzett felleti
orientci diszkontinuitsbl kt plda lthat, mg a 3-mal cmkzett visszaverdsi kpessg
diszkontinuitsokrl s a 4-gyel cmkzett fnyessgi diszkontinuitsokrl (rnyk) egy-egy. Az ldetektls
csak a kppel foglalkozik, gy nem tesz klnbsget a jelenet ezen diszkontinuitsfajti kztt, de a ksbbi
feldolgozs igen.
A 24.5. (a) bra egy asztalon nyugv tzgpet tartalmaz jelenet kpt mutatja, a 24.5. (b) pedig a kpre
lefuttatott ldetektl algoritmus eredmnyt mutatja. Lthatjuk, hogy az ldetektl kimenete s az idelis
vonalas bra kztt van klnbsg. A kis rszek lei nem mind illeszkednek egymshoz, vannak hzagok, ahol
nincsenek vonalak, valamint zajos kontrok, amelyek a jeleneten semmilyen lnyeges vonsnak nem felelnek
meg. A ksbbi feldolgozsi fzisokban ezeket a hibkat majd korriglni kell. Hogyan detektljuk a kpen az
leket? Figyeljk meg a kp fnyintenzits-profiljt egy egydimenzis keresztmetszet mentn egy lre
merleges irnyban, pl. az asztal bal le s a fal kztt. Nagyjbl olyan lesz ez, mint amit a 24.6. (a) bra
mutat. Az l helye az x = 50-nek felel meg.
767
Az szlels
24.4. bra - Klnfle lek: (1) mlysgi diszkontinuits, (2) felleti orientci
diszkontinuits, (3) viszszaverdsi kpessg diszkontinuits, (4) fnyessgi
diszkontinuits (rnykok)
24.5. bra - (a) Egy asztalon nyugv tzgp fnykpe. (b) Az (a) alapjn meghatrozott
lek.
Tekintettel, hogy az lek azoknak a kphelyeknek felelnek meg, ahol a fnyessgben hirtelen vltozs
tapasztalhat, egy naiv tlet az lehetne, hogy a kpet differenciljuk, s azokat a helyeket keressk meg, ahol az
I'(x) derivlt rtke nagy. Nos, az tlet majdnem mkdkpes. A 24.6. (b) brn lthatjuk, hogy az x = 50
csccsal egytt ms helyeken, msodlagos cscsok is megjelentek (pldul x = 75), amiket tvesen valdi
leknek fogadhatunk el. A jelensg oka a kp zajossga. Ha a kpet elszr simtjuk, akkor a felesleges cscsok
eltnnek, ahogy azt a (c) mutatja.
24.6. bra - Fell: Az I(x) intenzitsprofil egy egydimenzis rszlet mentn egy lpcsfok
ln t. Kzpen: Az intenzits derivltja, I'(x). A fggvny nagy rtkei leknek
felelnek meg, de a fggvny zajos. Lent: Az intenzits simtott vltozatnak derivltja,
(I G )', amely I G'-hoz hasonlan egy lpsben szmolhat. Az x = 75 pontban lev
zajos l jellt eltnt.
768
Az szlels
Van arra eslynk, hogy optimalizljuk a munkt ezen a ponton: egyetlen mveletben kombinlhatjuk a simtst
s az ldetektlst. Egy ttel szerint tetszleges f s g fggvnyek esetn megmutathat, hogy a konvolci
derivltja (f g)' megegyezik a derivlt konvolcijval: f (g)'. Teht ahelyett, hogy elszr simtannk,
majd differencilnnk, egyszeren konvolvljuk a kpet a Gauss simt fggvny derivltjval, G'-val. gy az
egydimenzis ldetektls algoritmusa a kvetkez:
1. Az I kpet a G'-val kell konvolvlnunk, hogy az R-et megkapjuk.
2. Jelljk be az azokat a cscsokat ||R(x)||-ben, amelyek egy elre definilt T kszbnl magasabbak. A kszb
rtkt gy hatrozzuk meg, hogy a zaj miatti msodlagos cscsokat eliminljuk.
Kt dimenziban egy l irnytottsga tetszleges szg lehet. A fggleges lek detektlsnak mdja
nyilvnval: G'(x) G(y)-nal kell konvolvlnunk a kpet. A hats y irnyban simt (a Gauss-konvolci miatt),
x irnyban pedig egy simtssal ksrt differencils. A fggleges lek detektlsi algoritmusa gy az albbi:
1. Konvolvljuk az I (x, y) kpet az fV(x, y) = G' (x) G (y)-nal, hogy az RV(x, y) -t megkapjuk.
2. Jelljk be azokat a cscsokat az ||RV (x, y)||-ben, amelyek egy elre definilt Tn kszbnl magasabbak.
A tetszleges orientcij l detektlshoz a kpet kt szrvel: az fV = G'(x) G(y) s az fH = G'(y) G(x)
szrvel kell konvolvlni (az fH az fV 90-kal elforgatott vltozata). A tetszleges orientcij ldetektl
algoritmus az albbi:
1. Konvolvljuk az I (x, y) kpet az fV (x, y)-nal, valamint az fH (x, y)-nal, hogy az RV(x, y)-t s az RH(x, y) -t
megkaphassuk. Definiljuk az
-t.
2. Jelljk be azokat a cscsokat az ||R(x, y)||-ban, amelyek egy elre definilt T kszbnl magasabbak.
Miutn ezzel az algoritmussal megjelltk az lek kppontjait, a kvetkez lps az azonos lekhez tartoz
kppontok sszektse. Ez megtehet, ha felttelezzk, hogy brmely kt szomszdos kppont, amely lpont s
769
Az szlels
konzisztens irnytottsg, szksgszeren ugyanahhoz az lhez tartozik. Ezt a folyamatot Canny-fle

ldetektornak (Canny edge detection) nevezzk, kitallja, John Canny utn.
Miutn detektltuk ket, az lek alkotjk tbb kvetkez feldolgozsi lps alapjt: felhasznlhatjuk ket a
trbeli kpalkotsban, a mozgsdetektlsban s az objektumok felismersben.
3.2. A kp szegmentlsa
Az emberek rendszerezik szlelseiket; az egyes fotrzkelkhz tartoz fnyessgrtkek halmaza helyett
vizulis csoportokat szlelnk, amelyek ltalban objektumokkal vagy azok rszeivel asszociltak. Ez a
kpessg a szmtgpes lts szmra is ppgy fontos.
A szegmentls (segmentation) a kp felbontsa rszcsoportokra a kppontok hasonlsga alapjn. Az
alaptlet a kvetkez: minden kpponthoz rendelhetnk bizonyos vizulis tulajdonsgokat, mint pldul
fnyessg, szn s mintzat.2 Ezek az attribtumok egy objektumon vagy annak egyetlen rszn bell, csak
kismrtkben vltoznak, mg az objektumok kztti hatrok mentn tipikusan egyik vagy msik attribtum
jelentsen vltozik. gy kell a kpet kppontok halmazaira felosztanunk, hogy ezeket a knyszereket amennyire
csak lehet, kielgtsk.
Tbbfle mdszer ltezik ezen intuitv elkpzels matematikai formalizlsra. Pldul Shi s Malik (Shi s
Malik, 2000) ezt grfparticionlsi problmaknt hatrozzk meg. A grf csompontjai a kppontoknak felelnek
meg, az lek pedig a kztk lev kapcsolatoknak. Egy Wij sly rtke az i s j kppontokat sszekt len attl
fgg, hogy a kt kppont mennyire hasonl fnyessgben, sznben, mintzatban s ms tulajdonsgokban. Ezek
utn olyan partcikat keresnek, amelyek minimalizlnak egy normalizlt vgsi kritriumot. Durvn
fogalmazva a grf particionlsnak kritriuma, hogy a csoportok kztti lek slyainak sszegt
minimalizljuk, a csoportokon belli lek slyainak sszegt pedig maximalizljuk.
A pusztn alacsony szint, helyi tulajdonsgokon pldul a fnyessgen s sznen alapul szegmentci
hibzsra hajlamos eljrs. Ahhoz, hogy az objektumokhoz rendelt hatrokat megbzhatan megtallhassuk, a
jelenetben vrhat objektumfajtkrl magas szint tudst is be kell ptennk. A beszdfelismersre ezt a rejtett
Markov-modell formalizmusa teszi lehetv, mg a kpek kontextusban egy ilyen egysges keretrendszer mg
mindig az aktv kutats trgya. Mindenesetre az objektumokrl szl magas szint tuds a kvetkez alfejezet
trgya.
4. D informci kinyerse
Ebben az alfejezetben azt mutatjuk meg, hogyan kell a ktdimenzis kpbl kiindulva a jelenet hromdimenzis
reprezentcijig eljutni. Fontos, hogy a jelenettel foglalkozzunk, hiszen vgs soron az gens a vilgban
ltezik, nem a kpskon, a lts clja pedig annak elrse, hogy az gens a vilg objektumaival egyttmkdjn.
Mindazonltal az gensek tbbsgnek csak a jelenet egyes aspektusainak korltozott absztrakt
reprezentcijra van szksge, nem minden rszletre. A knyv htralev rszben lthat, a vilggal
foglalkoz algoritmusok az objektumok tmr lersra ptenek, nem minden hromdimenzis felletdarabka
kimerten teljes szmbavtelre.
Elsknt az objektumfelismerst (object recognition) trgyaljuk, azt a folyamatot, amely sorn a kpek
jellemzi (mint pldul az lek) talakulnak ismert objektumok (mint pldul a tzgpek) modelljeiv. Az
objektumfelismers hrom lpsbl ll: a jelenet szegmentlsa klnll objektumokra, mindegyik objektum
pozcijnak s trbeli orientcijnak a megfigyelhz kpesti meghatrozsa, valamint mindegyik objektum
alakjnak a meghatrozsa.
A manipullsi s a naviglsi feladatok szempontjbl legfontosabb az objektum pozcijnak s trbeli
orientcijnak (az objektum n. helyzetnek pose) a meghatrozsa a megfigyelhz kpest. Ahhoz, hogy
egy nyzsg gyrban eligazodjunk, tudnunk kell az akadlyok elhelyezkedst, mert akkor egy olyan plyt
tudunk tervezni, amely az akadlyokat kikerli. Ha egy trgyat szeretnnk felvenni s kzben tartani, a kzhez
kpesti helyzetet kell ismernnk, mert csak gy tudjuk generlni a megfelel plyj cselekvsszekvencit. A
manipullst s a naviglst tipikusan szablyozsi hurokban oldjuk meg az rzkelk informcija
visszacsatolst jelent, amivel a robot vagy a robotkar mozgst befolysolni tudjuk.
A mintzati jellemzk a kppontra kzppontozott kis felletdarabka statisztikai elemzsn alapulnak.
770
Az szlels
Hasznljunk most matematikai jellst a pozci s az orientci lersra. A jelenet egy P pontjnak a
pozcijt hrom szm jellemzi, a P pont (X, Y, Z) koordinti a sttkamra nylsban elhelyezett origj s az
optikai tengellyel parallel Z tengely koordinta-rendszerben (lsd 24.1. bra). Amivel rendelkeznk, az a kp
egy pontjnak (x, y) perspektivikus vetlete. Ez egyben a fnysugarat is definilja a nyls fell, amely mentn
valahol elhelyezkedik a P pont. A P pont tvolsgt azonban nem ismerjk. Az orientci fogalmt ktfle
rtelemben lehet hasznlni:
1. Az objektum egsznek az orientcija. Ezt egy hromdimenzis forgatsi fggvnyben specifiklhatjuk,
az objektum koordinta-rendszert a kamerhoz viszonytva.
2. Az objektum felletnek az orientcija a P pontban. Ez egy n norml vektorral adhat meg, amely a
felletre merleges irnyt hatrozza meg. A fellet orientcijt sokszor a lejtssel (slant) s a dlssel (tilt)
fejezzk ki. A dls az n s a Z tengely ltal bezrt szg. A lejts az X tengely s az n kpskra vett vetlete
ltal bezrt szg.
Amikor a kamera a trgyhoz kpest elmozdul, az objektumnak mind a tvolsga, mind az orientcija
megvltozik. Ami viszont nem fog vltozni, az a trgy alakja (shape). Ha a trgy pl. egy kocka, akkor a kocka
jellege nem vltozik, ha a trgy mozog. A geometria kutati szzadok ta prblkoznak az alak fogalmnak
formalizlsval abbl az alaptletbl kiindulva, hogy az alak az a valami, ami bizonyos
transzformcicsoport pl. a forgatsok s a transzlcik kombincii hatsra nem vltozik. A nehzsg
abban rejlik, hogy hogyan keressk meg a globlis alak egy olyan reprezentcijt, amely elegenden ltalnos
ahhoz, hogy a valdi vilg alakbeli vltozkonysgt s nem csupn oly egyszer formkat, mint a hengerek, a
kpok s a gmbk lefedje, s mgis knnyen kinyerhet legyen a vizulis bemenetbl. A fellet loklis
alakjnak a jellemzse sokkal jobban feltrt. Ez lnyegben a grblettel lehetsges azaz azzal, hogy hogyan
vltozik a fellet normlisa, ha a felleten klnbz irnyokba elmozdulunk. A sk esetn egyltaln nincs
vltozs. A henger esetn sincs, ha a tengely mentn haladunk, a r merleges irnyban azonban a normlis, a
henger sugarval fordtottan arnyos temben forog. Ezekkel a krdsekkel a differencilgeometria foglalkozik.
A trgy alakja bizonyos manipulcis feladatok szempontjbl fontos, pl. ahhoz, hogy eldntsk, hogy a trgyat
hol fogjuk meg. Legfontosabb szerepe azonban a trgyak felismersben van, ahol a geometriai alak a sznnel s
a textrval egyetemben a legjellemzbb vonst jelenti, hogy a trgyakat azonosthassuk, a kp tartalmt a
korbban ltott osztlyokba besoroljuk s gy tovbb.
Az alapvet problma a kvetkez: ha egyszer a perspektivikus vetts alatt a hromdimenzis vilg egy pontbl
kiindul sugr mentn tallhat minden pontja a kpnek ugyanabba a pontjba vettdtt, hogyan nyerjk vissza
a hromdimenzis informcit? A vizulis rzkelsben ehhez szmos segt dolog ll rendelkezsre, a
mozgst, a sztereoltst, a textrt, az rnyalst s a kontrokat belertve. Ezek mindegyike, ahhoz hogy a
kp rtelmezst (kzel) egyrtelm mdon megoldhassa, a jelenetre vonatkoz httr-felttelezseken alapul.
Az albbiakban ezekkel a mdszerekkel foglalkozunk.
4.1. A mozgs
Eddig egy idpontban csak egy kppel foglalkoztunk. A videokamerk azonban msodpercenknt 30 kpkockt
rgztenek, s a kockk kztti klnbsgek fontos informcik forrsai lehetnek. Abban az esetben, ha a
kamera a hromdimenzis jelenethez kpest mozog, a kpen keletkez ltszlagos mozgst optikai folyamnak
(optical flow) nevezzk. A folyam a kpbeli jellegzetessgek mozgsirnyt s mozgsi sebessgt rja le, amit
a jelenet s a megfigyel egymshoz viszonytott relatv mozgsnak kvetkeztben kapunk. A 24.7. (a) s (b)
brn egy forg Rubik-kockt brzol videofelvtelbl ltunk kt filmkockt. A (c) kpen az elbbi kpekbl
szmtott optikai folyam vektorai lthatk. Az optikai folyam a jelenet struktrjra nzve tartalmaz hasznos
informcit. Pldul egy mozg kocsibl kinzve a tvoli trgyaknak sokkal lassbb a ltszlagos mozgsa,
mint a kzelieknek, gy a ltszlagos mozgs teme a tvolsgrl is hordoz valamifle informcit.
Az optikai folyam vektormezeje az x irny vx(x, y) s az y irny vy(x, y) komponensekkel jellemezhet. Ahhoz,
hogy az optikai folyamot megmrhessk, meg kell tallni az egymsnak megfelel pontokat a szomszdos
kpkockkon. Ehhez azt a tnyt hasznljuk fel, hogy az egymsnak megfelel pontok krli kprszeknek
hasonl a fnyessgmintzata. Tekintsk a p, (x0, y0) kppont krl t0 idpillanatban csoportosul
kpponttmbt. Ezt a tmbt a t0 + Dt idpillanatban a klnbz (x0 + Dx, y0 + Dy) pozcij qi kppontjelltek
krl csoportosul kpponttmbkkel ssze kell hasonltani. A hasonlsg egyik szba jhet mrtke a
klnbsgek ngyzetsszege (sum of squared differences, SSD):
771
Az szlels
24.7. bra - (a) Rubik-kocka egy forg lemezkorongon. (b) Ugyanaz a kocka 19/30
msodperccel ksbb (Richard Szeliski nyomn). (c) Az (a) s (b) kpek
sszehasonltsa alapjn szmolt optikai folyam vektorok (Joe Weber s Jitendra Malik
hozzjrulsval).
Az (x, y) az (x0 , y0) kppont krli tmb kppontjainak halmazn fut vgig. Megkeressk most azt a (Dx, Dy)-t,
amely az SSD-t minimizlja. Az (x0 , y0)-beli optikai folyam ilyenkor: (vx , vy) = (Dx/Dt, Dy/Dt). Alternatvaknt
maximalizlhatjuk a keresztkorrelcit (cross-correlation):
A keresztkorrelci akkor hasznlhat a legjobban, ha a jelenet kpben textra tallhat, mert ekkor a vizsglt
ablakokban nagy a fnyessgvltozs a kppontok mentn. Ha egy egyenletesen fehr falra nznk, a klnbz
q jelltekre szmtott keresztkorrelci majdnem azonos lesz, s az algoritmus a gyakorlatban vletlenszeren
fog vlasztani.
Tegyk fel, hogy a megfigyel T transzlcis s szgsebessggel rendelkezik [amelyek gy a sajtmozgst
(egomotion) rjk le]. Szrmaztatni lehet olyan sszefggseket, amelyek a megfigyel sebessgt, az optikai
folyamot s a jelenet trgyainak a pozcijt kapcsoljk ssze. Tegyk fel, hogy f = 1, akkor:
ahol Z(x, y) az (x, y) kpponthoz tartoz jelenetbeli pontnak a z koordintja.

A kplet jobb megrtst szolglja, ha az egyszer transzlci esett nzzk. Ebben az esetben a folyammez:
lesz. Nhny rdekes tulajdonsgot figyelhetnk meg. Az optikai folyam mindkt komponense, vx(x, y) s vy(x,
y) is zrus az x = Tx/Tz, y = Ty/Tz pontban. Ezt a pontot a folyammez expanzifkusznak (focus of expansion)
nevezzk. Tegyk fel, hogy az x y sk origjt az expanzifkuszba helyezzk t. Ilyenkor az optikai folyam
kifejezsei igen egyszer formt ltenek. Jellje (x', y') az x' = x Tx /Tz, s az y' = y Ty /Tz ltal definilt j
koordintkat. Ekkor:
772
Az szlels
Ennek az egyenletnek van nhny rdekes alkalmazsa. Tegyk fel, hogy n egy lgy, amely egy falra prbl
leszllni, s azt szeretn tudni, hogy adott aktulis sebessg mellett mennyi id mlva r a falhoz. Ezt az idt a
Z/Tz adja meg. Figyeljk meg, hogy annak ellenre, hogy a pillanatnyi optikai folyam nem kpes sem a Z
tvolsgot, sem a Tz sebessgi komponenst megadni, a kett arnyt meg tudja adni, s gy a leszlls
irnytsban felhasznlhat. Az l legyekkel val ksrletek altmasztjk, hogy a legyek pontosan ezt a
mechanizmust hasznljak. A legyek a legmerszebb replk az llatok s gpek kztt, s rdekes, hogy ezt egy
olyan ltrendszerrel teszik, amelynek borzasztan gyenge a trbeli felbontsa (krlbell 600 rzkelje van,
sszehasonltva az emberek 100 millijval), de kiemelked az idbeli felbontsa.
24.8. bra - (a) Egy olyan videokp-sorozat ngy kockja, amelyben a kamera a
trgyhoz kpest mozgott s forgott. (b) A sorozat els kpkockja, amelyen apr
ngyzetek jelzik a tulajdonsgfelismer ltal megtallt tulajdonsgokat (Carlo Tomasi
hozzjrulsval).
24.9. bra - (a) A 24.8. brn lthat kp tulajdonsgai elhelyezkedsnek

hromdimenzis rekonstrukcija. (b) A valdi hz ugyanabbl a perspektvbl.
773
Az szlels
A mlysg kiszmtshoz tbb kpkocka hasznlata szksges. Ha a filmre egy merev testet vesznk fel, akkor
ennek alakja kpkockrl kpkockra nem fog vltozni, s gy az optikai folyam termszetnl fogva zajos
mrseit jobban kezelhetjk. Az egyik ilyen megkzelts eredmnyt a 24.8. s a 24.9. brn lthatjuk (Tomasi
s Kanade, 1992).
4.2. Ktkamers (binokulris) trbeli lts

A legtbb gerincesnek kt szeme van. Ez hasznos redundancia arra az esetre, ha elveszten az egyiket, de ms
mdon is segt. A legtbb zskmnyllatnak a feje oldaln vannak a szemei, hogy nagyobb terletet belthasson.
A ragadozknak ell, hogy ktkamers trbeli ltst (binocular stereopsis) valsthassanak meg. Maga a
gondolat a mozgsi parallaxisra igen hasonlt, azonban az eltr idpontokhoz tartoz kpek helyett kt (vagy
tbb), trben szeparlt kpet hasznlunk, hasonlan ahhoz, mint amilyeneket pl. az elrenz emberi szemek
szolgltatnak. Tekintettel arra, hogy a jelenet egy adott jellemzje az egyes kpskok z koordintjhoz kpest
ms helyen lesz a kpen, ha a kt kpet egymsra fektetjk, a kpjellemz elhelyezkedsben a kt kp
klnbsget diszparitst (disparity) fog mutatni. Ez ltszik a 24.10. brn, ahol a piramis legkzelebbi
pontja balra mozdult el a jobb oldali kpen, s jobbra a bal oldalin.
24. bra - A trbeli lts alapgondolata: klnbz kamerapozcik ugyanannak a

hromdimenzis jelenetnek kiss eltr ktdimenzis nzeteit eredmnyezik
24.11. bra - A diszparits s a mlysg sszefggse a sztereoltsban
774
Az szlels
Dolgozzuk ki a diszparits s a mlysg geometriai kapcsolatt. Elszr azt az esetet vizsgljuk meg, amikor a
kt szem (illetve a kt kamera) elrenz, s optikai tengelyk prhuzamos. A jobb s a bal kamera kapcsolata
gy egy b nagysg (bzisvonal) transzlci az x koordinta-tengely mentn. A H = vx t vzszintes s V = vyt
fggleges kpeltrs szmtshoz az optikai folyam elbb megismert kifejezseit hasznlhatjuk, Tx = b/t, Ty
= Tz = 0 mellett. Az x, y, s z rotcis paramterek zrusok. Azt kapjuk eredmnyl, hogy H = b/Z s V = 0.
Szavakkal megfogalmazva ez azt jelenti, hogy a vzszintes kpeltrs a bzisvonal s a mlysg arnya, a
fggleges eltrs pedig zrus.
Normlis ltsi krlmnyek kztt az emberek fixlnak, azaz sszetartan nznek elre (fixate), vagyis a
jelenetben ltezik egy olyan pont, amelyben a kt optikai tengely metszi egymst. A 24.11. bra egy P0 pontra
fixl szemeket mutat, amely pont a kt szem kzpvonaltl Z tvolsgban helyezkedik el. Az egyszersg
kedvrt szgeltrst fogunk szmtani radinban. Az sszetarts P0 pontjban az eltrs zrus. A jelenet egy Zvel tvolabbi P pontja esetn szmthatjuk a P pont PL bal s a PR jobb oldali kpnek a szgeltoldst. Ha azok
mindegyike a P0 -hoz kpest /2 szggel eltolt, akkor a PL s a PR eltoldsa, ami a P kpeltrse, pontosan .
Egyszer geometriai talaktsokbl azt fogjuk kapni, hogy:
Embereknl a b bzisvonal (baseline) kb. 6 cm. Tegyk fel, hogy Z kb. 100 cm. A legkisebb detektlhat
(ami a kppont nagysgval fgg ssze) kb. 5 szgmsodperc, avagy 2,42 10 5 radin, amibl a Z 0,4 mm-re
addik. Z = 30 cm-re Z = 0,036 mm-es lenygz rtket kapunk. Ez azt jelenti, hogy 30 cm-es tvolsgban az
emberek akr a 0,036 mm-es kpmlysg klnbsg megklnbztetsre is kpesek. Ez teszi lehetv, hogy be
tudjuk fzni a crnt egy tbe, s hasonl mveleteket tudunk elvgezni.
4.3. Textragradiensek
A mindennapi nyelvben a textra vagy felletmintzat (texture) a fellet kitapinthat tulajdonsgaira
vonatkozik (az angol nyelvben ugyanazzal a sztvel rendelkezik, mint maga a szvet 3). A szmtgpes
ltsban a textra egy ehhez kzeli fogalomra, egy felletnek a skban ismtld, vizulisan rzkelhet
mintzatra vonatkozik. Pldaknt emlthetjk egy plet ablakainak a mintzatt, egy szvetter ktsi mintjt, a
leoprd foltos bundjt, a pzsit fszlainak a mintzatt, kavicsokat a strandon vagy embertmeget egy
stadionban. Az elrendezs nha kzel periodikus, mint pldul a ktsi szemek a szvetteren, ms esetekben,
mint pldul a strandon lv kavicsok esetn, a szablyossg csak statisztikai rtelemben ltezik a kavicsok
srsge a strand klnbz rszein nagyjbl azonos.
24.12. bra - (a) A textragradienseket illusztrl jelenet. Feltve, hogy a vals mintzat
egyforma, lehetv teszi a fellet irnygnak a meghatrozst. A szmtott irnyt a
kpen oly mdon elhelyezett fehr kr s nyl jelzi, mintha a krt a felletre festettk
volna abban a pontban. (b) Egy velt fellet alakjnak meghatrozsa a mintzat
3
avagy textile (A ford.)
775
Az szlels
alapjn. (A kpeket Jitendra Malik s Ruth Rosenholtz hozzjrulsval kzljk

[Malik s Rosenholtz, 1994].)
Amit most a jelenetre vonatkozan lltottunk, igaz. A kpen a textraelemek vagy texelek (texels) ltszlagos
nagysga, alakja, tvolsga stb. igencsak vltozik, ahogy ezt a 24.12. bra mutatja. A csempelapok a jeleneten
azonosak. A lapok kivettett nagysgnak s alakjnak megvltozsban kt f ok jtszik szerepet:
1. Az egyes texeleknek a kamertl vett vltoz tvolsga. Emlkezznk arra, hogy a perspektivikus vettsben a
tvoli trgyak kisebbnek tnnek. A sklatnyez 1/Z.
2. Az egyes texelek vltoz rvidlse. Ez a texeleknek a kamerbl kiindul rltsi irnyhoz viszonytott
orientcijn mlik. Rvidls nincs, ha a texel a rltsi irnyra merleges. A rvidls mrtke cos -val
arnyos, ahol a a texel skjnak a lejtse.
Egy kevs matematikai elemzst kveten meghatrozhatjuk a klnbz texeltulajdonsgok, mint pl. a terlet,
a rvidls s a srsg vltozsi mrtknek kifejezseit. Ezek az n. textragradiensek (texture gradients) a
fellet alakjnak s a megfigyelhz kpesti dlsnek s lejtsnek a fggvnyei.
Ahhoz, hogy az alakot a textrbl kinyerhessk, ktlpcss eljrshoz kell folyamodnunk: (a) elszr mrjk a
textragradienseket; (b) majd becsljk a mrt gradienseket okozni ltsz felletalakot, azok dlst s lejtst.
A 24.12. bra mutatja ezen eljrs eredmnyeit.
4.4. rnyals
Az rnyalst (shading) a jelenethez tartoz fellet klnbz rszeirl kapott megvilgts
intenzitsvltozst a jelenet geometrija s a fellet-visszaversi tulajdonsgai hatrozzk meg. A
szmtgpes grafikban a feladat a kp I(x,y) fnyessgfggvnynek a megadsa, ha a jelenet geometrija s a
visszaverdsi tulajdonsgok adottak. A szmtgpes ltsban azt remljk, hogy ez a folyamat invertlhat,
vagyis visszallthatjuk a jelenet geometrijt s visszaverdsi tulajdonsgait, ha az I(x,y) kpfnyessg adott.
A problma olyan nehznek bizonyult, hogy a legegyszerbb esetektl eltekintve e tren nem sikerlt
eredmnyeket elrni.
Induljunk ki egy olyan pldbl, ahol az alakot tnyleg visszanyerhetjk az rnyalsbl. Tekintsnk egy
Lambert-fle felletet, amit egy tvoli, pontszer fnyforrs vilgt meg. Ttelezzk fel azt is, hogy a fellet
messze van a kamertl, gy fggleges sk vettst fogunk hasznlni a perspektivikus vetts megkzeltsre.
A kp fnyessge:
I(x, y) = kn(x, y) s
ahol k egy sklaegytthat, n a fellet norml egysgvektora s s a fnyforrs irnyba mutat egysgvektor.
Mivel n s s egysgvektorok, skalrszorzatuk a kett kztti szg koszinusza. A fellet alakjt az n fellet menti
vltozsa tartalmazza. Ttelezzk fel, hogy k s s ismertek. A problmnk most a fellet n normlisnak a
kiszmtsa, ha az I(x,y) kpfnyessg adott.
Az els megjegyzs, amit meg kell tenni, az az, hogy az n meghatrozsa az adott (x,y) kppontfnyessg
ismeretben loklisan alulhatrozott. Ki tudjuk ugyan szmtani az n s a fnyforrs kztti szget, ez azonban
776
Az szlels
az n-et csak annyiban korltozza, hogy egy bizonyos, s irny s = cos1(I/k) palstszg kp felletn
helyezkedik el. Hogy tovbblphessnk, jegyezzk meg, hogy kppontrl kppontra az n vltozsa nem lehet
tetszleges. Egy sima fellet normlisa csak sima mdon vltozhat amely korltozst az integrlhatsg
(integrability) szakkifejezssel jelljk. Ezt a felismerst szmos mdszerben fel is hasznljk. Egy lehetsges
eljrs az n trsa a Z(x,y) mlysg Zx s Zy parcilis derivltjainak felhasznlsval. Ennek eredmnye Z egy
parcilis differencilegyenlete, amit megfelel hatrfelttelek figyelembevtelvel Z(x,y)-ra nzve meg lehet
oldani.
Az eljrs ltalnosthat. Nem szksges, hogy a fellet Lambert-fle legyen, s az sem, hogy a fnyforrs
pontszer legyen. Lnyegben ugyanez a mdszer hasznlhat, ha sikerl a fellet R(n) reflektanciatrkpt
(reflectance map) meghatrozni, amely a felletelem fnyessgt annak n normlisa fggvnyben fejezi ki.
Az igazi nehzsg a klcsns visszaverdsek kezelse. Egy tipikus belstrjelenet esetn, mint pldul egy
irodban lv trgyak esetn a felleteket nem csupn a fnyforrsok vilgtjk meg, hanem a jelenet ms
felleteitl visszavert fny is, amelyek tnyleges msodlagos fnyforrsokknt szolglnak. Ezek a klcsns
megvilgtsi hatsok igen jelentsek lehetnek. Az ilyen helyzetben a reflektanciatrkp megkzelts teljes
mrtkben hasznlhatatlan a kp fnyessge nemcsak a normlison mlik, hanem a jelenet klnbz
felleteinek bonyolult trbeli viszonyain is.
Az ember az rnyalsbl kpes valamilyen mrtk alakinformci kinyersre, gy ez a problma minden
nehzsge ellenre tovbb is rdekes marad.
4.5. Kontrok
Amikor egy olyan vonalas rajzot nznk, mint amilyen a 24.13. bra, a kp egy hromdimenzis elrendezs
letszer benyomst kelti bennnk. Hogyan lehetsges ez? Hiszen lttuk korbban, hogy egy s ugyanaz a
vonalas kp vgtelen sok jelenet konfigurcibl szrmazhat. Figyeljk meg, hogy mg a felszn lejtsnek s
emelkedsnek rzett is megkapjuk. Ez minden bizonnyal (a tipikus alakzatokra vonatkoz) magas szint tuds
s valamilyen alacsony szint knyszerek sszekapcsolsnak kvetkeztben lehetsges.
24.13. bra - Egy felidz vonalas rajz (Isha Malik hozzjrulsval)
A vonalas brban rejl kvalitatv tudssal fogunk foglalkozni. Korbban lttuk, hogy a rajz vonalainak
klnfle lehet a fontossga (lsd 24.4. bra s ksrszvege). Az a folyamat, ahogy a kp minden vonalnak a
tnyleges fontossgt megllaptjuk, a vonalcmkzs (line labeling), s ez volt a szmtgpes lts ltal
elsknt tanulmnyozott problmk egyike. Tegyk fel egyelre, hogy a vilg olyan leegyszerstett
modelljvel dolgozunk, ahol a trgyaknak nincsenek felletei, s ahol az olyan vonalakat, amelyek
megvilgtsi diszkontinuitsokbl addnak, mint amilyenek az rnyklek s a tkrzsek, valamilyen
777
Az szlels
elfeldolgoz eljrssal a kpbl kiemeltk. A figyelmnket gy olyan vonalas brkra sszpontosthatjuk, ahol
minden vonal vagy mlysgi, vagy orientci diszkontinuitshoz tartozik.
Mindegyik vonalat ezek utn vagy egy a fellet hatrn megjelen pszeudol (limb) vetletnek (ami a fellet
azon pontjainak sszessge, ahol a rlts irnya a fellet rintje), vagy egy lnek (edge) lehet tekinteni (ami a
fellet normlisnak egy diszkontinuitsa). Az leket tovbb konvex, konkv vagy hatrol losztlyokba
sorolhatjuk. A pszeudolek s a hatrol lek esetn rdekes annak az eldntse, hogy a vonalas brn a grbt
hatrol kt felletbl melyik van hozznk kzelebb. Ezeket a kvetkeztetseket gy kpzelhetjk el, hogy
mindegyik vonalhoz a 6 lehetsges vonalcmknek (line label) az egyikt rendeljk hozz, ahogy az a 24.14.
brn lthat.
24.14. bra - Klnfle vonalcmkk
1. A + s a cmkk rendre a konvex s a konkv leket jelentik. Ezeket az olyan normlis

diszkontinuitsokhoz rendeljk, ahol az l mentn tallkoz mindkt fellet lthat.
2. A s a hatrol konvex leket jelentenek. A kamerval fellrl nzve az l mentn tallkoz
mindkt felletelem azonos oldalon fekszik gy, hogy az egyik eltakarja a msikat. Ha a nyl irnyba
mozgunk, a felletek hozznk kpest jobbra esnek.
3. A s a cmkk a pszeudoleket jellik. Az ilyen helyeken a fellet sima mdon grbl, s
sajt magt takarja. Ha a dupla nyl irnyba lpnk, a fellet tlnk jobbra helyezkedik. A rlts irnya a
pszeudol minden pontjban a fellet rintje. Ahogy a nzpont vltozik, a pszeudol a fellet mentn
mozog.
Egy brn tallhat n szm vonal kombinatorikusan elvileg lehetsges cmke-hozzrendelsbl csupn csekly
szm hozzrendels lehetsges fizikailag. Ezeknek a cmkzseknek a megllaptsa az n. vonalcmkzsi
problma. Jegyezzk meg, hogy a problma csak akkor rtelmes, ha a cmke a vonal mentn nem vltozik. Ez
nem mindig igaz, hiszen a grblt objektumok kpein a cmke egy vonal mentn igenis vltozhat. Ebben a
rszben ez nem jelent problmt, mert csak polideres objektumokkal foglalkozunk.
A polideres jelenetelemzssel elszr Huffman s tle fggetlenl Clowes prblkoztak (Huffman, 1971;
Clowes, 1971). Huffman s Clowes elemzsket a nem tltsz trideres (trihedral) testekbl azaz olyan
testekbl, amelyeknl mindegyik sarokpontjnl pontosan hrom fellet fut ssze ll jelenetek esetre
korltoztk. A tbb objektumot tartalmaz jelenetek esetn kizrtk a trideres felttelt megsrt
objektumkonfigurcikat is, mint amilyen pldul az egyik lk mentn rintkez kt kocka. Nem engedtk a
repedseket (cracks) sem, azaz olyan leket, amelyek mentn a tangencilis skok folytonosan vltoznak. A
trideres vilgban Huffman s Clowes kimert listt adtak az sszes klnbz sarokponttpusrl meg arrl is,
hogy azok hogyan ltszhatnak ltalnos nzpontbl szemllve. Az ltalnos nzpont felttel lnyegben azt
ttelezi fel, hogy az sszes csatlakozs megtartja a jellegt, ha a szem csak kiss mozdul el. Ha pldul a kpen
hrom vonal metszi egymst, akkor a felttelbl kvetkezik, hogy a jelenet hozzjuk tartoz leinek szintn
metszenik kell egymst.
24.15. bra - A trideres cscsok ngy fajtja
778
Az szlels
A 24.15. bra mutatja azt a ngyfle helyzetet, ahogy a hrom skfellet egy sarokpontban tallkozhat. Ezeket az
eseteket gy szerkesztettk, hogy egy kockt nyolc oktnsra (octant) bontottunk. A trideres sarokpontok egsz
vlasztkt szeretnnk generlni a kocka kzppontjban gy, hogy a klnbz oktnsokat kitltjk. Az 1-es
cmkj sarokpont az egyetlenegy kitlttt oktnshoz tartozik, a 3-as cmkj a hrom kitlttt oktnshoz s gy
tovbb. Az olvasnak kellene beltnia, hogy ezek tnyleg kimertik az sszes lehetsges helyzetet. Ha valaki
pldul a kockban kt oktnst kitlt, akkor nem lesz kpes a kzppontban egy rvnyes trideres sarokpontot
megszerkeszteni. Jegyezzk meg azt is, hogy ezen ngy eset a sarokpontban tallkoz konvex s konkv lek
klnbz kombinciinak felel meg.
A sarokpontban tallkoz hrom l a krlttk lv teret nyolc oktnsra osztja. A sarokpontot brmely,
anyaggal nem kitlttt oktnsbl lehet szemllni. A nzpont oktnson belli elmozdtsa a kpen lthat
csatlakozsok jellegt megvltoztatni nem fogja. A 24.15. brn lthat 1-es cmkj sarokpontot a marad ht
oktnsbl szemllve a 24.16. brn lthat csatlakozscmkket kapjuk.
Annak kimert vizsglata, hogy egy sarokpont milyen mdon lthat, a 24.17. brn felsorolt lehetsgekhez
vezet. A kpen ngy klnbz csatlakozstpust azonosthatunk: L, Y, nyl- s T csatlakozst. Az L csatlakozs
a kt lthat l esete. Az Y s a nylcsatlakozs hrom lnek felel meg. Az Y csatlakozsban a szgek egyike
sem lpi tl a 180-ot. A T csatlakozs a takarssal kapcsolatos. Ha egy kzeli, nem tltsz fellet egy
tvolabbi lt eltakar, egy fl llel tallkoz folytonos lt kapunk. A T csatlakozs ngy cmkje a ngyfle l
takarsnak felel meg.
24.16. bra - A 24.15. brn 1-gyel jellt cscs klnbz elfordulsai
24.17. bra - A HuffmanClowes-cmkekszlet
779
Az szlels
Ha egy vonalas rajzot ennek a csatlakozssztrnak a segtsgvel cmkznk meg, a problma annak a
megllaptsa, hogy mely csatlakozsinterpretcik lesznek globlisan konzisztensek. A konzisztencit az a
szably knyszerti ki, miszerint a rajzon egy vonalnak egy s csakis egy cmkje lehet a vonal egsz hosszban.
Ezen problma algoritmikus megoldst Waltz adta meg (pontosabban egy olyan kibvtett problma
megoldst adta meg, amely az rnykot, a grbleti diszkontinuitsokat [repedseket] s a sztvlaszthatan
konkv leket is figyelembe veszi [Waltz, 1975]). Az algoritmus a knyszerkielgts egyik legels alkalmazsa
volt az MI terletn (lsd 5. fejezet). A knyszerkielgts nyelvn a vltozk a csatlakozsok, a vltozk rtkei
a csatlakozsok cmkzse, a knyszer pedig az, hogy minden vonalnak csak egy cmkje van. Br a trideres
vonalcmkzsi problma NP-teljes, a kznsges knyszerkielgtsi algoritmusok a gyakorlatban jl
mkdnek.
5. Objektumok felismerse
A lts lehetv teszi szmunkra, hogy megbzhatan felismerjnk embereket, llatokat s lettelen dolgokat.
Az MI-ben, illetve a szmtgpes ltsban az objektumfelismers fogalmt szoks szerint mindezen dolgokra
alkalmazzk. Ez magban foglalja a kpen rgztett objektumok osztlynak felismerst pldul: ez egy arc,
illetve adott objektumok felismerst is pldul: ez Bill Clinton arca. A motivcit ilyen alkalmazsi terletek
jelentik:
Biometrikus azonosts (biometric identification): a bngyi vizsglatok s a vdett ltestmnyek
belpsszablyozsa megkveteli az egynek azonostst. Az ujjlenyomatok, az riszlenyomat s az arckpek
olyan kpeket eredmnyeznek, amelyeket adott egynekhez kell rendelni.
780
Az szlels
Tartalomalap kpkeress (content-based image retrieval): knny egy dokumentumban megtallni azt a
helyet ha ltezik , ahol a macska sz szerepel. Brmelyik szvegszerkeszt kpes erre. Most gondoljon
arra a feladatra, hogy egy kpen megtallja a kppontok azon rszhalmazt, amely egy macska kpnek felel
meg. Ha valaki rendelkezne ezzel a kpessggel, akkor megvlaszolhatna olyan keresseket, mint pldul
Bill Clinton s Nelson Mandela egytt, egy grkoris a levegben, az Eiffel-torony jszaka stb., anlkl
hogy egy gyjtemny minden egyes fnykphez feliratkulcsszavakat kellett volna rendelnnk. Ahogy a kps videogyjtemny nvekszik, a kzi feliratozs lehetetlenn vlik.
Kzrs-felismers (handwriting recognition): pldul az alrsok, bortkok cmmezi, csekkeken
szerepl sszegek s a kziszmtgpek tollalap beviteli megoldsa.
A ltst nemcsak objektumok, hanem cselekvsek felismersre is hasznljuk. Felismerhetnk jrsmdokat
(egy bart jrst), kifejezseket (egy mosolyt, egy grimaszt), gesztikulcit (egy integet embert),
cselekvseket (ugrst, tncot) s gy tovbb. A cselekvsfelismerst clz kutats mg gyerekcipben jr, gy
ebben az alfejezetben az objektumfelismersre koncentrlunk.
A vizulis objektumok felismersnek feladata ltalban knny az emberek szmra, de a szmtgpek
szmra igen nehznek bizonyult. Fel akarjuk ismerni egy ember arct fggetlenl a megvilgts, a kamerhoz
kpesti helyzet s az arckifejezs klnbz variciitl. Ezen varicik brmelyike szles kr vltozsokat
eredmnyez a kppontok fnyessgrtkeiben, gy a kppontok kzvetlen sszehasonltsa valsznleg nem
fog mkdni. Ha valaki egy kategria (pldul az aut) pldnyait szeretn felismerni, akkor a kategrin
belli varicikat is figyelembe kell vennie. Mg a postai irnytszmoknl a kzzel rt szmjegyek
felismersnek igen korltozott feladata is komoly kihvsnak bizonyult.
A felgyelt tanuls vagy a mintaosztlyozs termszetes keretet biztost az objektumfelismers
tanulmnyozshoz. Pozitv (arcok) s negatv pldaknt (nem arcok) adott kpek esetben a cl egy olyan
fggvny megtanulsa, amely az j kpeket felcmkzi az arc s a nem arc jellsekkel. A 18. s 20. fejezet
sszes technikja lehetsges jellt a feladatra: tbbrteg perceptronokat, dntsi fkat, legkzelebbi-szomszd
osztlyozkat s kernelgpeket alkalmaztak mr objektumfelismersi feladatokra. Meg kell azonban
jegyeznnk, hogy ezen technikk alkalmazsa objektumok felismersre tvolrl sem egyrtelm.
Az els kihvs a kp szegmentlsa. Minden kp tipikusan tbb objektumot fog tartalmazni, gy elszr olyan
kppontrszhalmazokra kell osztanunk, amelyek egy-egy objektumnak felelnek meg. Miutn a kpet rgikra
osztottuk, utna a rgikat vagy az azokbl sszelltott egysgeket tadjuk egy osztlyoznak, hogy
meghatrozza az objektumok cmkit. Sajnlatos mdon a lentrl felfel szegmentci hibkra rzkeny eljrs,
ezrt alternatv megoldsknt knlkozik a fentrl lefel objektumcsoport meghatrozsa. Eszerint keresni kell
egy kppontrszhalmazt, amit arcknt lehet osztlyozni, s ha ez sikerlt, mris van egy csoportunk! A tisztn
fentrl lefel mdszerek nagyon szmtsignyesek, mivel klnbz mret kpablakokat kell megvizsglni
klnbz helyszneken, s az sszes klnbz objektumhipotzissel ssze kell vetni ket. Jelenleg a
leginkbb gyakorlati objektumfelismer rendszerek ilyen fentrl lefel stratgit alkalmaznak, br ez
megvltozhat, ahogy a lentrl felfel technikk fejldnek.
A msodik kihvs annak biztostsa, hogy a felismers folyamata kellen robusztus a megvilgts s az
elhelyezkeds vltozsaira. Az emberek fel tudnak ismerni objektumokat a kppontok fnyessgrtkeivel mrt
pontos megjelens jelents vltozsai ellenre is. Pldul egy bart arct klnbz fnyviszonyok mellett vagy
klnbz ltszgekbl is felismerjk. Egy ennl is egyszerbb pldaknt megvizsglhatjuk a kzzel rt 6-os
szmjegy felismerst. Kpesnek kell lenni a 6-os felismersre klnbz mretekben, a kp klnbz
pozciiban s a kp kisebb elforgatsai ellenre is.4
A kulcsmomentum azt szrevenni, hogy a geometriai transzformcik, mint pldul az elfordts, a mretvlts
s a forgats, vagy a kp fnyessgnek megvltozsai a fnyforrsok fizikai mozgatsa ltal, ms jellemzkkel
rendelkeznek, mint a kategrin belli varicik, mint pldul az emberek arcainak klnbzsgei.
Nyilvnval, hogy a tanuls az egyetlen md az emberi arcok klnbzsgeinek megtanulsra vagy a 4-es
szmjegy klnbz rsmdjainak felismersre. Msrszrl a geometriai s fizikai transzformcik hatsai
szisztematikusak s kikszblhetk a tanul mintk paramtereit ler tulajdonsgok megfelel tervezsvel.
Annak rdekben, hogy a geometriai transzformcikra vonatkoz invariancit biztostsuk, egy egszen
hatkonynak bizonyult eljrs a kp rgijnak elfeldolgozsa gy, hogy standard pozciba, mretre s
orientcira alaktjuk. Egy alternatv megolds az, ha egyszeren figyelmen kvl hagyjuk a geometriai s
4
A teljes elforgatsinvariancia nem szksges s nem is kvnatos ekkor a 9-es s a 6-os sszekeverhet lenne!
781
Az szlels
fizikai transzformcik alkalmi termszett, s gy gondolunk rjuk, mint az osztlyoz varilhatsgnak egy
jabb forrsra. A tant mintk halmazban az sszes ilyen varicira pldkat kell elhelyeznnk, s abban
remnykednk, hogy az osztlyoz kikvetkeztet egy megfelel transzformcihalmazt a bemenetre, s gy
kiszri a varicikat.
Vizsgljunk meg most az objektumfelismersre szolgl specilis algoritmusokat! Az egyszersg rdekben
ktdimenzis sszelltsban fogjuk a problmt vizsglni, ahol mind a tanul, mind a tesztmintk ktdimenzis
fnyessgbrk formjban adottak. Olyan terleteken, mint pldul a kzrs-felismers, ez nyilvnvalan
elegend. Mg hromdimenzis objektumok esetben is hatkony stratgia az objektumokat tbb ktdimenzis
nzettel reprezentlni (lsd 24.18. bra), s az j objektumokat a (valamilyen reprezentcij) trolt nzetekkel
sszehasonltva osztlyozni.
24.18. bra - Kt hromdimenzis trgy tbbfle nzete
Az elz alfejezet megmutatta, hogy tbb tnyez vesz rszt a hromdimenzis informci kinyersben egy
jelenetbl. Az objektumfelismers is tbb tnyezn alapszik egy tigrist a narancs s fekete sznek
keveredsrl, cskos mintzatrl s testnek alakjrl ismernk fel.
A szn s a mintzat hisztogramok vagy empirikus frekvenciaeloszlsok segtsgvel reprezentlhat. Ha adott
egy tigris kpe mintaknt, akkor megmrhetjk a klnbz szn kppontok arnyt. Ezutn, ha egy ismeretlen
pldt ltunk, sszevethetjk a szn hisztogramjt a korbbi tigrispldknl ltottakkal. A mintzatok
elemzshez a kp klnbz irny s sklzs szrkkel trtnt konvolcija utn kapott eredmnyeinek
hisztogramjait vizsgljuk, egyezst keresve.
Az alak felhasznlsa az objektumfelismersben sokkal bonyolultabbnak bizonyult. Nagyjbl kt irnyzatot
klnbztethetnk meg: fnyessgalap felismerst (brightness-based recognition), ahol a kppontok
fnyessgrtkeit direkt mdon hasznljuk, s jellemzalap felismerst (feature-based recognition), ahol
kiemelt jellemzk, mint pldul az lek vagy a kulcspontok rszleges elrendezst hasznljuk. Miutn
rszletesebben megvizsgltuk e kt megkzeltst, trgyalni fogjuk a pozcibecslst (pose estimation), azaz az
objektum helyzett s irnyt a jelenetben.
5.1. Fnyessgalap felismers

Ha adott egy kpponthalmaz, amely egy lehetsges objektumnak felel meg, akkor vlaszszuk a jellemzknek
magukat a kppontok fnyessgeit. Egy msik varici szerint elszr konvolvlhatjuk a kpet tbbfle lineris
szrvel, s az eredmnyl kapott kp pontjainak rtkeit tekinthetjk a jellemzknek. Ez a megkzelts
klnsen sikeres olyan feladatokban, mint a kzzel rt szmjegyek felismerse, ahogy azt a 20.7. alfejezetben
lthattuk.
Sokfle statisztikai mdszert hasznltak arra, hogy kpeket tartalmaz adatbzisok segtsgvel arcfelismerket
fejlesszenek ki, mint pldul feldolgozatlan kppontbemeneten mkd neurlis hlkat kppontbemenettel,
782
Az szlels
vonal- s lszrk ltal ellltott jellemzket hasznl dntsi fkat s wavelet-jellemzket hasznl, naiv
Bayes-modelleket. Az utbbi mdszer nhny eredmnye a 24.19. brn lthat.
24.19. bra - Egy arcmegtall algoritmus eredmnye (Henry Schneiderman s Takeo

Kanade hozzjrulsval)
A feldolgozatlan kppontok jellemz vektorknt trtn hasznlatnak egy negatv aspektusa az ebben a
reprezentciban rejl hatalmas redundancia. Vegynk pldul kt egyms melletti kppontot az arc pofa
rszn; valsznleg igen ers kzttk a korrelci, hiszen hasonl a geometrijuk, megvilgtsuk stb. Az
adatmennyisget cskkent technikk, mint pldul a fkomponens-analzis, sikeresen hasznlhatk a
jellemzvektor dimenziszmnak cskkentsre, lehetv tve az olyan dolgok, mint pldul arcok,
nagydimenzis terekben val felismersnl nagyobb sebessg felismerst.
5.2. Jellemzalap felismers

A feldolgozatlan kppontok fnyessgrtkei jellemzknt trtn felhasznlsa helyett felismerhetnk adott
helyen lev jellemzket, mint pldul rgikat vagy leket (lsd 24.3. alfejezet). Kt motivcink van az lek
hasznlatra. Az egyik az adatmennyisg cskkentse sokkal kevesebb l van, mint kppont. A msik a
megvilgtsfggetlensg a kontraszt egy megfelel tartomnyban az leket nagyjbl azonos helyen
ismerjk fel, fggetlenl a tnyleges fnyforrs-konfigurcitl. Az lek egydimenzis jellemzk; ktdimenzis
s nulladimenzis tulajdonsgokat (rgikat, illetve pontokat) szintn hasznlunk. Vegyk szre a trbeli
elhelyezkeds kezelsben jelentkez klnbsget a fnyessgalap s a jellemzalap mdszerek kztt! A
fnyessgalap mdszerekben az (x,y) hely a jellemz.
Az lek elrendezse egy objektum tulajdonsga ez az egyik oka, ami miatt a rajzokat knnyedn rtelmezni
tudjuk (lsd 24.13. bra), mg akkor is, ha ilyen kpek nem fordulnak el a termszetben! Ezen tuds
legegyszerbb felhasznlsnak mdja egy legkzelebbi-szomszd osztlyozval trtnhet. Elre kiszmtjuk s
eltroljuk az ismert objektumok nzeteihez tartoz lkonfigurcikat. Ha adott egy ismeretlen objektumnak
megfelel lelrendezs a bemeneti kpen, akkor meghatrozhatjuk az eltrolt nzetekhez mrt tvolsgt. A
legkzelebbi-szomszd osztlyoz a legkzelebbi illeszkedt vlasztja.
Sokfle defincit javasoltak a kpek kztti tvolsgra. Az egyik legrdekesebb megkzelts a deformcis
illeszkeds (deformable matching) tletn alapul. DArcy Thompson klasszikus munkjban (On Growth and
783
Az szlels
Form [DArcy Thompson, 1917]) megfigyelte, hogy a hasonl, de nem azonos alakzatok gyakran egybeessbe
hozhatk egyszer koordinta-transzformcikkal.5 E mdszer szerint az alakzatok hasonlsgt egy hrom
lpsbl ll folyamattal hatrozzuk meg: (1) megoldjuk a kt alakzat megfeleltetsi problmjt, (2) a
megfeleltetst felhasznljuk egy egymsra illesztsi transzformci megbecslsre, s (3) kiszmtjuk a kt
alakzat kztti tvolsgot az egymsnak megfelel pontok illeszkedsi hibinak sszegeknt, kiegsztve a
fedsbe hoz transzformci nagysgval.
Az alakzatot a bels vagy kls krvonalt alkot pontok diszkrt halmazaknt reprezentljuk. Ezeket
elllthatjuk egy ldetektl ltal megtallt lkppontok helye alapjn, gy kapunk egy N pontbl ll {p1,,
pN} halmazt. A 24.20. (a) s (b) bra kt alakzat mintapontjait mutatja.
Most tekintsnk egy pi mintapontra s az onnan indul sszes tbbi mintapontra mutat vektorra egy alakzaton.
Ezek a vektorok kifejezik a teljes alakzat konfigurcijt a referenciaponthoz viszonytva. Ez a kvetkez
tlethez vezet: rendeljnk minden mintaponthoz egy lert, az alakzatkontextust (shape context), amely
megadja az alakzat tovbbi rsznek durva elrendezst az adott ponthoz viszonytva. Pontosabban fogalmazva
a pi alakzatkontextusa a maradk N 1 pk pontra a pk pi relatv koordintk egy kzelt hi trbeli hisztogramja.
Egy logaritmikus polris koordinta-rendszert hasznlunk a tartk meghatrozsra annak biztostsa rdekben,
hogy a ler rzkenyebb legyen a kzeli kppontok esetben. A 24.20. (c) bra mutat erre egy pldt.
Vegyk szre, hogy az alakzat kontextusnak defincija magban hordozza az elforgatsinvariancit, hiszen
minden mrst az objektum pontjaihoz kpest vgznk. A mretinvariancia elrshez minden sugrirny
tvolsgot normalizlunk a pontprok kztti tlagos tvolsggal.
Az alakzatkontextus lehetv teszi, hogy a megfeleltetsi problmt megoldjuk kt hasonl, de nem azonos
objektumra, mint ahogy az a 24.20. (a) s (b) brn ltszik. Az alakzatkontextus klnbz lesz egy S alakzat
klnbz pontjaira, de egy S s egy S' alakzat megfelel (homolg) pontjainak alakzatkontextusa hajlamos lesz
a hasonlsgra. Ezek utn a kt alakzat megfeleltethet pontjai megtallsnak problmjt akknt kezelhetjk,
mint hasonl alakzatkontextussal rendelkez prok megtallst.
24.20. bra - Alakzatkontextus-szmts s -illeszts. (a, b) Kt alakzat lnek

mintapontjai. (c) Az alakzatkontextus szmtsra hasznlt log-polr hisztogram
rekeszek brja. 5 rekeszt hasznlunk a log r s 12 rekeszt szmra. (df) Az (a) s (b)
brn jellt referenciamintk alakzatkontextusai: , , . Minden alakzatkontextus a
maradk ponthalmaz koordintinak log-polr hisztogramja a referenciapontot mint
origt hasznlva. (A stt cellk tbb pontot jelentenek a rekeszekben.) Vegye szre a
s pontok alakzatkontextusainak vizulis hasonlsgt, amelyeket a kt alakzat
relatve hasonl pontjaira szmoltunk! Ezzel ellenttben a alakzatkontextusa egszen
eltr. (g) Az (a) s (b) kztt ktoldali illesztssel megtallt megfeleltetsek, a
hisztogramok 2 tvolsga ltal definilt kltsget hasznlva.
A modern szmtgpes grafikban erre az tletre az ttnssel, morfolssal (morphing) hivatkoznak.
784
Az szlels
Preczebben fogalmazva: tekintsk a pi pontot az els, a qj pontot a msodik alakzaton. Jellje a Cij = C(pi,qi) a
kt pont illesztsnek kltsgt. Minthogy az alakzatkontextusok hisztogramokkal reprezentlt eloszlsok, gy
termszetes a 2 tvolsg hasznlata:
ahol hi(k) s hj(k) a normalizlt hisztogram k-adik rtkt jelli a pi, illetve a qj pontokban. Ha adott az els
objektum i s a msodik objektum j pontjainak sszes lehetsges prostsra a Cij kltsgek halmaza, akkor az
illeszts teljes kltsgt akarjuk minimalizlni azzal a knyszerfelttellel, hogy az illeszkedsnek klcsnsen
megfelelnek kell lennie. Ez egy plda a slyozott pros illeszts (weighted bipartite matching)
problmjra, amely O(N3) idben megoldhat a magyar algoritmussal.
A mintapontok megfeleltetse alapjn a teljes alakzatra kiterjeszthet a megfeleltets annak a fedsi
transzformcinak a megbecslsvel, amely az egyik alakzatot a msikra kpezi le. A regularizlt vkonylemez
spline-ok (thin plate spline) klnsen hatkonyak. Ha az alakzatokat fedsbe hoztuk, a hasonlsgi mrtkek
kiszmtsa viszonylag kzenfekv. A kt alakzat kztti tvolsg definilhat az egymsnak megfelel pontok
alakzatkontextus-tvolsgainak s a vkonylemez spline-hoz rendelt ktsi energinak a slyozott sszegeknt.
Ezt a tvolsgmrtket meghatrozva egy egyszer legkzelebbi-szomszd osztlyoz megoldja a felismersi
problmt. A 20. fejezetben rtuk le ezen mdszer kitn teljestmnyt a kzzel rt szmjegyek
osztlyozsban.
5.3. Az elhelyezkeds becslse

Amellett hogy meghatrozzuk, mi is az objektum, a helyzett is szeretnnk megllaptani, azaz a nzhz
kpesti pozcijt s az irnyt. Pldul egy ipari alkalmazsban a robot karja nem tud felvenni egy objektumot,
amg nem tudja a helyzett. Merev kt-, illetve hromdimenzis objektumok esetben a problmnak egy
egyszer s jl definilt megoldsa van, amely az illesztsi mdszeren (alignment method) alapszik, amit a
kvetkezkben fejtnk ki.
785
Az szlels
Az objektumot M jellemzvel, avagy m1, m2, , mM hromdimenzis ponttal reprezentljuk pldul egy
soklap objektum sarokpontjaival. Ezeket valamilyen, az objektumnak termszetes koordinta-rendszerben
hatrozzuk meg. Ezek utn a pontokat egy ismeretlen hromdimenzis forgatsnak, R-nek vetjk al, amit egy
ismeretlen t mrtk eltols kvet, vgezetl egy vetts kvetkezik, amivel elllnak a kpsk {p1, p2, pN}
jellemzi. ltalban N M, mivel bizonyos modellpontokat elnyelhettek, s a jellemzdetektor kihagyhat egyes
jellemzket (vagy hamisakat hatrozhat meg a zaj miatt). Ezt egy hromdimenzis mi modellpontra s a neki
megfelel pi kppontra a kvetkezkppen fejezhetjk ki:
Itt az R a rotcis mtrix, t az eltols, s jelli a perspektivikus vettst vagy annak egy kzeltst, mint
pldul a sklzott ortografikus vettst. A vgs eredmny a Q transzformci, ami az mi modellpontot
megfelelteti a pi kppontnak. Br kezdetben nem ismerjk a Q transzformcit, (merev objektumokra) tudjuk,
hogy Q-nak minden modellpontra azonosnak kell lennie.
Meghatrozhatjuk Q-t a modellpontjainak s a pontoknak megfelel ktdimenzis projekcik adott
hromdimenzis koordinti alapjn. Intucink a kvetkezt sgja: felrhatunk olyan egyenleteket, amelyek az
mi modellpontokat s a pi kppontokat szszekapcsoljk. Ezekben az egyenletekben az ismeretlen mennyisgek
az R forgatsi mtrix s a t eltolsi vektor paramtereinek felelnek meg. Ha van elg egyenletnk, ki kell
tudnunk szmolni Q-t. Nem fogjuk bizonytani itt, hanem csupn lltjuk a kvetkez eredmnyt:
Ha adott hrom, nem egy egyenesre es m1, m2 s m3 modellpont, s ezek sklzott ortogonlis projekcija, p1, p2
s p3 a kpskon, akkor ltezik pontosan kt transzformci a hromdimenzis modell koordintakeretbl a
ktdimenzis kpkoordinta-keretbe.
Ezek a transzformcik a kpskra vonatkoz tkrzsen keresztl kapcsolatban llnak egymssal, s egy
egyszer zrtalak megoldssal meghatrozhatk. Ha meg tudnnk hatrozni a kp hrom jellemzjnek
megfelel hrom modelljellemzt, akkor kiszmolhatnnk Q-t, az objektum helyzett. Az elz alfejezetben
trgyaltunk egy alakzatkontextuson alapul megfeleltetst. Ha az objektumnak vannak jl meghatrozott sarkai
vagy ms jellegzetes pontjai, akkor egy mg egyszerbb technika alkalmazsa vlik lehetsgess. Az tlet
lnyege a generls s tesztels. Egy kezdeti megfeleltetst kell tallnunk egy kphrmas s egy modellhrmas
kztt, majd a TRANSZFORMCITKERES eljrst hasznljuk Q egy hipotzisnek ellltsra. Ha a tippelt
megfelels helyes volt, akkor Q helyes lesz, s ha a tbbi modellpontra alkalmazzuk, a kppontok predikcijt
eredmnyezi. Ha a tippelt megfelels helytelen volt, akkor Q helytelen lesz, s ha a maradk modellpontokra
alkalmazzuk, nem lltja el a kppontokat.
24.21. bra - Az illesztsalgoritmus informlis lersa
Ez a 24.21. brn lthat ILLESZTS algoritmus alapja. Az algoritmus megtallja egy adott modell
elhelyezkedst, vagy hibval tr vissza. Az algoritmus idbeli komplexitsa a legrosszabb esetben arnyos a
modell- s kpponthrmasok kombinciinak szmval, vagyis
-mal, megszorozva minden egyes
kombinci ellenrzsnek kltsgvel. Az ellenrzs kltsge M logN, mivel az M modellpont mindegyikre
el kell lltanunk a kpbeli pozcit, s meg kell tallnunk a legkzelebbi kpponttl mrt tvolsgot, ami egy
log N mvelet, ha a kp pontjai egy megfelel adatstruktrban helyezkednek el. gy legrosszabb esetben az
algoritmus idbeli komplexitsa O(M4N3 logN), ahol M s N a modell s a kp pontjainak szma. Az
786
Az szlels
elhelyezkedsklaszterezsen alapul technikk randomizlssal lecskkentik a komplexitst O(MN3)-re. Ezen

algoritmus alkalmazsnak eredmnyei a tzgpre a 24.22. brn lthatk.
24.22. bra - (a) A tzgp fnykpn tallt sarkok. (b) Az eredeti kpre rhelyezett
hipotetikus rekonstrukci (Clark Olson hozzjrulsval).
6. Navigls s manipulls a lts segtsgvel

A lts egyik legfontosabb alkalmazsa az, hogy informcit szolgltat az objektumok manipullshoz hogy
felszedhessk, megfoghassuk, elforgathassuk stb. azokat , valamint hogy akadlyok kikerlsvel
naviglhassunk. Az a kpessg, hogy a ltst ezen clokra hasznljk, a legprimitvebb llati ltrendszerekben
is jelen van. Sok esetben a ltrendszer minimlis abban az rtelemben, hogy a rendelkezsre ll ltmezbl
csak annyi informcit nyer ki, ami az llat viselkedsnek a tjkoztatsra szksges. Igen valszn, hogy a
modern ltrendszerek a korai, primitv organizmusokbl fejldtek ki, amelyek egy fnyrzkeny foltot
hasznltak az egyik vgkn, s gy tudtk magukat a fny fel vagy azzal ellenttes irnyba orientlni. A 24.4.
alfejezetben lttuk, hogy a legyek egy nagyon egyszer optikai folyamra alapoz ltst hasznlnak, hogy le
tudjanak szllni a falon. A What the Frogs Eye Tells the Frogs Brain c. klasszikus tanulmny (Lettvin s
trsai, 1959) megfigyeli, hogy egy bka hen fog halni, ha olyan tellel van krlvve, amely nem mozog.
Csak a mret s a mozgs alapjn llaptja meg, hogy mi lelem.
24.23. bra - Az t kpe egy autban lv kamerval lefnykpezve. A vzszintes fehr

cskok jelzik azokat a keressi ablakokat, amiken bell a vezrl az tvonali jeleket
keresi. A gyenge kpminsg nem szokatlan az alacsony felbonts fekete-fehr videk
esetben.
787
Az szlels
A robotoknak nevezett organizmusokban szmtgpes ltrendszereket hasznlunk. Tekintsnk egy specilis

robotfajtt: egy automata jrmvezett egy autplyn (lsd 24.23. bra). Elszr elemezzk a feladatot; azutn
meghatrozzuk a ltsi algoritmust, amely a feladatok helyes vgrehajtshoz szksges. A vezet eltt ll
feladatok kztt talljuk az albbiakat:
1. Oldals irnyts biztostani, hogy a kocsi biztonsgosan a kzlekedsi svon bell maradjon, vagy szksg
esetn zkkenmentesen vltson svot.
2. Hosszanti irnyts biztostani, hogy a kocsi eltt biztonsgos tvolsg legyen.
3. Akadlyelhrts a szomszdos kzlekedsi svokban halad kocsik figyelse s felkszls az elkerl
manverezsre, ha azok valamelyike svot szeretne vltani.
A vezet feladata, hogy generlja ezen feladatok legjobb teljestshez alkalmas kormnyzsi, gyorstsi vagy
fkezsi cselekvseket.
Az oldals irnytshoz szksges a gpkocsi pozcijnak s irnytottsgnak a svhoz kpesti reprezentlsa.
A 24.23. brn lthat kp esetn ldetektl algoritmusokkal azonostjuk a svhatrokat jelz hatrol
vonalakhoz tartoz leket. Ezt kveten ezekre az lekre sima grbket illeszthetnk. Ezen grbk paramterei
informcit hordoznak a gpkocsi oldals elhelyezkedsre nzve, az aut haladsi irnyra a svon bell s a
sv veltsgre. Ez az informci a gpkocsi dinamikjval egytt kpezi mindazt, amire a kormnyzst
irnyt rendszernek szksge van. Jegyezzk meg azt is, hogy mivel kpkockrl kpkockra a sv kpi
vetletnek pozcija csupn csekly mrtkben vltozik, tudjuk, hogy a kpen a svhatrjelz vonalakat hol
keressk csak azokon a terleteken kell keresnnk, amelyek prhuzamos fehr vonalakkal vannak megjellve.
A hosszanti irnytshoz az elttnk halad gpkocsik tvolsgra van szksg. Erre a ktkamers sztereolts
vagy optikai folyam segtsgvel tehetnk szert. Mindkt megkzeltst lnyegesen egyszersthetjk, ha
kihasznljuk a sk felleten trtn haladsbl add knyszereket. Ilyen technikk felhasznlsval a
vizulisan irnytott autk nagy sebessggel hossz ideig tudnak kzlekedni.
Fontos
788
Az szlels
A gpkocsi-vezetsi plda egy szempontot igencsak vilgoss tesz: egy konkrt feladat esetn a kpen
elvben tallhat sszes informci kinyerse nem szksges. Nem szksges a gpkocsik pontos
alakjnak a meghatrozsa, az ttal szomszdos fves terletekre vonatkoz az-alak-a-textrbl
problma megoldsa stb. A feladat informciszksglete csak egy bizonyos tpus informcira
vonatkozik, s lnyeges szmtsi sebessget s robusztussgot lehet biztostani, ha csak erre az
informcira sszpontostunk, s a problmbl add knyszereket teljes egszben kihasznljuk. Az
elbbi rszekben bemutatott ltalnos megkzeltsek clja az volt, hogy egy ltalnos alapelmletet
adhassunk, amit majd a konkrt feladat szksgleteihez lehet specializlni.
7. sszefoglals
Br az ember szmra az rzkels knnyed cselekvsnek tnik, igen nagy mennyisg komplex szmtst
ignyel. A lts clja informci kiemelse olyan feladatokhoz, mint a manipulls, a navigls s az
objektumfelismers.
A kpalkots (image formation) folyamata, a geometriai s fizikai aspektusokat tekintve, jl feltrt terlet.
Ha adott egy hromdimenzis jelenet lersa, ennek valamilyen tetszleges kamerapozcinak megfelel
kpt knnyszerrel elllthatjuk (grafikai problma). E folyamat megfordtsa s a jelenet lersnak a kp
alapjn trtn ellltsa nehz.
Ahhoz, hogy a manipullsi, naviglsi s objektumfelismersi feladatokhoz szksges vizulis informcit
kiemelhessk, szksg van valamilyen kzbls reprezentci megkonstrulsra. A kpekbl az olyan
primitv elemeket, mint az lek s a rgik, a kpfeldolgozsi algoritmusok (image-processings) emelik ki.
Egy kpben tbbfle segtsg rejlik, amely lehetv teszi, hogy a jelenetrl hromdimenzis informcit
kapjunk. Idetartozik a mozgs, a sztereolts, a textra, az rnyals s a kontrelemzs. Ezek mindegyike a
fizikai jelenetre vonatkoz httr- felttelezseken alapul, hogy az interpretcit kzel egyrtelmv tegye.
A teljes kr objektumfelismers nagyon nehz problma. A fnyessg- s a jellemzalap megkzeltseket
trgyaltuk. Ms lehetsgek is vannak.

Az emberi lts megrtsre irnyul szisztematikus prblkozsok az korig nylnak vissza. Eukleidsz (kb. i.
e. 300) rt a termszetes perspektvrl az olyan lekpezsrl, amely a hromdimenzis vilg minden P
pontjhoz az OP sugr irnyt rendeli hozz, amely sugr a P pontot a vetts O kzppontjval kti ssze.
Eukleidsz ismerte a mozgsi parallaxis jelensgt is. A perspektivikus vetts matematikai megrtst, egy
skra val vetts szempontjbl, a 15. szzadban az itliai renesznsz segtette el. Az els, a hromdimenzis
jelenet helyes geometriai vettsn alapul festmnyt ltalban Brunelleschinek tulajdontjk (1413). 1435-ben
Alberti fogalmazta meg a szablyokat, s inspirlta a mvszek generciit, akik mvszi teljestmnyt mig
csodljuk. A perspektva tudomnynak ahogy akkor neveztk kidolgozsban kimagaslott Leonardo da
Vinci s Albrecht Drer. Leonardo ks 15. szzadi lersait a fny s az rnyk (chiaroscuro) jtkrl, az
rnyk umbra s penumbra rgiirl, valamint a lgi perspektvrl mg mindig rdemes elolvasni (Kemp,
1989).
Br a perspektvt a grgk is ismertk, furcsamd a felfogsuk a szemnek a ltsban betlttt szereprl
zavaros volt. Arisztotelsz azt gondolta, hogy a szem a mai lzeres tvolsgmrk mintjra fnysugarakat
bocst ki. Ezt a tves elkpzelst a vilgnak az arab tudsok kzvettettk, tbbek kzt Alhazen a 10. szzadban.
Ezutn klnfle kamerk fejlesztse kvetkezett. Ezek egy szobbl (latinul a camera szobt jelent) lltak,
ahova a fnyt a falon egy kis nylson t engedjk be, hogy az tellenes falon a kinti jelenet kpt kivettse.
Ezen kamerk mindegyikben a kp termszetesen fordtott volt, ami vg nlkli zavart okozott. Ha a szem
ilyen elv berendezs lenne, akkor hogyan lehetsges, hogy a kpet helyesen ltjuk? A problma a korszak
legnagyobb elmit foglalkoztatta (Leonardt is belertve). A krds megvlaszolshoz Kepler s Descartes
munkssga kellett. Descartes az ablakzsalu nylsba egy olyan szemet helyezett be, amelynek nem tltsz
felhmrtegt eltvoltottk. A retinra kitertett papron gy egy fordtott kpet kapott. Br a retins kp valban
fordtott, ez nem okoz problmt, mert az agy helyesen interpretlja a kpet. Mai szaknyelven azt mondhatnnk,
hogy megfelel mdon kezelni kell az adatstruktrkat.
A lts megrtsben a kvetkez lnyeges elrelps a 19. szzadban trtnt. Helmholtz s Wundt 1.
fejezetben emltett munkssga a pszichofizikai ksrleteket szigor tudomnyos szintre emelte. Young,
789
Az szlels
Maxwell s Helmholtz munkja megalaptotta a sznes lts hrom sznen alapul elmlett. Azt a tnyt, hogy
az emberi szem a mlysg rzkelsre is kpes, ha a kt szem kiss eltr kpet lt, Wheatstone a sztereoszkp
feltallsval demonstrlta (Wheatstone, 1838). A kszlknek azonnal nagy sikere lett a szalonokban Eurpaszerte. A ktkamers sztereolts lnyegt, azaz hogy a jelenet kt, kiss eltr ltszgbl ksztett kpe
elegend informcit hordoz a jelenet hromdimenzis visszalltshoz, a fotogrammetria terletn aknztk
ki. Megszlettek a kulcsfontossg matematikai eredmnyek. Kruppa bebizonytotta, hogy ha t klnbz pont
kt klnbz kpvel rendelkeznk, vissza lehet lltani a kt kamera pozcija kztti elfordulst s eltolst,
valamint a jelenet mlysgt (egy sklafaktor erejig) (Kruppa, 1913). Br a sztereolts geometrijt j ideje
ismertk, a fotogrammetria megfeleltetsi problmjt ltalban emberek oldottk meg, akik az egymsnak
megfelel pontokat igyekeztk egymshoz illeszteni. Az embereknek a megfeleltetsi problma megoldsban
megmutatkoz csodlatos kpessgt Julesz Bla demonstrlta a vletlen-pont sztereogram feltallsval
(Julesz, 1971). Ezen problma megoldsra mind a szmtgpes lts terletn, mind a fotogrammetriban sok
munkt fordtottak az 1970-es s az 1980-as vekben.
A 19. szzad msodik fele volt az a peridus, amikor az emberi ltsra vonatkoz pszichofizikai kutatsokat
megalapoztk. A 20. szzad els felben a lts terletn a legfontosabb eredmnyekhez a Max Wertheimer
vezette Gestalt pszicholgiai iskola jutott. Az egsz tbb, mint a rszek sszege jelszval azt a nzetet
hangslyoztk, hogy az szlels elsdleges elemei a teljes formk legyenek, ne pedig az sszetevk, mint
pldul az lek.
A msodik vilghbor utni szakaszt megjult aktivits jellemezte. A legfontosabb J. J. Gibson munkja volt,
aki rmutatott az optikai folyam s a textragradiensek fontossgra olyan krnyezeti vltozk becslsnl, mint
a dls s a lejts (Gibson, 1950; 1979). jbl hangslyozta az ingerek fontossgt s gazdagsgt. Gibson,
Olum s Rosenblatt rmutattak, hogy az optikai folyammez elegend informcit tartalmaz ahhoz, hogy a
megfigyel meghatrozhassa sajt mozgst a krnyezetben (Gibson s trsai, 1955). A szmtgpes ltsban a
kutats ezen terleten s a (matematikailag ekvivalens) struktra-a-mozgsbl terleten fleg az 1980-as
vekben ment vgbe, Koenderink, Van Doorn, Ullman s Longuet-Higgins alapoz eredmnyeit kvetve
(Koendrink s Van Doorn, 1975; Ullman, 1979; Longeut-Higgins, 1981) adott lendletet e tevkenysgnek. A
kezdeti aggodalmakat a mozgsbl szrmaztatott struktra stabilitsval kapcsolatban Tomasi s Kanade
munkja (Tomasi s Kanade, 1992) csillaptotta, akik megmutattk, hogy tbb kpkocka felhasznlsval s az
ebbl szrmaz szles alapvonallal az alak egszen pontosan felismerhet.
Chan s trsai rjk le a lgy meghkkent vizulis appartust, amelynek tzszer nagyobb az idbeli vizulis
aktivitsa, mint az emberek (Chan s trsai, 1998). Azaz egy lgy egy maximum 300 kpkocka/msodperc
sebessg filmet is gy tudna nzni, hogy felismeri az egyes kpkockkat.
Az 1990-es vekben megjelent koncepcionlis jts a mozgsbl szrmaztatott struktra tanulmnyozsa volt.
Egy ilyen belltsban a kamera kalibrcija nem szksges, ahogy azt Faugeras megmutatta (Faugeras, 1992).
Ez a felfedezs sszefgg az objektumfelismersben alkalmazott geometriai invarinsokkal, ahogy azt Mundy
s Zisserman ttekintettk (Mundy s Zisserman, 1992), s a mozgsbl szrmaztatott rokon struktrval
(Koenderink s Van Doorn, 1991). Az 1990-es vekben a szmtgpek sebessgnek s trolsi kapacitsnak
nvekedsvel a digitlis videofelvtelekbl trtn mozgsi szekvenciaelemzst sok j terleten alkalmaztk.
Valsvilg-beli jelenetek geometriai modelljeinek felptse a szmtgpes grafikai technikkkal trtn
elllts cljbl klnsen npszernek bizonyult, amelyet olyan rekonstrukcis algoritmusok vezettek, mint
amelyet pldul Debevec, Taylor s Malik fejlesztettek ki (Debevec, Taylor s Malik, 1996). Hartley s
Zisserman, valamint Faugeras s trsainak knyvei tfogan trgyaljk a tbbszrs nzetek geometrijt
(Hartley s Zisserman, 2000; Faugeras s trsai, 2001).
A szmtgpes ltsban az alak textrbl val kinyersre vonatkoz legfontosabb kezdeti eredmnyeket
Bajcsynak, Liebermannak s Stevensnek ksznhetjk (Bajcsy s Lieberman, 1976; Stevens, 1981). Mg ez a
munka sk felletekre vonatkozott, a grblt felletekre vonatkozan tfog elemzseket Garding, Malik s
Rosenholtz vgeztek (Garding, 1992; Malik s Rosenholtz, 1994).
A szmtgpes ltsban az alaknak az rnykolsbl val kinyerst Berthold Horn tanulmnyozta (Horn,
1970). E terlet f cikkeit a (Horn s Brooks, 1989) tekinti t. Ez a megkzelts szmos egyszerst felttellel
lt, amelyekbl a legknyesebb a klcsns megvilgts hatsnak figyelmen kvli hagysa volt. A klcsns
megvilgts fontossgt kellen rtkeltk a szmtgpes grafika terletn, ahol ppen ezen hats
figyelembevtelre fejlesztettk ki a fnysugrkvetst s a radiozitst. Egy elmleti s gyakorlati kritika a
(Forsyth s Zisserman, 1991)-ben tallhat.
790
Az szlels
Az alaknak a kontrbl val meghatrozsa terletn Huffman s Clowes kezdeti, kulcsfontossg

hozzjrulsai utn polideres objektumok esetre (Huffman, 1971; Clowes, 1971) Mackworth s Sugihara
teljess tettk az elemzst (Mackworth, 1973; Sugihara, 1984). Malik kifejlesztette a tartomnyonknt sima
grblt objektumok cmkzsi smjt (Malik, 1987). Kirousis s Papadimitriou megmutattk, hogy a trideres
jelenet vonalcmkzse NP-teljes (Kirousis s Papadimitriou, 1988).
Ahhoz, hogy a sima grblt objektumok vetleteibl a vizulis esemnyeket megrtsk, szksg van a
differencilgeometria s a szingularitselmlet egyttesre. Ezek tanulmnyozshoz a legjobb irodalom
Koenderink Solid Shape c. mve (Koenderink, 1990).
A hromdimenzis objektumfelismers terletn Roberts az MIT-n benyjtott diszszertcija adott lnyegi
eredmnyeket (Roberts, 1963). Sokan gy tartjk, hogy ez a szmtgpes lts terletn az els PhDdisszertci, amely sok kulcsfontossg tletet vezetett be, az ldetektlst s a modellalap illesztst is
belertve. A Canny-fle ldetektlst (Canny, 1986) vezette be. A Roberts ltal bevezetett illeszts gondolata
ksbb Lowe, Huttenlocher s Ullman munkjban jra megjelent (Lowe, 1987; Huttenlocher s Ullman, 1990).
A helyzet sszerendelsi mdszer alapjn trtn becslsnek hatkonysgt jelents mrtkben Olson nvelte
(Olson, 1994). A hromdimenzis objektumfelismers kutatsnak egy msik nagy vonulata, az alakzatok
trfogati primitvekre, n. ltalnostott hengerekre (generalized cylinders) alapul lersa, amelyet Tom
Binford vezetett be, klnsen npszernek bizonyult (Binford, 1971).
Mg az objektumfelismerssel foglalkoz szmtgpes lts kutatsa nagyrszt a hromdimenzis objektumok
ktdimenzis kpekre trtn lekpezsvel foglalkozott, addig a mintafelismerssel foglalkoz kzssgben
ltezett egy prhuzamos irnyzat, amely a problmt a mintaosztlyozs problmjaknt ltta. Az ezt motivl
pldk olyan terletekrl kerltek ki, mint az optikai karakterfelismers s a kzzel rt irnytszmok
felismerse, ahol az elsdleges problma egy objektumosztly tipikus variciinak jellemvonsait megtanulni,
s ezek alapjn klnvlasztani ket ms osztlyoktl. A megkzeltsek sszehasonltst a (LeCun s trsai,
1995) tartalmazza. Az objektumfelismersrl szl tovbbi munkk kztt van (Sirovitch s Kirby, 1987; Viola
s Jones, 2002) arcfelismersrl szl munkja. Az alakkontextus mdszert (Belongie s trsai, 2002) rja le.
(Dickmanns s Zapp, 1987) demonstrlt elszr nagy sebessggel az autplyn halad, vizulisan vezrelt
jrmvel; Pomerleau neurlis hlzatok segtsgvel rt el hasonl teljestmnyt (Pomerleau, 1993).
Stephen Palmer munkja, a Vision Science: Photons to Phenomenology (Palmer, 1999) a legjobb sszefoglal
munka az emberi lts lersra; David Hubel Eye, Brain and Vision (Hubel, 1988) s Irvin Rock Perception c.
mve (Rock, 1984) rvid bevezett nyjtanak a neuropszicholgia, illetve az szlels terleteibe.
A szmtgpes lts terletnek legjobb sszefoglal jegyzete David Forsyth s Jean Ponce munkja, a
Computer Vision: A Modern Approach. Sokkal rvidebben trgyalja a terletet (Nalwa, 1993; Trucco s Verri,
1998). A Robot Vision (Horn, 1986) s a Three-Dimensional Computer Vision (Faugeras, 1993) rgebbi, de mg
mindig hasznos jegyzetek, sajt, specilis tmjukban. David Marr knyve, a Vision (Marr, 1982) fontos
szerepet tlttt be a szmtgpes lts (pszichofizika) s a tradicionlis biolgiai lts (neurobiolgia)
sszekapcsolsban. A szmtgpes lts tmjban a kt f folyirat az IEEE Transactions on Pattern
Analysis and Machine Intelligence s az International Journal of Computer Vision. A szmtgpes ltssal
foglalkoz konferencik tbbek kzt az ICCV (International Conference on Computer Vision), a CVPR
(Computer Vision and Pattern Recognition) s az ECCV (European Conference on Computer Vision).
7.2. Feladatok
24.1.
A sr, lombos koronval rendelkez fa rnykban szmos vilgos foltot lehet ltni. Meglepetsre mind
krkrs. Mirt? Hiszen ha gy vesszk, a levelek kztti rsek, amelyeken keresztl tvilgt a nap, nagy
esllyel nem ilyenek.
24.2.
Cmkzze meg a 24.24. brn lthat objektumot, azt felttelezve, hogy a kls leket takar leknek
cmkztk, s az sszes sarokpont trideres. Tegye meg ezt a visszalp algoritmussal, amely a sarokpontokat A,
B, C s D sorrendben fogja megvizsglni, mindegyik lpsnl gy megvlasztva a cmkket, hogy azok az elbb
megcmkzett csatlakozsokkal s lekkel konzisztensek legyenek. Prblja most a sarokpontokat B, D, A s C
sorrendben megcmkzni.
791
Az szlels
24.24. bra - A megcmkzend objektum, amelynek minden sarokpontja trideres
24.3.
Tekintsen egy vgtelen hossz, r sugar hengert, amelynek tengelye az y tengellyel prhuzamos. A henger
Lambert-fle fellettel rendelkezik, s a pozitv z tengely fell irnytjuk r a kamert. Mit fog ltni a kpen, ha
a hengert egy pontszer fnyforrs vilgtja meg, amely a pozitv x tengelyen a vgtelenben helyezkedik el.
Magyarzza meg a vlaszt gy, hogy az azonos fnyessg kontrokat rajzolja fel a vettett kpre. Az azonos
fnyessg kontrok azonos tvolsgban helyezkednek-e el?
24.4.
A kpbeli lek a jelenetesemnyek sokasgnak felelhetnek meg. Tekintsen egy tetszleges fnykpet, amely
valdi hromdimenzis jelenetet brzol. Azonostson a kpen tz lt, s ksrelje meg egyenknt eldnteni,
hogy az l (a) a mlysg, (b) a felleti normlis, (c) a reflektancia, illetve (d) a megvilgts szakadsnak felele meg.
24.5.
Mutassa meg, hogy a konvolci egy adott fggvnnyel felcserlhet a differencilssal, azaz, hogy:
(f g') = f g'
24.6.
792
Az szlels
Egy terlet feltrkpezshez egy sztereorendszer hasznlatt fontolgatjuk. A rendszer kt CCD kamerbl fog
llni, mindegyik 512 512 pixel felbonts egy 10 10 cm ngyzet alak rzkeln. A felhasznland lencsk
fkusztvolsga 16 cm, s a lencsk a vgtelenben fixlnak. A bal oldali kp (u1, v1) s a jobb oldali kp (u2, v2)
egymshoz tartoz pontjaira v1 = v2, hiszen a kt kpskon az x tengelyek az epipolris vonalakkal
prhuzamosak. A kt kamera optikai tengelye prhuzamos. A kt kamera kztti bzisvonal 1 m.
a. Ha a legkzelebbi mrend tv 16 m, mi a tapasztalhat legnagyobb diszparits (kppontban)?
b. Mi a tvmrs pixelfelbontsbl add felbontsa 16 m tvolsgban?
c. Milyen tv tartozik az egy kppontos kpeltrshez?
24.7.
Az illesztsi algoritmust egy ipari alkalmazsnl szeretnnk hasznlni, ahol lapos alkatrszeket egy
szlltszalag visz, a szalag felett pedig egy fgglegesen elhelyezett kamera figyel. Az alkatrsz
elhelyezkedst hrom vltoz hatrozza meg, egy az elfordulst s kett az alkatrsz ktdimenzis pozcijt.
Ez egyszersti a problmt, s a TRANSZFORMCIT-KERES fggvny az egymsnak megfelel kp- s
modelltulajdonsgokbl kt prt ignyel ahhoz, hogy az elhelyezkedst azonostsa. Hatrozza meg csak ebben a
krnyezetben az illesztsnek a legrosszabb esetre vett komplexitst.
24.8.
(Pietro Perona nyomn.) A 24.25. bra X s Y pontban kt kamert mutat, amelyek megfigyelnek egy jelenetet.
Rajzolja le azt a kpet, amit az egyes kamerk ltnak (felteheti, hogy minden jellt pont ugyanabban a vzszintes
skban helyezkedik el). Mi tudhat meg a kt kp alapjn az A, B, C, D s E pontok a kamera alapvonaltl mrt
relatv tvolsgrl, s milyen alapon?
24.25. bra - Fellnzeti kp egy ktkamers ltrendszerrl, amely egy veget figyel
meg, amely mgtt egy fal van
24.9.
A kvetkez lltsok kzl melyik igaz s melyik hamis?
a. Sztereokpeken az egymsnak megfelel pontok megtallsa a sztereomlysg-megllapts folyamatnak
legegyszerbb feladata.
b. Az alak-mintzatbl feladat megoldhat egy fnycskokat tartalmaz hl jelenetre trtn vettsvel.
793
Az szlels
c. A HuffmanClowes cmkz rendszer mindenfle polideres objektumot tud kezelni.

d. Grbket tartalmaz objektumok vonalas rajzaiban a vonal cmkje vltozhat az egyik vgtl a msikig.
e. Ugyanazon jelenet sztereonzeteiben minl messzebb van a kt kamera egymshoz kpest, annl
pontosabban hatrozhat meg a mlysg.
f. Egy jelenetben tallhat egyforma hosszsg vonalak mindig egyforma hosszsgra vettdnek a kpen.
g. A kpen egyenes vonalak szksgszeren egyenes vonalaknak felelnek meg a jelenetben.
24.10.
A 24.23. bra egy aut nzpontjbl kszlt egy autplya kijratnl. Kt aut lthat a kzvetlenl balra lev
svban. Milyen okok miatt kell a nznek azt a kvetkeztetst levonnia, hogy az egyik kzelebb van, mint a
msik?
794
25. fejezet - Robotika

Ebben a fejezetben az genseket fizikai beavatkoz szervekkel ltjk el, hogy rosszalkodhassanak.
1. Bevezets
A robotok (robots) olyan fizikai gensek, amelyek a fizikai vilg megvltoztatsval oldanak meg feladatokat.
E clbl klnbz beavatkoz szervekkel (effectors) szerelik fel ket, pldul lbakkal, kerekekkel, karokkal
s megfogkkal. A beavatkozk kizrlagos clja, hogy fizikai hatst fejtsenek ki a krnyezetre. 1 A robotokat
rzkelkkel (sensors) is felszerelik, hogy rzkelhessk krnyezetket. Manapsg a robotikban szmtalan
klnfle rzkelt hasznlnak: kamerkat s ultrahangradarokat a krnyezet mrsre, giroszkpokat s
gyorsulsmrket a robot sajt mozgsnak kvetsre.
A legtbb mai robot hrom nagy kategria egyikbe sorolhat. A manipultorok (manipulators), vagy ms
nven robotkarok fizikailag a munka helysznhez rgztettek, pldul egy ipari szerelsoron egy gyrban vagy
a Nemzetkzi rllomson. A manipultorok mozgst ltalban irnythat csuklk sora biztostja, lehetv
tve, hogy a vgbeavatkoz szerv a munkatr brmely pontjra eljuthasson. Az ipari robotok messze
leggyakoribb fajtja a manipultor, vilgszerte tbb mint egymilli mkdik bellk. Bizonyos mobil
robotkarokat krhzakban, mtteknl hasznlnak. Kevs autgyrt tudna ma mr meglenni ipari robotok
nlkl, s egyes robotkarok mg malkotsok ksztsre is kpesek.
A msodik csoportot a mobil robotok (mobile robots) alkotjk. A mobil robotok kerekek, lbak vagy hasonl
szerkezetek segtsgvel mozognak a fizikai krnyezetben. Hasznljk ket krhzakban telkihordsra,
dokkokban rurakodsra s ms, hasonl feladatokra. Korbban mr emltettnk egy pldt, a NAVLAB ember
nlkli kzti jrmvt (unmanned land vehicle, ULV), amely autplyn kpes nllan, sofr nlkl
naviglni. Msfajta mobil robotokat, pldul az ember nlkli lgi jrmveket (unmanned air vehicle, UAV)
katonai feldertsre, mezgazdasgi permetezsre s megfigyelsre hasznlnak. Az autonm vz alatti
jrmvek (autonomous underwater vehicle, AUV) nagy szerepet jtszanak a mlytengeri felfedezsekben,
mg a bolygjrk (planetary rovers), mint pldul a 25.1. (a) brn lthat Sojourner, az rkutatsban
segdkeznek.
25.1. bra - (a) A NASA Sojourner mobil robotja, amely a Mars felsznt dertette fel
1997 jliusban. (b) A Honda P3 s Asimo elnevezs humanoid robotjai.
A 2. fejezetben mg beavatkozkrl (actuators) beszltnk, s nem beavatkoz szervekrl (effectors). A beavatkoz egy vezrlvonal,
amely a beavatkoz szervnek kzvetti az utastst, mg a beavatkoz szerv maga a fizikai eszkz.
1
795
Robotika
A harmadik tpusba tartoznak a hibridek: olyan mobil robotok, amelyekre karokat is szereltek. Ezek kz
sorolhatjuk a humanoid robotokat (humanoid robots), amelyek fizikai felptse hasonlt az emberhez. A
25.1. (b) brn kt ilyen humanoid robot lthat, mindkett Japnban kszlt, a Hondnl. A hibridek a rgztett
manipultoroknl nagyobb tvolsgokban is kpesek beavatkoz szerveiket hasznlni, de ltalban nehezebben
tudjk vgrehajtani a feladatukat, mert nem rendelkeznek kell stabilitssal s szilrdsggal, amit a lergzts
biztost.
A robotika trgykre magban foglalja a protziseket (emberek rszre ksztett mestersges vgtagok,
mestersges fl vagy szem), az intelligens krnyezeteket (mint pldul egy egsz hz felszerelve szenzorokkal
s beavatkoz szervekkel) s a tbbelem (multibody) rendszereket is, ahol a feladatokat rengeteg apr
egyttmkd robot hajtja vgre.
A valdi robotoknak ltalban olyan krnyezetben kell boldogulniuk, amely csak rszlegesen megfigyelhet,
sztochasztikus, dinamikus s folytonos. Nhny, de nem mindegyik robotkrnyezet szekvencilis s multigens
jelleg is. A rszleges megfigyelhetsg s a sztochasztikussg annak az eredmnye, hogy egy meglehetsen
nagy s komplex vilggal kell foglalkozni. A robot nem lt a sarkok mg, s bizonytalansg van a
mozgsparancsok vgrehajtsban a hajtsok csszsa, a srlds stb. miatt. Mi tbb, a fizikai vilg makacsul
visszautastja, hogy vals idejnl gyorsabb legyen! Szimulcis krnyezetben egyszerbb tanulsi
algoritmusok hasznlatval (mint pldul a 21. fejezetben lert Q-tanuls) lehetsges mindssze nhny CPUmunkara sorn tbb milli prbt vgrehajtva tanulni, de vals krnyezetben veket vehetnek ignybe ezek a
ksrletek. Tovbb, az igazi tkzsek valban fjdalmat okozhatnak, ellenttben a szimulltakkal. A valdi
robotrendszerekbe ahhoz, hogy a robot gyorsan tanulhasson s biztonsgosan zemelhessen elzetesen
informcit kell bepteni magrl a robotrl, fizikai krnyezetrl s az elvgzend feladatrl.
2. Robothardver
Eddig a knyvben adottnak tekintettk az gensek architektrjt (rzkelket, beavatkoz szerveket s
processzorokat), s csak az gensek mkdtet programjra koncentrltunk. A valsgban a robotok sikere
legalbb annyira mlik a feladathoz ill, megfelel szenzorok s beavatkoz szervek megvlasztsn.
2.1. rzkelk
A szenzorok jelentik az rzkelsi interfszt a robotok s krnyezetk kztt. A paszszv rzkelk (passive
sensors), mint pldul a kamerk, tnylegesen puszta megfigyeli a krnyezetknek: olyan jeleket vesznek,
amelyeket a robot krnyezetben lv ms trgyak generlnak. Az aktv szenzorok (active sensors), mint
pldul a hangloktor, energit sugroznak krnyezetkbe, s rzkelik, ha ez az energia visszaverdik. Az
aktv szenzorok ltalban tbb informcit szolgltatnak, de ugyanakkor tbbet fogyasztanak, s interferencia
lphet fel, ha egyszerre tbbet is hasznlunk. Akr aktv, akr passzv rzkelkrl van sz, hrom csoportba
lehet ket osztani az alapjn, hogy tvolsgot mrnek, teljes kpet kzvettenek a krnyezetrl vagy a robot
egyes sajt tulajdonsgait figyelik.
Sok mobil robot egy adott trrszt lefed psztz tvolsgmrt (range finder) hasznl, olyan szenzort,
amely a kzeli trgyak tvolsgt mri. Gyakori tpus a szonrszenzor, ms nven hangloktor. A
szonrszenzorok irnytott hanghullmokat bocstanak ki, amelyek egy rsze visszaverdik a trgyakrl. A
visszaverds ideje s a hullm intenzitsa informcival szolgl a kzeli trgyak helyzetrl. Az AUV-kre
(autonm vz alatti jrm) vz alatti hangloktorokat szerelnek. Szrazfldn a hangloktorokat rossz
irnyfelbontsuk miatt fleg kis tvolsgon belli tkzsek elkerlsre hasznljk. A hangloktorok
alternatvjt jelenthetik (elssorban lgi jrmveknl) a radaralap s a lzeres tvolsgmrk. Egy lzeres
psztz tvolsgmr lthat a 25.2. brn.
25.2. bra - (a) A mobil robotoknl npszer SICK LMS lzeres tvolsgmr. (b) Egy
horizontlisan felszerelt tvolsgmr ltal mrt visszaverdsi kp 2D-s trkpre
vettve.
796
Robotika
Egyes tvolsgmrk csak nagyon kicsi vagy nagyon nagy tvolsgokra hasznlhatk. A kis tvolsg
szenzorok kz tartoznak a taktilis, vagyis tapintsalap rzkelk (tactile sensors), mint pldul az
rzkelbajusz, lkhrt vagy az rintsrzkeny br. A skla msik vgn a globlis helymeghatroz
rendszer (Global Positioning System, GPS) ll, amely a mholdakbl rkez impulzusok alapjn szmtja a
tvolsgot. Jelenleg kt tucat mhold kering orbitlis plyn, s mindegyik kt kln frekvencin sugroz
jeleket. A GPS-vevkszlkek a fzistolsbl tudjk kiszmtani a mholdtl val tvolsgukat. Tbb
mholdtl rkez jel alapjn hromszgelssel nhny mteres pontossggal meghatrozhat a Fldn elfoglalt
tnyleges pozci. A differencilis GPS (differential GPS) mg egy pontosan ismert helyen lv fldi vev
jelt is hasznlva idelis esetben millimteres pontossgot r el. Sajnlatos mdon a GPS nem hasznlhat
beltrben vagy vz alatt.
A szenzorok msik fontos osztlyt kpezik a kprzkelk (imaging sensors). A kamerk kpet adnak
szmunkra a krnyezetrl, valamint a 24. fejezetben trgyalt, szmtgpes gpi ltsi mdszerek
alkalmazsval modellekkel, illetve tulajdonsgokkal rjk le a krnyezetet. A sztereolts klnsen fontos a
robotikban, mivel mlysgi informcit is kzvett. Jvjk mindamellett elg bizonytalan, mert sikeresen
folyik j, aktv tvolsglekpezsi technolgik kidolgozsa.
A harmadik fontos osztlyt az nrzkelk (proprioceptive sensors) alkotjk, amelyek a robot sajt llapotrl
adnak tjkoztatst. Annak rdekben, hogy a robot csuklinak pontos llsrl informcink legyen, a motorok
tengelyt sokszor szghelyzet-dekdolkkal (shaft decoders) ltjk el, amelyek kis lpsekben kvetik a
tengely elfordulst. A robotkarokon a tengelyre szerelt dekdolk brmikor pontos helyzetinformcit tudnak
szolgltatni. Mobil robotokon a szghelyzet-dekdolkat a kerk mozgsnak figyelsre hasznljk, amely
alapjn szmthat a megtett t. Ezt hvjk odometrinak (odometry). Sajnlatos mdon az odometria a
kerekek csszsa s sodrdsa miatt csak kis tvolsgokban hasznlhat. A kls hatsok, mint pldul az
ramlsok az AUV-knl (autonm vz alatti jrm) vagy a szl az UAV-k (autonm lgi jrm) esetben tovbb
nveli a mrs bizonytalansgt. Az inerciaszenzorok (inertial sensors), mint pldul a giroszkp, javtanak a
pontossgon, de nmagukban mg nem kszblik ki a pozcimrs hibjnak elkerlhetetlen halmozdst.
A robotllapot ms fontos jellemzinek mrsre er- s nyomatkrzkelket (force, torque sensors)
hasznlnak. Ezek nlklzhetetlenek, ha a robotnak trkeny trggyal kell dolgoznia, vagy olyannal, amelynek
pontos mrete s helyzete nem ismert. Kpzeljk csak el, amikor egy kzel egytonns manipultornak egy
villanykrtt kell becsavarnia. Ha tl nagy ervel fogn meg a krtt, knnyen sszeroppanthatn. Az
errzkelk lehetv teszik, hogy a robot tudja, milyen nehz megfogni a krtt, mg a nyomatkrzkelk
informcit szolgltatnak, hogy milyen nehz becsavarni. A j szenzorok kpesek ert mrni mindhrom
elmozdulsi s mindhrom elfordulsi irnyban.
2.2. Beavatkoz szervek

A robotok beavatkoz szerveik segtsgvel mozognak s vltoztatjk alakjukat. Ahhoz, hogy megrtsk a
beavatkoz szervek felptst, elszr is ltalnos rtelemben kell beszlnnk a mozgs s az alak elvont
rtelmezsrl, a szabadsgfokok (degree of freedom, DOF) koncepcijnak felhasznlsval.
797
Robotika
Szabadsgfoknak szmt minden olyan irny, amelyben a robot vagy egyik beavatkoz szerve mozogni kpes.
Pldul egy merev, szabadon mozg robotnak (mint amilyenek az AUV-k) hat szabadsgfoka van, hrom az (x,
y, z) trbeli elhelyezkeds, hrom pedig a szgelforduls (orientci). Ezeket szoktk csavarsnak, billentsnek
s forgatsnak is hvni (RPY roll, pitch, yaw). Ez a hat szabadsgfok meghatrozza a robot kinematikus
llapott,2 ms nven a pozcijt s az orientcijt egyttesen. A robot dinamikai llapota (dynamic state)
minden egyes kinematikai paramter vltozsi sebessgt is tartalmazza, gy minden kinematikai dimenzinl
egy-egy tovbbi dimenzit hoz be.
25.3. bra - (a) A Stanford manipultor: egy korai robotkar t rotcis (R) s egy
transzlcis (prizmatikus) csuklval (P), sszesen hat szabadsgfokkal. (b) Egy
elskerk-kormnyzs nemholonomikus ngykerek jrm mozgsa.
Nem merev testek esetben magn a roboton bell tovbbi szabadsgfokok vannak. Pldul az emberi kar
esetben a knyk egy szabadsgfok, mert egy irnyba kpes elfordulni. A csukl hrom szabadsgfok, mert
tud fel-le s jobbra-balra mozogni, tovbb forogni is. ltalban minden egyes robotcsuklnak is egy, kt vagy
hrom szabadsgfoka van. Hat szabadsgfok szksges ahhoz, hogy pldul egy kezet a trben tetszleges
pozciba s irnyba (orientciba) hozzunk. A 25.3. (a) brn lthat robotkarnak pontosan hat szabadsgi foka
van: t rotcis csukl (revolute joint), amelyek forgst tesznek lehetv, s egy transzlcis csukl
(prismatic joint), amely kinylsra kpes. Egy egyszer ksrlet segtsgvel knnyedn meggyzdhetnk
arrl, hogy az emberi kznek valjban hatnl tbb szabadsgfoka van: keznket az asztalra rakva mg mindig
kpesek vagyunk elforgatni a knyknket, anlkl hogy a keznk konfigurcija megvltozna. Azokat a
manipultorokat, amelyeknek tbb szabadsgfoka van, mint ami minimlisan szksges ahhoz, hogy
vgbeavatkoz szervket (end effector) a kvnt helyre vigyk, knnyebb vezrelni, mint azokat, amelyek csak a
minimlisan szksges szm szabadsgfokkal rendelkeznek.
Mobil robotoknl a szabadsgfokok szma nem felttlenl egyezik meg a mozgatott rszek szmval. Vegynk
pldul egy tlagos autt: tud mozogni elre-htra s tud fordulni. Ez gy kt szabadsgfok. Ennek ellenre a
kocsi kinematikja hromdimenzis: egy szabad lapos felleten knnyedn el tud jutni brmilyen (x, y) pontba,
tetszleges orientcival (lsd 25.3. (b) bra). Azaz a kocsinak 3 effektv szabadsgfoka (effective DOF) van,
de 2 irnythat szabadsgfoka (controllable DOF). A robotra azt mondjuk, hogy nemholonomikus
(nonholonomic), ha az effektv szabadsgfoka nagyobb, mint az irnythat szabadsgfoka, mg holonomikus
(holonomic), ha ez a kett megegyezik. A holonomikus robotokat knnyebb irnytani. Mennyivel egyszerbb
lenne olyan kocsival parkolni, amely kpes oldal irnyban is mozogni, nem csak elre-htra! Viszont a
holonomikus robotok jellemz mdon mechanikailag sokkal bonyolultabbak. A legtbb robotkar holonomikus,
mg a mobil robotok ltalban nemholonomikusak.
A mobil robotok szmra mozgat mechanizmusok szles trhza ll rendelkezsre: kerekek, lnctalpak, lbak
stb. A differencil hajts (differential drive) robotoknak ktoldalt kln mozgathat kerekeik (vagy
lnctalpaik) vannak, ugyangy, mint a tankoknak. Ha mindegyik kerk azonos sebessggel mozog, akkor a
jrm egyenesen halad elre. Ha ellenkez irnyba mozognak, akkor a robot kpes egy helyben megfordulni. A
2
A kinematika sz a grg cinema-bl ered, ami mozgst jelent.
798
Robotika
msik alternatvt a szinkrn hajts (synchro drive) jelenti, amelynl minden kerk el tud fordulni a tengelye
mentn. Ez knnyen vezethetne koszhoz, ha nem lenne az a knyszer, hogy minden kerk mindig azonos
irnyba lljon, s azonos sebessggel forogjon. Mind a differencil, mind a szinkrn hajts nemholonomikus.
Egyes drga robotok holonomikus hajtst hasznlnak, ltalban hrom vagy tbb nllan irnythat kerkkel.
A kerekekkel ellenttben a lbak mg a nagyon nehz tereppel is megbirkznak. Ugyanakkor a lbak
meglehetsen lassak sk terepen, s mechanikailag nehezebb megpteni ket. Robotikai szakemberek
prbltak mr klnfle konstrukcikat, egytl akr tucatnyi lbig. Ksztettek lbbal rendelkez robotokat
stlsra, futsra, st mg ugrlsra is. Egy ilyen plda lthat a 25.4. (a) brn: ez a robot dinamikusan stabil
(dinamically stable), ami azt jelenti, hogy kpes talpon maradni, mikzben krbe ugrl. Statikusan stabilnak
(statically stabile) hvjk azokat a robotokat, amelyek gy kpesek llva maradni, hogy nem mozognak a
lbaik. A robot statikusan akkor stabil, ha a slypontja a lbai ltal kifesztett sokszg fl esik.
25.4. bra - (a) Marc Raibert egyik lpeget robotja mozgs kzben. (b) A Sony AIBO
robot focizs kzben (copyright 2001, The RoboCup Federation).
Ms tpus mobil robotok teljesen eltr mdszereket hasznlnak a mozgshoz. A lgi jrmveken ltalban
propellereket vagy turbinkat alkalmaznak. Robot lghajk a meleg ramlatokat hasznljk ki, hogy a levegben
maradjanak. Az autonm vz alatti jrmvek gyakran alkalmaznak a tengeralattjrkon hasznltakhoz hasonl
fvkkat.
Szenzorok s beavatkoz szervek nmagukban mg nem tesznek ki egy robotot. Egy igazi robotnak
energiaforrsra is szksge van, hogy mozgathassa beavatkoz szerveit. A legnpszerbb megolds mind a
manipultorok mozgatshoz, mind a helyvltoztatshoz, a villanymotor. Ugyanakkor a pneumatikus (srtett
gzzal mkd) s a hidraulikus (folyadkkal kzvettett nyomssal mkd) hajtsoknak is megvannak a
maguk alkalmazsi terletei. A legtbb robot valamifle digitlis kommunikcis eszkzzel is rendelkezik,
pldul vezetk nlkli hlzati kapcsolattal. Vgezetl szksg van valami vzra is, amelyre fel lehet szerelni
az alkatrszeket s az eszkzket, valamint egy forrasztpkra, ha az alkatrszek s eszkzk megsznnek
mkdni.
3. rzkels a robotikban
Az rzkels az a folyamat, amelynek sorn a robot a szenzoraibl rkez jeleket krnyezetnek bels
reprezentcijra kpezi le. Az rzkels nehz, mivel ltalban a szenzorok adatai zajjal terheltek, a krnyezet
csak rszlegesen megfigyelhet, nem jsolhat viselkeds s gyakran dinamikus is. klszably, hogy egy j
bels reprezentcinak hrom tulajdonsga van: elg informcit hordoz ahhoz, hogy a robot a megfelel
dntst meghozhassa; strukturltsga lehetv teszi, hogy hatkonyan frissthet legyen; valamint termszetes
799
Robotika
olyan rtelemben, hogy a bels llapotvltozk megfeleltethetk egy-egy vals fizikai vilgbeli
llapotvltoznak.
A 15. fejezetben megmutattuk, hogy a Kalman-szrk, a rejtett Markov-modellek s a dinamikus Bayes-hlk
alkalmasak egy rszlegesen megfigyelhet krnyezet llapottmenet- s rzkel modelljeinek a
reprezentlsra. Ismertettnk egzakt s kzelt algoritmusokat a bels hiedelmi llapot (belief state) a
krnyezet llapotvltozi felett rtelmezett a posteriori valsznsg-eloszls frisstsre. Erre szmos
dinamikus Bayes-hls modellt mutattunk be a 15. fejezetben. Robotikai problmk esetben a modellhez
ltalban megfigyelt vltozknt a robot sajt korbbi cselekvseit is hozzveszszk, mint ahogy az a 17.9. bra
hlzatn lthat. A 25.5. bra ennek a fejezetnek a jellseit mutatja: Xt a krnyezet llapota (belertve a
robotot is) a t idpillanatban; Zt a t idpontbeli megfigyels (az rzkelsbl szrmaz adatok), az At pedig az
rzkelst kveten vgzett cselekvs.
A szrsi (filtering) feladat, vagyis a hiedelmi llapot frisstse alapveten azonos a 15. fejezetben
trgyaltakkal. A feladat az j hiedelmi llapot, P(Xt+1|z1:t+1, a1:t) kiszmtsa a P(Xt|z1:t, a1:t1) aktulis hiedelmi
llapotbl s az j zt+1 megfigyelsbl. Az alapvet klnbsg az, hogy (1) explicit felttelekkel lnk mind a
dntst, mind a megfigyelst illeten, (2) folytonos vltozkkal kell dolgoznunk diszkrtek helyett. Ezrt
mdostanunk kell a (15.3)-as rekurzv szralgoritmust, integrlt hasznlva az sszegzs helyett:
Az egyenlet azt fejezi ki, hogy az X llapotvltoz feletti a posteriori eloszlst a t + 1 idpillanatbani rekurzvan
szmtjuk az egy idlpssel korbbi megfelel becslsbl. A szmtsokhoz felhasznljuk a korbbi cselekvst,
at-t, s az aktulis szenzoros megfigyelst, zt+1-et. Pldul ha clunk egy futballoz robot fejlesztse, akkor Xt+1
lehet a labda relatv helyzete a robothoz kpest. A posteriori P(Xt|z1:t, a1:t1) mindazon llapotok felett rtelmezett
valsznsg-eloszls, amelyek megrzik mindazt, amit a korbbi rzkel mrsekbl s irnytsokbl
tudunk. A (25.1) egyenlet megmondja, hogyan becsljk rekurzvan ezt a pozcit, folyamatosan felhasznlva
az jabb szenzoradatokat (pldul kamerakpek) s a robot mozgsparancsait. A P(Xt+1|xt, at) valsznsget
llapottmenet-modellnek (transition model) vagy ms nven mozgsmodellnek (motion model) hvjuk, mg
P(zt+1|xt+1) az rzkel modell (sensor model).
25.5. bra - A robotrzkels felfoghat gy, mint cselekvsek s mrsek sorozatnak

idbeli egymsra hatsa, ahogy ezt a dinamikus Bayes-hl is illusztrlja
3.1. Helymeghatrozs
A helymeghatrozs (localization) jellemz plda a robotrzkelsre. A problma lnyege a dolgok pontos
helyzetnek meghatrozsa. A helymeghatrozs az egyik legfontosabb rzkelsi feladat a robotikban, mivel a
fizikai krnyezettel val sikeres klcsnhatshoz felttlenl szksges. Pldul a robotkaroknak tudniuk kell,
800
Robotika
hol van az a trgy, amivel dolgozni akarnak. A navigl robotoknak pedig pontosan ismernik kell sajt
helyzetket, hogy eljuthassanak a cljukhoz.
A helymeghatrozsi feladat hrom, egyre nehezebb problmaknt jeletkezik. Ha a trgy kezdeti pozcija s
irnya (orientcija) ismert, akkor a helymeghatrozs tulajdonkppen kvetsi feladatot (tracking) jelent, s
ez korltos bizonytalansggal jellemezhet. Ennl nehezebb a globlis helymeghatrozs (global
localization), amikor is a kezdeti pozci egyltaln nem ismert. A globlis helymeghatrozs kvetsi
problmv egyszersdik, ha sikerl lokalizlni a kvnt trgyat, de itt is elfordulhatnak olyan esetek, amikor
a robotnak nagyon nagy bizonytalansgokkal kell megbirkznia. Vgezetl lehetnk gonoszak is a robotunkkal,
ha elvesszk, elraboljuk elle az ppen lokalizlni prblt trgyat. Ezt elrablsos problmnak (kidnapping
problem) hvjk, s gyakran tesztelik vele a robot lokalizcis algoritmusnak robusztussgt extrm
krlmnyek kztt.
25.6. bra - (a) Egy mobil robot egyszerstett kinematikai modellje. A robotot a kr
jelkpezi, s a bevgs mutatja a haladsi irnyt. Kln-kln lthatjuk a t-beli s a t +
1-beli pozcit s orientcit a vt t s t t frisstsi rtkekkel. Szintn fel van tntetve
egy t idpontban megfigyelt referenciapont (tereptrgy) az (xi, yi) pontban. (b) A
psztz tvolsgmrs modellje. Egy adott tvolsg mrshez (z1, z2, z3, z4) tartoz kt
lehetsges robothelyzet lthat. Sokkal valsznbb, hogy a bal oldali helyzetbl
szrmaznak a tvolsgmrsek.
Azrt, hogy egyszerv tegyk a dolgot, felttelezzk, hogy a robotunk lassan mozog sk terepen, s pontos
trkpe van a krnyezetrl. (Egy ilyen trkp lthat a 25.8. brn.) Egy mobil robot helyzett kt derkszg
koordintjval (x, y) s az irnyt jellemz szggel rjuk le, ahogy ez a 25.6. (a) brn is lthat. (Mivel nem
foglakoztunk a hozz tartoz sebessgekkel, ez inkbb kinematikai, mint dinamikus modell.) Ha ezt a hrom
rtket egy vektorba fogjuk ssze, akkor brmely llapot megadhat Xt = (xt, yt, qt) formban.
Kinematikai kzeltsben minden cselekvs felbonthat kt pillanatnyi sebessgre: egy vt (transzlcis)
sebessgre s egy wt (rotcis) szgsebessgre. Kis t idkre a robot mozgsnak egy durva determinisztikus
modellje az albbi alakban adhat meg:
Az
jells a determinisztikus llapotbecslsre vonatkozik. Termszetesen a fizikai robotok valamilyen
mdon mindig megjsolhatatlanok maradnak. Ezt gyakran modellezik egy f(Xt, vt, t) kzprtk, x
kovariancij Gauss-eloszlssal. (Lsd mg az A) fggelk matematikai definciit.)
801
Robotika
A kvetkez lpsben szksgnk van egy rzkel modellre. Ktfle rzkel modellrl beszlhetnk. Az els
azon alapul, hogy a szenzor referenciapontoknak (landmarks) nevezett lland s felismerhet
jellemvonsokat rzkel s azonost a krnyezetben. Minden referenciapontrl meghatrozza annak tvolsgt
s szgt. Tegyk fel, hogy a robot az xt = (xt, yt, qt) llapotban van, s rzkel egy ismert (xi, yi) helyen lv
referenciapontot. Ha nem vesszk bele az rzkels zajossgt, egyszer geometrival megkaphat a tvolsg s
a szg (lsd a 25.6. (a) bra). Megfigyels alapjn a pontos becsls a tvolsgra s a szgre:
A zaj most is torztja a mrseinket. Egyszerstsl Gauss-eloszls, z kovariancij i zajt ttelezhetnk fel:
A 25.2. brn bemutatott tvolsgszenzorokhoz kicsit msfle rzkel modell is megfelel lehet. Az ilyen
rzkelk egy zt = (z1,, zM) vektort adnak vissza tvolsgadatokkal, amelyek a robothoz kpest rgztett
irnyokban lv trgyakrl hordoznak informcit. Adott xt pozciban legyen
a j-edik sugr irnyba lv
legkzelebbi akadly pontos tvolsga. Csakgy, mint korbban, most is Gauss-zajt tteleznk fel. ltalnosan
vehetjk gy, hogy a klnbz sugrirnyokbeli hibk fggetlenek s azonos eloszlsak, gy:
A 25.6. (b) bra egy pldt mutat be ngyirny tvolsgmr szkennerre, kt klnbz pozci esetn. A kett
kzl az egyik sokkal nagyobb valsznsggel adhatta a megfigyels ngy rtkt. sszehasonltva a psztz
tvolsgmrses modellt a referenciapontos modellel lthat, hogy az elbbinek az az elnye az utbbival
szemben, hogy nincs szksg egy referenciapont azonostsra mieltt egy tartomnypsztzs rtelmezhet
lenne. St az is elfordulhat ahogy a 25.6. (b) bra esetben is , hogy a robot egy jellegtelen fallal tallkozik.
Ugyanakkor, ha van egy tisztn lthat, azonosthat referenciapont, akkor abbl azonnal megkaphat a pontos
helyzet.
A 15. fejezetben mr tallkoztunk a Kalman-szrvel, amely a hiedelmi llapotot egyetlen tbbvltozs Gausseloszlssal reprezentlja, illetve a rszecskeszrvel, amely a hiedelmi llapotot az llapotokhoz rendelt
rszecskeegyttessel reprezentl-ja. A legtbb modern lokalizl algoritmus e kt mdszer egyikt hasznlja a
robot P(Xt|z1:t, a1:t1) hiedelmi llapotnak lekpezsre.
A rszecskeszrs lokalizcis algoritmust Monte Carlo lokalizcinak (Monte Carlo localization, MLC)
hvjk. Az MCL alapveten megegyezik a 15.15. brn bemutatott rszecskeszrs algoritmussal, mindssze
annyit kell mdostanunk, hogy szksgnk van a megfelel mozgs s szenzor modellre. A 25.7. bra bemutat
egy vltozatot, psztz tvolsgmrses modellel. Az algoritmus mkdst, azt, hogy hogyan azonostja a
robot sajt tartzkodsi helyt az irodapletben, a 25.8. bra szemllteti. Az els kpen mg a rszecskk
egyenletesen oszlanak el, az elzetes informci alapjn, jelkpezve a teljes bizonytalansgot a robot pozcijt
illeten. A msodik kpen mr az els mrsek alapjn klasztereket alkotnak a rszecskk, oda tmrlve, ahol
valsznleg tartzkodik a robot. A harmadik esetben pedig mr elg informci ll rendelkezsre a mrsekbl,
hogy az sszes rszecske ugyanoda jusson.
25.8. bra - A Monte Carlo lokalizci, egy rszecskeszr algoritmus mobil robotok
pozcijnak meghatrozsra. Fell: a kezdeti, teljes bizonytalansg. Kzpen:
nagyjbl ktplus bizonytalansg, miutn a robot elindult a kzps (szimmetrikus)
folyosn. Alul: egyetlen pont kr szklt bizonytalansg, miutn bement az egyik
irodba.
802
Robotika
803
Robotika
25.7. bra - A Monte Carlo lokalizl algoritmus, fggetlen zajjal terhelt psztz
tvolsgmrses modellt hasznlva
A Kalman-szr a msik szles krben hasznlt lokalizl algoritmus. A Kalman-szr a P(Xt|z1:t, a1:t1)
posteriort egy Gauss-eloszlssal reprezentlja. Az eloszls kzprtkt t-vel, kovariancijt pedig t-vel
jelljk. A f problma a Gauss-hiedelmekkel az, hogy csak lineris mozgsi modell, f s lineris mrsi
modell, h mellett zrtak. Nemlineris f vagy h esetn a szr frisstsnek eredmnye ltalban mr nem lesz
Gauss-eloszls. gy Kalman-szrt hasznl lokalizcis algoritmusok linearizljk a mozgsi s az rzkel
modelleket. A linearizls egy nemlineris fggvny adott loklis lineris kzeltse. A 25.9. bra a linearizls
elvt mutatja be egy (egydimenzis) robotmozgsi modellen. A bal oldalon fut a mozgs nemlineris f(xt, at)
modellje (az at vezrls nem szerepel az brn, mert nem jtszik szerepet a linearizlsban). A jobb oldalon ezt
egy f(xt, at) lineris fggvnnyel kzeltjk. A lineris fggvny a t pontban rinti az f-et, ami a t idre
vonatkoz becslsnk kzprtke. Ezt a linearizlst (els fok) Taylor-sorfejtsnek (Taylor expansion)
hvjk. Az olyan Kalman-szrt, amely f-et s h-t Taylor-sorfejtssel linearizlja, kiterjesztett Kalmanszrnek (KKSZ; extended Kalman Filter EKF) hvjuk. A 25.10. bra egy KKSZ helymeghatroz
algoritmust hasznl robot becslssorozatt mutatja. Ahogy a robot halad, a helyzetre vonatkoz becsls
bizonytalansga egyre n, ahogy azt a hibaellipszis is mutatja. A hiba cskken, ahogy a robot egy ismert
elhelyezkeds referenciapont tvolsga s szge alapjn javtani tudja sajt helyzetre vonatkoz becslst. A
hiba vgl jra nni kezd, ahogy a referenciapont kikerl a robot ltkrbl. A KKSZ algoritmus jl mkdik,
ha knnyen azonosthat referenciapontok vannak. Ellenkez esetben az a posteriori eloszls multimodlis is
lehet, mint a 25.8. (b) brn. A referenciapontok azonostsnak szksgessgt jelent problma csak egy plda
a 15. fejezet vgn trgyalt adatasszocicis (data association) problmnak.
25.9. bra - Egydimenzis, linearizlt mozgsi modell illusztrlsa: (a) Az f fggvny s t

+ 1 idpontbeli t kzprtke s kovariancija (t alapjn). (b) A linearizlt vltozat az
f rintje a t pontban. A t kzprtk ugyanaz marad, ugyanakkor az elrevettett
kovariancia mr klnbzik a t+1-tl.
804
Robotika
25.10. bra - Plda a kiterjesztett Kalman-szr hasznlatra lokalizcis problmhoz.

A robot egy egyenes mentn mozog. Ahogy halad elre, a sajt helyzetnek ismerethez
tartoz bizonytalansg fokozatosan n, ahogy azt a hibaellipszisek mutatjk. Amikor
szrevesz egy ismert pozcij referenciapontot, a bizonytalansg cskken.
3.2. Trkpezs
Az elzk sorn egyetlen trgy helymeghatrozsnak problmjt trgyaltuk meg. A robotikban azonban
ltalban egyszerre tbb trgy helyzett kell meghatrozni. A klasszikus plda erre a feladatra a trkpezs.
Kpzeljnk el egy robotot, amelyiknek nincs pontos trkpe a krnyezetrl, magnak kell azt elksztenie. Az
ember fantasztikus kpessgeket fejlesztett ki, hogy feltrkpezze krnyezett, mra mr az egsz bolygt.
Termszetesen add feladat egy olyan algoritmus kitallsa, amely kpess teszi ugyanerre a robotot is.
Az irodalomban a robottrkpezs problmjt gyakran mint szimultn helymeghatrozst s trkpezst
(SZLT; simultaneous localization and mapping, SLAM) emltik. A robotnak nem csupn egy trkpet kell
konstrulnia, hanem ezt anlkl kell tennie, hogy ismern, maga hol tartzkodik. Az SZLT az egyik alapvet
robotikai problma. Azt a vltozatot fogjuk tekinteni, amikor a krnyezet lland. A feladat gy is meglehetsen
bonyolult; s mg nehezebb vlik, ha megengedjk, hogy a krnyezet vltozzon, ahogyan a robot mozog
benne.
Statisztikai oldalrl nzve a trkpezs egy Bayes kvetkeztetsi problma, csakgy, mint a lokalizci. Jelljk
M-mel a trkpet s Xt-vel a robot t pillanatbeli helyzett, mint ahogy azt korbban is tettk. Ekkor trhatjuk a
(25.1) egyenletet, hogy a posterior tartalmazza a teljes trkpet is:
Szerencsre az egyenletbl ltszik, hogy a feltteles eloszlsok, amelyek a cselekvsek s mrsek

figylembevtelhez kellenek, alapveten megegyeznek a helymeghatrozs problmjnl hasznltakkal. A f
klnbsg az, hogy az j llapottr mr sokkal tbb dimenzis, mert tartalmazza az sszes robothelyzeten kvl
az sszes trkpet is. Kpzeljk csak el, ha egy egsz pletet akarunk lekpezni fotorealisztikusan! Ez esetleg
tbb szz milli numerikus adatot ignyelne. Minden egyes numerikus adat egy vletlen vltoz lesz, s
hozzjrul, hogy az llapottr elkpeszten nagy dimenzis legyen. Ami mg tovbb bonyoltja a problmt,
hogy a robot esetleg elre nem is tudja, hogy milyen nagy a krnyezete, ezrt M dimenzijt a trkpezs sorn
dinamikusan kellene nvelni.
805
Robotika
Taln a legszlesebb krben hasznlt mdszer az SZLT-problma megoldsra a KKSZ. A szrhz ltalban
trstanak mg egy referenciapont-rzkel modellt is, valamint kittel, hogy az sszes referenciapont
megklnbztethet legyen. A korbbiakban a posterior becslst egy t vrhat rtk, t kovariancij Gausseloszlssal jellemeztk. Az SZLT/problma KKSZ-megkzeltsnl a posterior megint csak Gauss-eloszls
lesz, de most a kzprtk egy sokkal nagyobb vektor. Nemcsak a robot helyzett rgzti, hanem tartalmazza a
trkp sszes jellemzjt (vagy referenciapontjt) is. Amennyiben n ilyen jellemznk van, akkor a vektor 2n + 3
dimenzis lesz (kt paramterrel rhat le a referenciapontok helyzete s hrommal a robot pza).
Kvetkezskppen a t mtrix (2n + 3)-szor (2n + 3)-as lesz, az albbi struktrval:
Ahol is a XX a robot helyzetnek a kovariancija, amit mr korbban figyelembe vettnk a

helymeghatrozsnl. XM egy 3-szor 2n-es mtrix, amely a referenciapontok s a robotkoordintk kztti
korrelcit fejezi ki. Vgezetl a MM egy 2n-szer 2n-es mtrix, ami a trkpjellemzk kovariancijt rja le,
belertve az sszes pronknti korrelcit. gy a KKSZ memriaignye kvadratikusan n n-nel, a trkpen lv
jellemzk szmval, s a frisstsi id szintn kvadratikus n-ben.
Mieltt elmerlnnk a matematikai rszletekben, tanulmnyozzuk grafikusan a KKSZ-t. A 25.11. bra egy
robotot mutat, amelynek krnyezetben nyolc referenciapont helyezkedik el kt sorban, mindegyikben ngy
referenciaponttal. Kezdetben a robotnak nincs informcija arrl, hogy hol helyezkednek el a referenciapontok.
Ttelezzk fel, hogy az sszes pont ms szn, s a robot ezeket egyrtelmen meg tudja klnbztetni
egymstl! A robot egy ismert pozcibl balra indul el, de fokozatosan elveszti pontos helynek ismerett. Ezt
jellik a hibaellipszisek a 25.11. (a) brn. Az ellipszisek szlessge nvekszik, ahogy a robot halad elre.
Ahogy a robot mozog, a kzeli referenciapontok tvolsgnak s szgnek rzkelse rvn a robot meg tudja
becslni azok helyzett. Termszetesen ezeknek a becslseknek a bizonytalansga nagyban fgg a robot sajt
helyzetre vonatkoz becslsnek bizonytalansgtl. A 25.11. (b) s (c) brk illusztrljk a robot hiedelmt,
ahogy fokozatosan halad elre krnyezetben.
25.11. bra - A KKSZ alkalmazsa a robottrkpezs problmjra. A robot plyja a

szaggatott vonal, s a besatrozott ellipszisek jelentik helyzetre vonatkoz sajt
becslseit. Nyolc pont jelenti az ismeretlen helyzet referenciapontokat, mg a
helyzetkre vonatkoz becslseiket a fehr ellipszisek mutatjk. Az (a), (b) s (c)
brkon a robot helyzetre vonatkoz becsls bizonytalansga folyamatosan nvekszik,
ahogy azok a referenciapontok is, amelyek mellett elmegy. A (d) brn a robot jra
elrkezik az els referenciaponthoz, gy az sszes tbbi pont helyzetnek
bizonytalansga is cskken, ksznheten annak, hogy a becslsek korrelltak.
806
Robotika
Ezen becslsek fontos jellemzje ami egyltaln nem magtl rtetd az brkon , hogy a becslseket
egyetlen Gauss-eloszls jellemzi. A 25. 11. brn lthat hibaellipszisek csupn ennek az eloszlsnak a vetletei
a robot- s referenciakoordintk alterbe. Ez a tbbvltozs Gauss a posteriori eloszls tartja fenn a korrelcit
az sszes becsls kztt. Fontos ez az szrevtel annak megrtshez, hogy mi trtnik a 25.11. (d) brn. Itt a
robot szrevesz egy korbban mr feltrkpezett referenciapontot. Ennek kvetkeztben sajt pozcijnak
bizonytalansga drasztikusan cskken, mint ahogy az szszes tbbi referenciapont bizonytalansga is. Ez annak
a kvetkezmnye, hogy a robot s a pontok helyzetnek becslse ersen korrelltak a Gauss a posteriori
eloszlsban. Brmilyen j informci egy vltozrl (ebben az esetben a robot helyzetrl) automatikusan
cskkenti az sszes tbbi vltoz bizonytalansgt.
A trkpezshez hasznlatos KKSZ algoritmus hasonlt a korbban a lokalizcihoz hasznlt KKSZ-re. A
legfontosabb klnbsget a referenciapont-vltozk hozzadsa jelenti a posteriorban. A referenciapontok
mozgsmodellje trivilis: nem mozognak. gy az f fggvny azokra a vltozkra az identitsfggvny. A mrsi
fggvny alapveten megegyezik a korbban hasznlttal. Az egyetlen klnbsg a KKSZ frisstsi egyenletben
az, hogy a Ht Jacobi-mtrixnak nemcsak a robot pozcijt kell figyelembe vennie, hanem a referenciapontok tben megfigyelt helyzett is. Az gy kapott KKSZ-egyenletek mg ijesztbbek, mint a korbbiak, ezrt itt nem is
trgyaljuk ket.
Ugyanakkor van mg egy nehzsg, amit szp csndben figyelmen kvl hagytunk eddig: az M trkp mrett
nem tudjuk elre. Ebbl kifolylag a vgs becslshez tartoz t s t elemeinek szma szintn ismeretlen.
807
Robotika
Ezeket dinamikusan kell meghatrozni, ahogy a robot jabb referenciapontokat tall. A problma megoldsa
elg egyszer: amikor a robot felfedez egy j referenciapontot, egyszeren hozzad egy j elemet a
posteriorhoz. Ha ennek az j elemnek a variancijt nagyon nagy kezdeti rtkre vlasztjuk, akkor az
eredmnyl kapott posterior ugyanaz, mintha a robot mr korbban is tudott volna annak a referenciapontnak a
ltezsrl.
3.3. Tovbbi rzkelsi tpusok

Nem minden robotrzkels helymeghatrozs s trkpezs. A robotok rzkelhetnek hmrskletet, szagokat,
hangokat stb. Ezek kzl sok valsznsgi alapon becslhet, mint ahogyan a lokalizcinl s a trkpezsnl
lttuk. Mindssze olyan feltteles valsznsg-eloszlsokat kell tallni, amelyek lerjk az llapotvltozk
idbeli viselkedst, illetve olyan eloszlsokat, amelyek jellemzik a mrsek s az llapotvltozk kapcsolatt.
Azonban nem minden mkd robotrzkelsi rendszer alapul valsznsgi modellezsen. Valjban nem
szksges, hogy minden bels llapotnak legyen vals fizikai interpretcija, ahogy az a mi pldink esetn
volt. Pldul kpzeljnk magunk el egy jr robotot, amely ppen az egyik lbt prblja egy akadly felett
temelni. Felttelezzk, hogy a robot olyan szablyt alkalmaz, amely szerint kiindulsknt csak kicsit emeli fel a
lbt, de egyre nagyobb s nagyobb magassgokkal prblkozik, ha a lba folyton beletkzik valamilyen
akadlyba. Mondhatjuk-e, hogy az emelt lb magassga valamilyen vals fizikai paramter reprezentcija?
Esetleg igen, s akkor az az akadly magassgra, illetve tlphetsgre vonatkozik. Ugyanakkor mondhatjuk
azt is, hogy a lbmagassg a robot vezrlsnek egy segdvltozja, mindenfajta fizikai jelents nlkl. Az ilyen
reprezentcik nem ritkk a robotikban, s bizonyos feladatok megoldsra kivlan alkalmasak.
A robotika jelenlegi trendjei egyrtelmen egy jl definilt szemantikval rendelkez lers fel mutatnak. A
valsznsg-alap modellek egyre inkbb kiszortjk a tbbi megoldst olyan komplex problmk esetn, mint
amilyen a helymeghatrozs s a trkpezs. Bizonyos esetekben azonban a statisztikai technikk tlsgosan
krlmnyesek, s nha a gyakorlatban az egyszerbb megoldsok is ppen olyan hatkonyak. A
legmegfelelbb alkalmazand mdszer kivlasztst leginkbb a valdi robotokkal trtn munka sorn szerzett
tapasztalatok segtik.
4. Mozgstervezs
A robotikban a dntsek vgl is a beavatkoz szervek mozgsban jutnak kifejezsre. A ponttl pontig
mozgs (point-to-point motion) esetn a cl a robotnak vagy vgbeavatkoz szervnek egy megadott helyre
val eljuttatsa. Nagyobb kihvst jelent a kvet mozgs (compliant motion), amikor is a robot gy mozog,
hogy kzben vgig fizikai kontaktusban marad egy akadllyal. Plda erre, amikor egy robotkar becsavar egy
gt, vagy amikor vgigtol az asztalon egy dobozt.
Azzal kell kezdennk, hogy keresnk egy megfelel reprezentcit, amely alkalmas a mozgstervezsi
problmk lersra s megoldsra. Kiderl, hogy a konfigurcis tr (configuration space) a
robotllapotok tere, amelyet a pozci, az orientci s a csuklszgek definilnak alkalmasabb a feladatra,
mint a 3D tr. A plyatervezs (path planning) azt jelenti, hogy meg kell tallni az egyik konfigurcitl egy
msikig vezet utat. A korbbi fejezetekben mr szmos ttervezsi mdszert vzoltunk fel. A robotikban az
ttervezs legfbb jellemvonsa az, hogy folytonos terekkel dolgozik. A szakirodalom szmos klnbz
technikt tart szmon, amelyek kifejezetten olyan esetekre alkalmazhatk, ahol a cl tvonalak keresse
sokdimenzis folytonos terekben. Kt f megkzelts ltezik: a celladekompozci (cell decompisition) s a
szkeletonizci (skeletonisation). Mindkett diszkrt grf keressi feladatra vezeti vissza s egyszersti le a
folytonos tkeressi problmt azltal, hogy kanonikus llapotokat s plykat r le a folytonos trben. Ebben a
fejezetben vgig felttelezzk, hogy a mozgs determinisztikus, s a robot helybli azonostsa egzakt. A
ksbbi fejezetek gyengteni fogjk ezeket a felttelezseket.
4.1. Konfigurcis tr
A robotmozgsi feladatok megoldsnak els lpseknt a problmhoz ki kell tallni egy megfelel
reprezentcit. Kezdjk egy egyszer problma egyszer brzolsval. Vegyk a 25.12. (a) brn lthat
robotkart. Kt csuklval rendelkezik, amelyek egymstl fggetlenl mozoghatnak. Ha a csuklkat mozgatjuk,
megvltozik a knyk s a megfog (x, y) koordintja. (A kar z irnyban nem kpes elmozdulni.) Mindez azt
sugallja, hogy a robot konfigurcii lerhatk egy ngydimenzis koordinta-rendszerben, ahol: (xknyk, yknyk)
jelenti a knyk relatv helyzett a krnyezethez kpest, mg (xmegfog, ymegfog) a megfog helyzett. Vilgos, hogy
ez a ngy koordinta lerja a robot sszes lehetsges llapott. Ezt a lerst munkatr-reprezentcinak
808
Robotika
(workspace representaion) is nevezik, mivel a robot helyzett ugyanabban a koordinta-rendszerben rjuk le,
mint a mozgatni (vagy ppen elkerlni) kvnt trgyakt. A munkatr-reprezentci jl hasznlhat tkzs
elkerlsre, klnsen akkor, ha a trgyakat egyszer poligonokknt modellezzk.
A munkatr-reprezentcival az a problma, hogy a robot szmra nem minden munkatr-koordinta rhet el,
mg akkor sem, ha nincsenek akadlyok. Ez a munkatr elrhet koordintira vonatkoz sszekapcsolsi
knyszerek (linkage constrains) miatt van. Pldul a knyk (xknyk, yknyk) s a megfog (xmegfog, ymegfog)
pozcija egymstl mindig adott tvolsgra van, mert egy merev alkar kapcsolja ket ssze. Ha a robotmozgstervezs munkatr-koordintkban trtnik, akkor a generlt tvonalaknak mindig meg kell felelnik ezeknek a
knyszereknek. Ez azrt klnsen nehz, mert az llapottr folytonos, a knyszerek pedig nemlinerisak.
Knnyebb a dolgunk, ha konfigurcis trben (configuration space) terveznk. Ahelyett hogy Descarteskoordintkkal rnnk le a robot helyzett a trben, a csuklk konfigurcijt vesszk figyelembe. A pldban
szerepl robotnak kt csuklja van, gy llapott a kt csukl llsval jellemezhetjk:
jelenti a vllcsukl
szgt, mg
a knykcsuklt. Ha semmilyen akadly sincs a munkatrben, akkor a robot csukli
brmilyen rtket szabadon felvehetnek a konfigurcis trben. St plyatervezs sorn a kiindulsi s a
clkonfigurci egyszeren sszekthet egy egyenessel. A robot ezt az egyenest kvetve konstans sebessggel
mozgatja csuklit, amg el nem ri a kijellt helyet.
Sajnlatos mdon azonban a konfigurcis trnek is megvannak a maga problmi. A robot feladatai ltalban a
munkatr koordintiban adottak, s nem a konfigurcis trben. Konkrtan pldul azt akarjuk, hogy a robot
vgberendezst a munkatrben egy adott pontra mozgassa, st esetleg mg az orientci is adott. Ez felveti azt
a krdst, hogy hogyan kpezzk le a munkatr-koordintkat a konfigurcis trbe. ltalban ennek a
problmnak az inverze egyszerbb, azaz knnyebben kpezhetk le a konfigurcis tr koordinti a
munkatrbe, hiszen a problma nhny egyrtelm koordinta-transzformcival megoldhat. Ezek a
transzformcik linerisak transzlcis, s trigonometrikusak rotcis csuklk esetn. A transzformcik
sorozatt kinematiknak (kinematics) hvjk. Ezzel a kifejezssel mr tallkoztunk korbban, a mobil
robotoknl.
Inverz kinematiknak (inverse kinematics) hvjk egy olyan robot konfigurcijnak kiszmtst, ahol a
robot beavatkoz szerveinek helyzete a munkatr koordintiban adott. Az inverz kinematikai szmtsok
ltalban nehezek, klnsen sok szabadsgfok robotok esetben. St a megolds ritkn egyrtelm.
Pldarobotunk esetben kt klnbz konfigurci is ltezik, amikor a megfog ugyanazt a helyzetet veszi fel
a munkatrben, mint ami a 25.12. brn lthat.
ltalban kt szabadsgfok (2DOF) robotkar esetn az inverz kinematikai feladat megoldsainak szma nulla
s kett kztt van, brmilyen bemeneti munkatr-koordintra. A legtbb ipari robot esetn vgtelen sok
megolds van. Ennek megrtshez kpzeljk el, hogy a pldarobotunkhoz hozzadunk mg egy rotcis
csuklt, aminek tengelye prhuzamos a meglv csuklk egyikvel. gy a legtbb konfigurci esetn szabadon
tudjuk mozgatni a kzbls csuklkat, mikzben a megfog pozcija nem vltozik (az orientcija azonban
igen). Nhny tovbbi csuklval (mennyivel?) megoldhat, hogy a kart ugyangy mozgatva az orientci se
vltozzon. Mr lttunk erre pldt, amikor letettk keznket az asztalra, s mgis tudtuk mozgatni a
knyknket. A kz pozcijbl add kinematikai korltozsok alapjn mg nem hatrozhat meg
egyrtelmen az emberi knyk konfigurcija. Ms szavakkal, a vll-kar egyttes inverz kinematikai
problmjra vgtelen sok megolds ltezik.
25.12. bra - (a) Egy kt szabadsgfok robotkar munkatere. A munkatr egy doboz,
amiben egy lapos akadly lg a mennyezetrl. (b) Ugyanennek a robotnak a
konfigurcis tere. A fehrrel jelzett terlet jelenti azokat a konfigurcikat, ahol a
robot nem tkzik ssze semmivel. A pont az brn a robot bal oldali konfigurcijt
mutatja.
809
Robotika
A msik problma a konfigurcis trrel kapcsolatosan akkor merl fel, amikor akadlyok is vannak a
munkatrben. A 25.12. (a) brn lthat esetben pldul szmos ilyen akadly van; az egyik pont a robot
munkaternek kzepbe nylik bele. A munkatrben ezek az akadlyok egyszer geometriai formkknt
jelennek meg, klnsen a robotikai tanknyvekben, ahol a poligonlis akadlyokra fkuszlnak. De hogyan
nznek ki ezek a konfigurcis trben?
Pldarobotunk konfigurcis tert mutatja a 25.12. (b) bra a 25.12. (a) brn lthat akadlyok esetre. A
konfigurcis teret kt altrre bonthatjuk: azoknak a konfigurciknak a terre, amelyek elrhetk ez a szabad
tr (free space), illetve az elrhetetlen konfigurcik ltal alkotott trrszre, amit foglalt trnek (occupied
space) hvnak. A 25.12. (b) brn a fehr rsz jelenti a szabad teret, mg az sszes tbbi a foglalt tr. A
klnbz rnyalatok jelzik, hogy melyik akadlyrl is van sz: a szabad teret krbehatrol fekete rszek
jelentik azokat a konfigurcikat, amelyeknl a robot nmagval tkzik ssze. Knny beltni, hogy a vll- s
knykcsuklk szls llsai ezt eredmnyezik. A robot kt oldaln lv ovlis rszek az asztalnak felelnek
meg, amin a robot ll. A harmadik ovlis terlet a bal oldali fal. Vgezetl, a konfigurcis trben a
legklnsebb alakzat a robot mozgsterbe belelg, egyszer fggleges elem. Ennek igen klns alakja
van, ersen nemlineris, s helyenknt mg konkv is. Egy kis kpzelervel felismerhetjk a megfog alakjt a
bal fels szln. Szaktsunk egy kis idt ennek a fontos brnak a tanulmnyozsra. Az alakzat egyltaln nem
nyilvnval! A 25.12. (b) brn a pont a robot 25.12. (a) brn lv llapotnak megfelel konfigurcit
mutatja. A 25.13. brn tovbbi hrom konfigurcit is lthatunk, mind a munkatrben, mind a konfigurcis
trben. A conf-1 llsban a megfog megkzelti a kzps akadlyt.
A legtbb esetben a szabad tr alakja nagyon bonyolult a konfigurcis trben, mg akkor is, ha a munkateret
egyszer poligonokkal reprezentljuk. ppen ezrt a gyakorlatban inkbb feltrkpezik a konfigurcis teret,
semmint pontosan kiszmtjk. A trkpezs sorn generlnak egy konfigurcit, s megnzik, hogy az a szabad
trben van-e. Ehhez alkalmazzk a robot kinematikjt, s annak alapjn mr ltszik, ha az adott konfigurci
tkzssel jr a munkatrben.
25.13. bra - Hrom klnbz robotkonfigurci a munkatrben s a konfigurcis

trben
810
Robotika
4.2. Celladekompozcis mdszerek

Els megkzeltsben celladekompozcit (cell decompisition) hasznlunk plyatervezshez, ami azt jelenti,
hogy a szabad teret vges szm folytonos rgira, cellkra osztjuk fel. Fontos tulajdonsga ezeknek a
rgiknak, hogy a plyatervezs egyszer mdszerekkel megoldhat egy-egy celln bell (pl. egyenes vonal
mozgssal). Ezutn a plyakeress diszkrt grfkeressi problmv egyszersdik, nagyon hasonlv ahhoz,
amit a 3. fejezetben mr bemutattunk.
A legegyszerbb celladekompozci egy szablyos osztstvolsg rcsbl ll. Ilyen ngyzethls
dekompozcit mutat be a 25.14. (a) bra, az ehhez a srsg felosztshoz tartoz optimlis tvonallal.
Klnbz rnyalatokat hasznltunk a szabad tr egyes cellihoz tartoz rtkek jellsre. Ez az rtk
mutathatja pldul, hogy milyen messze van az adott cella a cltl. (Kiszmtshoz hasznlhatjuk a 17.4. brn
ismertetett RTKITERCI algoritmus egy determinisztikus vltozatt.) A 25.14. (b) brn lthat a kar
mozgsa a munkatrben.
Az ilyen felbontsnak a nagyon knny megvalsthatsg az elnye. Ugyanakkor, hasznlatakor kt korltozs
is l. Elszr is, csak kis dimenzij munkaterek esetn mkdik, mert a cellk szma d-vel, a dimenzik
szmval exponencilisan n. Msodszor, felmerl a krds, hogy mit csinljuk azokkal a cellkkal, amelyek
vegyesek, vagyis rszben a szabad trhez, rszben a foglalthoz tartoznak. Egy ilyen celln keresztl men
megolds nem felttlenl mkdik, mert lehet, hogy az adott irnyban nem lehet thaladni a celln. Ez az
ttervezt bizonytalann tenn. Ugyanakkor, ha egyltaln nem engedjk meg, hogy a plya ilyen vegyes
cellkon menjen keresztl, tervez algoritmusunk hinyos lesz. Elfordulhat, hogy az egyetlen lehetsges t a
clhoz egy ilyen celln megy t klnsen akkor, ha a cella mrete sszehasonlthat a trkzk s tjrk
fizikai mretvel.
25.14. bra - (a) A kltsgfggvny s az ellltott trajektria a konfigurcis trben,

diszkrt hls celladekompozcis kzelts esetn. (b) Ugyanaz az tvonal a
munkatrben brzolva. rdemes megfigyelni, hogy a robot behajltja a knykt, hogy
elkerlje a fggleges akadlyt.
811
Robotika
A fenti problmk elkerlse rdekben a celladekompozcis mdszeren ktflekppen lehet javtani. Az els,
ha megengedjk a vegyes cellk tovbb osztst mondjuk az eredeti mret felre. Ezt rekurzvan folytathatjuk,
amg nem tallunk olyan utat, ami csak szabad trben lv cellkon megy t. (Termszetesen a mdszer csak
akkor mkdik, ha egy adott cellrl egyrtelmen el tudjuk dnteni, hogy vegyes-e. Ez viszonylag knny, ha
a konfigurcis tr hatrai matematikailag egyszeren lerhatk.) Akkor teljes a mdszernk, ha ltezik korlt a
legkeskenyebb tjrra, amin az tvonal bejrhat. Annak ellenre, hogy a konfigurcis tren bell alapveten
a bonyolultabb, trkksebb rszekre fkuszldik a szmtsi igny, mg mindig nem lesznk kpesek
sokdimenzis problmk kezelsre, mivel a cellk minden rekurzv jraosztsa 2d kisebb cellt hoz ltre. A
msik megolds sorn azzal tesszk teljess az algoritmusunkat, hogy ragaszkodunk a szabad tr egy egzakt
celladekompozcijhoz (exact cell decomposition). Ez a mdszer megengedi, hogy a cellk szablytalan
alakak legyenek, de kizrlag a szabad tr hatrn. Az alakzatoknak viszonylag egyszereknek kell maradniuk,
hogy knnyen meg lehessen hatrozni egy szabad cella tljt. Ez a technika bizonyos magasabb szint
geometriai ismereteket ignyel, ezrt rszletesebben nem trgyaljuk.
Ha megvizsgljuk azt a plyt, amit a 25.14. brn kaptunk, lthatjuk, hogy mg tovbbi nehzsgeket kell
lekzdennk. Elszr is, vegyk szre, hogy a plya mentn nagyon les kanyarok vannak. A robot brmilyen
vges sebesessggel mozog, nem tudja ezeket bevenni. Msodszor, az t helyenknt nagyon kzel halad el az
akadlyok mellett. Mindenki, aki mr vezetett autt, tudja, hogy egy olyan parkolhely, ahol csak egy-egy
millimter szabad hely van mindkt oldalon, valjban nem is parkolhely. ppen ezrt olyan megoldsokra
treksznk, amelyek robusztusak a kis mozgsi hibkra nzve.
25.15. bra - (a) A taszt potenciltr tvol tartja a robotot az akadlyoktl. (b) A
megoldsknt kapott plya, ha egyszerre minimalizljuk az thosszt s a
potencilfggvnyt.
812
Robotika
Szeretnnk maximalizlni az tvonal tvolsgt az akadlyoktl, ugyanakkor minimalizlni annak hosszt.

Mindezt a potenciltr (potential field) mdszer bevezetsvel rhetjk el. A potenciltr az llapottrben
definilt fggvny, amely nagy rtket vesz fel brmely akadly kzelben, s attl tvolodva egyre cskken.
Ilyen potenciltr lthat a 25.15. (a) brn: minl sttebbre van sznezve a konfigurcis tr, annl kzelebb
van egy akadlyhoz. Plyatervezshez hasznlva a potenciltr mg egy kltsgfggvnyt jelent az
optimalizls sorn. Ez rdekes kompromisszumot rejt magban. Egyfell a robot igyekszik lervidteni az t
hosszt a clig, msfell prbl minl tvolabb maradni az akadlyoktl, azltal hogy minimalizlja a
potencilfggvnyt. A kt szempontot megfelelen slyozva az eredmny a 25.15. (b) brn lthat plyhoz
hasonl lesz. Az bra az egyestett kltsgfggvnybl rtkitercival szmtott rtkfggvnyt is mutatja.
Vilgos, hogy az gy kapott megoldsi tvonal hosszabb, viszont biztonsgosabb.
4.3. Szkeletonizcis mdszerek

Az tkeres algoritmusok msik f csoportja a szkeletonizls (skeletonization) elvn alapul. Ezek a
mdszerek a robot szabad ternek egydimenzis lekpezsvel dolgoznak, amely alapjn a tervezsi problma
mr knnyebben megoldhat. Ezt az alacsonyabb dimenzij reprezentcit hvjk a konfigurcis tr vznak
(skeleton).
A 25.16. brn a szkeletonizcira lthat egy plda: a szabad tr Voronoi-grfja (Voronoi graph) azokbl a
pontokbl ll, amelyek kett vagy tbb akadlytl egyenl tvolsgra vannak. Ahhoz, hogy a plyatervezshez a
Voronoi-grfot lehessen hasznlni, a robotnak elszr is meg kell vltoztatnia aktulis konfigurcijt gy, hogy
rajta legyen a grfon. Knnyen belthat, hogy a konfigurcis trben ez mindig megoldhat egyenes vonal
mozgssal. Ezutn a robot a grf mentn halad mindaddig, amg el nem ri a clkonfigurcihoz legkzelebb
es pontot. Ekkor elhagyja a Voronoi-grfot, s elmegy a clig. A konfigurcis trben ez egyenes vonal
mozgssal ismt megvalsthat.
25.16. bra - (a) A Voronoi-diagram azon pontok halmaza a konfigurcis trben,

amelyek egyenl tvolsgra vannak kt vagy tbb akadlytl. (b) A szabad tr 400
vletlenszeren kivlasztott pontjbl felptett valsznsgi thlzat.
813
Robotika
Ilyen mdon az eredeti tkeressi feladatot a Voronoi-grfon lv tvonal megtallsra redukltuk. A Voronoigrf (nhny klnleges esetet leszmtva) egydimenzis, s vges sok olyan pontja van, ahol hrom vagy tbb
grbe metszi egymst. gy azon a legrvidebb t megtallsa egy diszkrt grfkeressi problma, amilyet a 3. s
4. fejezetekben mr trgyaltunk. Ha a Voronoi-grf mentn haladunk, akkor nem a legrvidebb utat kapjuk, de
az egyik legbiztonsgosabbat. A htrnya ennek a mdszernek, hogy nehz tbbdimenzis konfigurcis terekre
alkalmazni, s sokszor tl nagy kitrket tesz, fleg ha a szabad tr nagyon tg. Ezenfell a Voronoi-diagram
szmtsa bonyolult lehet a konfigurcis trben, klnsen ahol az akadlyok alakja nagyon sszetett.
Alternatvt jelent a Voronoi-diagramokkal szemben a valsznsgi thlzat (probabilistic roadmap)
mdszere. Ez a szkeletonizcis technika tbb lehetsges tvonallal dolgozik, gy jobb megoldst jelent nagy,
nyitott terek esetn. A valsznsgi thlzatra lthat plda a 25.16. (b) brn. A grfot vletlenszeren
generlt, a szabad trbe es, nagyszm konfigurci alkotja. Ezek utn kt csompontot sszektnk egy llel,
amennyiben knny eljutni egyikbl a msikba. Alapveten egyenes lekkel dolgozunk, s azok
termszetesen csakis a szabad trben futhatnak. Eredmnyl egy vletlenszer grfot kapunk a robot szabad
terben. Ha ehhez mg hozzvesszk a kezdeti s a clkonfigurcit, az tkeress diszkrt grfkeressi
problmv vlik. Elmletileg a mdszer nem teljes, mivel rosszul felvett ponthalmazzal lehet, hogy soha nem
tallunk megoldst. A felvett pontok szma s a konfigurcis tr alakja alapjn korltozhatjuk a kudarc
valsznsgt. Azt is megtehetjk, hogy fknt azon a terleten generlunk pontokat, ahol egy elzetes,
mindkt vgpontbl lefuttatott rszleges keress alapjn sejtjk, hogy a helyes t visz majd. Ezekkel a
kiegsztsekkel a valsznsgi thlzat mdszere jobban hasznlhat ms technikknl magasabb dimenzij
konfigurcis terek esetben is.
5. Bizonytalan mozgsok tervezse

Az eddig trgyalt plyatervezsi algoritmusok kzl egyik sem foglalkozott a robotika egyik kzponti
problmjval: a bizonytalansggal. A robotikban a bizonytalansg a krnyezet rszleges
megfigyelhetsgbl s a robot mozgsnak sztochasztikus (vagy nem modellezett) sszetevibl ered. Hibt
okozhat az is, ha valamilyen kzeltses mdszert, pldul rszecskeszrst hasznlunk. Ilyen esetekben a
robotnak nincs pontos informcija a helyzetrl, mg akkor sem, ha a krnyezet sztochasztikus vonsait
tkletesen modelleztk.
A legtbb mai robot a dntshozatalhoz determinisztikus algoritmusokat hasznl, mint pldul az eddig trgyalt
tkeres algoritmusokat. Gyakori megolds, hogy a helymeghatroz algoritmus ltal ellltott
llapoteloszlsbl a legvalsznbb llapotot (most likely state) vlasztjk ki. Ennek a mdszernek az elnye a
szmtsok sorn mutatkozik meg. A plyatervezs mr a konfigurcis trben is kihvs, s mg nehezebb
lenne, ha az llapotok teljes valsznsg-eloszlsval kellene dolgoznunk. Csak akkor tehetjk meg, hogy nem
vesznk tudomst a bizonytalansgi tnyezrl, ha az kellen kicsi.
814
Robotika
Sajnlatos mdon azonban nem hagyhatjuk mindig figyelmen kvl a bizonytalansgot. Egyes problmk esetn
egyszeren tlsgosan nagy! Hogyan is hasznlhatnnk determinisztikus plyatervezst egy mobil robot
irnytshoz, ha fogalma sincs a robotnak arrl, hogy hol van? ltalban, ha a robot valdi llapota nem
egyezik meg a maximlis valsznsgi szably ltal szmtottal, akkor az irnyt algoritmus nem lesz
optimlis. Az eltrs nagysgtl fggen ez egy sor nem kvnatos esemnyt idzhet el, pldul tkzst ms
trgyakkal.
A robotikban szmos technikt dolgoztak ki a bizonytalansg kezelsre. Nhnyuk a 17. fejezetben trgyalt
bizonytalansgi dntshoz algoritmusokbl ered. Ha a robotnak csak az llapottmenetek kapcsn kell
bizonytalansggal szmolnia, msklnben llapota teljesen megfigyelhet, akkor a problmt legjobban a
Markov dntsi folyamattal (MDF) lehet modellezni. Az MDF ltal adott megolds optimlis eljrsmd
(policy), amely minden lehetsges llapotban megmondja a robotnak, hogy mit csinljon. Ezzel a mdszerrel
kpes brmifle mozgsi hiba kezelsre, ahol a determinisztikus ttervez egyetlen megoldsa sokkal kevsb
lenne robusztus. Robotikban a stratgikat ltalban navigcis fggvnyeknek (navigation functions) hvjk.
A 25.14. (a) brn bemutatott rtkfggvny knnyen talakthat ilyen navigcis fggvnny, ha egyszeren
kvetjk a gradienst.
Csakgy, mint a 17. fejezetben, a rszleges megfigyelhetsg itt is tovbb nehezti a problmt. Az gy
keletkez robotirnytsi problmt a rszlegesen megfigyelhet MDF-fel (RMMDF) modellezzk. Ilyen
esetekben a robotnak ltalban van egy bels kpe az llapotrl, ahogy azt mr a 25.3. alfejezetben
megtrgyaltuk. Az RMMDF-re a megolds a robot bels llapotn definilt stratgia. Mskpp megfogalmazva,
a stratgia bemenete egy teljes valsznsg-eloszls. Ez a robot szmra lehetv teszi, hogy ne csak az alapjn
tudjon dntst hozni, amit tud, hanem azt is felhasznlhassa, amit nem tud. Pldul ha nem ismeri egy kritikus
llapotvltoz rtkt, akkor sszeren informcigyjtst (information gathering) fog vgrehajtani. Az MDF
keretein bell erre van lehetsg, mivel az MDF teljes megfigyelhetsget felttelez. Sajnlatos mdon azok a
technikk, amelyek az RMMDF-eket pontosan megoldjk, nem alkalmazhatk a robotikban, minthogy nem
ismeretes folytonos idej vltozatuk. A diszkretizls ltalban olyan hatalmas mter RMMDF-eket
eredmnyez, amelyek messze meghaladjk a mai eszkzk feldolgozsi kapacitst. Jelen esetben a legtbb,
amit tehetnk, hogy megprbljuk a helyzet bizonytalansgt minimumra cskkenteni. A trgy menti
navigls (coastal navigation) heurisztikus mdszervel pldul jl cskkenthet a pozci ismeretnek
bizonytalansga, ha a robot vgig ismert referenciapontok kzelben halad. Ugyanakkor fokozatosan cskkenti
ms, kzeli referenciapontok helyzetnek bizonytalansgt is, ami aztn lehetv teszi a robot szmra, hogy
jabb terleteket trkpezzen fel.
5.1. Robusztus mdszerek

Valsznsgi mdszerek helyett kezelhetjk a bizonytalansgot gynevezett robusztus (robust) mdszerekkel
is. A robusztus mdszer csak korltozott mrtk bizonytalansgot enged meg a problma minden egyes
paramtervel szemben, ugyanakkor nem trst valsznsgeket az egyes rtkekhez a megengedett hatron
bell. A robusztus megolds a bemeneti rtkektl fggetlenl megfelelen mkdik mindaddig, amg azok
nem lpnek t egy hatrt. A robusztus mdszerek egy extrm formja a 12. fejezetben trgyalt alkalmazkod
tervezs (conformant planning), ami gy alakt ki terveket, hogy egyltaln nincs informcija az llapotrl.
Itt egy olyan robusztus technikt ismertetnk, amelyet sszeszerelsi feladatoknl finom mozgsok tervezsre
(FMT; fine motion planning) hasznlnak. FMT-re pldul akkor van szksg, amikor egy robotkart egy nagy,
merev trgyhoz nagyon kzel kell mozgatni. A f problma az FMT-vel az, hogy a krnyezet kismret,
lnyeges elemeivel kell dolgozni, nagyon apr mozdulatokkal. Ilyen kis lptk esetn a robot mr kptelen
pontosan mrni vagy irnytani pozcijt, st adott esetben mg a krnyezet alakjrl sincs pontos kpe.
Felttelezzk, hogy ezek a bizonytalansgok mind korltosak. Az FMT-problmkra a megoldst legtbbszr
feltteles tervek s irnyelvek kidolgozsa jelenti, amelyek a vgrehajts kzben visszacsatolsknt hasznljk a
szenzorok adatait, s a megadott bizonytalansgi korltokon bell minden esetben megbzhatan mkdnek.
Az FMT-k felgyelt mozgsok (guarded motion) sorbl tevdnek ssze. Minden egyes felgyelt mozdulat
(1) egy mozgsparancsbl s egy (2) lellsi felttelbl ll, ami a robot szenzorainak adatain alapul. A folyamat
igaz rtkkel tr vissza, ha sikeresen befejezdtt a felgyelt mozgs. A mozgsutastsok jellemzen
engedkeny, azaz nbell mozgsok (compliant motion), amelyek lehetv teszik, hogy a robot kitrjen, ha
az utasts vgrehajtsa tkzst eredmnyezne. A 25.17. brn lthat plda egy ktdimenzis konfigurcis
teret mutat, kzpen egy szk, fggleges lyukkal. Ez egy olyan feladat konfigurcis tere lehetne, amikor egy
szgletes csapot kell beilleszteni egy nla alig szlesebb lyukba. A mozgsutastsok konstans sebessgeket
rnak el. A lellsi felttel a fellettel trtn rintkezs. A vezrls bizonytalansgnak modellezsnl
felttelezzk, hogy a robot nem pontosan az utastsban megadott irnyba mozdul el, hanem a krl egy Cv
815
Robotika
kpon bell, tetszlegesen. A 25.17. bra azt mutatja, mi trtnne, ha adott sebessggel elindtannk a mveletet
az s kezdpontbl. A mozgs bizonytalansga miatt a robot a szrke terleten bell brhova megrkezhet a
fellethez. Van r esly, hogy beletall a lyukba, de nagyobb valsznsggel valamelyik oldaln ll meg. Mivel
a robot nem fogja tudni, hogy a lyuk melyik oldaln van, ezrt azt sem fogja tudni, hogy merre mozduljon.
25.17. bra - Egy ktdimenzis krnyezet, a sebessg vektor bizonytalansgt brzol

kppal. A vezrls bizonytalansga miatt az eredeti szndknak megfelel v sebessg
valjban brmilyen vektor lehet a Cv kpon bell. Ennek eredmnyekppen a robot
vgs konfigurcija brhol lehet a burkoln (a vilgosabban rnyalt terleten), azaz
nem tudjuk, hogy eljutottunk-e a lyukba, vagy sem.
Egy kifinomultabb stratgia lthat a 25.18. s a 25.19. brn. A 25.18. bra esetben a robot szndkosan a
lyuknak az egyik oldala fel mozog. Az brn lthat a mozgsparancs s a lells felttele: valamely fellettel
val rintkezs. A 25.19. brn olyan a mozgsparancs, hogy a robot a fellet mentn mozdul el, mg bele nem
tall a lyukba. Ez nbell mozgsvezrls alkalmazst ttelezi fel. Mivel a mozgs irnya (a
bizonytalansggal egytt is) jobbra mutat, a robot mindig jobbra fog csszni, valahnyszor rintkezsbe kerl a
vzszintes fellettel. Amikor elri a lyukat, lecsszik annak jobb oldali szle mentn, mivel a fggleges
fellethez kpest valamennyi lehetsges vektor lefel mutat. Addig fog mozogni, amg el nem ri a lyuk aljt,
mivel ez szmra a lellsi felttel. A vezrls bizonytalansga ellenre a robot valamennyi lehetsges plyja a
lyuk aljval trtn rintkezsnl r vget. Mindenkppen ez trtnik, hacsak a fellet szablytalansgai miatt a
robot valahol meg nem akad.
Lthatjuk, hogy a finom mozgsok tervezse nem trivilis; valjban sokkal nehezebb, mint a pontos mozgsok
tervezse. Vagy minden egyes mozgshoz rgztett szm diszkrt rtket vlasztunk, vagy a krnyezet
geometrijt hasznljuk fel azon irnyok megllaptshoz, amelyek minsgileg klnbz viselkedst
eredmnyeznek. A finommozgs-tervez a konfigurcis tr lerst, a sebessgbizonytalansgi kp szgt s
azt a specifikcit tekinti inputnak, amely megadja a lehetsges lellsifelttel-rzkelseket (ebben az esetben a
fellettel val rintkezst). Az eredmnynek egy olyan tbblpses feltteles tervnek vagy stratginak kell
lennie, ami garantlja a sikert, ha egyltaln ltezik ilyen terv.
Pldnkban felttelezzk, hogy a terveznek pontos kpe van a krnyezetrl, de korltos hiba is bevezethet a
modellbe a kvetkezk szerint: amennyiben a hibk paramterekkel lerhatk, gy azok a paramterek
szabadsgfokok formjban hozzadhatk a konfigurcis trhez.
25.18. bra - Az els mozgsparancs s a lehetsges robotmozgsok burkolja. A hibtl

fggetlenl tudjuk, hogy a vgs konfigurci a lyuk bal oldaln lesz.
816
Robotika
25.19. bra - A msodik mozgsparancs s a lehetsges mozgsok. Mg hibk esetn is

vgl bele fogunk tallni a lyukba.
Az utols pldban, amennyiben a lyuk mlysge s szlessge bizonytalan, gy ezeket jabb kt szabadsgfok
formjban hozzvehetjk a konfigurcis trhez. Az nem lehetsges, hogy a robotot ezekbe az irnyokba
elmozdtsuk a konfigurcis trben, s a robot pozcijt sem tudjuk kzvetlenl rzkelni. Azonban mindkt
korltozst figyelembe vehetjk, amikor ezt egy FMT-problmaknt rjuk le, megfelelen specifiklva a
vezrls s az rzkels bizonytalansgait. Ez egy sszetett, ngydimenzis tervezsi problmhoz vezet,
azonban azonos tervezsi technikk alkalmazhatk. Megjegyezzk, hogy a 17. fejezetben ismertetett
dntselmleti mdszerektl eltren ez a fajta megkzelts a legrosszabb esetre vonatkoz terveket
eredmnyezi ahelyett, hogy a terv vrhat minsgt maximalizln. A legrosszabb esetre vonatkoz tervek
dntselmleti rtelemben csak akkor optimlisak, ha a vgrehajts kzbeni kudarc sokkal kltsgesebb, mint
brmely ms, a vgrehajts sorn felmerl kltsg.
6. Mozgs
Beszltnk mr arrl, hogyan tervezzk meg a mozgst, de arrl nem, hogy hogyan mozogjunk. Az eddigi
terveink klnsen azok, amelyeket determinisztikus plyatervezvel lltottunk el felttelezik, hogy a
robot egyszeren kpes kvetni brmilyen megtervezett plyt. A valsgban termszetesen nem ez a helyzet. A
robotoknak van tehetetlensgk, ezrt nem tudnak tetszleges plyt kvetni, csak nagyon kis sebessg esetn.
817
Robotika
A legtbbszr ert kell kifejtenie a robotnak, nem pedig meghatrozott pozciba eljutnia. Ez a fejezet azokrl a
mdszerekrl szl, amelyekkel ki lehet szmtani ezeket az erket.
25.20. bra - Robotkarvezrls (a) egysgnyi ersts arnyos szablyozval; (b) 0,1-es
erstsi tnyezj arnyos szablyozval; (c) PD szablyozval, 0,3-as ersts
arnyos taggal s 0,8-as differencil komponenssel. Mindhrom esetben a robotkar a
szrkvel jellt plyt prblta kvetni.
6.1. Dinamika s vezrls

A 25.2. alfejezetben mr megismerkedtnk a dinamikus llapot (dynamic state) fogalmval, amely a robot
sebessgmodelljvel kiterjeszti a robot kinematikai llapott. Pldul egy csukl szgnek rtke mellett a
dinamika magban foglalja a szg vltozsi sebessget is. A dinamikai llapot reprezentlsra szolgl
llapottmenet-modell tartalmazza az erk erre a vltozsi sebessgre gyakorolt hatst. Ezek a modellek
ltalban differencilegyenleteket (differential equations) hasznlnak, amelyek egy kinematikai mennyisget
(pldul egy kinematikai llapotot) viszonytanak annak idbeli megvltozshoz (pldul a sebessghez) is.
Elvileg a mozgstervezshez a kinematikai helyett dinamikai modellt is hasznlhattunk volna. Ez a metodika
magasabb szint teljestmnyt eredmnyezne a robotnl, ha egyltaln meg tudnnk alkotni a terveket. Azonban
a dinamikai llapot sokkal bonyolultabb a kinematikainl. A dimenzik magas szma miatt ezt a mdszert csak
a legegyszerbb robotok esetben lehetne sikeresen alkalmazni. ppen ezrt a gyakorlatban leginkbb az
egyszerbb kinematikai plyatervez algoritmusokra hagyatkoznak.
A kinematikai plyatervez algoritmusok hinyossgainak kompenzlsra gyakran hasznlnak klnll
szablyozkat (controllers), hogy pontosan a plyn tartsk a robotot. Szablyozk segtsgvel a krnyezetbl
vett visszacsatolssal vals idben generlhatk a vezrljelek az irnytsi clok elrshez.
Referenciaszablyozrl (reference controller) beszlnk, ha az a feladat, hogy a robot egy elre kitztt
plyn maradjon ezt hvjk referenciaplynak (reference path). Azokat a szablyozkat, amelyek globlis
kltsgfggvnyeket optimalizlnak, optimlis szablyozknak (optimal controllers) hvjuk. Az optimlis
stratgik az MDF-ek szmra valjban optimlis szablyozk.
Els rnzsre egyszernek tnik az a feladat, hogy adott plyn tartsuk a robotot. A gyakorlatban azonban mg
ennek a ltszlag knny feladatnak is vannak buktati. A 25.20. (a) brn lthatjuk, hogy mik addhatnak. A
fekete vonal a robot ltal befutott t, ahogy prblja a kinematikai plyt kvetni. Ha eltrs keletkezik zaj
vagy a robot mozgsa sorn fellp erkre vonatkoz korltozsok miatt , a robot ellenkez irny, az
eltrssel arnyos nagysg ervel igyekszik azt kompenzlni. Elsre ez a megolds kzenfekvnek tnik, mivel
az eltrseket ellenerkkel kompenzljuk, gy a robot a plyn marad. Ugyanakkor mindez azt eredmnyezi,
hogy robotunk erteljesen vibrlni kezd, ahogy az a 25.20. (a) brn is ltszik. Ez a vibrci a robotkar
termszetes tehetetlensgbl kvetkezik: amikor a robot visszar a referenciaplya adott pontjra, tllendl,
ami a korbbihoz hasonl, de ellenttes eljel hibt eredmnyez. Ahogy az brn is lthat, ez a fajta
tllendls akr az egsz trajektria mentn folytatdhat, s az eredmnyl kapott mozgs nem ppen idelis.
Vilgos, hogy jobb szablyozsra van szksg.
Mieltt rtrnnk a megfelelbb szablyozsra, formlisan rjuk le a tllendlst okoz szablyozt. Azokat a
szablyozkat, amelyek ellenttes irny, arnyos ervel reaglnak a megfigyelt hibra P szablyoznak (P
controller) hvjuk. A P bet arnyosat (proportional) jelent: a pillanatnyi vezrls mindig arnyos a robotkar
818
Robotika
hibjval. Mg formlisabban kifejezve: legyen y(t) a referenciaplya id (t) szerint paramterezve. A P

szablyoz ltal generlt at vezrljel:
at = KP(y(t) xt)
ahol Xt a robotkar t idpontbeli llapota. KP a szablyoz gynevezett erstsi tnyezje (gain parameter),
ami azt hatrozza meg, hogy milyen hevesen reagl a szablyoz az aktulis xt llapot s a kvnt y(t) kztt
lv eltrsre. A pldnkban KP = 1. Els pillantsra azt gondolhatja valaki, hogy ha KP-t kis rtkre
vlasztjuk, akkor az megoldja a problmt. Sajnos nem gy van. A 25.20. (b) brn lthat KP = 0,1 esetben a
trajektria, amely tovbbra is oszcilll. A kisebb erstsi tnyez csak lelasstotta az oszcillcit, de egyltaln
nem oldotta meg a problmt. Ha elhanyagoljuk a srldst, a P szablyoz tulajdonkppen egy rug, s a
vgtelensgig oszcilll a rgztett egyenslyi pont krl.
Hagyomnyosan az ilyen problmkat az irnytselmlet (control theory) trgykrbe soroljk. Ennek a
tudomnygnak egyre nagyobb a jelentsge a mestersges intelligencival foglalkoz kutatk szmra.
vtizedek kutatsai sorn szmos olyan szablyozt alkottak meg, amelyek lnyegesen bonyolultabbak a fent
hasznlt egyszer szablyoznl. Egy referenciaszablyoz stabil (stable), ha kis megvltozsok csak korltos
hibt eredmnyeznek a referenciajelhez kpest. Szigoran stabil (strictly stable), ha a robot a kis
megvltozsok ellenre is vissza tud trni a referenciaplyra. Lthat, hogy a P szablyoznk stabil, de nem
szigoran stabil, mivel kptelen visszatrni a referenciatrajektrira.
A legegyszerbb szablyoz, ami eleget tesz a szigor stabilits kvetelmnyeinek a mi esetnkben a PD
szablyoz (PD controller). A P bet tovbbra is az arnyosat jelli, mg a D a differencilt. A PD
szablyozt az albbi egyenlet rja le:
Ahogy az mr a kpletbl is ltszik, a PD szablyoz egy differencilis taggal egszti ki a P szablyozt, ami az
at-t egy olyan taggal bvti, ami arnyos az y(t) xt hiba id szerinti els derivltjval. Mi a hatsa egy ilyen j
tagnak? ltalban a derivtor csillaptja a szablyozott rendszert. Tegyk fel, hogy egy adott rendszerben
idben gyorsan vltozik az (y(t) xt) hiba, mint ahogyan a fentebb trgyalt esetben is. A differencilis tag
ilyenkor az arnyos ellenben hat, s sszessgben cskkenteni fogja a vltozsra trtn reakcit.
Ugyanakkor, ha a hiba llandsul, a differencilis tag httrbe szorul, s az arnyos tag fogja meghatrozni a
szablyozst.
PD szablyozt hasznlva KP = 0,3 s KD = 0,8 paramterekkel a 25.20. (c) brn lv trajektrit kapjuk. A
plya sokkal simbb, s nem lthat oszcillci sem. Ahogy a plda is mutatja, egy differencil tag stabill
tehet egy szablyozt, amely enlkl nem az.
A gyakorlatban a PD szablyoznak is lehetnek hibi. Van gy, hogy a PD szablyoz akkor sem tudja nullra
reduklni a hibt, ha a kls eltrts megsznik. Ez a pldnkbl nem nyilvnval, de nha szksg van egy
msik visszacsatolsra is az arnyoson fell, hogy a hibt meg lehessen szntetni. A megolds erre a problmra
egy harmadik tag hozzadsa a szablyozshoz, ami a hiba id szerinti integrljn alapul:
KI egy jabb erstsi tnyez. A kifejezs kiszmtja a hiba id szerinti integrljt. Ennek hatsra a
referenciajel s az aktulis llapot kztt hosszan fennll eltrs megsznik. Pldul ha xt hosszabb ideig
kisebb, mint y(t), akkor az integrl addig fog nni, amg az at el nem tnteti a hibt. Az integrtor biztostja,
hogy a szablyoznak ne legyen rendszeres hibja, azon az ron, hogy n az oszcillci veszlye. PID
szablyoznak (PID controller) hvjuk azt a szablyozt, amelyik mindhrom tagot tartalmazza. Szles krben
hasznljk klnbz ipari alkalmazsokhoz s irnytsi feladatokhoz.
6.2. Potenciltr-vezrls
A potenciltereket mint jabb kltsgfggvnyeket vezettk be a robotmozgs-tervezs sorn, de alkalmasak
arra is, hogy kzvetlenl generljk a robot mozgst, kiegsztve a plyatervezsi fzist. Ahhoz, hogy ezt
elrjk, definilnunk kell egy vonz ert, ami a robotot a clkonfigurci fel vonzza, valamint egy taszt
potencilteret, amely tvol tartja az akadlyoktl. Egy ilyen teret mr bemutattunk a 25.21. brn. Az egyetlen
819
Robotika
globlis minimumhelye a clkonfigurci, rtke pedig az e cltl val tvolsg, valamint az akadlyok
kzelsgnek sszege. Az brn bemutatott potenciltr kialaktst nem elzte meg tervezs. ppen ezrt a
potencilterek jl alkalmazhatk vals idej megoldsokhoz. A 25.21. brn kt trajektria lthat, ahogy egy
robot kt klnbz kezdeti konfigurcibl megprblja megmszni a potencilteret. Nagyon sok alkalmazs
esetn a potencilteret hatkonyan ki lehet szmtani brmilyen adott konfigurci esetben. St adott
robotkonfigurci esetn a potencilok kialakulsval a potencilgradienst is meghatrozhatjuk. Ezek a
szmtsok ltalban klnsen hatkonyak, fleg a plyatervez algoritmusokhoz hasonltva, amelyek mind
exponencilisak a konfigurcis tr dimenzijban (a szabadsgfokokban).
25.21. bra - Potenciltr-vezrls. A robot egy potenciltrben halad, amely az

akadlyoktl taszt erkbl s a clkonfigurcihoz vonzkbl ll. (a) Sikeres tvonal.
(b) Loklis optimum.
Az a tny, hogy a potencilteres mdszer ilyen hatkonyan megtallja az utat a clhoz a konfigurcis trben
mg nagy tvolsgok esetn is, megkrdjelezi a tervezs szksgessgt. Vajon csak szerencsnk volt a
pldnk esetben, vagy tnyleg elegend a potencilterek hasznlata? A vlasz az, hogy szerencsnk volt. A
potenciltereknek szmos olyan loklis minimumhelye lehet, amely csapdba ejti a robotot. Ebben az esetben a
robot gy kzelti meg az akadlyt, hogy csak vllcsukljt mozgatja egszen addig, amg bele nem tkzik az
akadlyba a rossz oldalon. A potenciltr nem ad annyi informcit, hogy a robot behajltsa a knykt, hogy
tfrjen az akadly alatt. Ms szavakkal, a potenciltren alapul technikk nagyon jk loklis robotirnytsra,
de globlis tervezst ignyelnek. A msik htultje ennek a mdszernek az, hogy az erk, amiket generl, csak
az akadlyoktl s a cltl val tvolsgtl fggnek, nem veszik figyelembe a robot sebessgt. gy a
potenciltr-alap vezrls tnyleg egy kinematikai mdszer, s nem felttlenl mkdik, ha a robot gyorsan
mozog.
6.3. Reaktv irnyts

Eddig olyan irnytsi mdszerekkel foglalkoztunk, amelyek megkvntk a krnyezet bizonyos fok ismerett
ahhoz, hogy akr referenciaplyt, akr potencilteret alkothassunk. Ezzel a megkzeltssel kapcsolatban
azonban felmerlnek bizonyos problmk. Elszr is, sokszor nagyon nehz pontos modellt alkotni a
krnyezetrl, klnsen ha az komplex vagy nagyon tvol van, mint mondjuk a Mars felszne. Msodszor, mg
ha sikerl is pontos modellt ksztennk, a szmtsi nehzsgek s a lokalizcis technikk hibja folytn
alkalmazhatatlann vlnak ezek a mdszerek. Bizonyos esetekben megfelelbb a reflexszer gensek
hasznlata, ezt hvjk reaktv irnytsnak (reactive control).
Erre plda a 25.22. (a) bra hexapodja, azaz hatlb robotja, amelyet nehz terepen val kzlekedsre terveztek.
A robot szenzorai tbbnyire alkalmatlanok arra, hogy megfelel pontossg modellt alkossanak a krnyezetrl,
hogy a robot a korbban trgyalt plyatervezsi algoritmusok brmelyikt hasznlhassa. De hiba ltnnk el
megfelel szenzorokkal, a tizenkt szabadsgfok (kett lbanknt) tl nagy szmtsi kapacitst ignyelne
plyatervezs esetn.
820
Robotika
25.22. bra - (a) Hexapod robot. (b) Kiterjesztett vges automata (KVA) (augmented
finite state machine, AFSM) egyetlen lb vezrlshez. Fontos, hogy ez a KVA-szenzoros
visszacsatolsra reagl: ha a lb megakad az elremozgats sorn, akkor magasabbra
emeli.
Mindazonltal a krnyezet explicit ismerete nlkl is lehetsges kzvetlenl szablyozt tervezni a feladathoz.
(Mr lttuk ezt a PD szablyoz esetben, amely kpes volt a komplex robotkart a megadott plyn tartani a
robot dinamikjnak pontos ismerete nlkl. Ugyanakkor szksg volt a kinematikai modell alapjn megalkotott
referenciaplyra.) A hatlb robot esetben megfelel absztrakcis szinten meglepen knny meghatrozni az
irnytsi trvnyt. A megfelel algoritmus ciklusosan mozgathatn a lbakat. Egy ideig a levegben mozognak,
utna pedig a fldn tmaszkodnak. A hat lbat gy kell koordinlni, hogy egyszerre hrom (ellenttes
oldalakon) mindig a fldn legyen, biztostva a robot fizikai stabilitst. Egy ilyen irnytsi algoritmust knny
programozni, s remekl mkdik sk felleten. Nehz terepen az egyes akadlyok meggtolhatjk a lbakat az
elremozdulsban. Ezen a problmn egy egszen egyszer irnytsi szabllyal segthetnk: ha a lb mozgst
valami blokkolja, a robot egyszeren hzza vissza, emelje magasabbra, s prblja jra! Az eredmnyl kapott
vezrlst, mint vges automatt mutatja a 25.22. (b) bra. Egy reflexszer genshez llapotokat trst, ahol a
bels llapot a gp aktulis llapotnak indexe (s1-tl s4-ig) jelli.
Ennek az egyszer visszacsatolson alapul szablyoznak a klnbz vltozatai figyelemre mltan robusztus
lpeget vezrlst valstanak meg, amellyel a robot grngys terepen is kpes elrejutni. Vilgos, hogy ehhez
a szablyozhoz nem kell krnyezeti modell, s nem kell semmifle keresst alkalmazni a vezrls
megalkotshoz. Amikor egy ilyen vezrlt hasznlunk, a robot viselkedsnek kialaktsban nagyon fontos
szerepet kapnak a krnyezetbl visszacsatolsknt rkez jelek. A szoftver magtl mg nem hatrozza meg,
hogy ppen mi fog trtnni a robottal, ha belehelyezik az adott krnyezetbe. Az olyan viselkedst, ami egy
(egyszer) szablyoz s a (komplex) krnyezet klcsnhatsaknt jn ltre kibontakoz viselkedsnek
(emergent behavior) hvjuk. Szigoran vve brmelyik eddig trgyalt robotra mondhatnnk, hogy kibontakoz
viselkedst mutat, hiszen egyetlen modell sem tkletes. Trtneti okok miatt azonban ezt a kifejezst csak arra
az irnytsi technikra mondjk, amelyik nem hasznl explicit krnyezeti modellt. A kibontakoz viselkeds
jellemz tulajdonsga szmos biolgiai organizmusnak is.
Technikailag a reaktv irnyts csak egy implementcija az MDF-ek (illetve ha vannak bels llapotok, akkor
POMDF-ek) stratgiinak. A 17. fejezetben szmos technikt ismertettnk, amelyek alkalmasak a robot
modelljbl s a robot krnyezetnek a modelljbl stratgik generlsra. A robotikban az ilyen stratgik
kzzel trtn megszerkesztsnek nagy gyakorlati jelentsge van, mivel kptelenek vagyunk tkletes
modelleket alkotni. A 21. fejezetben lert megerstses tanulsi mdszerek segtsgvel tapasztalati ton lehet
stratgikat szerkeszteni. Nhny ezen mdszerek kzl pldul a Q-tanuls s a stratgiakeres mdszerek
nem ignyel krnyezeti modellt, hanem a tanuls sorn sszegyjttt, nagy mennyisg adatra tmaszkodik. gy
alkalmas j minsg szablyozk ltrehozsra robotok szmra.
7. Szoftverarchitektrk a robotikban
Szoftverarchitektrnak (software architecture) hvjk az algoritmusok strukturlsnak mdszertant. Egy
architektra ltalban nyelveket s eszkzket tartalmaz programok rshoz, valamint egy tfog szisztmt,
amely alapjn a programokat ssze lehet illeszteni.
821
Robotika
A modern robotikai szoftverarchitektrknak sikeresen kell tvznik a reaktv irnytst s a modellalap,

tudatos vezrlst. Sok szempontbl a reaktv s a tudatos irnyts eltr elnykkel s htrnyokkal
rendelkezik. A reaktv szablyozs szenzoros informcin alapul, s nagyon jl hasznlhat vals idej,
alacsony szint dntshozsra. Ugyanakkor ritkn ad globlis szinten elfogadhat megoldst, mert a globlis
dntsek olyan informcit ignyelnek, amely a dnts meghozatalakor mg nincs a robot birtokban. Ilyen
esetekben a modellalap tervezs a megfelel.
Kvetkezskppen a legtbb robotarchitektra reaktv technikkat hasznl az alacsony szint irnytshoz, s
modellalapt a magasabb szinthz. Amikor a PD szablyozrl beszltnk, szmtsba vettnk egy ilyen
kombincit, ahol a (reaktv) PD szablyoz egytt dolgozik a (modellalap) plyatervezvel. Hibrid
architektrnak (hybrid architecture) hvjk ltalban azokat az architektrkat, amelyek tvzik a reaktv s
a modellalap technikkat.
7.1. Alrendelt architektra

Az alrendelt architektra (subsumption architecture) (Brooks, 1986) egy olyan keretrendszer, amelyen
bell lehetsg nylik reaktv szablyozk vges automatkbl trtn sszelltsra. Ezeknl az automatknl,
llapotgpeknl a csompontok egyes szenzoros vltozk vizsglatt tartalmazzk olyan esetekben, ahol a vges
automatnl is a vltoz vizsglatnak eredmnye hatrozta meg a vgrehajts menett. Az leket el lehet ltni
cmkkkel, amelyek akkor generldnak, amikor az leken thaladunk, s amelyeket a robot motorjhoz vagy
egy msik vges automathoz kldnk. Azonfell a vges automatknak vannak bels idztik (rik), amik
irnytjk, hogy mennyi id alatt lehet tjutni egy-egy len. Az gy kapott llapotgpet szoks kiterjesztett
vges automatnak (KVA) (augmented finite state machine, AFSM) hvni, ahol a kiterjeszts a bels rajel
hasznlatra vonatkozik.
Egy egyszer KVA hasznlatra plda a 25.22. (b) brn lthat ngyllapot gp, amely ciklikus mozgst
generl a hexapod robot szmra. Ez az KVA ciklikus szablyozt hasznl, aminek mkdse tulajdonkppen
nem fgg a krnyezetbl jv visszacsatolstl. Az elrenyjtsi szakasz sorn viszont mr hasznlja a
szenzoros informcit. Ha a lb elakad, azaz nem tudja vgrehajtani az elremozgst, a robot visszahzza a
lbat, majd magasabbra emelve jra prblkozik. Azaz a szablyoz kpes reaglni a robot krnyezettel val
fizikai rintkezsre.
Az alrendelt architektra tovbbi primitveket szolgltat az KVA-ek szinkronizlshoz, s a tbbszrs,
esetleg ellentmondsban lv KVA-k kimenetnek sszehangolshoz. Ezltal lehetv vlik a programoz
szmra, hogy egyre bonyolultabb szablyozkat ptsen fel bottom-up, alulrl felfel technikval. Pldnkban
egy-egy KVA-val kezdhetnk az egyes lbak vezrlshez, majd a kvetkez KVA mr tbb lb mkdsnek
sszehangolst vgezheti. Mindezekfltt megvalsthatunk valamilyen magas szint viselkedst, mondjuk,
egy tkzs elkerlst, amely mr htrlst s visszafordulst is tartalmaz.
Az tlet, hogy KVA-kkal valstsuk meg a robot szablyozst, igen nagy elrelps. Kpzeljk el, milyen
nehz lenne ugyanezt a viselkedst lerni a konfigurcis trben, brmelyik korbban trgyalt plyatervez
algoritmussal! Elszr is szksgnk lenne a terep pontos modelljre. A hatlb robot konfigurcis tere
sszesen tizennyolc dimenzis (tizenkt dimenzi a lbanknti kt-kt motortl szrmazik, hat pedig a robot
pozcija s orientcija a krnyezethez kpest). Mg ha a szmtgpeink elg gyorsak is lennnek, hogy
kiszmoljanak egy plyt egy ilyen kiterjedt trben, tovbbi problmt jelentennek az egyb elfordul
hatsok, mint pldul az, ha a robot megcsszik a lejtn. Az ilyen sztochasztikus hatsok miatt egyetlen t a
konfigurcis trben csaknem bizonyosan tl trkeny lenne, s mg egy PID szablyoz sem tudna
megbirkzni a felmerl problmkkal. Ms szavakkal, a modellalap mozgstervezs tl bonyolult feladat a
mai robotok plyatervez algoritmusainak.
Sajnos azonban az alrendelt architektrnak is megvannak a maga problmi. Elszr is, az KVA-k ltalban
feldolgozatlan szenzoros informcit kapnak, ami csak akkor elegend a dntshozshoz, ha az adatok
megbzhatk, s tartalmazzk az sszes szksges informcit. De ha a szenzoros adatokat nemtrivilis mdon
kell idben integrlni, akkor sikertelen lehet a dntshozs. ppen ezrt az alrendelt tpus szablyozkat
loklis feladatokra hasznljk, mint pldul fal mentn halads vagy egy lthat fnyforrs kvetse.
Msodszor, a modell hinya nehzkess teszi a robot feladatnak megvltoztatst. Az alrendelt tpus robot
ltalban csak egy feladatot hajt vgre, s nincs is elkpzelse arrl, hogy hogyan mdosthatn vezrlst gy,
hogy ms feladatokat is el tudjon ltni (mint a ganajtr bogr a 2.2. alfejezetben). Vgezetl, az alrendelt
tpus vezrlst elg nehz tltni. A gyakorlatban tbb tucat bonyolult, egyttmkd KVA s a krnyezet
klcsnhatsait a legtbb programoz mr nem tudja kvetni. Ezen okok miatt az alrendelt architektrt nagy
822
Robotika
trtneti jelentsge ellenre ritkn szoktk kereskedelmi forgalomba kerl robotoknl hasznlni.
Ugyanakkor nhny leszrmazottjt mr igen.
7.2. Hromrteges architektra

A hibrid architektra modellbe ptett tudssal tvzi a reaktivitst. Messze a legnpszerbb hibrid architektra
az gynevezett hromrteges architektra (three-layer architecture), amely egy reaktv, egy vgrehajt s
egy modellez rtegbl ll.
A reaktv rteg (reactive layer) alacsony szint vezrlst biztost a robot szmra. Ezt egy szoros
szenzorcselekvs-hurok jellemzi. Dntsi ciklusa gyakran milliszekundum nagysgrend.
A vgrehajt vagy szekvencilis rteg (executive/sequencing layer) kapcsolja ssze a reaktv rteget a
modellezvel. Direktvkat fogad a modellez rtegtl, s egyms utn tovbbtja azokat a reaktv rteg
szmra. A vgrehajt rteg kezelheti pldul a modellez rteg plyatervez algoritmusa ltal generlt
tvonalpontokat, s eldnti, hogy melyik reaktv viselkedst hvja meg. A dntsi id a vgrehajt rteg
esetben tlagosan msodperc nagysgrend. Ez a rteg felels tovbb azrt is, hogy a szenzoros informcikat
egy belsllapot-reprezentciba integrljuk. Kezeli pldul a robot lokalizcis s online trkpezsi rutinjait.
A modellez rteg (deliberate layer) a beptett tudssal komplex feladatokra globlis megoldsokat generl,
tervezssel. A bonyolult feladatok nagy szmtsi ignye miatt a dntsi ciklusid perc nagysgrend is lehet. A
modellez vagy tervez rtegmodelleket hasznl a dntsek meghozshoz. Ezek a modellek lehetnek
elzetesen betplltak vagy adatokbl tanuls tjn ltrejttek, s ltalban a vgrehajt modell ltal gyjttt
llapotinformcit hasznljk.
A hromrteg architektra klnbz vltozatait tallhatjuk meg a legtbb mai robot szoftverrendszerben. A
hrom rtegre val bonts nem ktelez. Egyes robotszoftverrendszerek tovbbi rtegeket is tartalmaznak,
pldul felhasznli interfsz rteget az emberekkel val kommunikls vezrlsre , vagy olyan rtegeket,
amelyek a cselekvsnek a tbbi, ugyanabban a krnyezetben tevkenyked robottal val sszehangolsrt
felelsek.
7.3. Robotprogramozsi nyelvek

Sok robotvezrlnek megvan a sajt kln programozsi nyelve. Pldul az alrendelt architektra sok
programja a Brooks (Brooks, 1990) ltal megalkotott viselkedsi nyelvet (behavior language) alkalmazza. Ez
egy szablyalap, vals idej nyelv AFSM vezrlsekhez. A LISP-hez hasonl szintaxis, egyedi szablyokat
fordt AFSM-ekra, valamint tbb AFSM loklis s globlis zenetkld mechanizmussal van integrlva.
Csakgy, mint az alrendelt architektra, a viselkedsi nyelv is csak egyetlen AFSM-re kpes fkuszlni, s
relatv alacsony szint kommunikcit enged meg az egysgek kztt. Az jabb kutatsok erre az tletre ptve
olyan nyelvek sort fejlesztettk ki, amelyek alapveten hasonltanak a viselkedsi nyelvre, de nagyobb
teljestmnyek, s gyorsabban futnak. Ilyen nyelv pldul az ltalnos robot nyelv (generic robot language,
GRL), amely Horswill (Horswill, 2000) nevhez fzdik. A GRL egy funkcionlis programozsi nyelv
nagymret modulris irnytsi rendszerekhez. Ugyangy, mint a viselkedsi nyelv, a GRL is vges
automatkbl ptkezik. Ezenfell sokkal nagyobb lehetsget hagy a klnbz modulok kztti
kommunikcis formk s szinkronizcis lehetsgek definilsra. A GRL-programok hatkony imperatv
nyelvekre fordtdnak le, mint amilyen pldul a C.
Egy msik fontos, modern programozsi nyelv (s hozz tartoz architektra) a Firby (Firby, 1994) ltal
megalkotott reaktv akcitervrendszer (reactive action plan system, RAPS). A RAPS lehetv teszi, hogy a
programozk clokat s ezekhez tartoz terveket (vagy rszleges stratgikat) definiljanak, valamint
feltteleket, amelyek esetn az adott terv nagy valsznsggel sikeres lesz. Ami nagyon fontos, hogy a RAPS
lehetsget ad az esetleges kudarc kezelsre is, ami szksgszer velejrja a valdi robotikai rendszereknek.
A programoz szmos rzkel rutint specifiklhat a klnbz tpus kudarcok esetre, s mindegyikhez
definilhat egy kivtelkezelsi rutint. Hromrteg architektrknl gyakran hasznljk a RAPS-ot a vgrehajt
rtegben, az jratervezst nem ignyl kis eltrsek, vratlan esemnyek kezelsre.
Szmos ms nyelv ltezik, amely lehetv teszi a robot szmra, hogy mrlegeljen s tanuljon. Ilyen pldul a
GOLOG (Levesque s trsai, 1997b), amely akadlyok nlkl egyesti a modellalap problmamegoldst
(tervezst) s a reaktv irnyts kzvetlen megvalstst. A GOLOG-programok szitucikalkulus (10.3.
alfejezet) formjban jutnak kifejezsre, nemdeterminisztikus mozgsopertorok hozzadsnak a
823
Robotika
lehetsgvel. Ha a vezrlprogramban nemdeterminisztikus mozgsok is specifikltak, a programoznak teljes

modellt kell szolgltatnia a robotrl s krnyezetrl. Amikor a vezrlprogram egy nemdeterminisztikus
vlasztsi lehetsghez r, egy tervez algoritmust hv meg (szablykszt formban), hogy az meghatrozza a
kvetkez lpst. Ilyen mdon a programoz rszleges vezrlket r, s a vgs irnytsi dntshozst a
beptett mechanizmusra bzza. A GOLOG szpsge a modellalap s a reaktv vezrls problma nlkli
sszeillesztsben van. Annak ellenre, hogy a GOLOG alkalmazsnak tbb felttele van (teljes
megfigyelhetsg, diszkrt llapotok, teljes modell), sok beltri robot szmra nyjt megfelel, magas szint
irnytst.
A CES, C++ begyazott rendszerekhez (C++ for embedded systems), a C++ nyelv kiterjesztse, amely mr
valsznsgeket s tanulst is tartalmaz (Thrun, 2000). A CES adattpusai valsznsgi eloszlsok, amelyek a
programoz szmra lehetv teszik a bizonytalan informcik kezelst a korbbi nehzsgek nlkl. Ami mg
fontosabb, hogy a CES lehetsget nyjt a robot szoftverpldkkal val tantsra, nagyon hasonlan a 20.
fejezetben trgyalt tanulsi algoritmusokhoz. Ennek kihasznlsval a programozk hagyhatnak helyet a
programban a ksbb megtanulhat fggvnyek szmra ezek tipikusan differencilhat parametrikus
reprezentcik, mint pldul a neurlis hlk. Ezeket a fggvnyeket a kln tanulsi fzisban tanulja meg a
rendszer, ahol a tant hatrozza meg a kvnt kimeneti viselkedst. A CES sikeresnek bizonyult rszlegesen
megfigyelhet s folytonos esetekben is.
Az ALisp (Andre s Russell, 2002) a LISP tovbbfejlesztett vltozata. Az Alisp lehetv tesz
nemdeterminisztikus dntsi pontok megadst, hasonlan a GOLOG dntsi pontjaihoz. De ahelyett, hogy a
ttelbizonytra bzn a dntst, az ALisp induktv mdon, megerstses tanulssal megtanulja a helyes
cselekvst. Az ALisp-ot rugalmas eszkznek tekinthetjk a trgytartomnyrl szl fleg a megfelel
dntsek szubrutinjainak hierarchikus szerkezetre vonatkoz tudsnak megerstses tanulssal tanul
rendszerbe val beptsre. Eddig csak szimulcik sorn alkalmaztk az ALisp-ot, de nagyon gretes
mdszernek tnik olyan robotok ptshez, amelyek tanulnak a krnyezetkkel val klcsnhatsbl.
8. Alkalmazsi terletek
Most pedig felsorolunk nhnyat a robottechnolgia fontos alkalmazsi terletei kzl.
Ipar s mezgazdasg. Hagyomnyosan azok az gazatok hasznlnak robotokat, amelyek nehz, fizikai jelleg
emberi munkt ignyelnek, de mgis megfelelen strukturlhatk s automatizlhatk. A legjobb plda az
sszeszerel zemi gyrtsor, ahol a manipultorok rutinszeren vgzik feladatukat, az sszeszerelst, az
alkatrszek behelyezst, az anyagkezelst, a hegesztst s a festst. Sok esetben a robotok sokkal
kltsghatkonyabbak, mint a humn munkaer.
A szabadban sok nehz gp helyt robotok vettk t a betakartsnl, a bnyszatban, a fldmunkknl. Pldul
nemrgiben a Carnegie Mellonon, egy projekt sorn bemutattk, hogy a robotok 50-szer gyorsabban kpesek
levakarni a festket egy hajrl, mint az emberek, s sokkal kevesebb krt tesznek a krnyezetben. Autonm
bnyszrobotok prototpusai bizonytottk, hogy sokkal gyorsabban s pontosabban kpesek kitermelni az rcet
a fld alatti bnykban, mint az emberek. Robotokat hasznlnak az elhagyatott bnyk s csatornarendszerek
nagy pontossg feltrkpezshez is. Ugyan sok rendszer mg csak ksrleti stdiumban van, pusztn id
krdse, hogy a robotok mikor veszik t az emberektl a flig mechanikus munkk tbbsgt.
Szllts. A robotizlt szlltsnak sok oldala van. Az autonm helikopterektl kezdve, amelyek nehezen
megkzelthet helyekre juttathatnak el szlltmnyokat, az automata kerekes szkeken t (amik olyan
embereket szlltanak, akik nem tudnk irnytani a hagyomnyos kerekes szket), egszen az autonm
rakodgpekig, amelyek fellmljk a dokkokban a szakkpzett humn sofrt is a kontnerek hajkra s
teherautkra val bepakolsnl. J plda a beltri szllt robotokra a 25.23. (a) brn lthat Helpmate nev
robot. Ezt a robotot krhzak tucatjaiban hasznljk tel s egyb orvosi felszerels szlltsra. A kutatk olyan
autszer robotot is kifejlesztettek, amely kpes nllan naviglni az autplyn, s terepen is megllja a
helyt. zemi krlmnyek kztt a szlltrobotok ma mr rutinszeren ltjk el a szlltsi feladatokat
raktrakban s a gyrtsorok kztt.
Ezen robotok kzl sok ignyli, hogy munkja elvgzshez vltoztassunk valamit krnyezetn. A
leggyakoribb, hogy tjkozdst segt elemeket kell felszerelni, pldul induktv krket a padlba, aktv
fnyjeleket, vonalkdokat vagy GPS-adkat. Jelenleg mg mindig nagy kihvs olyan robotot tervezni, amely
kpes a termszetes krnyezetben tjkozdni, s nem ignyel mestersges eszkzket. Ez klnsen fontos
olyan esetekben, mint pldul a mlytengeri kutatsok, ahol a GPS nem elrhet.
824
Robotika
Veszlyes krnyezet. Robotok segtettek az embereknek a nukleris hulladkok eltakartsban. A

legnevezetesebb helyszn Csernobil s Three Mile Island volt. A robotok ott voltak a World Trade Center
sszeomlsa utn is, s olyan helyekre is bementek, amelyek a mentcsapatok szmra tl veszlyesek voltak.
Nhny orszgban lszer szlltsra s ami klnsen veszlyes feladat bombk hatstalantsra
hasznlnak robotokat. Szmos kutats irnyul napjainkban aknaszed robotok kifejlesztsre mind szrazfldi,
mind tengeri hasznlatra. A legtbb ilyen cl robot tvirnytssal mkdik, azaz emberek vezrlik messzirl
ket. Ezen robotok nllv ttele a kvetkez fontos fejlesztsi lps.
Felfedezs. A robotok eljutottak oda is, ahov az ember mg soha, pldul a Mars felsznre (lsd 25.1. (a)
bra). Robotkarok segtik az rhajsokat a mholdok befogsban s plyra lltsban, valamint a Nemzetkzi
rlloms (ISS) ptsben. Robotok segtenek a tenger alatti kutatsokban. Gyakran hasznljk ket elsllyedt
hajk feltrkpezsre. A 25.24. brn egy elhagyatott sznbnyt feltrkpez robot lthat, a
tvolsgszenzorai ltal a jratrl alkotott 3D modellel egytt. 1996-ban tudsok egy jrrobotot engedtek le egy
mkd vulkn krterbe, s fontos adatokat gyjtttek klimatolgiai kutatsokhoz. Ember nlkli lgi
jrmveket, ms nven drnokat (drones) hasznlnak katonai mveletekhez. A robotok egyre hatkonyabbak
az informcigyjtsben olyan terleteken, amelyek nehezen megkzelthetk (vagy veszlyesek) az ember
szmra.
25.23. bra - (a) A Helpmate robot lelmiszert s egyb orvosi felszerelst szllt tbb
tucat krhzban, vilgszerte. (b) Sebszrobotok a mtben (da Vinci Surgical Systems).
Egszsggy. A sebszorvosok munkjt segtend egyre tbbszr hasznlnak robotokat az orvosi eszkzk
pontos mozgatshoz olyan knyes szerveket rint mttek esetben, mint az agy, a szv vagy a szem. A 25.23.
(b) bra egy ilyen rendszert mutat be. A robotok nagy pontossguknak ksznheten nlklzhetetlen
eszkzkk vltak bizonyos cspprotzisek beltetsnl. Pilottanulmnyok kimutattk, hogy vgbltkrzs
esetn a robotizlt eszkzk hasznlata cskkenti a srls veszlyt. A mtn kvl, a kutatk megkezdtk
olyan robotok kifejlesztst, amelyek ids vagy fogyatkos emberek segtsgre lehetnek, mint pldul az
intelligens robotizlt jrgpek vagy intelligens jtkok, amelyek figyelmeztetnek a gygyszerek bevtelre.
Szemlyi kiszolglk. A szolgltats a robotok nagy, gretes alkalmazsi terlete. A szervizrobotok a
mindennapi teendk elvgzsben segdkeznek. A kereskedelmi forgalomban is kaphat szervizrobotok kztt
vannak autonm porszvk, fnyrk s golflabdaszedk. Ezen robotok mindegyike nllan, emberi segtsg
nlkl kpes naviglni, s teljesteni feladatt. Nhny szervizrobot nyilvnos helyeken tevkenykedik, mint
pldul az idegenvezetknt alkalmazott robotizlt informcis pult a bevsrlkzpontokban, a vsrokon vagy
a mzeumokban. A szervizfeladatok elltsa emberi interakcit kvn, s azt, hogy a robot megfelelen
boldoguljon kiszmthatatlan s dinamikus krnyezetekben.
25.24. bra - (a) Egy elhagyatott bnya feltrkpezse egy robottal. (b) A bnynak a
robot ltal kapott 3D kpe.
825
Robotika
Szrakozs. A robotok megkezdtk a jtk- s szrakoztatipar meghdtst is. A 25.4. (b) brn mr
tallkoztunk a Sony AIBO-val, ami br kutyaszer jtk, vilgszerte hasznljk MI-kutatlaborokban klnbz
projektek platformjaknt. Az egyik, nagy kihvst jelent feladat, ahol az AIBO-kat fizikai eszkzknt
hasznltk, a robotfoci (robotic soccer): versengs kt csapat kztt, az emberi focihoz hasonl szablyokkal,
de autonm mobil robotokkal. A robotfoci nagyon j lehetsgeket knl az MI-kutatsokhoz, mert sok olyan
problmt foglal magban, ami mshol, komolyabb alkalmazsokban is megjelenik. Az vente megrendezsre
kerl robotfoci-bajnoksgok sok MI-kutatt vonzzanak, s rdekesebb, izgalmasabb tettk a robotiknak ezt
az gt.
Emberi kiegsztk. Az utols alkalmazs, amirl szt ejtnk, az emberi kiegsztk. A kutatk kifejlesztettek
mr a kerekes szkhez hasonl lpeget jrgpet, amelyek alkalmasak emberek szlltsra. Szmos helyen
jelenleg arra koncentrlnak, hogy olyan eszkzket alkossanak, amelyek megknnytik az embernek a jrst
vagy a karok mozgatst egy, a testhez kvlrl csatlakoztatott vzzal, amely kpes pluszert kifejteni. Ha
valakire tartsan rgztenek egy ilyen szerkezetet, akkor mestersges vgtagnak is tekinthet. A robotok ltali
tvjelenlt, illetve teleoperci is felfoghat emberi kiegsztsnek. A teleoperci azt jelenti, hogy robotikai
eszkzk segtsgvel nagy tvolsgbl tudunk megadott feladatokat vgrehajtani. A teleoperci npszer
megvalstsa a mesterszolga (master-slave) elv konfigurci, amikor is a robot manipultor a tvolban lv,
humn opertor mozdulatait kveti, egy heptikus (rzetet is kzvett) interfszen keresztl. Ezek a rendszerek
mind jobban kiterjesztik az emberi kpessgeket a krnyezettel val tkletesebb klcsnhats rdekben.
Nhny projekt azt tzte ki clul, hogy lemsolja az embert, legalbbis felletes szinten. Japnban mr szmos
cgnl kaphatk humanoid robotok.
9. sszefoglals
A robotika tulajdokppen nem ms, mint intelligens gensek, amelyek kpesek megvltoztatni a fizikai vilgot.
Ebben a fejezetben a kvetkez alapvet ismereteket sajttottuk el a robothardverrel s -szoftverrel
kapcsolatban.
A robotok szenzorokkal vannak felszerelve, hogy rzkelhessk az ket krlvev vilgot, s beavatkoz
szervekkel, hogy fizikai erkkel hathassanak krnyezetkre. A legtbb robot vagy manipultor, amely egy
adott helyhez van rgztve, vagy mobil robot, ami kpes mozogni.
A robotikai rzkels a dntshez kapcsold mennyisgeknek a szenzoros adatokbl val becslse. Ehhez
szksgnk van egy bels reprezentcira, valamint egy olyan mdszerre, amivel azt idnknt frissthetjk. A
nehz rzkelsi problmk gyakori pldi a helymeghatrozs s a trkpezs.
Valsznsg-alap szr algoritmusok, mint pldul a Kalman-szrk s a rszecskeszrk hasznosak a
robotrzkels szempontjbl. Ezek a technikk frisstik a bels vilgkpet, pldul az llapotvltozk a
posteriori eloszlst.
A robot mozgsnak tervezse ltalban a konfigurcis trben trtnik, ahol minden pont egyrtelmen
meghatrozza a robot egy adott pozcijt s orientcijt, csuklinak szgt.
A konfigurcis trben keres algoritmusok kztt fontos megemlteni a celladekompozcit, amely a teljes
konfigurcis teret vges sok cellra bontja fel, valamint a szkeletonizcis technikkat, amelyek az adott
826
Robotika
konfigurcis teret egy alacsonyabb dimenziba vettik le. A mozgstervezs problmjt ezutn mr
egyszerbb struktrkban val keresssel is meg lehet oldani.
A keres algoritmus ltal megtallt plyn a robot akkor tud vgighaladni, ha egy PID szablyozt tesznk a
rendszerbe, aminek referenciaplyja a kvnt tvonal.
A potenciltr-alap technikk a cltl s az akadlyoktl val tvolsg szerint definilt potencilfggvnyek
segtsgvel navigljk a robotot. Ezek a technikk megakadhatnak loklis minimumhelyeken, de kpesek
mozgsgenerlsra elzetes tervezs nlkl.
Nha egyszerbb egy robotszablyozt kzvetlenl megtervezni, mint a plyt a krnyezet explicit
modelljbl levezetni. Egy ilyen szablyozt legtbbszr lerhatunk vges automataknt.
Az alrendelt architektra a programozk szmra lehetv teszi, hogy bels rajellel kiegsztett vges
automatk sszekapcsolsval robotvezrlket alkossanak.
A npszer hromrteg architektra olyan robotszoftver fejlesztshez is keretet ad, amely integrlja a
modellalap tervezst, a rszfeladatokra bontst s a szablyozst.
Lteznek feladatspecifikus robotprogramozsi nyelvek, amelyek megknnytik a robotszoftverek fejlesztst.
Ezek a nyelvek ksz szerkezetekkel segtik a tbbszl programok rst, a szablyozsi irnyelveknek a
tervezsbe trtn integrlst s a tapasztalatalap tanulst.

A robot szt a cseh drmar, Karel Capek npszerstette 1921-ben rt R.U.R. (Rossums Universal Robots) c.
sznmvvel. Az robotjait nem mechanikusan szereltk ssze, hanem kmiai ton lltottk el. A mben a
robotok megharagszanak mestereikre, s elhatrozzk, hogy tveszik az uralmat. gy tnik (Glanc, 1978), hogy
valjban Capek btyja, Josef alkotta meg a robot szt a cseh robota (robotols) s robotnik (jobbgy) sz
sszevonsval, 1917-es Opilec c. novelljban.
A robotika kifejezst Asimov hasznlta elszr 1950-ben, ugyanakkor a robotika trtnete ms megnevezssel
sokkal rgebbre nylik vissza. Az kori grg mitolgiban Talszt, a mechanikus embert lltlag
Hphaisztosz, a kovcsisten ksztette. Jacques Vaucanson egy csodlatos automatt ptett a 18. szzadban. Az
1738-as mechanikus kacsa a korai robotok egy pldja, aminek sszetett viselkedse mg fixen volt beleptve.
Az els programozhat, robotszer alkots taln Jacquard szvszke volt (1805), amirl mr az 1. fejezetben
mr szt ejtettnk.
Az els kereskedelmi forgalomba kerlt robot a Unimate (universal automation) manipultor volt. A Unimateet Joseph Engelberger s George Devol fejlesztette. 1960-ben adtk el az els pldnyt a General Motorsnak,
ahol tv-kpcsvek gyrtsnl hasznltk. Szintn 1960-ben nyjtotta be Devon az els robotokra vonatkoz
szabadalmat az Egyeslt llamokban. 11 vvel ksbb a Nissan Corp. az elsk kztt oldotta meg egy teljes
szerelsor automatizlst. A fejlesztst a Kawasaki vgezte Engelberger s Devol Unimation nev cgtl
szrmaz robotokkal. Fknt Japnban s az USA-ban ez az elrelps jelents talakulsnak nyitott utat, amely
mind a mai napig tart. A Unimationt a PUMA robot fejlesztse kvette 1978-ban. A PUMA a Programmable
Universal Machine for Assembly (programozhat univerzlis gp szerelshez) nvbl szrmazik, s eredetileg a
General Motors szmra fejlesztettk. A kvetkez vtizedekben ez lett a robotmanipultorok de facto
szabvnya. Manapsg egymillira becslik a vilgon dolgoz robotok szmt, s ezeknek tbb mint fele
Japnban tevkenykedik.
A robotikai kutatsokrl szl szakirodalom nagyjbl kt rszre oszthat: mobil robotokra s rgztett
manipultorokra. A Grey Walter ltal 1948-ban ksztett teknst tekinthetjk a vilg els autonm mobil
robotjnak annak ellenre, hogy a rendszer nem volt programozhat. A 60-as vekben, a Johns Hopkins
Egyetemen ksztett Hopkins Beast mr sokkal kifinomultabb volt. Mintafelismer hardvervel azonostotta a
szabvnyos fali AC-csatlakozkat, s kpes volt mozgsa sorn megtallni azokat, rcsatlakozni s feltlteni
akkumultort. Mgis, a Beastnek nagyon limitlt kpessgei voltak. Az els ltalnos cl robot a Shakey
volt, amit a Stanford Research Institute-ban (SRI) fejlesztettek ki az 1960-as vek vgn (Fikes s Nilsson,
1970; Nilsson, 1984). Shakey volt az els robot, amelybe integrltk az rzkelst, a tervksztst s a
vgrehajtst. Ez a jelents eredmny szmos tovbbi MI-kutatst inspirlt. Szintn jelents hats projektek
voltak mg a Stanford Cart s a CMU Rover (Moravec, 1983). A mobil robotokkal kapcsolatos klasszikus
munkkat Cox s Wilfong foglaltk ssze (Cox, s Wilfong, 1990).
827
Robotika
A robottrkpezs gykerei kt klnbz helyrl erednek. Az egyik szl Smith s Cheeseman munkssgval
kezddtt (Smith s Cheeseman, 1986), akik Kalman-szrt alkalmaztak szimultn helymeghatrozsi s
trkpezsi problmkhoz. Az algoritmust elszr Moutarlier s Chatila implementlta 1989-ben, majd Leonard
s Durrant-Whyte terjesztettk ki (Leonard s Durrant-Whyte, 1992). Dissanayake s trsai 2001-ben rtk le az
gazat jelenlegi fejlettsgi szintjt (Dissanayake s trsai, 2001). A msik szl a foglalsi hlzat (occupancy
grid) reprezentci megalkotsval kezddtt, amelyet a valsznsgi trkpezsnl hasznlnak. A foglalsi
hlzat minden (x, y) pontra meghatrozza annak a valsznsgt, hogy ott egy akadly van (Moravec s Elfes,
1985). A modern robottrkpezsrl Thrun rt sszefoglalt (Thrun, 2002). Kuipers s Levitt (Kuipers s Levitt,
1988) az elsk kztt voltak, akik metrikus helyett topolgikus trkpezst javasoltak, az ember trbeli
tjkozdst vve alapul.
A korai mobil robot helymeghatrozsi technikkat Borenstein s trsai tekintettk t (Borenstein s trsai,
1996). Annak ellenre, hogy a Kalman-szr vtizedeken t jl ismert helymeghatrozsi mdszer volt az
irnytselmletben, a helymeghatrozs problmjhoz tartoz ltalnos valsznsgi szably csak jval
ksbb jelent meg az MI-irodalomban, Tom Dean s kollgi (Dean s trsai, 1990), valamint Simmons s
Koenig (Simmons s Koenig, 1995) munkssga rvn. Ez utbbi pros vezette be a Markovhelymeghatrozs (Markov localization) fogalmt. A technika els, valsvilg-beli alkalmazst Burgard s
trsai mutattk be (Burgard s trsai, 1999) egy sor roboton keresztl, amelyeket mzeumokba teleptettek. A
rszecskeszr-alap Monte Carlo helymeghatrozs, amelyet Fox s trsai fejlesztettk ki (Fox s trsai, 1999),
manapsg szles krben hasznlatos. A Rao-Blackwellized rszecskeszr kombinlja a rszecskeszrst a
robot lokalizcival, valamint az egzakt szrst a trkpalkotssal (Murphy s Russell, 2001; Montemerlo s
trsai, 2002).
A mobil robotokhoz kapcsold kutatsok szimullsnak az elmlt vtizedben kt jelents verseny is teret
adott. Az AAAI ves robotbajnoksgt 1992 ta rendezik meg. Az els verseny gyztese a CARMEL volt
(Congdon s trsai, 1992). A fejlds azta igen jelents s tretlen: a 2002-es verseny sorn pldul a
robotoknak be kellett jrniuk a konferenciakzpontot, megtallni a regisztrcis pultot, regisztrlni a
konferencira, s vgl tartani egy beszdet. Az 1995-ben, Kitano s kollgi (Kitano s trsai, 1997) ltal
elindtott Robocup kezdemnyezs clja, hogy 2050-re olyan teljesen autonm humanoid robotokbl ll
futballcsapatot fejlesszen, amely kpes megverni az aktulis emberi vilgbajnokcsapatot. Klnbz
bajnoksgokat szerveznek kerekes, eltr mret, szimullt robotoknak s ngylb Sony Aibknak. 2002-ben a
vilgbajnoksgra tbb mint 30 orszgbl rkeztek csapatok, s a rendezvny legalbb 100 000 nzt vonzott.
A robotmanipultorok, eredeti nevkn kzszem gpek (hand-eye machine) tanulmnyozsa meglehetsen
ms vonalon fejldtt. Egy ilyen kzszem gp megalkotsra az els igazi ksrlet Heinrich Ernst MH-1-ese
volt, amelyet PhD-tziseiben rt le az MIT-n (Ernst, 1961). Az edinburghi Gpi Intelligencia (Machine
Intelligence) program mr igen korn jelents eredmnyeket mutatott fel ltsalap sszeszerel rendszerkkel,
amit FREDDY-nek hvtak (Michie, 1972). Ezen ttr ksrletek utn rengetegen foglalkoztak geometriai
algoritmusokkal determinisztikus s teljesen megfigyelhet mozgstervezsi problmkhoz. A robotmozgstervezs P-TR nehzsgt Reif egy termkenyt cikke mutatta be (Reif, 1979). A konfigurcistrreprezentcit Lozano-Perez-nek (Lozano-Perez, 1983) ksznhetjk. Nagy befolyst gyakoroltak Schwartz s
Sharir publikcii az ltaluk zongoraszlltknak (piano movers) nevezett problmrl (Schwartz s trsai,
1987).
A konfigurcis tr rekurzv cellkra bontsval val tervezs Brookstl s Lozano-Perez-tl szrmazik (Brooks
s Lozano-Perez, 1985), ezt ksbb Zhu s Latombe fejlesztettk jelentsen tovbb (Zhu s Latombe, 1991). A
legkorbbi szkeletonizcis algoritmusok a Voronoi-diagramokon (Rowat, 1979) s a lthatsgi grfokon
(visibility graph) alapultak (Wesley s Lozano-Perez, 1979). Guibas s trsai (Guibas s trsai, 1992) hatkony
technikt fejlesztettek ki a Voronoi-diagramok inkrementlis szmtsra. Choset (Choset, 1996) ltalnostotta
sokkal tfogbb mozgstervezsi problmkra a Voronoi-diagramokat. John Canny alapozta meg PhD-tzisvel
(Canny, 1991) az els klnll exponencilis algoritmust plyatervezsre. Msfle szkeletonizcis mdszert
hasznlt, amit sziluett (silhouette) algoritmusnak hvnak. Jean-Claude Latombe rsa (Latombe, 1991) a
klnbz mozgstervezsi metdusok szles skljt fedi le. Kavraki s trsai valsznsgi titervet
fejlesztettek (Kavraki s trsai, 1991), amely mg ma is a leghatkonyabb. Lozano-Perez s trsai (LozanoPerez s trsai, 1984), valamint Canny s Reif (Canny s Reif, 1987) is foglalkoztak a finom mozgsok
tervezsvel korltozott rzkels esetn, s intervallumra vonatkoztatott bizonytalansgot hasznltak
valsznsgi bizonytalansg helyett. A referenciapont-alap navigls a mobil robotok esetben sok hasonl
tletet hasznl (Lazanas s Latombe, 1992).
A robotok mint dinamikus rendszerek irnytsa, legyen sz manipultorrl vagy mobil robotrl, hatalmas
irodalommal rendelkezik, amelynek anyagrl ebben a fejezetben alig-alig esett sz. A fontos mvek kz
828
Robotika
tartozik Hogan trilgija (Hogan, 1985) az impedancia szablyozsrl s egy ltalnos tanulmny a robotok
dinamikjrl Featherstone-tl (Featherstone, 1987). Dean s Wellman az elsk kztt voltak, akik
megprbltk sszektni az irnytselmletet s az MI-tervezrendszereket (Dean s Wellman, 1991). Hrom
klasszikus tanknyv a robotkarok matematikjrl Paultl (Paul, 1981), Craigtl (Craig, 1989) s Yoshikawtl
(Yoshikawa, 1990) szrmazik. A megfogs (grasping) trgykre szintn nagyon fontos a robotikban: egy
stabil megfogs meghatrozsnak problmja meglehetsen nehz (Mason s Salisbury, 1985). A megfelel
megfogs rintkezsrzkelket vagy heptikus visszacsatolst (haptic feedback) kvn a fellp erk s az
esetleges csszs meghatrozsra (Fearing s Hollerbach, 1985).
A potenciltr-vezrlst, amely egyszerre prblja megoldani a mozgstervezs s az irnyts problmjt,
Khatib vezette be a robotika irodalmba (Khatib, 1986). Mobil robotok esetben ezt az tletet rszleges
megoldsnak tekintettk az tkzsek elkerlsnek problmjhoz. Ksbb Borenstein (Borenstein, 1991)
tovbbfejlesztette az algoritmust, s a vektortrhisztogram (vector field histogram) nevet adta neki. A
navigcis fggvnyeket, a determinisztikus MDF-hez tartoz vezrlsi irnyelvek robotikai megfeleljt,
Koditschek vezette be (Koditschek, 1987).
A robotokhoz tartoz szoftverarchitektra tmja sok heves vitt vltott ki. Az MI j reg zszlshajja a
hromrteg architektra Shakey tervezsnek eredmnye, ksbb Gat jtotta fel (Gat, 1998). Az alrendelt
architektra Brooks munkja (Brooks, 1986), br tlk fggetlenl Braitenberg (Braitenberg, 1984) is fejlesztett
hasonlt, akinek knyve, a Jrmvek, egy sor egyszer viselkedsalap robotot mutat be. Brooks hatlb
lpeget robotjnak sikert sok ms projekt kvette. Connell PhD-munkja keretben (Connell, 1989) olyan
teljesen reaktv mobil robotot fejlesztett, amely kpes volt trgyakrt elmenni s azokat elhozni. A
viselkedsalap paradigma tbbrobotos rendszerekre val kiterjesztst megtallhatjuk Mataric (Mataric, 1997)
s Parker (Parker, 1996) munkiban. A GLR (Horswill, 2000) s a COLBERT (Konolige, 1997) robotok
megvalstottk a prhuzamostott viselkedsalap irnytst ltalnos robotprogramozsi nyelveken. Arkin
tfog kpet nyjtott a tma aktulis helyzetrl (Arkin, 1998).
A 7. fejezetben lert helyezett automatkat (situated automata) (Rosenschein, 1985; Kaelbling s
Rosenschein, 1990) szintn hasznljk mobil robotok irnytsra, feldertsi s szlltsi feladatoknl. A
helyezett automatk szorosan kapcsoldnak a viselkedsalap tervezshez abbl a szempontbl, hogy vges
automatkbl llnak, amelyek egyszer kombincis hlzatokkal nyomon kvetik a krnyezet llapotnak
bizonyos aspektusait. Amg a viselkedsalap megkzelts az explicit reprezentci hinyt hangslyozza, a
helyezett automatkat algoritmikusan ptik deklaratv krnyezeti modellekbl, gy minden llapotregiszter ltal
reprezentlt tartalom jl definilt.
Szmos j kziknyv jelent meg mostanban a mobil robotokrl. A fent emltetteken fell Kortenkamp s trsai
(Kortenkamp s trsai, 1998) gyjtse minden rszletre kiterjed ttekintst nyjt a mai mobil robot
architektrkrl s rendszerekrl. Kt jabb knyv, Dudek s Jenkin (Dudek s Jenkin, 2000), valamint Murphy
(Murphy, 2000) munkja ltalnosabb megkzeltsben trgyalja a robotikt. Mason knyve (Mason, 2001) a
robotkarokrl olyan modern tmkat is trgyal, mint pldul az nbell mozgs. A robotikval foglalkoz
legjelentsebb konferencia az IEEE International Conference on Robotics and Automation. A tmval
foglalkoz folyiratok kzl kiemelkedik az IEEE Robotics and Automation, az International Journal of
Robotics Research s a Robotics and Autonomous Systems.
9.2. Feladatok
25.1.
A Monte Carlo-helymeghatrozs torztott brmilyen vges mret mintra. Azaz az algoritmus ltal kiszmolt
vrhat rtk a rszecskeszrs mkdsbl addan eltr a tnyleges vrhat rtktl. Ebben a pldban ezt a
torztst kell kiszmolni.
Hogy kicsit egyszerstsk a problmt, vegynk egy teret, amelyben a robotnak ngy lehetsges llapota
(helyzete) van: X = {x1, x2, x3, x4}. Kezdetben egyenletes eloszlssal vlasztunk N 1 mintt a megadott
llapotok kzl. Mint ltalban, itt is tkletesen elfogadhat, ha egyms utn akr tbb is generldik
brmelyik X llapotbl. Legyen Z egy binris szenzorvltoz, az albbi feltteles valsznsgekkel:
P(z|x1)
0,8
= P(z|x1) = 0,2
829
Robotika
P(z|x2)
0,4
= P(z|x2) = 0,6
P(z|x3)
0,1
= P(z|x3) = 0,9
P(z|x4)
0,1
= P(z|x4) = 0,9
A Monte Carlo-helymeghatrozs ezeket a valsznsgeket hasznlja, hogy generlja a rszecskk slyt,

amelyeket azutn normalizl s felhasznl az jabb mintavtelezsnl. Az egyszersg kedvrt felttelezzk,
hogy az jabb mintavtelezsnl, N nagysgtl fggetlenl, csak egyetlen j mintt generlunk. Ez a minta
korrellhat brmelyik X llapottal. gy a mintavev folyamat X-re nzve meghatroz egy valsznsg-eloszlst.
a. Mi az j mintra eredmnyl kapott valsznsg-eloszls X-re nzve? Vlaszolja meg a krdst az N = 1,
, 10 esetekre, valamint N = -re.
b. A P s Q kt valsznsg-eloszls kztti klnbsget mrhetjk a KL divergencival, amelynek
defincija:
c. Melyek a KL divergencia rtkei az (a)-beli eloszlsok s a valdi posterior kztt?

d. Milyen vltoztatst hajtana vgre a feladat szvegezsn (nem az algoritmuson!) annak rdekben, hogy
garantljuk a fenti specifikus becsl torztatlansgt mg vges N-ekre is? Legalbb kt klnbz megoldst
adjon (mindkettnek elgsgesnek kell lennie).
25.2.
Alkalmazza egy psztz tvolsgmrvel elltott szimullt robot esetben a Monte Carlo-helymeghatrozsi
algoritmust. A rcstrkp s a tvolsgadatok elrhetk az aima.cs.berkeley.edu kdtrbl. A megolds akkor
teljes, ha bemutatja a robot sikeres globlis helymeghatrozst.
25.3.
Vegyk a 25.12. brn lthat robotkart. Tegyk fel, hogy a robot alapja 60 cm hossz, a felkarja s az alkarja
pedig egyarnt 40-40 cm. Ahogy a 25.4. alfejezetben belttuk, az inverz kinematikai feladat megoldsa sokszor
nem egyrtelm. lltson fel egy explicit, zrt alak megoldst az inverz kinematikra erre a robotkarra.
Pontosan milyen felttelek mellett egyrtelm a megolds?
25.4.
Implementljon egy algoritmust, amely kiszmtja egy tetszleges (n n-es logikai tmbbel) adott 2D krnyezet
Voronoi-diagramjt. Illusztrlja algoritmust a Voronoi-diagram felrajzolsval 10 rdekes trkpen. Mekkora
az algoritmus komplexitsa?
25.5.
Ez a feladat feltrja a kapcsolatot a munkatr s a konfigurcis tr kztt, a 25.25. bra pldit hasznlva.
25.25. bra - Diagram a 25.5. feladathoz
830
Robotika
a. Vegyk a 25.25. (a)-tl (c)-ig lthat robotkonfigurcikat, nem vve figyelembe a diagramokon feltntetett
akadlyokat. Rajzolja fel az ezeknek megfelel robotkar-konfigurcikat a konfigurcis trben. (Segtsg:
minden egyes karkonfigurci egyetlen pontra kpzdik le a konfigurcis trben, ahogy ezt a 25.12. (b) bra
is mutatja.)
b. Rajzolja meg a konfigurcis teret a 25.25. (a)(c) brkon lthat minden egyes munkatrdiagramra.
(Segtsg: a konfigurcis terek megegyeznek a 25.25. (a) brn lvvel, ami a robot nmagval val
tkzst jelent terletet illeti, de klnbsgek addnak a terlet hatrt jelent akadlyok hinybl s az
egyes brkon lv akadlyok klnbz helyzetbl.)
c. A 25.25. (e)(f) brkon lthat fekete pontok mindegyikhez rajzolja meg a hozz tartoz konfigurcit a
munkatrben. Az rnykolt rszeket hagyja figyelmen kvl.
d. A 25.25. (e)(f) brkon lthat konfigurcis terek mindegyikt egy-egy klnll (a munkatrben lv)
akadly generlta (ez a sttebb terlet), valamint azok a megszortsok, amelyek a robot nmagval val
tkzsbl erednek (a vilgosabb rnyalat). Rajzolja meg mindkt diagramhoz a stt terletnek megfelel
akadlyt a munkatrben.
e. A 25.25. (d) bra azt mutatja be, hogy egyetlen skbeli (lapos) akadly kt elvlasztott rszre tudja bontani a
konfigurcis teret. Maximum hny elvlasztott rszre tudja bontani az egybefgg akadlymentes teret
egyetlen lapos akadly behelyezse egy 2 szabadsgfokos robot esetn? Adjon pldt r, s indokolja meg,
mirt nem lehetsges nagyobb szm fggetlen terlet kialaktsa. Mi a helyzet, ha nem lapos az akadly?
25.6.
Vegyk a 25.26. bra egyszerstett robotjt. Tegyk fel, hogy a robot derkszg koordinti ismertek minden
idpillanatban, mint ahogy a clhelyzet is. Ugyanakkor van egy akadly, amelynek a helyzete nem ismert. A
robot csak a kzvetlen krnyezetben kpes rzkelni az akadlyt, mint ahogy azt az bra is illusztrlja. Az
egyszersg kedvrt ttelezzk fel, hogy a robot mozgsa zajjal nem terhelt, s az llapottr diszkrt. A 25.26.
bra csak egy plda. Ebben a feladatban azt krjk, hogy minden lehetsges rcsvilgra gondoljon, ahol van
rvnyes t a start pozcitl a clig.
831
Robotika
25.26. bra - Egyszerstett robot egy labirintusban. Lsd 25.6. feladat.
a. Tervezzen egy modellalap vezrlt, amely garantlja, hogy a robot mindig elri a clt, amennyiben ez
lehetsges. A modellalap vezrl egy, a mozgs sorn fokozatosan kialaktott trkp formjban kpes
trolni a terep jellemzit. A robot az egyes mozdulatok kztt tetszleges idt tlthet gondolkodssal.
b. Most pedig tervezzen egy reaktv vezrlt ugyanerre a feladatra. Ez a vezrl nem trolhatja a korbbi
rzkelsek eredmnyeit. (Azaz nem kszthet trkpet!) Ehelyett minden dntst az aktulis rzkel adatai
alapjn hozza meg, amely magban foglalja a sajt helynek s a cl pontos helyzetnek ismerett. A
dntshozsi idnek fggetlennek kell lennie a krnyezet mrettl, valamint a mr megtett lpsek
szmtl. Maximum hny lps kell a robotnak ahhoz, hogy elrje cljt?
c. Hogy fog viselkedni az (a) s (b) pontban megtervezett vezrl, ha az albbi hat felttel valamelyike fennll:
folytonos llapottr; zajjal terhelt rzkels; zaj a mozgsban; zaj mind a mozgsban, mind az rzkelsben; a
cl helyzete ismeretlen (csak akkor ismeri fel a clt, ha az az rzkel hattvolsgn bellre kerl); vagy
mozg akadlyok vannak. Minden egyes felttelre s mindkt vezrlre adjon egy-egy pldt, amikor is a
robot elbukik (vagy magyarzza el, mirt nem tud).
25.7.
A 25.22. (b) brn kiterjesztett vges automatt hasznltunk a hatlb robot egyetlen lbnak vezrlshez.
Ebben a feladatban a cl egy olyan AFSM tervezse, amely a hat kln lbhoz tartoz vezrlvel
egyttmkdve hatkony s stabil mozgst eredmnyez. Ennek elrshez ki kell bvteni az egyes lbakat
vezrl AFSM-eket, hogy zeneteket is kldjenek az j AFSM-nek, s hogy vrjanak amg ms zenetek
rkeznek. Magyarzza el, hogy mirt hatkony a vezrlje, azaz mirt nem fogyaszt feleslegesen energit (pl.
cssz lbak miatt), s hogy mirt mozgatja a robotot megfelelen nagy sebessggel! Bizonytsa be, hogy
vezrlje megfelel a 25.2. alfejezetben tmasztott stabilitsi feltteleknek.
25.8.
(Ezt a feladatot Michael Genesereth s Nils Nilsson talltk ki, s az els vesektl a vgzskig mindenkinek
szl.) Az emberek annyira gyesek alapfeladatok elvgzsben mint pldul csszk felemelse vagy dobozok
egymsra raksa , hogy gyakran elfelejtik milyen sszetettek ezek a mozdulatok valjban. A feladat sorn
felfedezzk e feladatok komplexitst, s sszefoglaljuk a robotika elmlt 30 vnek fejldst. Elszr
hatrozzuk meg a feladatot (pldul egy kapu ksztse hrom dobozbl), majd ptsnk egy robotot ngy
emberbl az albbiak szerint:
Agy: az Agy feladata a cl elrst biztost terv kidolgozsa s a kezek irnytsa a terv megvalstsa sorn.
Az Agy informcit csak a Szemtl kaphat, kzvetlenl nem lthatja a helysznt! Az Agy az egyetlen, aki
tudja, mi a cl.
Szem: a Szem feladata a helyszn rvid lersa az Agy szmra. A munkakrnyezettl kb. egy mternyire kell
lennie, s vagy kvalitatv lerst (mint pldul: Az oldaln fekv zld doboz tetejn egy piros doboz van),
832
Robotika
vagy kvantitatv lerst (A zld doboz kb. 50 cm tvolsgra balra van a kk hengertl) adhat. A Szem az
Agytl jv krdsekre is vlaszolhat, gy pldul: Van-e hely a Bal Kezem s a piros doboz kztt? Ha
van kznl egy videokamera, akkor lltsuk r a munkakrnyezetre, s a Szem ezen keresztl nzze azt, ne
lssa kzvetlenl!
Kezek (Jobb s Bal): mindkt Kezet ms ember jtssza. A kt Kz egyms mellett ll. A Balkz csak a sajt
balkezt hasznlja, a Jobbkz pedig csak a jobbat. A Kezek csak egyszer, az Agytl rkez feladatokat
hajthatnak vgre. Pldul: A Balkz mozduljon 5 cm-t elre. Csak mozgsparancsot kpesek vgrehajtani
pldul a vedd fel a dobozt nem olyan parancs, amit a Kz vgre tud hajtani. A csalsok megakadlyozsa
vgett megkvetelhetjk, hogy a kezeken legyen keszty vagy hasznljanak csipeszt. A Kezeknek bekttt
szemmel kell tevkenykednik. Egyetlen rzkelsi kpessgk az, hogy meg tudjk mondani, amikor tjukat
valamilyen elmozdthatatlan akadly, pldul egy asztal vagy a msik Kz zrja el. Ilyen esetben hangjelzst
adhatnak az Agy informlsa cljbl.
833
26. fejezet - Filozfiai alapok

Ebben a fejezetben arrl esik sz, hogy mit jelent gondolkozni, vajon kpesek-e erre a mestersges trgyak, s
szeretnnk-e, ha kpesek lennnek r.
Ahogyan az 1. fejezetben emltettk, a filozfusok sokkal rgebb ta vannak jelen, mint a szmtgpek, s
folyamatosan prblnak vlaszokat tallni nhny olyan krdsre, amely a mestersges intelligencihoz ktdik:
Hogyan mkdik az elme? Kpesek-e gpek intelligensen cselekedni; s ha igen, lenne-e elmjk? Milyen
etikai kvetkezmnyei lehetnek az intelligens gpeknek? A knyv eddigi huszont fejezetben a mestersges
intelligencia sajt krdseirl volt sz, most egy fejezet erejig a filozfusok tmival foglalkozunk.
Elszr nhny elnevezs: a filozfiban gyenge MI-hipotzisnek (weak AI) nevezik azt az lltst, miszerint a
gpek valsznleg kpesek intelligensen cselekedni (vagy jobban mondva, kpesek gy cselekedni, mintha
intelligensek lennnek), mg azt az lltst, hogy a gpek valban intelligensen cselekszenek, ers MIhipotzisnek (strong AI) hvjk.
A legtbb MI-kutat elfogadja a gyenge MI-hipotzist, az erssel pedig nem trdik: amg a program mkdik,
az nem rdekes, hogy az intelligencia szimulcijnak nevezik-e vagy vals intelligencinak. Minden MIkutatnak foglalkoznia kellene munkja etikai kvetkezmnyeivel.
1. Gyenge MI: Tudnak-e a gpek intelligensen

cselekedni?
Nhny filozfus megprblta bebizonytani, hogy a mestersges intelligencia nem lehetsges, azaz a gpek
valsznleg nem tudnak intelligensen cselekedni. Nhnyan az MI-kutats lelltst szeretnk elrni rveikkel:
A szmtsorientlt megkzelts kultusznak rszeknt ztt mestersges intelligencinak
mg eslye sincsen arra, hogy tarts eredmnyeket rjen el () itt az ideje, hogy az MIkutatk erfesztseit s a tmogatsukra sznt hatalmas pnzeket mshova tereljk, mint
a szmtsorientlt megkzelts.
(Sayre, 1993)
A mestersges intelligencia lehetsges mivolta nyilvn azon mlik, miknt definiljuk. Lnyegt tekintve a
mestersges intelligencia egy adott architektrhoz a legjobb gensprogramot keresi. Ebben a
megfogalmazsban mr a definci szerint is lehetsges az MI: brmely k trbitet tartalmaz digitlis
architektrhoz pontosan 2k gensprogram tartozik; ahhoz pedig, hogy megtalljuk a legjobbat, egyszeren csak
egyesvel fel kell sorolni s tesztelni az genseket. Ez ugyan nem lenne praktikus nagy k esetn, de a filozfia
az elmlettel, nem pedig a gyakorlattal foglalkozik.
A mestersges intelligencira adott defincink jl mkdik a mrnki problma esetben is, ahol egy adott
architektrhoz tartoz j genst kell tallni. Nagy a ksrts teht, hogy befejezzk itt ezt a szakaszt, s igenl
vlaszt adjunk a cmben feltett krdsre. A filozfusok azonban kt architektrt akarnak sszehasonltani: az
embert s a gpet. Radsul a hagyomnyosan feltett krds gy hangzik: Tudnak-e a gpek gondolkodni?
Sajnos ez egy helytelenl feltett krds. Hogy megrtsk, mirt, nzzk az albbi krdseket:
Tudnak a gpek replni?
Tudnak a gpek szni?
A legtbb angolul beszl ember1 egyetrt abban, hogy az els krdsre igennel kell felelni: a replgpek
tudnak replni; de a msodik krdsre az angolban a vlasz nemleges: a hajk s a tengeralattjrk haladnak
ugyan a vzben, de az angolban ezt nem nevezik szsnak. Sem ezeknek a krdseknek persze, sem a
vlaszoknak nincsen semmilyen hatsa a tengerszek, a tengerszeti mrnkk vagy az ezekkel a dolgokkal
brmilyen kapcsolatba kerlk mindennapi munkjra. A vlaszoknak alig van kzk a replgpek s
tengeralattjrk tervezshez s kpessgeihez; inkbb arrl szlnak, hogy a szavak hasznlatnak milyen
mdjait vlasztottuk ki. gy alakult, hogy az szni sz az angolban azt jelenti, hogy testrszeinek
mozgsval elrehalad a vzben, mg a replni sz jelentse az angolban nem hatrozza meg a
1
A krdsek eredeti formja s gy az elemzs trgya az angol nyelv. (A ford.)
834
Filozfiai alapok
helyvltoztats mdjt.2 A gondolkod gpek gyakorlati lehetsge mg csak mintegy tven ve jelent meg,
s ez az id nem volt elg az angolul beszlknek, hogy a gondolkodni sz az angolban j jelentst kapjon.
Alan Turing azt javasolta Computing Machinery and Intelligence c. hres cikkben (Turing, 1950), hogy ne azt
krdezzk, tudnak-e a gpek gondolkodni, hanem azt vizsgljuk, hogy tmennek-e a gpek egy viselkedsi
intelligenciateszten, amelyet ksbb Turing-tesztnek neveztek el. A teszt szerint a programnak t percen t kell
(gpelt online zenetekkel) beszlgetnie egy krdezvel. A krdeznek ezutn vlasztania kell, hogy egy
programmal vagy egy szemllyel beszlgetett-e, s egy program akkor felel meg a teszten, ha az id 30%-ban
megtveszti a krdezt. Turing azt a sejtst fogalmazta meg, hogy 2000-re egy 109 tregysgbl ll
szmtgpet be lehet gy programozni, hogy megfeleljen a teszten, mde nem lett igaza. Az ugyan megtrtnt
mr, hogy nhny embert t percig becsaptak; pldul az ELIZA program s az MGONZ internetes csevegrobot
becsapott olyan embereket, akik nem gondoltak arra, hogy taln egy programmal beszlhetnek, s az ALICE
program becsapott egy zsritagot a 2001-es Loebner-djrt zajl versenyben. De egyetlenegy program sem
kerlt annak kzelbe, hogy 30%-ot rjen el kpzett zsrivel szemben, s az MI-kutats egsze nem is szentel
tl nagy figyelmet a Turing-teszteknek.
Turing az intelligens gpek lehetsge ellen felhozhat rvek szles vlasztkt is megvizsglta, belertve szinte
minden olyan ellenrvet, amely a cikk megjelense ta eltelt fl vszzadban felmerlt. A kvetkezkben ezek
kzl nznk meg nhnyat.
1.1. A kpessg hinybl vett rv

A kpessg hinybl vett rv azzal a kvetelssel lp fel, hogy a gpek sohasem kpesek X-et tenni. Az Xekre Turing a kvetkez pldkat hozza:
Kedvesnek, tallkonynak, szpnek s bartsgosnak lenni, kezdemnyezni, humorrzket
mutatni, megklnbztetni a helyest a helytelentl, hibkat kvetni el, szerelmesnek lenni,
lvezni a tejsznes epret, elrni, hogy valaki szerelmes legyen bel, tapasztalatbl tanulni,
helyesen hasznlni a szavakat, sajt gondolatai alanynak lenni, annyira vltozatosan
viselkedni, mint az ember, valami igazn jat tenni.
Turing
Turingnak az intucijt kellett hasznlnia, hogy megsejtse, mi vlhat lehetsgess a jvben, mi azonban abban
a knyelmes helyzetben vagyunk, hogy visszanzhetnk a szmtgpek eddigi teljestmnyre. Senki sem
tagadja, hogy a szmtgpek ma sok olyan dolgot megtesznek, amely korbban kizrlag az emberekhez
tartozott. A programok sakkoznak, dmt vagy ms jtkokat jtszanak, alkatrszeket vizsglnak gyrtsorokon,
a szvegszerkesztskor ellenrzik a helyesrst, helikoptereket s autkat irnytanak, betegsgeket
diagnosztizlnak s tbb szz ms tevkenysget vgeznek ppolyan jl, vagy mg jobban, mint az emberek. A
szmtgpek kicsiny, de jelents felfedezseket tettek a csillagszatban, a matematikban, a kmiban, az
svnytanban, a biolgiban, a szmtstudomnyban s ms terleteken. Ezekhez a felfedezsekhez az emberi
szakrthz hasonl szint teljestmnyekre volt szksg.
Annak fnyben, amit most tudunk a szmtgpekrl, nem meglep, hogy jl teljestenek a sakkhoz hasonl
kombinatorikai problmkban. De az algoritmusok az emberhez mrhet szinten hajtanak vgre olyan
tevkenysgeket is, amelyek ltszlag emberi dntst ignyelnek, amelyek sorn, mint Turing mondta, kpesnek
kell lenni a tapasztalatbl tanulni s megklnbztetni a helyest a helytelentl. Mg egszen korn, 1955ben Paul Meehl (lsd mg Grove s Meehl, 1996) kpzett szakrtk dntshozatali folyamatt tanulmnyozta
olyan szubjektv esetekben, mint pldul hogy egy dik elvgez-e egy kpzsi programot, vagy egy bnz
visszaesik-e. A megvizsglt 20 eset kzl 19-nl Meehl azt tallta, hogy egyszer statisztikai tanulsi
algoritmusok (mint pldul a lineris regresszi vagy a naiv Bayes-tanuls) jobb elrejelzseket adnak, mint az
emberi szakrtk. Az Educational Testing Service a GMAT-vizsga esszkrdseinek milliit osztlyozza 1999
ta egy automatizlt programmal. A program osztlyzata az osztlyzst vgz emberek minstsvel az esetek
97%-ban egyezik meg, s ez az arny hasonl ahhoz, amennyire a klnbz emberek ltal adott minstsek
megegyeznek (Burstein s trsai, 2001).
Vilgos, hogy sok mindent, kztk olyan dolgokat is, amelyekhez ltalnos meggyzdsnk szerint komoly
emberi leselmjsg s rtelem szksges, a szmtgpek ugyanolyan jl el tudnak vgezni, mint az emberek,
vagy akr mg jobban is. Ez persze nem jelenti azt, hogy a szmtgpek leselmjsget s rtelmet
Az orosz nyelvben az szni megfelelje hajkra is vonatkozik. A magyar szni ige is vonatkozhat hajkra, st, ismt csak az angoltl
eltren, mg felhkre is. (A ford.)
2
835
Filozfiai alapok
tanstannak az ilyen dolgok vgrehajtsakor: ezek nem rszei viselkedsknek (errl a krdsrl majd mshol
beszlnk), hanem inkbb arrl van sz, hogy gyakran tves az els felttelezsnk az adott tevkenysg
elvgzshez szksges mentlis folyamatrl. Ugyanakkor az is igaz, hogy szmtalan feladatban a szmtgpek
(finoman szlva) nem jrnak az len, s ilyen Turing feladata, a nyltvg beszlgetsek folytatsa is.
1.2. A matematikai ellenvets

Turing (Turing, 1936) s Gdel (Gdel, 1931) munkssga rvn kzismert, hogy egyes matematikai krdsek
elviekben is megvlaszolhatatlanok bizonyos formlis rendszerekben. A leghresebb plda erre Gdel
nemteljessgi ttele (lsd 9.5. alfejezet). Ez, rviden sszefoglalva, azt mondja ki, hogy brmely F formlis
rendszerben, amelyben az aritmetika megfogalmazhat, lehetsges egy G(F) Gdel-mondatot konstrulni,
amelyre igaz, hogy
G(F) egy mondat F-ben, de F-en bell nem bizonythat.
Ha F konzisztens, akkor G(F) igaz.
Egyes filozfusok, mint pldul J. R. Lucas (Lucas, 1961) lltsa szerint ez a ttel azt bizonytja, hogy a gpek
mentlisan alsbbrendek az embereknl, mert a gpeket mint formlis rendszereket korltozza a nemteljessgi
ttel (nem tudjk megllaptani a sajt Gdel-mondatuk igazsgt), az embereket viszont ilyesmi nem
korltozza. Ez az llts vtizedes, sok knyvet fellel vitt keltett, pldul a matematikus Sir Roger Penrose
kt knyvben (Penrose, 1989; 1994) kpviseli ezt az lltst kicsit megcsavarva (pldul azzal a felttelezssel,
hogy az emberek azrt klnbznek, mert agyukat a kvantumgravitci mkdteti). Hrom problmt fogunk az
lltssal kapcsolatban megvizsglni.
Elszr is Gdel nemteljessgi ttele csak olyan formlis rendszerekre vonatkozik, amelyek elg ersek az
aritmetikhoz. Ezek kz tartozik a Turing-gp is, s Lucas lltsa rszben azon a felttelezsen alapul, hogy a
szmtgpek Turing-gpek. Ez j kzelts, m nem teljesen igaz. A Turing-gpek vgtelenek, a szmtgpek
azonban vgesek, s ezrt brmely szmtgpet le lehet rni egy nagyon nagy logikai lltsrendszerrel, amelyre
mr nem vonatkozik Gdel nemteljessgi ttele.
Msodszor is egy gensnek nem kell tlzottan szgyenkeznie amiatt, hogy egyes lltsok igazsgt, msoktl
eltren, nem tudja eldnteni. Nzzk pldul a kvetkez mondatot:
J. R. Lucas nem tudja konzisztensen azt lltani, hogy ez a mondat igaz.
Lucas ellentmondana nmagnak, ha azt lltan, hogy a fenti (teljes) mondat igaz, teht Lucas nem tudja ezt a
mondatot konzisztensen lltani, teht a mondat mindenkppen igaz. (A mondat nem lehet hamis, mert ha hamis
volna, akkor Lucas nem tudn konzisztensen lltani, teht igaz lenne.) Bebizonytottuk teht, hogy van egy
mondat, amelyet Lucas nem tud konzisztensen lltani, msok viszont (belertve a gpeket is) igen. De ez
elttnk semmit sem von le Lucas rtkbl. Egyetlenegy ember sem tudja, hogy egy msik pldt vegynk,
lete sorn kiszmtani tzmillird tzjegy szm sszegt, egy szmtgp viszont msodpercek alatt megteszi
ezt. Mgsem tartjuk ezt az emberi gondolkodsi kpessg alapvet korltjnak. vezredeken t, mieltt
felfedeztk volna a matematikt, az emberek ugyangy intelligens viselkedst tanstottak, nem valszn ht,
hogy a matematika a periferilisnl fontosabb szerepet jtszana az intelligencia meghatrozsban.
Harmadszor s legfkppen, mg ha el is fogadjuk, hogy a szmtgpek bizonytsi kpessge korltozott,
semmi sem bizonytja, hogy az emberek mentesek lennnek az ilyen korltozsoktl. Tlzottan is egyszer
szigoran bebizonytani, hogy egy formlis rendszer kptelen X-re, majd minden tovbbi bizonytk nlkl azt
lltani, hogy az emberek a maguk nem formlis mdjn kpesek erre az X-re. Azt, hogy az emberek nincsenek
alvetve Gdel nemteljessgi ttelnek, valban lehetetlen bebizonytani, mert brmely szigor bizonytsnak
tartalmaznia kellene az llts szerint formalizlhatatlan emberi tehetsg egy formalizlst, teht a bizonyts
nmagt cfoln meg. Lehet mg fellebbezni az intucihoz, miszerint az emberek valamilyen mdon kpesek a
matematikai belts emberfeletti cselekedeteire. Ezt a fordulatot fejezik ki az olyan rvek, mint pldul
feltteleznnk kell nnn konzisztencinkat, hogy a gondolkods egyltaln lehetsges legyen (Lucas, 1976).
De ha brmirl is, akkor az emberi gondolkodsrl mindenkppen tudjuk, hogy inkonzisztens. Ez egyrtelmen
igaz a mindennapi rvelsnkre, de vonatkozik mg az elvigyzatos matematikai gondolkodsra is. Hres plda
erre a ngyszn-problma. 1879-ben Alfred Kempe kzztett egy bizonytst, amelyet szles krben elfogadtak,
s amely hozzjrult, hogy a Royal Society tagjv vlasztottk. 1890-ben azonban Percy Heawood egy hibt
fedezett fel a bizonytsban, s egszen 1977-ig senki nem tudta a ttelt bebizonytani.
836
Filozfiai alapok
1.3. A meghatrozatlansgbl vett rv

A mestersges intelligencia vllalkozsnak legnagyobb hats s legmakacsabb kritikjt Turing gy mutatta
be, mint a viselkeds meghatrozatlansgbl szrmaz rvet. Az llts lnyege az, hogy az emberi
viselkeds tl komplex ahhoz, hogy egy szablykszlettel le lehessen rni, s mivel a szmtgpek semmi
msra nem kpesek, csak szablyok kvetsre, ezrt nem tudnak az emberekhez hasonl intelligens viselkedst
ltrehozni. Azt, hogy logikai szablyok egy halmazval kptelensg mindent lerni, a mestersges
intelligenciban kvalifikcis problmnak (qualification problem) nevezik (lsd 10. fejezet).
Ezt a nzetet fknt a filozfus Hubert Dreyfus kpviselte, aki szmos befolysos MI-kritika szerzje: What
Computers Cant Do (Dreyfus, 1972); What Computers Still Cant Do (Dreyfus, 1992), valamint a testvrvel,
Stuarttal, kzsen rt Mind Over Machine (Dreyfus s Dreyfus, 1986).
Azt az llspontot, amit kritizltak, Haugeland (Haugeland, 1985) nyomn elkezdtk Jfajta, rgivgs MInek nevezni (angol rvidtssel: GOFAI). A GOFAI azt felttelezn, hogy minden intelligens viselkeds
megragadhat egy olyan rendszerrel, amely a trgyterletet ler tnyek s szablyok halmazaibl kiindulva
logikai kvetkeztetst vgez. Ezrt a GOFAI a 7. fejezetben lert legegyszerbb logikai gensnek felel meg.
Dreyfusnak igaza van abban, hogy a logikai gensek ki vannak tve a kvalifikcis problma veszlynek.
Amint a 13. fejezetben lttuk, a nylt trgyterletekhez sokkalta megfelelbbek a valsznsgi kvetkeztet
rendszerek. Dreyfus kritikja teht nem per se a szmtgpek, hanem csak a programozs egy meghatrozott
mdja ellen irnyul. Okkal felttelezhetjk persze, hogy nem lenne tl nagy hats egy knyv Amire az
elsrend logikai szablyalap, nem tanul rendszerek kptelenek cmmel.
Dreyfus nzete szerint az emberi szakrtelemnek ugyan rsze nhny szably ismerete, de ezek csak
holisztikus kontextust vagy htteret alkotnak az emberi tevkenysghez. Pldaknt az ajndk adsakor s
fogadsakor ill trsas viselkedst hozza fel: ltalban az ember a megfelel krlmnyek kztt gy reagl,
hogy egy megfelel ajndkot ad. Az embernek lthatlag kzvetlen rzke van ahhoz, hogy miknt trtnnek
a dolgok, s mit lehet elvrni. Hasonl lltst tehetnk a sakkjtk vonatkozsban is: Egy tlagos
sakkmesternek lehet, hogy gondolkodnia kell azon, mit tegyen, de egy nagymester ltja, hogy a tbla egy
bizonyos lpst kvetel () a helyes reakci egyszeren csak beugrik a fejbe. Minden bizonnyal igaz, hogy
egy ajndkoz vagy egy sakknagymester gondolati folyamata azon a szinten zajlik, amely rejtett a tudatos elme
nismerete ell. Ez azonban nem jelenti, hogy ez a gondolati folyamat nem ltezik. Lnyeges, hogy Dreyfus
nem vlaszolja meg azt, hogy a helyes lps miknt kerl a nagymester fejbe. Mindez Daniel Dennett (Dennett,
1984) megjegyzsre emlkeztet:
Ez olyan, mintha a filozfusok azt tartank magukrl, hogy szakrt magyarzi a sznpadi
bvszek trkkjeinek, aztn, amikor megkrdezzk tlk, hogy milyen trkkt hasznlnak a
bvszek a n kettfrszelsnl, akkor azt a magyarzatot adjk, hogy mindez nagyon is
vilgos: a bvsz nem frszeli kett a nt, ezt csak sznleli. Ha azt krdezzk azonban:
Mgis hogyan sznleli?, a filozfusok ezt felelik: Nem rnk tartozik.
Daniel Dennett
A kt Dreyfus (Dreyfus s Deyfus, 1986) vzolja a szakrtelem tlpcss elsajttsnak folyamatt, kiindulva a
hasonl szablyalap feldolgozsbl (ahogyan az a GOFAI-ban is szerepel) eljutva a helyes reakci azonnali
kivlasztsnak kpessghez. A szerzk ezzel a javaslattal tulajdonkppen az MI kritikusaibl az MI
elmletalkotiv vlnak: egy eset-knyvtrakba szervezett neurlishl-architektrt vzolnak fel, azonban
rmutatnak nhny problmra is. Ezeket a problmkat szerencsre mr mind clba vette az MI-kutats
nhnyukat rszleges, msokat pedig teljes sikerrel oldva meg. Nzznk nhny ilyen problmt:
1. Httrtuds nlkl nem lehet jl pldkbl ltalnostani. Azt lltjk, senki sem tudja, miknt lehetne a
httrtudst bepteni a neuronhlk tantsi folyamatba. Pedig, amint a 19. fejezetben mi is lttuk, lteznek
mdszerek az a priori tuds felhasznlsra a tantsi folyamat sorn. Ezek a mdszerek persze a tuds
explicit megadsn alapulnak, amelynek lehetsgt a szerzpros elszntan tagadja. Nzetnk szerint ez a
problma ers indok a neurlis feldolgozs jelenlegi modelljeinek olyan jratervezsre, amely mr a tbbi
tanul algoritmushoz hasonlan kpes lesz felhasznlni a korbban megtanult tudst.
2. A neurlis hlk tanulsa a felgyelt tanuls egyik formja (lsd 18. fejezet), amely ignyli, hogy elzetesen
azonostsuk a relevns bemeneteket, valamint a megfelel kimeneteket. Ezrt azt lltjk, hogy nem is
kpesek ezek a hlzatok autonm mdon, emberi betants nlkl zemelni. Valjban a nem ellenrztt
tanuls (unsupervised learning) (lsd 20. fejezet) s a megerstses tanuls (reinforcement learning)
(lsd 21. fejezet) ppen a tant nlkli tanulst teszi lehetv.
837
Filozfiai alapok
3. A tanul algoritmusok nem teljestenek jl sok jellemz esetn, viszont ha kijelljk a jellemzk egy
halmazt, nem ismeretes olyan mdszer, amellyel j jellemzket illeszthetnk be, ha a jelenlegiek nem
lennnek elegendk a megtanult tnyekhez, valjban j eljrsok, mint pldul a szupport vektor gpek, jl
megbirkznak a nagy jellemzhalmazokkal is. A 19. fejezetben pedig lthattuk, hogy alapjaikat tekintve
lteznek mdszerek az j jellemzk bevezetsre, habr mg sok tennival akad ezen a terleten.
4. Az agy kpes a szenzorait relevns informcik keressre irnytani, s kpes kinyerni az informcikbl
azt, ami relevns az adott szituciban. Ezzel szemben jelenleg egyetlen rszlett sem rtjk ennek a
mkdsmdnak lltjk , s mg csak olyan hipotzist sem tudunk alkotni rluk, amely tmutatsul
szolglhatna az MI-kutatknak. Valjban az aktv lts terlete, amelyet az informcirtk-elmlet (lsd
16. fejezet) alapoz meg, ppen hogy a szenzorok irnytsnak problmjval foglalkozik, s az elrt elmleti
eredmnyek egy rszt mr t is ltettk robotmegvalstsokba.
sszegezve azt mondhatjuk, hogy szmos olyan krds, melyet Dreyfus felvetett a kznapi httrtuds, a
kvalifikci problma, a bizonytalansg kezelse, a tanuls, a dntshozatal elre lefordtott mdjai, annak
fontossga, hogy ne testetlen kvetkeztetgpeket tekintsnk, hanem szitucijukba gyazott genseket , ma
mr bekerlt az intelligens gensek tervezsnek szokvnyos menetbe. Vlemnynk szerint mindez teht nem
a mestersges intelligencia lehetetlensgt, hanem ppen a fejldst bizonytja.
2. Ers MI: Tudnak-e tnylegesen gondolkodni a

gpek?
Tbb filozfus llspontja szerint egy Turing-teszten tmen gp nem gondolkodna tnylegesen, csupn
szimulln a gondolkodst. Ezt az ellenvetst is elre ltta Turing. Geoffrey Jefferson (Jefferson, 1949)
professzor egy beszdt idzi:
Amg nem kpes egy gp egy szonettet rni vagy egy zenei versenymvet komponlni,
pusztn a gondolatai s az rzsei alapjn, s nem szimblumok vletlen alakulsa folytn,
addig nem fogunk beleegyezni, hogy egy gp egyenl lehet az aggyal; ehhez az kell, hogy ne
csupn megrja, de tudja is, hogy megrta.
Geoffrey Jefferson
Ezt nevezi Turing tudatossgi (consciousness) rvnek: a gpnek sajt mentlis llapotainak s cselekvseinek
tudatban kell lennie. Ugyan a tudatossg fontos tmakr, Jefferson megllaptsa azonban lnyegileg a
fenomenolgihoz (phenomenology), a kzvetlen tapasztalat tudomnyhoz ktdik: a gpnek tnylegesen
reznie kell az rzseit. Ms szerzk az intencionalitsra (intentionality) koncentrlnak, ami azt krdezi, hogy
a gp felttelezett hiedelmei, vgyai s ms reprezentcii tnylegesen valamilyen valsvilg-beli dologra
vonatkoznak-e.
Figyelemre mlt Turing vlasza erre az ellenvetsre. Felhozhatott volna rveket amellett, hogy a gpek valban
rendelkezhetnek tudattal (avagy viszonyulhatnak fenomenolgiailag, illetve viselkedhetnek intencionlisan).
Ehelyett Turing gy rvel, hogy ez a krds ppen gy rosszul lett megfogalmazva, mint a Tudnak-e a gpek
gondolkodni? krds. Radsul mirt kellene ersebb kritriumokat vrni el a gpek esetben, mint az
embereknl? A mindennapi letben vgs soron nincsen semmilyen kzvetlen bizonytkunk a tbbi ember
bels mentlis llapotairl. Mgis, amint Turing rmutat, ahelyett hogy llandan errl vitatkoznnk, azzal az
udvarias felttelezssel (polite convention) lnk, hogy mindenki kpes gondolkodni.
Azonban Turing szerint Jefferson hajland lenne ezt az udvarias felttelezst a gpekre is kiterjeszteni, ha
tallkozna intelligensen cselekv gpekkel. Az albbi dialgust idzi, amely annyira beplt a mestersges
intelligencia szjhagyomnyba, hogy egyszeren nem hagyhattuk ki:
EMBER: Szonetted els sorban, mely gy hangzik, hogy hasonltanlak tged a nyri
naphoz, nem lenne legalbb ugyanolyan j, ha tavaszi nap szerepelne?

GP: Nem jnne ki az tem.
EMBER: De ha tli nap lenne? Ez temre ugyanolyan j.
GP: Persze, de ht senki sem szeretn, ha egy tli naphoz hasonltank.
838
Filozfiai alapok
EMBER: Mondanl olyat, hogy Pickwick r a karcsonyra emlkeztet tged?

GP: Bizonyos rtelemben igen.
EMBER: A karcsony viszont egy tli nap, s n nem gondolom, hogy Pickwick rnak ellenre
lenne az sszehasonlts.
GP: Nem hiszem, hogy ezt komolyan gondolod. A tli nap alatt egy tlagos tli napot szoks
rteni, nem pedig egy olyan klnlegeset, mint a karcsony.

Turing
Azt ugyan elismeri Turing, hogy a tudatossg megmagyarzsa nehz krds, de tagadja, hogy brmi
jelentsge is volna a mestersges intelligencia gyakorlata szmra: Nem szeretnm azt a benyomst kelteni,
miszerint gy gondolnm, hogy a tudatossgban ne volna semmi rejtlyes elem. () De nem gondolom azt,
hogy ezeket a rejtlyeket meg kellene oldani ahhoz, hogy meg tudjuk vlaszolni a cikkemben trgyalt
krdseket. Egyetrthetnk Turinggal, hiszen az a fontos szmunkra, hogy intelligensen viselked programokat
ksztsnk, nem pedig az, hogy msok azt vajon szimullt vagy valsgos intelligencinak tartjk. Persze
msfell sok filozfusnak igencsak fontos ez a krds. Ezt megvilgtand vegyk szemgyre, hogy ms
eseteken mennyire tartjk valsgosnak az ember ksztette trgyakat.
A mestersges karbamidot 1828-ban sikerlt elszr ellltania Fredrick Whlernek. A szintzis fontossgt az
adta, hogy bizonytkot szolgltatott a szerves s szervetlen kmia akkortjt sokak ltal vitatott egysgre. A
vegylet ellltsa utn a kmikusok egyetrtettek abban, hogy a mestersges karbamid valdi karbamid,
hiszen az sszes megfelel fizikai jellemzben megegyeznek. Ehhez hasonlt, hogy a mestersges destket
ugyangy destknek nevezzk, s a mestersges megtermkenyts (a mestersges intelligencia msik mdja)
ugyanolyan megtermkenyts. Azonban a mestersges virgok nem virgok, s, amint Daniel Dennett rmutat,
a mestersges Chateau Latour bor sem lenne a klnleges Chateau Latour francia bor, mg akkor sem, ha
kmiailag megklnbztethetetlen volna, mivel nem a rgztett helyen (a francia Bordeaux-i borvidken) s
nem a rgztett mdon kszlt. Ugyangy egy mestersges Picasso-festmny akrhogy is nz ki nem volna
igazi Picasso-festmny.
Megllapthatjuk teht, hogy bizonyos esetekben az ember ksztette trgy viselkedse fontos, ms esetekben
pedig a szrmazsa. gy ltszik, megllapods krdse, hogy melyik esetben melyiket tartjuk fontosnak.
Mestersges elmk esetben nincsen ilyen megllapods, gy az intucinkra kell hagyatkoznunk. Egy filozfus,
John Searle (Searle, 1980), elg hatrozott intucival rendelkezik:
Senki sem gondolja, hogy egy vihar szmtgpes szimulcijtl elznnk. () Mi visz r
teht embereket annak felttelezsre, hogy a mentlis folyamatok szmtgpes szimulcija
mentlis folyamatokat mutatna fel?
(Searle, 1980) (3738. oldal)
Knnyen elfogadhat persze, hogy a viharok szmtgpes szimulcii senkit sem ztatnak el, az azonban
kevsb lthat, miknt lenne alkalmazhat ez az analgia a mentlis folyamatok szmtgpes szimulciira.
Hiszen amikor Hollywoodban locsolk s szlgpek segtsgvel szimulljk a vihart, elznak a sznszek. A
legtbben hatrozottan sszeadsnak tartjk az sszeads szmtgpes szimulcijt, s a sakkjtk
szmtgpes szimulcija is sakkjtk. A mentlis folyamatok vajon a viharokhoz hasonlthatk-e, vagy inkbb
az sszeadshoz s a sakkhoz? Olyanok, mint a Chateau Latour bor s Picasso, vagy mint a karbamid? Ez teljes
egszben azon mlik, hogy milyen elmletet vallunk a mentlis llapotokrl s folyamatokrl.
A funkcionalizmus (functionalism) szerint a mentlis llapotok kztes kauzlis felttelek a bemenetek s a
kimenetek kztt. A funkcionalista elmlet szerint, ha kt rendszer izomorf kauzlis folyamatokkal rendelkezik,
akkor ugyanazok a mentlis llapotai is. Egy szmtgpes programnak teht ugyanolyan mentlis llapotai
lehetnek, mint egy embernek. Azt persze mg nem hatroztuk meg, hogy az izomorf pontosan mit jelent, de
azt ttelezzk fel, hogy ltezik egy olyan absztrakcis szint, ami fltt nem szmt a specifikus implementci;
s ha a folyamatok eddig a szintig izomorfak, akkor ugyanazok lesznek a mentlis llapotok is.
Ezzel szemben a biolgiai naturalizmus (biological naturalism) szerint a mentlis llapotok magas szint
emergens tulajdonsgok, amelyeket a neuronok alacsony szint neurolgiai folyamatai okoznak, azaz a
neuronok (meghatrozatlan) tulajdonsgai a lnyegesek. A mentlis llapotokat gy teht nem lehet dupliklni
valamilyen programmal, amelynek azonos a bemenetkimenet funkcionlis struktrja, hanem az is szksges,
hogy a program olyan architektrn fusson, amelynek kauzlis eri megegyeznek a neuronokval. Az elmlet
839
Filozfiai alapok
nem mond semmit arrl, hogy a neuronok mirt rendelkeznek ilyen kauzlis ervel, s arrl sem, hogy ms
fizikai megtesteslsek rendelkezhetnek-e ezekkel az erkkel.
A kt llspont megvizsglshoz vegyk szemgyre elszr az elmefilozfia legrgibb problmjt, majd
pedig hrom gondolatksrletet.
2.1. A testelme problma

A testelme problma (mindbody problem) azt krdezi, hogy a mentlis llapotok s folyamatok miknt
kapcsoldnak a testi (specifikusan az agyi) llapotokhoz s folyamatokhoz. Ezt a krdst, mintha nem lenne elg
nehz, ltalnostani fogjuk az architektraelme problmv, hogy az elmvel rendelkez gpek
lehetsgrl beszlhessnk.
Egyltaln mi a problma a testelme problmban? Az els nehzsg Ren Descartes-ra vezethet vissza, aki
egy nem haland llek interakcijt vizsglta egy haland testtel, s egy dualista (dualist) elmletet lltott fel,
miszerint a llek s a test kt klnbz tpus dolog. A monista (monist), gyakran materialista (materialism)
nvvel is illetett elmlet szerint nincs olyan dolog, hogy halhatatlan llek, hanem csupn az anyagi objektumok
lteznek. Ennek megfelelen a mentlis llapotok (mint pldul a fjdalom, a lovagls tudata vagy az a
meggyzds, hogy Bcs Ausztria fvrosa) csupn agyllapotok. Ezt az elmletet John Searle egy tmr
szlogenben foglalta ssze: Az agy okozza az elmt.
A materialistnak legalbb kt komoly ellenvetssel kell szembeslnie. Az els a szabad akarat (free will)
problmja: hogyan lehetsges, hogy egy tisztn fizikai elme, amelynek minden talakulst szigor fizikai
trvnyek irnytjk, mgis megrzi a dnts szabadsgt? A legtbb filozfus szerint ez a problma ahelyett,
hogy a materializmusnak jelentene kihvst, inkbb a szabad akaratrl alkotott naiv fogalmunk gondos
jraalkotst ignyli. A msodik problma a tudatossg (consciousness) ltalnos tmakrhez kapcsoldik (a
problma hasonl, mint a megrts (understanding) s az ntudat (self-awareness) krdsei, habr nem
teljesen ugyanarrl van sz). A krds egyszeren ez: mirt van, hogy bizonyos agyllapotokkal rendelkezni
valamifle rzs, viszont msfajta fizikai llapotokkal rendelkezni (pldul sziklnak lenni) felteheten nem
rzs.
Ahhoz, hogy elkezdhessk megvlaszolni a krdst, az agyllapotok egy olyan megfogalmazst kell
megtallni, amely absztraktabb szint, mint az egy adott szemly agyt alkot atomok adott idpontbeli fizikai
elhelyezkedse. Pldul mikzben Ausztria fvrosra gondolok, agyam minden pikoszekundumban millird
apr vltozson megy keresztl, mgis ezek a vltozsok nem jelentik az agyllapot kvalitatv vltozst. Ennek
megfelelen be kell vezetnnk az agyllapot tpusok fogalmt, amelynek segtsgvel elklnthetk a
klnbz tpusba tartoz agyllapotok. Az egyes szerzk klnbzkppen rtik a tpus szt ebben az esetben.
A legtbbjk szerint, ha pldul vesznk egy agyat, s nhny sznatomjt ms sznatomra 3 cserljk, a
mentlis llapot mg nem vltozik meg. Ez azrt rvendetes, mert valjban az agy atomjai az anyagcserefolyamatok sorn llandan cserldnek, mgsem tnik gy, mintha ez nagy mentlis felfordulst okozna.
Vegyk most szemgyre a mentlis llapotok egy fajtjt, az intencionlis llapotoknak (intentional states) is
nevezett tletlogikai attitdket (propositional attitudes) (amelyekrl mr sz esett a 10. fejezetben). Ezek az
llapotok mint pldul a vlekeds, a tuds, a vgyakozs, a flelem s trsai olyanok, hogy bizonyos
szempontbl a kls vilgra utalnak. Az a vlekeds pldul, miszerint Bcs Ausztria fvrosa, egy bizonyos
vrosra s annak sttusra vonatkoz vlekeds. Azt fogjuk vizsglni, hogy rendelkezhetnek-e a szmtgpek
intencionlis llapotokkal, ezrt hasznos ttekinteni ezen llapotok jellemzst. Azt is lehet mondani pldul,
hogy az a mentlis llapot, hogy egy hamburgerre vgyom, klnbzik attl az llapottl, hogy egy pizzt
szeretnk, hiszen a hamburger s a pizza a valdi vilg klnbz trgyai. Msfell viszont amellett rveltnk
ppen nhny bekezdssel korbban, hogy a mentlis llapotok agyllapotok, teht az azonossgukat meg
kellene tudnunk hatrozni csupn a fejen bell maradva, minden hivatkozs nlkl a kls vilgra. A dilemma
megoldshoz vizsgljunk meg egy olyan gondolatksrletet, amely megprblja az intencionlis llapotokat
elklnteni a hozzjuk tartoz kls trgyaktl.
2.2. Az agy a tartlyban ksrlet

Kpzeljk el ha belebocstkozunk ebbe a gondolatksrletbe , hogy az agyunkat szletsnkkor kiveszik a
testnkbl, s egy csodlatos szerkezet tartlyba helyezik. Ez a tartly tpllja az agyat, lehetv tve, hogy
Esetleg a sznatom ms izotpjra, ahogyan ez az agyi kpalkot vizsglatok sorn gyakran trtnik.
840
Filozfiai alapok
nvekedjen s fejldjn. Ugyanakkor azonban egy teljessggel kitallt vilg szmtgpes szimulcijnak
elektromos ingereit vezetik az agyba, az agy motorikus ingereit pedig elfogjk, s hatsukra megfelelen
mdostjk a szimulcit.4 Ekkor az agy rendelkezhet a HallosanVgyik(n, Hamburger) mentlis llapottal,
akkor is, ha nincs is teste, amely az hsget rezn, zlelbimbi sincsenek, st taln egyltaln nincs is
hamburger a valdi vilgban. Azonosnak tekintjk-e ezt a mentlis llapotot egy testben lv agy megfelel
mentlis llapotval?
Az egyik kit a dilemmbl annak megllaptsa, hogy a mentlis llapotok tartalma kt klnbz
szempontbl rtelmezhet. A tg tartalom (wide content) nzet kpviseli a mentlis llapotok tartalmt a
mindentud kls megfigyel szemszgbl rtelmezik, amely megfigyel tltja az egsz szitucit, s
felismeri a vilg klnbsgeit. Teht a tg tartalom nzet szerint a tartlyba helyezett agy vlekedsei
klnbzk a norml szemly vlekedseitl. A szk tartalom (narrow content) nzet szerint viszont csak a
bels, szubjektv nzpontot kell figyelembe venni, s szerintk a kt vlekeds megegyezik.
Annak a vlekedsnek, hogy a hamburger zletes, bens termszete van: van valami, amihez az ilyen vlekeds
hasonlt. Most mr belptnk a qualik, a bens lmnyek birodalmba (a qualia sz a latin nyelvbl
szrmazik, megkzelt jelentse: ilyen dolgok). Tegyk fel, hogy a retina s az idegrendszer valamilyen
srlse folytn X szemly gy rzkeli a vrs sznt, mint Y a zldet, s vice versa. Ebben az esetben ugyangy
ltjk a kzlekedsi lmpt, s ugyangy is cselekszenek, de tapasztalataik valamikppen klnbzni fognak.
Mindketten elfogadhatjk, hogy tapasztalatuk neve: a lmpa vrs, de tapasztalatuk klnbz rzs lesz.
Nem vilgos, hogy mit jelent ez a mentlis llapotok megegyezst illeten. A kvetkezkben egy olyan
gondolatksrlettel foglalkozunk, amely azt vizsglja, hogy az emberi neuronokon kvl ms fizikai trgyaknak
is lehetnek-e mentlis llapotai.
2.3. Az agyprotzis-ksrlet
Az agyprotzis-ksrletet Clark Glymour vezette be a hetvenes vek kzepn, majd John Searle (Searle, 1980) is
finomtott rajta, de manapsg leginkbb Hans Moravec (Moravec, 1988) munkssgval szoks sszefggsbe
hozni. A ksrlet a kvetkez. Tegyk fel, hogy a neurofiziolgia eljutott odig, hogy tkletesen megrtette az
emberi agy sszes neuronjnak bemenetikimeneti jellemzit s sszekapcsoldst. Tegyk fel tovbb azt is,
hogy kpesek vagyunk olyan mikroszkopikus mret elektronikus berendezseket pteni, amelyek utnozni
tudjk ezeket a jellemzket, s problmamentesen hozzilleszthetk az idegszvethez. Vgl pedig tegyk fel
azt is, hogy valamilyen csodlatos sebszi technikval anlkl tudjuk az egyes neuronokat a megfelel
elektronikus eszkzkkel helyettesteni, hogy az agy egszben vett mkdse megszakadna. A ksrlet abbl
ll, hogy valaki fejben az sszes neuront elektronikus eszkzkkel helyettestik, majd pedig a folyamat
visszafordtsval visszajuttatjuk az illett a normlis biolgiai llapotba.
A szemlynek mind a mtt sorn tanstott kls viselkedse, mind bels tapasztalatai rdekelnek minket. A
ksrlet alanynak kls viselkedsnek definci szerint vltozatlannak kell maradnia az operci nlkl
megfigyelhet viselkedshez kpest.5 A ksrlet alanynak azonban egyben kpesnek kell lennie arra, hogy
noha a tudatossg hinyt vagy jelenltt egy harmadik szemly nehezen llapthatja meg beszmolt adjon a
tudatos tapasztalatt rt vltozsokrl. A trtntekre vonatkoz klnbz intuciink nyilvn ellentmondanak
egymsnak. Moravec szerint, aki robotkutat s funkcionalista, vltozatlan maradna a tudata. A filozfus s
biolgiai naturalista Searle azonban ugyanilyen ersen vallja, hogy a tudata eltnne:
Azt fogod szrevenni legnagyobb megdbbensedre , hogy a kls viselkedsed irnytsa
mintegy kicsszik a kezeid kzl. Azt veszed szre, hogy pldul amikor az orvosok
vizsgljk a ltsodat, hallod ket, amint azt mondjk: Egy piros trgyat tartunk n eltt,
krjk, mondja el, mit lt. Ez a kilts trne ki belled: Semmit sem ltok. Teljesen
megvakulok. De hallod a sajt hangodat, amint befolysodtl teljesen fggetlenl ezt
mondja: Egy vrs trgyat ltok magam eltt. () Tudatos tapasztalatod lassan semmiv
zsugorodik, de a kls, megfigyelhet viselkedsed vltozatlan marad.
(Searle, 1992)
Mindannyian csak intucink alapjn tudunk rvelni. Elszr vegyk szre, ahhoz, hogy a kls viselkeds
vltozatlan maradjon, mialatt a ksrlet alanya fokozatosan elveszti a tudatt, az akaratnak egyik pillanatrl a
msikra hirtelen s teljesen kell eltnnie; klnben a tudat zsugorodsa befolysoln a kls viselkedst
pldul ilyesmi szavak hangzannak el: Segtsg, eltnben vagyok! Elg valszntlenl hangzik azonban,
4
5
Ez a helyzet ismers lehet azoknak, akik lttk az 1999-ben kszlt Mtrix (The Matrix) c. filmet.
El tudunk kpzelni egy azonos kontrollszemlyt, akin egy placeboopercit hajtanak vgre, hogy a kt viselkedst sszevethessk.
841
Filozfiai alapok
hogy a neuronok egyenknti lecserlse az akarat hirtelen, egyik lpsrl a msikra trtn teljes eltnshez
vezetne.
Msodszor pedig nzzk meg, mi trtnik akkor, ha a ksrlet alanyt az alatt az id alatt krdezzk tudatos
tapasztalatairl, amikor egyetlen igazi neuron sincs jelen az agyban. A ksrlet felttele szerint olyasfle
vlaszokat kell kapnunk, mint Jl rzem magam. Meg kell mondanom, egy kicsit meg vagyok lepdve, hiszen
elhittem, amit Searle mondott. Vagy pedig egy mutatplcval egy kicsit megszrhatjuk a ksrleti alanyt s
megfigyelhetjk vlaszt: Juj, ez fj. Viszont norml krlmnyek kztt a mestersges intelligencia
programok ilyen kimeneteit a szkeptikus elutasthatja, mint egyszer ltszatvlaszokat. Hiszen elg knny
elkpzelni egy olyan szablyt, mint pldul: Ha a 12-es szenzoron Magas rtk jelenik meg, adj ki Juj!-t.
A lnyeg azonban az, hogy mivel a norml emberi agy sszes funkcionlis tulajdonsgt tmsoltuk,
felttelezhetjk, hogy elektronikus agyunk nem tartalmaz ilyen ltszatvlasz-mechanizmusokat. Azaz az
elektronikus agy ltal ltrehozott tudati megnyilvnulsokra olyan magyarzatot kell adnunk, amely csak a
neuronok funkcionlis tulajdonsgaira hivatkozik. Ennek a magyarzatnak azonban a vals agyra is
vonatkoznia kell, amelynek ugyanazok a funkcionlis tulajdonsgai. Ezrt, gy tnik, ktfajta konklzi
lehetsges.
1. A tudat kauzlis mechanizmusai, amelyek ezt a kimenetet a normlis agyban ltrehozzk, ugyangy
mkdnek az elektronikus vltozatban is, amely teht tudatos.
2. A normlis agy tudatos mentlis esemnyeinek semmilyen kapcsolata nincs a viselkedssel, valamint
nincsenek is jelen ezek az esemnyek az elektronikus agyban, amely teht nem tudatos.
A msodik lehetsget ugyan nem zrhatjuk ki, de ez arra redukln a tudatot, amit a filozfusok
epifenomenlis (epiphenomenal) szereplnek neveznek: valami: ami megtrtnik ugyan, de mintha nem is
vetne rnykot a megfigyelhet vilgban. Valamint ha a tudat tnyleg epifenomn, akkor az agyban lennie kell
egy msodik, nem tudatos mechanizmusnak, amelyhez a Juj! tartozik.
Harmadszor pedig tekintsk az operci visszacsinlsa utni helyzetet, amikor a ksrlet alanynak ismt
normlis agya van. Emlkezznk arra, hogy a definci szerint a ksrleti alany kls viselkedsnek olyannak
kell lennie, mintha az operci nem is trtnt volna meg. Ennek specilis eseteknt fel kell tudnunk tenni azt a
krdst: Milyen volt az operci alatt? Emlkszik a mutatplcra? A ksrleti alanynak pontos
emlknyomokkal kell rendelkeznie a tudatos tapasztalatai tnyleges termszetrl, belertve a qualit is;
mindannak ellenre, hogy Searle szerint nem is voltak ilyen tapasztalatai.
Searle taln azzal vlaszolna, hogy nem jl definiltuk a ksrletet. Ha a valdi neuronokat visszahelyezskkor
gy keltjk letre, ami az eltvoltsuk ta eltelt idt nem tkrzi, akkor termszetesen nem fognak emlkezni
az operci alatti tapasztalatokra. Hogy erre az eshetsgre is felkszljnk, a visszahelyezskor a mestersges
neuronok bels llapotnak megfelelen mdostanunk kell az ket helyettest neuronok llapott. Ha a valdi
neuronok felttelezett nem funkcionlis aspektusai ekkor egy olyan viselkedst eredmnyeznnek, amely
funkcionlisan klnbzik attl, mint amely a mestersges neuronok bent hagysval megfigyelhet lenne,
akkor reductio ad absurdumhoz jutnnk, mert ez azt jelenti, hogy a mestersges neuronok funkcionlisan nem
ekvivalensek a valdi neuronokkal. (A 26.3. feladat egy lehetsges utat mutat ezen rv cfolatra.)
Patricia Churchland (Churchland, 1986) rmutat arra, hogy ha a funkcionalista rv mkdik a neuronok szintjn,
akkor mkdnie kell brmely nagyobb funkcionlis egysg szintjn is, legyen az akr neuronok egy halmaza,
egy mentlis modul, egy lebeny, egy agyflteke vagy akr az egsz agy. Ezek szerint, ha elfogadjuk, hogy az
agyprotzis ksrlet tanulsga a tudat megmaradsa az agy kicserlse sorn, akkor azt is el kell fogadnunk,
hogy a tudat akkor is megmarad, ha az egsz agyat lecserlik egy ramkrre, amely csak annyit tesz, hogy a
bemenetekhez tartoz kimeneteteket visszakeresi egy risi tblzatban. Ez zavarba hozza a legtbb embert
(belertve magt Turingot is), akik intucija szerint a visszakeres tblk nem tudatosak, vagy legalbbis az
ltaluk generlt tudati tapasztalatok nem azonosak azokkal a tapasztalatokkal, amelyeket egy olyan rendszer
generlna, amit le lehetne rni gy (akr csak az egyszeren vett szmtsi rtelemben), mint ami hiedelmeket,
nismeretet, clokat s hasonlkat tart nyilvn s hoz ltre. Mindez sugallja, hogy ha meg akarjuk rizni az
agyprotzis-ksrletet mint az intucinkat vezrl segdeszkzt, akkor nem folyamodhatunk az agy egy
lpsben trtn lecserlshez, de azt nem jelenti, hogy knytelenek lennnk a lpsenknti neuroncserhez
folyamodni, amit Searle szeretne velnk elrni.
2.4. A knai szoba
842
Filozfiai alapok
Legutols gondolatksrletnk valsznleg egyben a leghresebb is. John Searle (Searle, 1980) gondolta ki, s
egy olyan hipotetikus rendszert r le, amely ltnivalan egy programot futtat, s megfelel a Turing-teszten; de
ugyanilyen vilgos az is (legalbbis Searle szerint), hogy semmit sem rt meg a bemenetei s kimenetei kzl.
Konklzija szerint teht a megfelel program futtatsa (azaz a megfelel vlaszok meglte) nmagban mg
nem elgsges felttele az elmemivoltnak.
A rendszer egy csak angolul rt emberbl ll, akinek egy angol nyelven rt szablyknyve s tbbfajta
paprhalmaza van, melyek kzl nmely paprhalmaz res, nmelyen pedig valamilyen rthetetlen jelsorozat ll.
(Teht az ember a CPU szerept jtssza, a szablyknyv a programnak, a paprhalmazok pedig a
troleszkznek felelnek meg.) A rendszer egy szobban tallhat, amelynek csak egy kis nylsa van a
klvilgra. Ezen a nylson keresztl rthetetlen felirat paprcetlik jelennek meg. Az ember megtallja a
szablyknyvben ezeket a szimblumokat, s kveti az ott lertakat. Az utastsok kztt szerepelhet, hogy rjon
le szimblumokat j paprcdulkra, keressen szimblumokat a paprhalmazokban, rendezze t a halmazokat s
hasonlk. Vgl, az utastsok kvetkezmnyeknt, egy vagy tbb szimblumot egy paprdarabra msol, s
kiadja a klvilgba.
Fontos
Eddig minden knnyen kvethet. De kvlrl nzve azt ltjuk, hogy a rendszer knai mondatokat
fogad, knai mondatokat ad vissza, s ez a prbeszd nyilvnvalan ppannyira intelligens, mint amit
Turing elkpzelt.6 Searle ennek alapjn gy rvel: a szobban lv szemly nem rt knaiul (ez adott). A
szablyknyv s a paprcetlik, lvn ezek csak paprok, szintn nem rtenek knaiul. Ebbl az
kvetkezik, hogy a knai nyelv semmifle megrtse nem zajlik le. Teht Searle szerint a megfelel
program futtatsa nem vezet szksgszeren a megrtshez.
Turinghoz hasonlan Searle is megvizsglt nhny lehetsges ellenvetst az rvvel szemben, s meg is prblta
visszautastani ezeket. Tbb kommenttor, kztk John McCarthy s Robert Wilensky, azt hozta fel, amit Searle
rendszervlasznak nevez. Az ellenvets abban ll, hogy ugyan feltehet az a krds, miszerint a szobban lv
szemly rt-e knaiul, de ez olyan, mint ha azt krdeznnk, hogy a CPU tud-e kbgykt vonni. Mindkt esetben
nemmel kell felelnnk, de mindkt esetben lltjk a rendszervlasz hvei a rendszer egsze igenis
rendelkezik a krdses kpessggel. Az biztos, hogy ha megkrdezzk a knai szobt, rt-e knaiul, a vlasz
igenl lesz (mghozz folykony knaisggal). Turing udvarias felttelezse szerint ennyi elegend is.
Vlaszban Searle ismtelten rmutat arra, hogy sem az ember, sem a paprhalmaz nem tud knaiul, teht
semmilyen knaiul rts sem lehetsges. Tovbb hozzteszi, az is elkpzelhet, hogy az ember megtanulja a
szablyknyvet, s a cetlik tartalmt is a fejben tartja, teht csupn az ember az, aki knaiul tudhatna, ha
azonban megkrdezzk t (angolul), akkor a vlasza nemleges lesz.
Most mr a lnyegi krdsnl vagyunk. A paprok tartalmnak memorizlsa csak elterel hadmvelet, hiszen
mindkett ugyangy egy fut program fizikai megtesteslse. Searle igazi lltsa a kvetkez ngy aximn
alapszik (Searle, 1990):
1. A szmtgpprogramok formlis, szintaktikai entitsok.
2. Az elmnek mentlis tartalma, azaz szemantikja van.
3. A szintaktika nmagban mg nem elgsges a szemantikhoz.
4. Az elmt az agy okozza.
Az els hrom aximbl arra a kvetkeztetsre jut, hogy a programok nem elgsgesek az elmhez. Msknt
megfogalmazva: ugyan lehet elme egy programot futtat gens, de nem lesz szksgszeren elme csupn a
program futtatsa miatt. A negyedik aximbl pedig arra a kvetkeztetsre jut, hogy brmely ms
rendszernek, amely kpes elmt okozni, az aggyal (legalbb) megegyez kauzlis erkkel kell rendelkeznie.
Ebbl pedig arra jut, hogy brmely mestersges agynak nem elg csupn egy adott programot futtatni, hanem
dupliklnia kell az agy kauzlis erit, valamint hogy az emberi agy a mentlis jelensgeket nem csupn egy
program futtatsa rvn hozza ltre.
Az, hogy a paprhalmaz taln nagyobb, mint az egsz bolyg, s hogy a vlaszok ltrehozsa milli vekig eltarthat, az rv logikai
struktrjt nem rinti. A filozfiai kpzs egyik clja ppen az, hogy kialakuljon egy kifinomult rzk, amellyel klnvlaszthatk a
relevns s az irrelevns ellenvetsek.
6
843
Filozfiai alapok
Az a vgkvetkeztets, hogy az elmkhez nem elgsgesek a programok, igenis kvetkezik az aximkbl

(amennyiben elg nagyvonalan rtelmezzk azokat). De a konklzi nem elgt ki bennnket: Searle csupn
azt bizonytotta be, hogy ha kifejezetten elutastjuk a funkcionalizmust (ahogy ezt a 3. aximjval teszi), akkor
nem lehet szksgszeren lltani azt, hogy a nem-agyak is elmk volnnak. Ez teljesen elfogadhat, gy ht az
egsz rv arra jut, hogy elfogadhat-e a 3. axima. Searle szerint a knai szoba rvek ppen az a lnyege, hogy
intucit ad a 3. axima elfogadshoz. De az rvre adott reakcik azt mutatjk, hogy csak azoknak nyjt
intuitv alapot, akik mr eleve hajlanak annak elfogadsra, hogy a programok nmagukban nem hozhatnak
ltre igazi megrtst.
Megismtelve teht, a knai szoba rv clja az, hogy megcfolja az ers MI-hipotzist: azt az lltst, miszerint a
helyes vltozat program futtatsa szksgszeren elmt eredmnyez. gy mkdik az rv, hogy bemutat egy
ltszlag intelligens, a megfelel tpus programot futtat rendszert, amely Searle szerint bizonythatan nem
elme. Ennl a rsznl azonban Searle az intucira s nem egy bizonytkra tmaszkodik: nzzk csak a szobt,
hol lenne itt az elme? De ez az rv ugyangy felhozhat az aggyal kapcsolatban is: nzznk r a sejtek (vagy az
atomok) sokasgra, amelyek vakon mkdnek a biokmia (vagy a fizika) trvnyei szerint hol lenne itt az
elme? Mirt tud egy nagy darab agy elme lenni, amikor egy nagy darab mj nem?
Tovbbmenve, amikor Searle beismeri, hogy elmletileg a neuronoktl klnbz anyag is lehet elme, akkor kt
okbl is tovbb gyengl az rve: egyrszt csak Searle intuciira (vagy a sajt intucinkra), tmaszkodhatunk,
hogy eldntsk, elme-e a knai szoba; msrszt, mg ha gy is dntnk, hogy a szoba nem elme, ez semmit nem
mond arrl, hogy a programot futtat ms fizikai kzeg (pldul a szmtgp) lehet-e elme.
Searle megengedi azt a logikai lehetsget, hogy az agy ppensggel egy hagyomnyos tpus logikai
programot valst meg; de ugyanazt a programot egy rosszfajta gpen futtatva nem kapnnk elmt. Searle
tagadja, hogy azt gondoln, a gpeknek nem lehet elmje, st azt lltja, hogy bizonyos gpeknek igenis van
elmje: az emberek elmvel rendelkez biolgiai gpek. Nem hagy azonban tl sok tmutatst afell, hogy az
elmvel rendelkezs a gpek milyen csoportjra terjed ki.
3. A mestersges intelligencia fejlesztsnek etikai

krdsei s kockzatai
Mindeddig arra sszpontostottunk, hogy kpesek vagyunk-e kifejleszteni egy mestersges intelligencit, most
azt is meg kell vizsglnunk, hogy kell-e ezt tennnk. Amennyiben az MI-technolgik hatsai tbbsgben
inkbb negatvak, mint pozitvak lennnek, akkor morlis felelssge lenne az ezen a terleten dolgozknak,
hogy ms terletekre helyezzk kutatsukat. Sok j technolgia jrt akaratlanul is negatv mellkhatsokkal: a
bels gs motor a lgszennyezst hozta s azt, hogy mg az denkertet is leaszfaltoztk, a maghasads
felfedezse pedig a csernobili s a Three Mile Island-i7 atomkatasztrfkat hozta, s a globlis pusztuls
veszlynek fenyegetst. Minden tudsnak s mrnknek szembe kell nznie a munkjukkal kapcsolatos etikai
krdsekkel: mely projekteket szabad befejezni, s melyeket nem, s hogyan kell ezeket a projekteket kezelni.
Mg egy Ethics of Computing (Berleur s Brunnstein, 2001) c. kziknyv is ltezik. A mestersges intelligencia
azonban, gy tnik, nhny j problmt is felvet, azon tl, hogy olyan hidakat akarunk pteni, amelyek nem
dlnek ssze:
Az emberek az automatizci miatt elveszthetik a munkjukat.
Az embereknek tl sok (vagy tl kevs) szabadidejk marad.
Az emberek elveszthetik az egyedisgrzsket.
Az emberek elveszthetik a szemlyisgi jogaik egy rszt.
Az MI-rendszerek alkalmazsa megszntetheti a felelssgre vonhatsgot.
A mestersges intelligencia sikere az emberi faj vgt jelentheti.
Sorra vesszk mindegyik felvetett problmt.
Az Egyeslt llamok eddigi legslyosabb atombalesetnek helyszne Pennsylvania llamban. Az 1979-ben trtnt baleset ugyan rendkvl
megrzta az amerikai kzvlemnyt, de kros egszsggyi kvetkezmnyeit tekintve nem mrhet a csernobili esethez. (A ford.)
7
844
Filozfiai alapok
Az emberek az automatizci miatt elveszthetik a munkjukat. A modern ipari gazdasg ltalban vve fggv
vlt a szmtgpektl, st nhny klnleges MI-programtl is. A gazdasg nagy rsze pldul, klnsen az
Egyeslt llamokban, a fogyaszti hiteltl fgg. A hitelkrtya-krelmek elbrlst, a lehvsok engedlyezst
s a visszalsek feldertst napjainkban mestersges intelligencia programok vgzik. Azt is mondhatn valaki,
hogy ezek a programok tbb ezer dolgozt tettek munkanlkliv, de valjban, ha elvennnk ezeket a
mestersges intelligencia programokat, nem is lteznnek ilyen llsok, mert az emberi munka elviselhetetlen
tbbletkltsget rna ezekre a tranzakcikra. A mestersges intelligencit hasznl gpests mindeddig tbb
llst hozott ltre, mint ahnyat megszntetett, s ezek az j llsok rdekesebbek, s jobban fizetnek. Ma mr,
amikor a mestersges intelligencia programokat az embereket segt intelligens genseknek tekintik,
kevesebben flnek a munkahelyk elvesztstl, mint amikor a mestersges intelligencia clja az embereket
helyettest szakrti rendszerek ltrehozsa volt.
Az embereknek tl sok (vagy tl kevs) szabadidejk marad. Alvin Toffler a Future Shock-ban (Toffler, 1970)
ezt rta: A szzadfordul ta a munkaht 50%-kal cskkent. Nem lg ki a sorbl ha azt jsoljuk, hogy 2000-re
ismt felvel cskken. Arthur C. Clarke (Clarke, 1968b) azt rta, hogy 2001-ben az emberek taln mr a teljes
unalommal nznek szembe, ahol az let legnagyobb problmja a tbb szz tv-csatorna kzti vlaszts lesz. Az
egyetlen ezen jslatok kzl, amelyik kzel ll a megvalsulshoz, az a tv-csatornk szma (Springsteen, 1992).
Valjban a tudsintenzv ipargakban dolgoz emberek egy 24 rban mkd, integrlt szmtgpestett
rendszer rszv vlnak, s ahhoz, hogy lpst tartsanak, hosszabb munkarkra lettek knyszertve. Az ipari
gazdasgban a jutalom kzeltleg egyenesen arnyos a befektetett idvel; 10%-kal tbb munka tbb-kevsb
10%-os bevtelnvekedst jelent. Az informcis gazdasgban, amelyet a nagy svszlessg kommunikci s
a szellemi tulajdon knny replikcija jellemez (ezt nevezi Frank s Cook a-gyztes-mindent-visz
trsadalom-nak) (Frank s Cook, 1996), nagy jutalom jr azrt, ha valaki csak egy kicsit is jobb a versenyben:
10%-kal tbb munka akr 100%-os bevtelnvekedst is jelenthet. Ezrt egyre nvekv nyoms nehezedik
mindenkire, hogy kemnyebben dolgozzon. A mestersges intelligencia nveli a technolgiai innovci temt,
teht hozzjrul ehhez az ltalnos trendhez, de egyben a mestersges intelligencia tartalmazza annak grett is,
hogy az automatizlt gensek kicsit tvllaljk a teendket s egy kis idhz juttatnak minket.
Az emberek elveszthetik az egyedisgrzsket. Weizenbaum, az ELIZA program szerzje, Computer Power and
Human Reason (Weizenbaum, 1976) c. mvben rmutat nhny potencilis veszlyre, amelyeket a mestersges
intelligencia jelent a trsadalom szmra. Weizenbaum egyik f rve az, hogy a mestersges intelligencia
kutatsa lehetv teszi annak elkpzelst, hogy az emberek automatk volnnak, amely elgondols az
autonmia, vagy akr a humanits rzsnek megsznshez vezet. Vegyk szre azonban, hogy ez az
elkpzels jval rgebb ta van jelen, mint a mestersges intelligencia: legalbbis a LHomme Machine (La
Mettrie, 1748) c. knyvig vezethet vissza. Azt is vegyk szre, hogy az emberisg tllte mr az
egyedisgrzsnek ms cskkenseit is: A De Revolutionibus Orbium Coelestium (Kopernikusz, 1543)
kimozdtotta a Fldet a Naprendszer kzpontjbl, s a Descent of Man (Darwin, 1871) pedig a Homo sapienst
egy szintre helyezte a tbbi fajjal. A mestersges intelligencia, amenynyiben szles krben sikeres lesz, ppen
gy veszlyt jelenthet a 21. szzad morlis felttelezseire, ahogyan Darwin evolcis elmlete fenyegette a 19.
szzad morlis felttelezseit.
Az emberek elveszthetik a szemlyisgi jogaik egy rszt. Weizenbaum arra is rmutatott, hogy a
beszdfelismersi technolgia a lehallgats elterjedshez, s gy a polgri jogok vesztesghez vezethet. Nem
lthatta elre azt a vilgot, ahol a terrorista fenyegetettsg megvltoztatja, hogy az emberek mennyi
megfigyelst hajlandk elfogadni, azt azonban helyesen ismerte fel, hogy a mestersges intelligencia a tmeges
megfigyels eszkzv vlhat. Jslata taln mr valra is vlt: az Egyeslt llamok kormnynak titkos
Echelon-rendszere felvevllomsok, antennamezk s radarllomsok hlzatbl ll, a rendszert nyelvek
kzti fordtst, beszdfelismerst s kulcsszavas keresst hasznl szmtgpek tmogatjk, amelyek a telefon-,
az e-mail, a fax- s a telexforgalmat vizsgljk vgig.8 Nhnyan elfogadjk, hogy a szmtgpests a
magnszfra vesztesghez vezet. Scott McNealy, a Sun Microsystems vezetje azt mondta: Amgy is nulla a
magnszfrd. Felejtsd el. Msok nem rtenek ezzel egyet: Louis Brandeis br 9 ezt rta 1890-ben: A
magnszfrhoz val jog minden jogok legalapvetbbike () a jog az ember sajt szemlyisghez.
Az MI-rendszerek alkalmazsa megszntetheti a felelssgre vonhatsgot. Az Egyeslt llamokban ma
uralkod peresked kzhangulat fontos krdss tette a jogi felelssget. Amikor egy orvos a diagnzis
fellltsakor egy orvosi szakrti rendszer tletre hagyatkozik, ki tehet felelss a diagnzis hibjrt?
Szerencss mdon, s ez rszben a dntselmleti megkzelts orvoslsra gyakorolt egyre nvekv
befolysnak ksznhet, ma mr elfogadott alapelv, hogy az orvos, aki vgrehajtja a nagy vrhat hasznossgi
8
9
Lsd Eavesdropping on Europe, Wired hrmagazin, 9/30/1998 s a hivatkozott EU-jelentseket.

Amerikai jogsz s jogi kzr, a mlt szzad els felben a Legfelsbb Brsg tagja. (A ford.)
845
Filozfiai alapok
rtk beavatkozsokat, akkor sem vdolhat hanyagsggal, ha ezeknek a beavatkozsoknak katasztroflisak a

tnyleges kvetkezmnyei a pciensnl. A krds ezek utn a kvetkez: Kinek a hibja, ha a diagnzis nem
plauzbilis? Mindeddig a brsgok gy tartottk, hogy az orvosi szakrti rendszerek ugyanazt a szerepet
tltik be, mint az orvosi tanknyvek s kziknyvek: az orvosoknak felelssge, hogy megrtsk a dntsek
indoklst, s sajt megtlsk alapjn kell hatrozniuk, hogy elfogadjk-e a rendszer javaslatt. Teht ha az
orvosi szakrti rendszereket gensekknt tervezzk, akkor cselekvseiket nem gy kell tekinteni, mint ami
kzvetlenl kihat a pciensre, hanem mint ami befolysolja az orvos viselkedst. Ha a szakrti rendszerek
megbzhatbban pontosabbak lesznek, mint a diagnzisokat felllt emberek, akkor az orvosok akr jogilag is
felelsek lehetnek, ha nem hasznljk fel a rendszer javaslatait. Gawande (Gawande, 2002) ezt a felttelezst
trkpezi fel.
Hasonl krdsek kezdenek megjelenni az interneten hasznlt intelligens gensekkel kapcsolatban. Mr elrtek
egy kis haladst knyszerfelttelek beptsvel az gensekbe, hogy pldul ne okozhassanak krokat ms
felhasznlk llomnyaiban (Weld s Etzioni, 1994). Amikor pnz is gazdt cserl, a problma mr nagyobb.
Amikor egy pnzgyi tranzakci sorn egy intelligens gens valaki nevben jr el, felels-e ez a szemly a
keletkez adssgokrt? Lehetsgess vlhat-e, hogy egy intelligens gensnek pnzgyi kintlvsge legyen, s
a sajt nevben eljrva elektronikus tranzakcikat hajtson vgre? Mindeddig nem ltszanak vilgosnak ezek a
krdsek. Tudomsunk szerint eddig egy program sem kapta meg azt a jogi sttust, hogy individuumknt
pnzgyi tranzakcikat hajthasson vgre, s jelenleg ez nem is ltszik indokoltnak. A valdi autplykon sem
tekintik a kzlekedsi szablyok betartatsakor vezetnek a programokat. A kaliforniai jogban legalbbis
semmilyen jogi szankci nincsen, amely megakadlyozhatn, hogy egy automata jrm tllpje a
sebessghatrt, noha baleset esetn felelss tehet a jrm vezrlmechanizmusnak tervezje. Csakgy, mint
az emberi megtermkenytsi technolgia esetn, a jog mg nem vette fel a lpst az j fejlemnyekkel.
A mestersges intelligencia sikere az emberi faj vgt jelentheti. Gyakorlatilag brmely technolgiban benne
rejlik a lehetsg, hogy krt okozzon rossz kezekben, de a mestersges intelligencia s a robotika esetben ezek
a rossz kezek akr maghoz a technolgihoz is tartozhatnak. Szmtalan sci-fi szl figyelmeztet jelknt arrl,
hogy robotok vagy robot-ember kiborgok mokfutst rendeznek. Marry Shelley Frankenstein, or the Modern
Prometheus (Shelley, 1818)10 c. mve s Karel Capek R.U.R. c. drmja, amelyben a robotok meghdtjk a
vilgot, korai pldi az ilyen trtneteknek. Mozifilmek is szlnak errl: a The Terminator (1984) a robotokleigzzk-a-vilgot klisit az idutazssal tvzi, a The Matrix (1999) pedig ugyanezt az agyak-a-tartlyban-nal
kombinlja.
gy tnik, legtbb esetben a robotok azrt fszerepli olyan sok vilg-leigzsa trtnetnek, mert az ismeretlent
jelkpezik, csakgy, mint a korbbi mesk boszorknyai s szellemei. Jelentenek-e a boszorknyoknl s a
szellemeknl komolyabb veszlyt? Valsznleg nem: ha a robotokat megfelelen, azaz olyan gensekknt
tervezik, amelyek a gazdik cljait teljestik, akkor a jelenlegi tervezs lpsenknti elrehaladsbl szrmaz
robotok szolglni fognak, nem pedig leigzni. Az emberek azrt hasznljk agresszven az intelligencijukat,
mert a termszetes kivlasztds miatt velk szletett agresszivitssal rendelkeznek. De a gpek, amiket
magunk ptnk, nem szletnek agresszvnak, hacsak nem dntnk gy, hogy ilyennek ptjk ket. Msrszt
viszont lehetsges, hogy a szmtgpek meghdtanak minket abban az rtelemben, hogy szolglatukkal
elengedhetetlenn vlnak, csakgy, mint az autk meghdtottk (ebben az rtelemben) az iparosodott vilgot.
Egy forgatknyv rszletesebb tanulmnyozst rdemel. I. J. Good (Good, 1965) rta ezt:
Definiljuk az ultraintelligens gpet olyan gpknt, amely messze tlhaladja a lehet
legintelligensebb ember intellektulis tevkenysgt is. Mivel a gpek tervezse az
intellektulis tevkenysgek egyike, egy ultraintelligens gp mg jobb gpeket tud tervezni;
nem krds, hogy egy intelligenciarobbans trtnne, ami messze lehagyja az emberi
intelligencit. Az ultraintelligens gp gy egyben az emberisg utols szksges felfedezse,
feltve persze, hogy a gp elg engedelmes, s elmondja, hogyan tarthatjuk ellenrzsnk
alatt.
I. J. Good
Az intelligenciarobbans-t technolgiai szingularitsnak (technological singularity) is nevezte a
matematika-professzor s sci-fi r Vernor Vinge, aki gy fogalmaz (Vinge, 1993): Harminc ven bell
rendelkezni fogunk a technolgiai eszkzkkel egy emberfeletti intelligencia ltrehozsra. Rviddel ezutn
befejezdik az ember korszaka. Good s Vinge (s mg sokan msok) jl figyelik meg, hogy a technolgiai
fejlds jelenleg az exponencilis grbe szerint n (gondoljunk csak a Moore-trvnyre). Azonban ebbl csak
egy elreugrssal lehet arra kvetkeztetni, hogy ez a grbe gy fog folytatdni a kzel vgtelen nvekeds
10
Charles Babbage-ra is hatssal volt fiatalemberknt a Frankeinstein olvassa.
846
Filozfiai alapok
szingularitshoz. Eddig minden ms technolgia egy S alak grbt kvetett, ahol az exponencilis nvekeds
vgl lecsengett.
A bekvetkez szingularitsrl r Vinge-et rmti ez a lehetsg, de ms szmtgptudsok s futuristk
rmmel vrjk. Hans Moravec a Robot: Mere Machine to Transcendent Mind c. rsban azt jsolja, hogy a
robotok tven ven bell elrik az emberi intelligencit, majd pedig meghaladjk azt. Ezt rja:
Egsz gyorsan kiszortanak minket a ltezsbl. Msokkal szemben engem ez a lehetsg nem
tlt el aggodalommal, n ezeket a jvbeli gpeket a leszrmazottainknak, elmebeli
gyermekeink-nek tartom, akiket kpnkre s hasonlatossgunkra ptettnk, nmagunkknt
egy jval nagyobb kpessg alakban. A korbbi genercik biolgiai gyermekeihez
hasonlan az emberisg hossz tv jvrl alkotott legjobb remnyt testestik meg. Bels
ktelessgnk minden elnyt megadni nekik s ellpni tjukbl, ha mr tbbet nem tudunk
segteni.
(Moravec, 2000)
A The Age of Spiritual Machines (Kurzweil, 2000) c. mvben Ray Kurzweil azt jsolja, hogy 2000-re mr
ers trend lesz sszekapcsolni az emberi gondolkodst az eredetileg az emberi faj teremtette gpek vilgval.
Mg egy j sz is van: transzhumanizmus (transhumanism), amely az ezt a jvt vr aktv trsadalmi
mozgalmat jelli. Elegend csak annyit mondani, hogy az ilyen krdsek kihvst jelentenek a legtbb mai
erklcsi gondolkodnak, akik az emberi let s az emberi faj megrzst j dolognak tartjk.
Gondoljunk bele vgl a robotok nzpontjba. Ha a robotok tudatoss vlnak, akkor immorlis lehet puszta
gpknt kezelni ket (pldul darabokra szedni). A robotoknak maguknak is morlisan kell cselekednik:
beljk kell programozni a j s a rossz elmlett. A sci-fi rk, kezdve Isaac Asimovval (Asimov, 1942), mr el
is kezdtek foglalkozni a robotjogok s robotfelelssgek krdseivel. A jl ismert Mestersges intelligencia
(A.I.) (Spielberg, 2001) c. mozifilm Brian Aldiss trtnetn alapul, amelyben egy intelligens robot, akit arra
programoztak, hogy embernek kpzelje magt, kptelen feldolgozni, hogy nem kell tulajdonos-anyjnak. A
trtnet (s persze a film) a robotok polgrjogi mozgalmnak megalapozottsgrl gyzhet meg egyeseket.
4. sszefoglals
Ebben a fejezetben a kvetkez krdsekkel foglalkoztunk:
A filozfusok szhasznlata szerint a gyenge MI kifejezs azt a feltevst jelenti, hogy a gpek valsznleg
kpesek intelligensen viselkedni, az ers MI pedig azt a feltevst, hogy az ilyen gpek elmvel
rendelkezknek szmtannak (s nem elmt szimullknak).
Alan Turing visszautastotta a Tudnak-e gondolkodni a gpek? krdst, s egy viselkedsi tesztet lltott a
helybe. Sok, a gondolkod gpek lehetsgvel szemben felhozhat ellenvetst megellegezett. A
mestersges intelligencia kutati kzl kevesen szentelnek figyelmet a Turing-tesztre, elnyben rszestik, ha
a rendszerek gyakorlati problmamegold kpessgre sszpontostunk, nem pedig az emberek utnzsra
val kpessgkre.
A modern korban ltalnosan egyetrtenek abban, hogy a mentlis llapotok agyllapotok.
Sem az ers MI ellen, sem a mellette felhozhat rvek nem meggyzk. Kevs els vonalbeli MI-kutat
gondolja azt, hogy brmi fontos is fgg ennek a vitnak a kimeneteltl.
A tudatossg rejtly maradt.
A mestersges intelligencia s a kapcsold technolgik ltal a trsadalomra jelentett veszlyek hat fajtjt
azonostottuk. Arra a kvetkeztetsre jutottunk, hogy nhny veszly valszntlen, kett azonban tovbbi
megfontolst rdemel. Az els az, hogy az ultraintelligens gpek, a maitl nagyon klnbz, mde rnk
nzvst korntsem kedvez jvhz vezethetnek. A msodik pedig az, hogy a robottechnolgia a
pszichopatknak is a kezbe adhatja a tmegpusztt fegyverek kulcst. Arra jutottunk azonban, hogy ez a
fenyegets inkbb szrmazik a biotechnolgibl s a nanotechnolgibl, mintsem a robotikbl.
847
Filozfiai alapok
Az elme termszete az kortl napjainkig a filozfiai elmletalkots lland tmja. Platn a Phaidn c.
dialgusban kifejezetten megvizsglta, majd elvetette azt a lehetsget, hogy az elme a test rszeinek
egybehangoltsga, szervezdsi mintja lenne (ez az llspont kzelt ahhoz, amit a modern elmefilozfiban
funkcionalizmusnak neveznk). Ehelyett arra az llspontra helyezkedett, hogy az elme egy halhatatlan, nem
anyagi llek, amely a testtl elvlaszthat, s szubsztancijban (lnyegi alkotelemt tekintve) klnbzik: ez a
dualizmus llspontja. Arisztotelsz az l lnyekre jellemz llek (grgl ) tbb fajtjt klntette el, s
legalbbis nhnyukra funkcionalista lerst adott (errl bvebben lsd (Nussbaum, 1978)).
Hrhedt Descartes dualisztikus elmefelfogsa, de ironikus mdon trtnelmi hatsa inkbb a mechanisztikus s
materialista elmefelfogs fel mutat. Az llatokat kifejezetten automatnak tartotta, s megellegezte a Turingtesztet: azt nem tudjuk elkpzelni, hogy [egy gp] a szavakat klnflekppen elrendezze, s ezltal rtelmesen
tudjon felelni arra, amit a jelenltben mondanak, amint ezt a legtompbb esz emberek is meg tudnak tenni
(Descartes, 1637).11 Azzal, hogy hevesen kardoskodott az llatok automata mivolta mellett, Descartes valjban
knnyebb tette, hogy az embereket is automatnak vljk, noha maga ezt a lpst sohasem tette meg. A
LHomme Machine (La Mettrie, 1748) c. knyv pontosan amellett rvelt, hogy az emberek automatk.
A modern analitikus filozfia ltalban elfogadja a materializmust (gyakran az agyllapot-azonossg elmlet
(identity theory) formjban (Place, 1956; Armstrong, 1968), ami szerint a mentlis llapotok azonosak az agyi
llapotokkal), de sokkal megosztottabb a funkcionalizmust, az emberi elme gpi analgijt tekintve, valamint
abban a krdsben, hogy sz szerinti rtelemben vve tudnak-e gondolkodni a gpek. Turing (Turing, 1950)
Computing Machinery and Intelligence c. cikkre adott korai filozfiai vlaszok egy rsze, pldul Scriven
(Scriven, 1953), megprblta cfolni, hogy rtelmes lenne azt mondani, hogy a gpek gondolkodhatnak, arra
alapozva, hogy ez srten a sz jelentst. Ezt a nzetet, legalbbis Scriven, cikknek jranyomshoz illesztett
fggelknek tansga szerint 1963-ra visszavonta (Anderson, 1964). A szmtstechnika-kutat Edsger
Dijkstra szerint Az a krds, hogy tud-e egy gp gondolkodni, nem rdekesebb annl, hogy tud-e szni egy
tengeralattjr. Ford s Hayes (Ford s Hayes, 1965) amellett rvelnek, hogy a Turing-teszt semmi segtsget
sem nyjt a mestersges intelligencia szmra.
Mivel az elmefilozfiban a mestersges intelligencia alapjn a funkcionalizmus vlasztsa tnik a
legtermszetesebbnek, a funkcionalizmus kritikja teht gyakran a mestersges intelligencia kritikjnak
formjt lti (mint Searle esetben). Block (Block, 1980) osztlyozst kvetve tbbfle funkcionalizmust
klnbztethetnk meg. Az agyllapot-azonossg elmlet egyik varinsa, a funkcionlis specifikci elmlete
(functional specification theory) (Lewis, 1966; 1980) a mentlis llapotokkal identifikland agyi llapotokat
a funkcionlis szerepk vlasztja ki. A gpi analgihoz szorosabban ktdik a funkcionlis llapotazonossg
elmlet (functional state identify theory) (Putnam, 1960; 1967). E szerint a mentlis llapotokat nem fizikai
agyi llapotokkal, hanem a kifejezett szmteszkzknt felfogott agy absztrakt szmtsi llapotaival kell
azonostani. Ezek az absztrakt llapotok felttelezs szerint fggetlenek az agy specifikus felptstl, ami
azonban nhnyakat arra ksztet, hogy a funkcionlis llapotazonossg elmletet a dualizmus egy formjnak
tartsk!
Mindkt agyllapot-azonossg elmletet, valamint a klnbz formj funkcionalizmusokat tmadjk azok a
szerzk, akik szerint ezek az elmletek nem megfelelk a mentlis llapotok qualia, azaz milyen rzs is ez
aspektusnak megmagyarzsra (Nagel, 1974). Searle ehelyett az intencionalits funkcionalizmusbeli
lltlagos megmagyarzhatatlansgra koncentrlt (Searle, 1980; 1984; 1992). Churchland s Churchland
(Churchland s Churchland, 1982) mindkt fajta kritikt visszautastjk.
Az eliminatv (kikszbl) materializmus (eliminative materialism) (Rorty, 1965; Churchland, 1979) abban
klnbzik az elmefilozfia tbbi jelents elmlettl, hogy meg sem ksrli a npies pszicholgia, az elmrl
alkotott htkznapi elkpzelseink igazolst, hanem mindet elveti, s megprblja az elme tisztn tudomnyos
elmletvel helyettesteni. Elmletileg akr a klasszikus mestersges intelligencia is szolgltathatn ezt a
tudomnyos elmletet, de valjban az eliminatv materialistk inkbb az idegtudomnytl s a neurlis hlk
kutatstl klcsnznek (Churchland, 1986), arra alapozva, hogy a klasszikus mestersges intelligencia,
klnsen a 10. fejezetben bemutatotthoz hasonl tudsreprezentcis kutatsi irny, hajlamos a npies
pszicholgia igazsgaira alapozni. Ugyan az intencionlis belltottsg llspont (Dennett, 1971) rtelmezhet
funkcionalistaknt, de valsznleg az eliminatv materializmus egyik formjnak kell tekinteni, mivel az
intencionlis belltottsg nem objektv tulajdonsga az gensnek, akire vonatkozik. Azt is vegyk figyelembe,
hogy lehetnk eliminatv materialistk egyes mentlis jelensgekkel kapcsolatban, mikzben msokat nem gy
elemznk. Dennett (Dennett, 1978) pldul a qualikat illeten sokkal inkbb eliminativista, mint az
intencionalitssal kapcsolatban.
11
A szveget a magyar fordts alapjn idztk: rtekezs a mdszerrl (ford. Szemere Samu s Boros Gbor). (A ford.)
848
Filozfiai alapok
A fejezetben szltunk a gyenge MI-vel szembeni kritika lehetsges forrsairl. Ugyan a posztneurlis hlk
korszakban divatoss vlt idejtmltnak tartani a szimbolikus megkzeltseket, nem minden filozfus kritikus
a Jfajta, rgivgs MI-vel szemben. Akadnak ennek mg elktelezett, st akr gyakorl hvei is. Zenon
Pylyshyn (Pylyshyn, 1984) amellett rvelt, hogy a szmtsi modell nemcsak elviekben a legjobb modell a
megismers megrtshez, hanem a jelenlegi kutats tja is lehet, s kifejezetten megcfolta Dreyfus kritikjt
az emberi megismers szmtsi modelljrl. Gilbert Harman (Harman, 1983) a hiedelemmdosts vizsglatt
az igazsg-karbantart mestersges intelligencia rendszerek kutatshoz kapcsolta. Micheal Bratman az emberi
pszicholgirl alkotott hiedelem-vgy-intenci modelljt (Bratman, 1987) alkalmazta a tervksztssel
kapcsolatos mestersges intelligencia kutatsokra (Bratman, 1992). Aaron Sloman (Sloman, 1978, iii. o.), a
mestersges intelligencia ers hipotzisnek radiklis hve odig elment, hogy rasszistnak nevezte Joseph
Weizenbaumot (Weizenbaum, 1976), mert szerinte a felttelezett intelligens gpeket nem kellene szemlyeknek
tekinteni.
Az elmrl, az agyrl s a kapcsold tmkrl szl filozfiai irodalom kiterjedt, s a megfelel szaknyelv s
rvelsi mdozatokra vonatkoz megalapozott kpzs hinyban gyakran nehezen olvashat. Ehhez a
folyamathoz az Encyclopedia of Philosophy (Edwards, 1967) felettbb hasznos segtsget nyjthat meggyzen
informatv szcikkeivel. A The Cambridge Dictionary of Philosophy (Audi, 1999) rvidebb, de kzrthetbb
m, noha a f szcikkek (mint pldul az elmefilozfia) mg gy is akr tbb mint tz oldal hosszak is
lehetnek. A MIT Encyclopedia of Cognitive Science (Wilson s Keil, 1999) egyarnt foglalkozik az elme
filozfijval, biolgijval s pszicholgijval. Az elmefilozfirl (belertve ebbe a funkcionalizmust s
ms, a mestersges intelligencihoz ktd llspontokat) szl cikkek ltalnos gyjtemnye tallhat a
Materialism and the Mind-Body Problem-ben (Rosenthal, 1971) s a Readings in the Philosophy of Psychology
(Block, 1980) els ktetben. Biro s Shanan (Biro s Shanan, 1980) a funkcionalizmus ellen s mellett rvel
cikkekbl lltott ssze antolgit. Ms cikkgyjtemnyek kifejezetten a filozfia s a mestersges intelligencia
kapcsolatval foglalkoznak: Minds and Machines (Anderson, 1964); Philosophical Perspectives in Artificial
Intelligence (Ringle, 1979); Mind Design (Haugeland, 1981) s a The Philosophy of Artificial Intelligence
(Boden 1990). Szmtalan bevezet ltezik a filozfiai MI-krds-hez (Boden, 1977; 1990; Haugeland, 1985;
Copeland, 1993). A The Behavioral and Brain Sciences, rvidtve BBS, fontos folyirat, amelyet a mestersges
intelligencival s az idegtudomnyokkal kapcsolatos vitknak szentelnek. Tbb jsg foglalkozik a
mestersges intelligencia etikai s felelssgi krdseivel: AI and Society, Law, Computers and Artificial
Intelligence, valamint az Artificial Intelligence and Law.12
4.2. Feladatok
26.1.
Haladjon vgig Turing lltlagos gpi fogyatkossgokrl alkotott listjn, keresse meg, melyeket
valstottak mr meg, melyeket lehet elvben megvalstani egy programmal, s melyek problematikusak azrt,
mert tudatos mentlis llapotokat ignyelnek.
26.2.
Szksgszeren bizonytja-e a knai szoba rv cfolata, hogy a megfelelen programozott szmtgpek
mentlis llapotokkal rendelkeznek? Szksgszeren egytt jr-e az rv elfogadsa azzal, hogy a
szmtgpeknek nem lehetnek mentlis llapotaik?
26.3.
Az agyprotzis rv fontos rsze, hogy kpesnek kell lennnk a ksrleti szemly agyt visszalltani a normlis
llapotba, hogy kls viselkedse ugyanolyan legyen, mintha a mtt nem is trtnt volna meg. Megalapozott
lehet-e egy olyan szkeptikus ellenvets, miszerint ez azzal jrna, hogy mdostani kell a neuronoknak a
tudatossghoz ktd neurofiziolgiai tulajdonsgait, melyek klnbznek a funkcionlis viselkedsben
rsztvevktl.
26.4.
Keressen ki a populris mdibl egy vagy tbb, a mestersges intelligencia lehetetlensgre irnyul rvet, s
elemezze azt.
A magyar olvas a mestersges intelligencia filozfijrl Darabos Tams mvbl tjkozdhat: A gpestett rtelem. Vzlatok a
mestersges intelligencia filozfijrl. ron Kiad, Budapest, 1991. (A ford.)
12
849
Filozfiai alapok
26.5.
Prbljon meg defincikat adni az intelligencia, a gondolkods s a tudatossg fogalmakra. Vessen fel
lehetsges ellenvetseket is a defincikkal szemben.
26.6.
Elemezze a mestersges intelligencinak a trsadalomra jelentett potencilis veszlyeit. Mely fenyegetsek a
legslyosabbak, s hogy lehetne kzdeni ellenk? Hogyan viszonyulnak ezek a potencilis elnykhz?
26.7.
A mestersges intelligencia jelentette potencilis fenyegetsek hogyan viszonyulnak ms szmtstechnikai,
vagy bio-, nano- s nukleris technolgikbl ered veszlyekhez?
26.8.
Nhny kritikus ellenvetse szerint a mestersges intelligencia lehetetlen, msok szerint meg tlsgosan is
lehetsges, s az ultraintelligens gpek veszlyt jelentenek. A kt felhozott ellenvets kzl melyiket tartja
valsznnek? Ellentmondsos-e a kettt egytt lltani?
850
27. fejezet - MI: Jelen s jv

Ebben a fejezetben felmrjk, hogy hol vagyunk s merre tartunk, mieltt folytatnnk. Taln nem felesleges.
Az I. rszben bevezettk a racionlis gensrendszert mint a mestersges intelligencia egysges szemlleti
kerett. Bemutattuk, hogy a tervezsi problma az gens rendelkezsre ll szlelseken s cselekvseken, az
gens viselkedsvel kielgtend clon s a krnyezet termszetn mlik. Az gensrendszertervek egsz sort
lehet elkpzelni, a reflexszer genstl kezdve egszen a teljesen cltudatos, tudsalap gensig. Tovbb ezen
rendszertervek komponensei tbbfle konkrt alakot lthetnek pldul logikait, valsznsgit vagy
neurlist. Az ilyen jelleg komponensek mkdsvel a megfelel fejezetek foglalkoztak.
Fontos
Az gensrendszer s komponensei tekintetben mind tudomnyos megrtsnk, mind technolgiai
kpessgnk hatalmasat fejldtt. Ebben a fejezetben htrbb lpnk a rszletektl, s azt krdezzk:
Elvezet-e ez a fejlds egy vltozatos krnyezetekben mkdsre kpes, ltalnos cl intelligens
genshez? A 27.1. alfejezetben szmba vesszk az intelligens gens komponenseit, hogy
meghatrozhassuk, mi az, amit ismernk, s mi az, ami mg hinyzik. A 27.2. alfejezetben az ltalnos
gensarchitektra kapcsn tesszk ugyanezt. A 27.3. alfejezetben azt vizsgljuk, hogy a racionlis
gens tervezse-e az elsdlegesen helyes cl. (A vlasz: Nem igazn, de egyelre megteszi.) Vgl
a 27.4. alfejezetben azzal foglalkozunk, milyen kvetkezmnyekkel jrhat vllalkozsunk sikere.
1. genssszetevk
A 2. fejezetben szmos genstervet s azok komponenseit mutattuk be. Figyelmnket sszpontostand itt csak
a hasznossgalap genssel foglalkozunk, amelyet a 27.1. brn mutatunk be jra. Ez a legltalnosabb
genstervnk; de megvizsgljuk tanulsi kpessgekkel val kiterjesztst is (lsd 2.15. bra).
Interakci a krnyezettel szenzorok s beavatkozszervek segtsgvel. Ez a mestersges intelligencia
trtnetnek nagy rszben komoly hinyossg. Nhny tiszteletre mlt kivtellel minden MI-rendszert gy
ptettek fel, hogy embereknek kellett szolgltatniuk a bemeneteket, s rtelmezni a kimeneteket, a robotika
pedig alacsony szint feladatokra sszpontostott, ahol nagyrszt hinyzott a magas szint kvetkeztets s
tervkszts. Ez rszben a magas kltsgek s a komoly tervezi erfeszts miatt volt gy, ami ahhoz kellett,
hogy egyltaln valdi, mkd robotokat kapjunk. Az elmlt vekben az elre elksztett, programozhat
robotok mint pldul a 25.4. (b.) brn lthat ngylb robot megjelensvel a helyzet rohamosan
megvltozott. Ez a vltozs vgs soron a kicsi, olcs, nagy felbonts CCD-kamerknak s a kompakt,
megbzhat motoros hajtsoknak ksznheten kvetkezett be. Az MEMS- (mikro-elektromechikai rendszerek)
technolgia miniatrizlt gyorsulsmrket s giroszkpokat hozott ltre, napjainkban pedig olyan
beavatkozszerveket llt el, amelyek pldul egy mestersges repl rovart bizonyos kpessgekkel ruhznak
majd fel. (Taln MEMS-beavatkozszervek millii kapcsolhatk majd ssze, hogy nagy teljestmny
makroszkopikus beavatkozkat kapjunk.) A fizikai krnyezeteket illeten az MI-rendszereknek nem lehet tbb
kifogsa. Tovbb egy teljessggel j krnyezet, az internet is ltrejtt.
27.1. bra - Egy modell- s hasznossgalap gens, ahogyan elszr a 2.14. brn
bemutattuk
851
MI: Jelen s jv
Nyomon kvetni a vilg llapott. Ez az intelligens gens szmra szksges legfontosabb kpessgek egyike,
amelyhez egyarnt szksg van rzkelsre s a bels reprezentci frisstsre. A 7. fejezetben tletlogikt
alkalmaztunk a vilg llapotnak nyomon kvetsre; a 10. fejezetben kiterjesztettk ezt az elsrend logikra;
a 15. fejezetben pedig szr algoritmusokat (filtering algorithms) mutattunk be, hogy a bizonytalan
krnyezeteket is kvetni tudjuk. Ezekre a szreszkzkre van szksg, amikor igazi teht tkletlen
rzkelsre kerl sor. A jelenlegi szr s rzkelsi algoritmusokat lehet gy kombinlni, hogy elg j
teljestmnyt kapjunk alacsony szint prediktumok lersnl, mint pldul a cssze az asztalon van, de van
mg megteend t elttnk, mg az algoritmusok azt is ki tudjk jelenteni, hogy: dr. Russell tezik dr.
Norviggel. Egy msik problma az, hogy ugyan az approximcis szr algoritmusok kpesek elg nagy
krnyezeteket kezelni, lnyegket tekintve azonban mg mindig propozicionlisak: a propozicionlis logikhoz
hasonlan nem kezelik explicit mdon az objektumokat s a relcikat. A 14. fejezetben bemutattuk, hogyan
lehet ennek a problmnak a megoldsra elsrend logikt alkalmazni; elvrsaink szerint nagy elrelpssel
fog majd jrni, ha a komplex krnyezetek kezelsre is alkalmazzk ezeket az elgondolsokat. Tovbb, mihelyt
egy bizonytalan krnyezetben elkezdnk objektumokrl beszlni, felmerl a bizonytalan azonossg (identity
uncertainty) problmja: nem tudjuk, melyik objektum melyik. A logika alap mestersges intelligenciban
meglehetsen elhanyagoltk ezt a problmt, mivel ltalban feltteleztk, hogy az szleletek lland
szimblumokat tartalmaznak az objektumok azonostsra.
Elrevetteni, rtkelni s kivlasztani jvbeli cselekvseket. Az alapvet tudsreprezentcis elvrsok itt is
ugyanazok, mint a vilg llapotnak nyomon kvetsnl; az elsdleges nehzsg a cselekvsekkel (mint
pldul beszlgetni s tezni) val boldogulsbl szrmazik, amelyek esetenknt az igazi gens elemi lpseinek
ezreit vagy milliit tartalmazhatjk. Az emberek is csak gy tudnak ezzel megbirkzni, hogy a viselkedst egy
hierarchikus struktrba (hierarchial structure) szervezik. A 12. fejezetben bemutatott tervezsi
algoritmusok nmelyike az ehhez hasonl mret problmk kezelsre hierarchikus s elsrend logikai
reprezentcit hasznl; msrszt pedig a 17. fejezetben megadott bizonytalansgi dntshoz algoritmusok
lnyegileg ugyanazon az elven alapulnak, mint a 3. fejezet llapottrbeli keres algoritmusai. Lthatan itt sok a
tennival, taln a hierarchikus megerstses tanuls (hierarchial reinforcement learning) jabb
fejlemnyei mentn.
Hasznossg mint a preferencik kifejezse. A racionlis dntseket az elvrt hasznossg maximalizlsra
alapozni elmletileg teljesen ltalnos, s megv a tisztn clorientlt megkzeltsek szmtalan hibjtl (mint
pldul az ellentmond clok s a bizonytalan elrsk). Mindeddig azonban kevs munka folyt a realisztikus
hasznossgi fggvnyek ellltsa tern kpzeljk el pldul az egymssal klcsnhatsban lv preferencik
komplex hlzatt, amelyeket az emberek irodai asszisztenseknt mkd gensnek meg kell rtenie. Elg
nehznek bizonyult az sszetett llapotokkal kapcsolatos preferencikat dekomponlni az sszetett llapotokrl
szl bizonyossgok Bayes-hls dekompozcijhoz hasonlan. Ennek az egyik oka az lehet, hogy az llapotok
852
MI: Jelen s jv
preferencii valjban az llapotok mltbeli preferenciibl lettek sszeszerkesztve, amelyeket

jutalomfggvnyek (reward functions) rnak le (lsd 17. fejezet). A keletkez hasznossgi fggvny akkor is
nagyon sszetett lehet, ha a jutalomfggvny egyszer. Mindez azt sugallja, hogy komolyan kell vennnk a
jutalomfggvnyek tudsmrnki konstrukcijt, mert ezzel tudjuk az gens rtsre adni, mit akarunk tle.
Tanuls. A 1820. fejezetben lertuk, hogy az gens tanulsa miknt fogalmazhat meg az gens klnbz
komponenseinek induktv (ellenrztt, nem ellenrztt vagy megerstses) tanulsaknt. Nagyon hatkony
logikai s statisztikai technikkat fejlesztettek ki, amelyek egsz nagy problmkkal is meg tudnak birkzni, s
gyakran elrik, st meghaladjk az embernek azt a kpessgt, amellyel egy adott sztr feletti prediktv
mintkat azonost. Msrszt viszont abban a fontos problmban, hogy a bemeneti sztrnl absztraktabb szint,
j reprezentcikat hozzanak ltre, a gpi tanuls kevs haladst rt el. Hogyan tud pldul egy autonm robot
ltrehozni az emberektl meg nem kapott olyan j prediktumokat, mint pldul az Iroda s a Kv? Hasonl
megfontolsok alkalmazhatk a viselkeds tanulsra is: a Tezs fontos, magas szint cselekvs, de hogyan
kerl be egy olyan cselekvsknyvtrba, ahol eredetileg csak jval egyszerbb cselekvsek szerepeltek, mint
pldul a KezetFelemelni s a Lenyelni. Amg nem rtjk meg ezeket a problmkat, addig a hatalmas jzan sz
tudsbzisok kzi ltrehozsnak csggeszt feladatval nznk szembe.
2. gensarchitektrk
Termszetes, ha azt krdezzk: Melyik architektrt alkalmazzam a 2. fejezetben bemutatottak kzl? A
vlasz: Mindegyiket! Lttuk, hogy a reflexszer vlaszok alkalmasak az idkritikus helyzetekben, mg a
tudsalap elhatrozs lehetv teszi, hogy az gens elre tervezzen. Egy teljes gensnek egy hibrid
architektra (hybrid architecture) segtsgvel kpesnek kell lennie mindkettre. A hibrid architektra egyik
fontos tulajdonsga, hogy a klnbz dntsi komponensek hatra nem rgztett. A szerkeszts vagy
kompills (compilation) pldul az elhatrozs szintjn megjelen deklaratv informcit folyamatosan
hatkonyabb reprezentcikk alaktja t, eljutva vgl a reflexszer szintre (27.2. bra). (Ez a clja a 19.
fejezetben bemutatott magyarzatalap tanulsnak.) Az olyan rendszereknek, mint a SOAR (Laird s trsai, 1987)
s a THEO (Mitchell, 1990), pontosan ez a struktrjuk. Minden alkalommal, amikor explicit elhatrozs rvn
jutnak el egy problma megoldsig, a megolds ltalnostott verzijt is eltroljk a reflexszer komponens
rszre. Ennek a folyamatnak a fordtottjt kevsb tanulmnyoztk mg: a krnyezet vltozsakor a megtanult
reflexek lehet, hogy tbb mr nem rvnyesek, s az gensnek vissza kell trnie a tudatos konstrukci szintjre,
hogy j viselkedst hozhasson ltre.
27.2. bra - A kompills clja a megfontolt (deliberatv) dntshozatal hatkonyabb,

reflexszer mechanizmuss val talaktsa
Egy gensnek sajt kvetkeztetseit is az ellenrzse al kell tudnia vonni. A kvetkeztetst abba kell hagynia,
ha cselekvsre van szksg, s a kvetkeztetsre rendelkezsre ll idt a leggretesebb szmtsokra kell
fordtania. Egy taxisofr gensnek, pldul, ha kzvetlenl maga eltt balesetet szlel, nem flrk alatt, hanem
a msodperc tredke alatt el kell tudnia dnteni, hogy fkezni fog, vagy inkbb kikerli a balesetet. A
msodperc ezen tredkt a legfontosabb krdsek vizsglatra kell fordtania, hogy balra, illetve jobbra szabade a sv, s nincs-e kzvetlenl mgtte egy nagy teheraut, s nem arra, hogy milyen az id, mennyire kopnak a
gumik, vagy hogy hol tallja a kvetkez utast. Az ilyen problmkkal a vals idej MI (real-time AI)
foglalkozik. Ahogy az intelligens rendszerek egyre bonyolultabb trgyterletekre vonulnak be, minden
853
MI: Jelen s jv
problma vals idejv vlik, hiszen az gensnek soha nem lesz elegend ideje arra, hogy a dntsi problmt
egzakt mdon oldja meg.
Vilgos, hogy srget szksg van az ltalnosabb dntshoz helyzetekben is mkd mdszerekre. Az utbbi
idben kt kecsegtet mdszertan is napvilgot ltott. Az els az akrmikor algoritmusok (anytime
algorithms) alkalmazsa (Dean s Boddy, 1988; Horvitz, 1987). Egy akrmikor algoritmusnl az algoritmus
kimenetnek minsge az id mlsval fokozatosan javul, brmikor szaktjuk is meg teht az algoritmust,
sszer dntshez jutunk. Az ilyen algoritmus vezrlst egy metadntsi eljrs vgzi, amely meghatrozza,
hogy rdemes-e a szmtsokat tovbb folytatni. Az akrmikor algoritmusra egy egyszer plda a ktszemlyes
jtkoknl ismertetett iteratv mlyt keress. Azonban bonyolultabb rendszerek amelyek szmos ilyen,
egyttesen mkd algoritmusbl llnak is konstrulhatk (Zilberstein s Russell, 1996). A msik mdszer a
dntselmleti metakvetkeztets (decision-theoretic metareasoning) (Horvitz, 1989; Russell s Wefald,
1991; Horvitz s Breese, 1996). Ebben a megkzeltsben az informcirtk elmlett (16. fejezet) a
szmtsok megvlasztsra hasznljuk. A szmts rtke mind a kltsgtl (a ksleltetett cselekvs miatt),
mind a hasznossgtl (a dnts javtott minsge miatt) fgg. A metakvetkeztetsi smkkal jobb keressi
algoritmusokat lehet ellltani, automatikusan garantlva az akrmikor tulajdonsgot. A metakvetkeztets
termszetesen kltsges, de a kompills arra is felhasznlhat, hogy a tlmunka kltsge eltrpljn a szmts
kltsge mellett, lvn hogy a szmts is felgyelt.
A metakvetkeztets csupn egyik aspektusa az ltalnos reflektv architektrnak (reflective architecture):
ezek az architektrk lehetv teszik a magn az architektrn bell keletkez szmtsi entitsok s
cselekvsek fltti tudatossgot. A reflektv architektrk elmleti alapja gy pthet fel, hogy a krnyezet
llapotbl s magnak az gensnek a szmtsi llapotbl ll, kzs llapotteret definilunk. Dntsi
eljrsokat s tanulsi algoritmusokat lehet gy tervezni, hogy ebben a kzs llapottrben mkdjenek, ezzel
segtve s javtva az gens szmtsi teljestmnyt.
Vgs soron azt vrjuk, hogy az olyan feladatspecifikus algoritmusok, mint amilyen az alfa-bta keress s a
htrafel lncols, eltnnek az MI-rendszerekbl, tovbb, hogy ezek olyan ltalnos mdszerekkel lesznek
helyettesthetk, amelyek az gens szmtsait j minsg dntsek hatkony ltrehozsa fel irnytjk.
3. Egyltaln a j irnyba haladunk?

Az elz fejezetekben sok elrelpst soroltunk fel, s mg tbb lehetsget a jvbeli fejldsre. De hova
vezet mindez? Dreyfus analgiaknt azt hozza fel (Dreyfus, 1992), hogy amikor valaki egy fa megmszsval
akar a Holdra jutni, az illet lland haladsrl szmolhat be egszen a fa cscsig. Ebben a fejezetben az a
krdsnk, hogy a mestersges intelligencia fejldse a famszsra hasonlt-e, vagy inkbb a holdraktra.
Az 1. fejezetben azt mondtuk, hogy clunk a racionlisan cselekv gens ptse. Azonban arra is
figyelmeztettnk, hogy
komplex krnyezetben a tkletes racionalitst mindig helyesen cselekedni lehetetlen
elrni. A szmtsi szksgletek egyszeren tl komolyak. A knyv nagyobb rszben
azonban azzal a munkahipotzissel fogunk lni, hogy a tkletes dntshozatal megrtse j
kiindulpont.
1. fejezet
Itt az ideje ismt vgiggondolni, mi is az MI pontos clja. genseket akarunk pteni, de milyen specifikci
van kzben a fejnkben? me, ngy lehetsg:
1. Tkletes racionalits (perfect rationality): A tkletesen racionlis gens minden pillanatban gy
cselekszik, hogy a krnyezetrl szerzett informcija alapjn vrhat hasznossgt maximalizlja. Mivel
lttuk, hogy a legtbb krnyezetben tlsgosan idrablk a tkletes racionalitshoz szksges szmtsok,
ezrt ez nem realisztikus cl.
2. Szmthat racionalits (calculative rationality): Ez az a megkzelts, amit implicit mdon a logikai s
dntselmleti gensek tervezsekor hasznltunk. Egy szmthatan racionlis gens vgl meghatrozza azt,
ami racionlis vlaszts lehetett volna kvetkeztetseinek az elejn. Ez rdekes tulajdonsga egy
rendszernek, de a legtbb krnyezetben a rosszkor rkez j vlasznak nincs semmi rtke. A gyakorlatban
az MI-rendszerek tervezi r vannak knyszertve arra, hogy a tervezsi minsget illeten egy elfogadhat
ltalnos teljestmny rdekben kompromisszumot hozzanak; szerencstlen mdon azonban a szmthat
racionalits elmleti alapja nem nyjt jl kidolgozott lehetsget egy ilyen kompromisszum meghozatalra.
854
MI: Jelen s jv
3. Korltozott racionalits (bounded rationality): Herbert Simon elvetette a tkletes (vagy akr a
kzeltleg tkletes) racionalits gondolatt, s a korltozott racionalitst lltotta a helyre (Simon, 1957),
ami a valdi gensek dntseinek ler elmlete. A kvetkezt rta:
A valsvilg-beli objektv racionlis viselkedshez, vagy akr csak ennek az objektv
racionlis viselkedsnek az elfogadhat megkzeltshez megoldand problmk mrethez
kpest tl kicsi az emberi elme komplex problmk megfogalmazsra s megoldsra
szolgl kapacitsa.
Herbert Simon
Azt javasolta, hogy a korltozott racionalits elsdlegesen az elfogadhatsgban (satisficing) nyilvnul meg:
olyan hossz ideig kell foglalkozni a dntssel, ami elegend egy elfogadhatan j vlasz megtallshoz.
Ezrt a munkjrt Simon kzgazdasgi Nobel-djat kapott, s ksbb rszletesen is rt mg rla (Simon, 1982).
Ez az emberi viselkedsnek sok esetben hasznosnak tn modellje, azonban nem ad formlis specifikcit az
intelligens gensek szmra, mert az elmlet nem adja meg az elfogadhatan j defincijt. Tovbb az
elfogadhatsg lthatan csak egyike a korltozott erforrsok lekzdst szolgl technikknak.
4. Korltozott optimalits, KO (bounded optimality, BO): Egy korltozottan optimlis gens adott szmtsi
erforrsok mellett a lehet legjobban cselekszik. Egy ilyen gens esetn az gensprogram vrhat
hasznossga legalbb olyan magas, mint az ugyanazon a gpen fut brmilyen ms gensprogram.
A ngy lehetsg kzl, gy tnik, a korltozott optimalits vlasztsa adja a legtbb eslyt az MI ers
elmleti megalapozsra. Megvan az az elnye, hogy elrhet: mindig van legalbb egy legjobb program a
tkletes racionalitsrl ugyanez nem mondhat el. A korltozottan optimalits gensek hasznosak a
mindennapi gyakorlatban is, a szmthat racionalits gensek ltalban nem, mg az elfogadhatsgra trekv
genseknl ez a szeszlyeiken mlik.
A hagyomnyos megkzelts az MI-ben az volt, hogy a szmthat racionalitssal kezdnk, majd az
erforrskorltok kielgthetsge rdekben kompromisszumokat hozunk. Ha ezek a korltok csak kis
problmkat okoznak, akkor a keletkez terv vrhatan a KO gens tervhez lesz hasonl. Ha azonban az
erforrskorltok kritikuss vlnak pldul mert a krnyezet egyre sszetettebb vlik , akkor a kt terv
vrhatan el fog trni egymstl. A korltozott optimalits elmlete ezen korltok kezelsre knl elveket.
A korltozott optimalitsrl egyelre keveset tudunk. Nagyon egyszer gpekhez s valamilyen mrtkben
korltozott krnyezetekhez korltozottan optimlis programok konstrulhatk (Etzioni, 1989; Russell s trsai,
1993). Bonyolult krnyezetekben mkd nagy, ltalnos rendeltets szmtgpek esetn azonban fogalmunk
sincs, hogy milyenek legyenek a KO-programok. Ha a korltozott optimalits konstruktv elmlete valaha is
megfogalmazhat lesz, hinnnk kell, hogy a korltozottan optimlis programok tervezse nem fog tlsgosan
fggni a hasznlt szmtgp rszleteitl. A tudomnyos kutatst nagyon megnehezten, ha pldul kiderlne,
hogy egy gigabjtos memrij gp nhny kbjt memrival val bvtse lnyegi klnbsget jelentene a
KO-program tervben. Ahhoz, hogy ez ne trtnjen meg, a korltozott optimalits kritriumait kiss lazbban
kell kezelni. Az aszimptotikus bonyolultsg (A) fggelk) mintjra definilhatjuk az aszimptotikus
korltozott optimalitst, AKO) (asymptotic bounded optimality, ABO) (Russell s Subramanian, 1995).
Tegyk fel, hogy egy P program egy M gp esetn korltozottan optimlis a krnyezetek E osztlyban, ahol a
krnyezetek komplexitsa nem korltozott. Ekkor a P' program egy AKO-program M rszre E-ben, ha egy P
programot egy kM gpen futtatva a teljestmnyben tlszrnyalja, s ahol a kM gp k-szor gyorsabb (vagy
nagyobb), mint M. Ha k nem bizonyulna risinak, elgedettek lehetnnk, ha nemtrivilis krnyezetek s
nemtrivilis architektrk esetn AKO-programokkal rendelkeznk. Kevs rci lenne abban, hogy risi
erfesztsek rn inkbb KO-, mint AKO-programokat keressnk, ha a hasznlhat gpek nagysga s
sebessge, gy tnik, egy adott id alatt konstans mrtkben gyis n.
Megkockztathatjuk azt is, hogy a KO- vagy az AKO-programok nagy teljestkpessg szmtgpek s
bonyolult krnyezetek esetn nem fognak szksgszeren egyszer s elegns struktrval rendelkezni. Lttuk
mr, hogy az ltalnos rendeltets intelligencihoz bizonyos fok reflexszer s tudatos kpessg szksges,
ami a tuds s a dntshozatali formk sokasgt, ezen formk mindegyikhez a tanul s a kompillsi
mechanizmusokat, a kvetkeztets vezrlsnek mdszereit s a trgyterletre vonatkoz specifikus tuds nagy
trt jelenti. A korltozottan optimlis gensnek adaptldnia kell ahhoz a krnyezethez, amelyben tartzkodik,
gy bels szervezettsge vgl az adott krnyezetre jellemz optimalizlsi smkat tkrzheti. Ez elvrhat,
hasonlkppen ahhoz, ahogy a slyukban s a lerben korltozott versenyautk szlssgesen kompliklt
konstrukcikig jutottak el. Az a sejtsnk, hogy a korltozott optimalitson alapul mestersges intelligencia
tudomnya nagy rszben olyan folyamatok tanulmnyozsbl fog llni, amelyek rvn egy gensprogram a
855
MI: Jelen s jv
korltozott optimalitshoz fog konverglni, s taln kevsb fog az eredmnyl kapott, nehezen ttekinthet
programok rszleteivel trdni.
sszegezve, a korltozott optimalits koncepcijt jl definilt s kivitelezhet kutatsi feladatnak javasoljuk a
mestersges intelligencia kutatsa szmra. A korltozott optimalits az optimlis programokat specifiklja, s
nem az optimlis cselekvst. A cselekvst gyis a programok generljk, s a programok azok, amelyek felett a
tervez befolyssal rendelkezik.
4. Mi van, ha az MI sikerrel jr?

David Lodge az irodalomkritikusok egyetemi vilgrl szl Small world (Kis vilg) (Lodge, 1984) c.
novelljban a fhs megdbbenst okoz, amikor a kivl, mde egymssal vitatkoz tagokbl ll
irodalomelmleti bizottsgtl megkrdezi: Mi van, ha igazuk van? Az elmletalkotk egyike sem gondolt
mg erre a krdsre (valsznleg azrt, mert megcfolhatatlan elmleteken vitatkozni csak ncl lehet). Nha
hasonl zavart okozhatunk, ha MI-kutatktl krdezzk azt: Mi van, ha sikerrel jrsz? A mestersges
intelligencia izgalmas dolog, az intelligens szmtgpek pedig nyilvnvalan jobbak, mint buta trsaik, mirt
ht az aggodalom?
Ahogy a 26.3. alfejezetben felvetettk, bizonyos etikai krdseket is meg kell fontolni. Az intelligens gpek
sokkal tbbre kpesek, de vajon erejket jra vagy rosszra fordtjk? A mestersges intelligencia kifejlesztsn
fradozk felelssge, hogy megbizonyosodjanak munkjuk pozitv hatsrl. Hogy a hats mennyire lesz
szles kr, az a siker mrtktl fgg. Mr a mestersges intelligencia mrskelt sikere is vltozsokat hozott a
szmtgp-tudomny tantsban (Stein, 2002) s a szoftverek fejlesztsben. Az MI olyan j alkalmazsokat
tett lehetv, mint pldul a beszdfelismer, kszletellenrz vagy megfigyel rendszerek, robotok s
keresgpek.
A mestersges intelligencia kzepes mret sikere vrhatan befolysoln a legklnbzbb emberek
mindennapi lett. A szmtgpestett kommunikcis rendszerek (mint pldul a mobiltelefonok s az
internet) mr eddig is mlyrehat vltozsokat okoztak a trsadalomban, a mestersges intelligencia esetben
azonban ez mg vrat magra. Knny elkpzelni, hogy a tnyleg hasznos otthoni s irodai szemlyi
asszisztensek komoly pozitv hatssal lennnek az emberek letre, habr rvid tvon valsznleg nmi
gazdasgi zavart is okozna. Az ilyen fejlettsgi szint technolgiai kapacits azonban alkalmazhat lenne
autonm fegyverek ltrehozsra is, s ez a legtbbek szerint nemkvnatos eredmny lenne.
Vgl pedig valsznnek tnik, hogy a mestersges intelligencia nagyarny sikere az emberihez hasonl
vagy annl magasabb szint intelligencia ltrehozsa megvltoztatn az emberisg tbbsgnek lett.
talakulna munknk s jtkunk bels termszete, csakgy, mint az intelligencirl s a tudatossgrl vallott
nzeteink, st megvltozna az emberi faj jvbeli sorsa is. Ezen a szinten az MI-rendszerek kzvetlen
fenyegetst jelenthetnnek az emberi autonmira, szabadsgra, st akr a fennmaradsunkra is. Mindezek miatt
a mestersges intelligencia kutatstl nem vlaszhatk el az etikai kvetkezmnyei.
Mit hoz majd a jv? A sci-fi rk lthatan jobban kedvelik a negatv utpikat, mint a pozitvakat,
valsznleg azrt, mert ez ad lehetsget az rdekesebb cselekmnyekre. De a mestersges intelligencia
mindeddig ms forradalmi technolgikhoz (nyomtats, csvezetkek, lgi utazs, telefnia) hasonlan
viselkedett: pozitv aspektusaik ellenslyoztk negatv hatsaikat.
sszefoglalsul azt mondhatjuk, hogy lttuk, a mestersges intelligencia mekkora haladst tett meg rvid
trtnete alatt, de ma is rvnyes Alan Turing Computing Machinery and Intelligence c. esszjnek
zrmondata:
Csak rvid tvolsgra ltunk elre, de azt ltjuk, hogy sok a tennival.
Alan Turing: Computing Machinery and Intelligence
856
A. fggelk - Matematikai alapok

1. A1. Bonyolultsganalzis s az O() jells
A szmtgpes szakembereknek gyakran szembe kell nznik azzal a feladattal, hogy eldntsk, kt algoritmus
kzl melyik fut gyorsabban, vagy melyik ignyel kevesebb memrit. Ezt a feladatot ktfle mdon lehet
megkzelteni. Az els a teljestmnymrs (benchmarking) ahol az algoritmusokat szmtgpen futtatjuk,
s megmrjk, milyen a sebessgk msodpercekben, valamint a memriafogyasztsuk bjtokban. Hiszen vgl
is ez az, ami igazbl szmt. A teljestmnymrs azonban nem biztos, hogy kielgt mrtk, mivel igen
specifikus: egy konkrt program teljestmnyt mri, amely program egy konkrt programozsi nyelven rdott,
konkrt gpen fut, konkrt fordt s bemeneti adatok mellett. A teljestmnymr program ltal szolgltatott
egyszer adatokbl nehz lenne arra kvetkeztetni, hogy az algoritmus milyen jl vizsgzik ms fordt, ms
szmtgp vagy ms adathalmaz esetn.
1.1. Aszimptotikus analzis

A msodik megkzelts az algoritmusok matematikai elemzsn (analysis of algorithms) alapul, konkrt
implementcitl s bemenetektl fggetlenl. Ezt a megkzeltst egy plda kapcsn, egy szmsorozatot
sszead program esetn fogjuk ismertetni:
Az elemzs els lpse a bemenetektl val eltekints, olyan paramter vagy paramterek megkeresse, amely
vagy amelyek jellemzk a bemenet mretre. Jelen pldban a bemenetet a szekvencia hosszval
jellemezhetjk, aminek a jele legyen n. Msodik lps az implementciktl val eltekints, azaz egy olyan
mrtk megkeresse, amely tkrzi az algoritmus futsiid-ignyt, de nem ktdik egy konkrt fordthoz
vagy szmtgphez. Az SSZEGZS program esetn ez lehetne pldul a vgrehajtott kd sorainak a szma. A
mrtk rszletesebb is lehetne, kln specifiklva az algoritmus ltal vgrehajtott sszeadsok, rtkadsok,
tmbhivatkozsok s elgazsok szmt. Mindkt esetben megkapjuk az algoritmus ltal vgzett lpsek teljes
szmnak a jellemzst a bemenet nagysgnak fggvnyben, amit T(n)-nek fogunk nevezni. Ha
megszmoljuk a kd sorait, a pldnk esetben az eredmny T(n) = 2n + 2.
Ha minden program olyan egyszer lenne, mint az SSZEGZS, az algoritmusok elemzse trivilis lenne. Kt
problma miatt a helyzet azrt bonyolultabb. Elszr is, ritka eset olyan paramtert tallni, mint az n, amely
teljes egszben jellemzi az algoritmus ltal vgrehajtott lpsek szmt. A legjobb, amivel ehelyett
rendelkezhetnk, a legrosszabb esetet jelent Tlegrosszabb(n) vagy az tlagos Ttlag(n) szmtsa. Az tlag
kiszmtshoz az elemznek fel kell tteleznie a bemenetek valamilyen eloszlst.
A msik problma az, hogy az algoritmusok ellenllnak az egzakt elemzsnek. Ilyen esetben kzeltsekre
szksges tmaszkodnunk. Azt mondhatjuk, hogy az SSZEGZS algoritmus O(n) avagy nagy ord n
jelezvn, hogy a mrtke, nhny kis rtk n kivtelvel, a legtbb esetben n konstans-szorosa. Formlisan:
T(n) O(f (n)) mrtk, ha T(n) kf(n) valamilyen k-ra, minden n > n0 esetn.
Az O(n) jells az aszimptotikus analzist (asymptotic analysis) jelenti. Kln vizsglat nlkl azt
mondhatjuk, hogy ha n aszimptotikusan kzeledik a vgtelenhez, egy O(n) algoritmus jobb, mint egy O(n2)
algoritmus. Egy egyedi teljestmnymr adat egy ilyen kijelentst nem tudna altmasztani.
Az O() jells a konstans szorzktl eltekint, emiatt kevsb precz, viszont knnyebb hasznlni, mint a T()-t.
gy pldul egy O(n2) algoritmus egy O(n) algoritmusnl hossz tvon mindig rosszabb lesz, azonban ha a kt
algoritmus T(n2 + 1) s T(100n + 1000), akkor az O(n2) algoritmus n 110-re jobb lesz.
857
Matematikai alapok
E htrnya ellenre az aszimptotikus elemzs az algoritmuselemzs legelterjedtebben hasznlt mdszere. Ez

azrt van gy, mert az elemzs mind a mveletek egzakt szmtl (a k konstans tnyezt figyelmen kvl
hagyva), mind a bemenet egzakt tartalmtl (csupn n nagysgt figyelembe vve) elvonatkoztat. Ily mdon az
elemzs matematikailag kivitelezhetv vlik. Az O() jells j kompromisszum a precizits s a knny
elemzs kztt.
1.2. NP s az inherensen nehz problmk

Az algoritmusok elemzse s az O() jells lehetv teszi, hogy egy konkrt algoritmus hatkonysgrl
nyilatkozzunk. Arrl azonban nem tudunk mondani semmit, hogy az adott problmhoz van-e nla jobb
algoritmus. A bonyolultsgelmlet (complexity analysis) terlete nem az algoritmusokat, hanem inkbb a
problmkat elemzi. Az els nagy szakadk a polinom idben megoldhat s a polinom idej megoldst
nlklz problmk kztt van, akrmilyen algoritmust is hasznlnnk. A polinom idej problmk osztlyt
azokt, amelyek O(nk) idben oldhatk meg valamilyen k esetn P-vel jelljk. Ezeket nha knny
problmknak hvjuk, mert az osztlyhoz O(logn) s O(n) futsi idej problmk is tartoznak. Idetartoznak
azonban O(n1000) problmk is, a knny elnevezst teht tlsgosan sz szerint venni nem lehet.
A problmk msik fontos osztlya az NP osztly, a nemdeterminisztikus polinom idej problmk osztlya.
Egy problma akkor tartozik ide, ha ltezik egy algoritmus, ami polinom idben meg tud tallni egy megoldst,
s mg ellenrizni is tudja, hogy a megtallt megolds korrekt-e. Az tlet az, hogy ha tetszlegesen nagyszm
proceszszorral rendelkeznk ahhoz, hogy az sszes sejtst egyszerre prbljuk ki, vagy pedig ha szerencssek
vagyunk, s mindig elsre eltalljuk a helyes megoldst, az NP problma P problmv vlik. A szmtgpes
tudomny egyik nagy nyitott krdse az, hogy az NP osztly ekvivalens-e a P osztllyal akkor, ha nlklzzk a
vgtelen processzorhalmaz, illetve a mindentud sejts luxust. A legtbb szmtgpes szakember meg van
gyzdve arrl, hogy P NP, vagyis, hogy az NP problmk inherens mdon nehezek, s nincsenek szmukra
polinom idej algoritmusok. Ezt azonban mg soha sem bizonytottk be.
Akik a P = NP eldntse irnt rdekldnek, azok figyelmbe az NP osztly egy alosztlyt, az NP-teljes (NPcomplete) problmk alosztlyt ajnljuk. A teljes sz itt a legvgst jelenti, s az NP osztly legnehezebb
problmit jelli ki. Azt bebizonytottk mr, hogy vagy minden NP-teljes problma P-ben van, vagy egyik sem.
Emiatt ez az osztly elmletileg rdekes, de gyakorlati jelentsge is van, mert sok fontos problmrl tudjuk,
hogy NP-teljes. Egy lehetsges plda a Boole-kifejezsek kielgthetsgnek problmja: egy adott logikai
kifejezs esetn ltezik-e az tletvltozinak olyan logikairtk-hozzrendelse, hogy a kifejezs igaz legyen?
Hacsak egy csodnak nem lesznk tani, s a P = NP nem lesz igaz, nincs olyan algoritmus, amely minden
kielgthetsgi problmt polinomilis idben megold. Az MI azonban jobban rdekelt abban, hogy vajon
lteznek-e hatkony algoritmusok tipikus, elre rgztett eloszlsokbl sorsolt problmk esetn. Ahogy ezt a 7.
fejezetben lttuk, vannak olyan algoritmusok, mint a WALKSAT, amelyek sok problma esetn egszen jl
teljestenek.
A co-NP osztly az NP komplemense abban az rtelemben, hogy minden NP-beli dntsi problma esetn
ltezik egy neki megfelel co-NP-beli problma felcserlt igen s nem vlaszokkal. Tudjuk, hogy a P mind
az NP, mind a co-NP osztlyok rszhalmaza, s azt gondoljuk, hogy vannak olyan co-NP-beli problmk,
amelyek P-nek nem elemei. A co-NP osztly legnehezebb problmi a co-NP-teljes problmk.
A #P osztly az NP-beli dntsi problmknak megfelel szmllsi problmk halmaza. Dntsi problmknak
igen-nem a megoldsuk: pldul ltezik-e megoldsa ennek a 3-SAT mondatnak? A szmllsi problmknak
egsz szmok a megoldsaik; mennyi megoldsa van ennek a 3-SAT mondatnak? Egyes esetekben a szmllsi
problma a dntsi problmnl sokkal nehezebb. gy pldul annak az eldntse, hogy egy pros grfhoz
ltezik-e egy tkletes prostsa O(VE) idej (ahol a grfnak V cscsa s E le van). A hny tkletes
prostsa ltezik egy konkrt pros grf esetn szmllsi problma viszont #P-teljes, amin azt kell rteni,
hogy legalbb olyan nehz, mint a #P-beli problmk brmelyike, s gy legalbb olyan nehz, mint az NP-beli
problmk brmelyike.
A P-TR a polinom-trigny problmk osztlyt szintn tanulmnyoztk mg nemdeterminisztikus gp
esetn is. Az az ltalnos vlekeds, hogy a P-TR-nehz problmk az NP-teljes problmknl nehezebbek,
br kiderlhet, hogy NP = P-TR, mint ahogy az is kiderlhet, hogy P = NP.
2. A2. Vektorok, mtrixok s lineris algebra
858
Matematikai alapok
A matematikusok egy vektort egy vektortrelemknt definilnak. Mi azonban konkrtabb defincit fogunk
hasznlni. Egy vektor az rtkek egy rendezett szekvencija. A ktdimenzis trben pldul olyan vektoraink
vannak, mint: x = 3, 4 s y = 0, 2 . A szoksos konvencihoz folyamodunk vastagon szedett betket
hasznlva a vektorneveknek, br egyes szerzk a nevek fl nyilat vagy vonalat hznak:
elemeire indexekkel lehet hivatkozni: z = z1, z2, , zn .
. Egy vektor
A vektorokon rtelmezett kt alapvet mvelet a vektorok sszeadsa s egy skalrral val szorzsa. Az x + y
vektorsszeads az elemenknti sszegzs: x + y = 3 + 0, 4 + 2 = 3, 6 . A skalrszorzs mindegyik
elemet egy konstans rtkkel szorozza be: 5x = 5 3, 5 4 = 15, 20 .
Egy vektor hosszt az |x| jelli, amelynek rtke egyenl a vektor elemeinek ngyzetsszegbl vett
ngyzetgykvel:
sszege, azaz
. Kt vektor skalrszorzata, x y a megfelel vektorelemek szorzatnak

, vagy konkrt esetnkben x y = 3 0 + 4 2 = 8.
A vektorokat sokszor egy n-dimenzis euklideszi tr irnytott vonalszakaszainak (nyilaknak) kpzeljk. Ekkor
a vektorsszeads annak felel meg, mintha az egyik vektor kezd pontjt a msik vektor vgpontjhoz
illesztennk, az x y skalrszorzat viszont |x||y|cos-vel lesz egyenl, ahol az x s az y kztti szg.
Egy mtrix az rtkek ngyszgletes elrendezse sorokba s oszlopokba. Itt egy 3 4 mret m mtrixot
ltunk:
Az mi,j els indexe a sort, a msodik az oszlopot jelli. Programozsi nyelvekben mi,j-t gyakran m[i,j], vagy
m[i][j]-nek rjk.
Kt mtrix sszegt a megfelel elemek sszeadsval definiljuk: (m + n)i,j = mi,j + ni,j. (Az sszeg klnbz
mret m s n mtrixokra nincs definilva.) Egy mtrixnak egy skalrral trtn szorzatt szintn
definilhatjuk: (cm)i,j = cmi,j. A mtrixszorzat (kt mtrix szorzata) mr bonyolultabb. Az mn szorzat csak
akkor definilt, ha az m mtrix a b, az n mtrix pedig b c mret (azaz a msodik mtrixnak annyi sora van,
mint amennyi oszlopa az els mtrixnak). Az eredmny egy a c mret mtrix. Ez azt jelenti, hogy a
mtrixszorzat nem kommutatv: ltalnossgban mn nm. Ha a mtrixok megfelel mretek, akkor az
eredmny:
Az I egysgmtrix Ii,j elemei egysgnyiek, ha i = j, klnben nullk. Az egysgmtrix tulajdonsga, hogy mI =

m, minden m-re. Az m transzponltjt, mT-t, megkapjuk, ha az m sorait s oszlopait felcserljk, formlisan:
.
A mtrixokat lineris egyenletrendszerek megoldsra a GaussJordan-elimincis (GaussJordan
elimination) algoritmussal hasznljuk, ami egy O(n3) komplexits algoritmus. Tekintsnk az albbi
egyenletrendszert, amelynek x, y s z megoldsra vagyunk kvncsiak:
+2x + y z = 8
3x y + 2z = 11
2x + y + 2z = 3
Ezt az egyenletrendszert kifejezhetjk mtrixos formban is:
859
Matematikai alapok
Itt az x y z c nem rsze a mtrixnak, csak emlkeztetl szolgl. Tudjuk, hogy ha egy egyenlet mindkt oldalt
egy konstanssal megszorozzuk, vagy ha kt egyenletet egymshoz hozzadunk, akkor szintn egy rvnyes
egyenlethez jutunk el. A Gauss Jordan-eliminci ezeket a lpseket ismtelten alkalmazza gy, hogy elszr
az els vltozt (az x-et) eliminljuk, az elst kivve az sszes egyenletbl, majd folytatjuk minden i-re, az iedik vltozt minden egyenletbl eliminlva, az i-edik egyenletet kivve. Az x-et a msodik egyenletbl gy
eliminljuk, hogy az els egyenletet 3/2-vel megszorozzuk, az eredmnyt pedig a msodik egyenlethez
hozzadjuk. Ezzel az albbi mtrixhoz jutunk el:
Folytatjuk gy eliminlva az x-et, az y-t s a z-t, mg vgl a:
mtrixot kapjuk, amely jelzi, hogy a megolds x = 2, y = 3, z = 1. (Prblja ki!)
3. A3. Valsznsgi eloszlsok

A valsznsg az esemnyhalmazokon definilt olyan mrtk, amely az albbi hrom aximt elgti ki:
1. Minden esemny mrtke egy 0 s 1 kztti szm. Ezt a kvetkezkppen rjuk: 0 P(E = ei) 1, ahol az E
egy esemnyt kpvisel vletlen vltoz, s az ei-k az E lehetsges rtkei. ltalnossgban a vletlen
vltozkat nagybetkkel, az rtkeit pedig kisbetkkel jelljk.
2. Az egsz halmaz mrtke 1; azaz
3. Diszjunkt halmazok unijnak a valsznsge az egyedi esemnyek valsznsgeinek sszege, azaz P(E =
e1 E = e2) = P(E = e1) + P(E = e2), ahol e1 s e2 diszjunktak.
Egy valsznsgi modell (probabilistic model) a klcsnsen egymst kizr, lehetsges kimenetelek
mintaterbl ll, s minden kimenetel valsznsgi mrtkbl. A holnapi idjrs modelljben pldul a
kimenetelek a kvetkezk lehetnek: napos, felhs, ess vagy havas. Ezen kimenetelek egy rszhalmaza kpvisel
egy esemnyt. A csapadkesemny pldul az {ess, havas} rszhalmaz.
A P(E = e1), , P(E = en) rtkekbl kpzett vektor jellsre a P(E)-t fogjuk hasznlni. A P(ei) jellst
szintn hasznlni fogjuk a P(E = ei) rvidtsre, hasonlan a
-knt rvidtjk.
A P(B|A) feltteles valsznsget a P(B A)/P(A) definilja. A s B felttelesen fggetlenek, ha P(B|A) = P(B)
[vagy ekvivalens mdon P(A|B) = P(A)]. Folytonos vltozk esetn az rtkek halmaza vgtelen, s hacsak
pontszer tskk nincsenek, mindegyik rtk valsznsge 0. Emiatt egy valsznsgi srsgfggvnyt
(probability density function) definilunk, amit szintn P(X)-szel fogunk jellni. P(X) jelentse a P(A) diszkrt
valsznsgi fggvnytl kiss eltr. A P(X = c) srsgfggvny-rtk az a valsznsg, hogy az X a c krli
intervallumba esik, elosztva az intervallum hosszval, s hatrtmenetet kpezve, ahogy az intervallum hossza
tart a 0-hoz:
860
Matematikai alapok
A srsgfggvnynek nemnegatvnak kell lennie minden x-re, s teljestenie kell, hogy:
Definilhatunk egy valsznsgi eloszlsfggvnyt (cumulative probability density function), F(X)-et is,
ami annak a valsznsge, hogy a vletlen vltoz x-nl kisebb:
Jegyezzk meg, hogy a valsznsgi srsgfggvnynek ltezik egysge, az eloszlsfggvny viszont egysg
nlkli. Ha az X-et pldul msodpercben mrjk, akkor a srsget Hz-ben (azaz 1/s) fogjuk. Ha X a mterben
mrt hromdimenzis tr egy pontja, akkor a srsget 1/m3-ben mrjk.
Az egyik legfontosabb valsznsg-eloszls a Gauss-eloszls (Gaussian distribution), amit normlis
eloszlsnak (normal distribution) is szoks nevezni. A kzprtk s szrs (2 variancij) Gausseloszls defincija:
ahol x egy folytonos vltoz -tl +-ig terjed rtkkszlettel. = 0 s 2 = 1 mellett kapjuk a standard
normlis eloszls (standard normal distribution) specilis esetet. Egy d dimenzis x vektor feletti eloszls a
tbbvltozs Gauss-eloszls (multivariate Gaussian distribution):
ahol az eloszls kzprtkvektora, pedig a kovarianciamtrix (covariance matrix).

A standard normlis eloszls egydimenzis eloszlsfggvnye:
ahol az erf(x) az n. hibafggvny (error function), amelynek zrt alakja nincs.

A kzponti hatreloszls ttele (central limit theorem) azt mondja, hogy n vletlen vltoz kzprtknek
az eloszlsa a normlis eloszlshoz tart, ha n tart vgtelenhez. Igaz ez a vletlen vltozk majdnem minden
halmazra, hacsak valamelyik vges alhalmaz variancija a tbbit nem fogja dominlni.

A szmtgpes tudomnyokban ma oly elterjedten hasznlt O() jellst (nagy ord) P. G. H. Bachmann nmet
matematikus vezette be a szmelmlettel kapcsolatban (Bachmann, 1894). Az NP-teljessg koncepcijt Cook
(Cook, 1971) dolgozta ki, mg a problmk egymsra reduklsnak modern mdszertant Karpnak
ksznhetjk (Karp, 1972). Munkssgukrt mindketten Turing-djban a szmtgpes tudomnyok
legmagasabb elismersben rszesltek.
Az algoritmusok elemzsre s tervezsre irnyul klasszikus munkk kztt talljuk a (Knuth, 1973; Aho s
trsai, 1974) mveket. jabb adalkok Tarjantl (Tarjan, 1983) s a Cormen, Leiserson s Rivest
szerzhrmastl (Cormen s trsai, 1990) szrmaznak. Ezekben a mvekben a hangslyt a kezelhet
problmkat megold algoritmusok tervezsre s elemzsre helyeztk. Az NP-teljessgnek, illetve a
kezelhetetlensg ms forminak az elmletbe a legjobb bevezetk (Garey s Johnson, 1979) s (Papadimitriou,
1994). Az elmlet trgyalsn tlmenen Garey s Johnson meggyzen, pldkkal illusztrljk, hogy a
861
Matematikai alapok
szmtgpes szakemberek mirt a polinom s az exponencilis futsi idigny hatrra teszik egyhangan a
kezelhet s kezelhetetlen problmk kztti hatrvonalat. A szerzk az NP-teljesknt vagy ms szempontbl
kezelhetetlennek ismert problmk terjedelmes katalgust is mellkelik.
A valsznsg-szmtsrl j mvek (Chung, 1979; Ross, 1988; BertsekasTsitsiklis, 2002; Feller, 1971).
862
B. fggelk - Megjegyzsek a
nyelvekrl s az algoritmusokrl
1. B1. Nyelvek definilsa BackusNaur-Formban
(BNF)
Jelen knyvben definiltunk nhny nyelvet, az tletlogika nyelvt (3. szakasz - A logika rsz), az elsrend
logika nyelvt (2.2. szakasz - Szimblumok s interpretcik rsz) s az angol nyelv rszhalmazt (4. szakasz Kiterjesztett nyelvtanok rsz). Egy formlis nyelvet mondathalmazknt definilunk, ahol egy-egy mondat a
szimblumok halmaza. A szmunkra rdekes nyelvek mindegyike vgtelen sok mondatbl ll,
kvetkezskppen szksgnk van e halmaz tmr jellemzsre. A jellemzst egy nyelvtan (grammar)
segtsgvel ksreljk meg. Nyelvtanunkat BackusNaur-forma (Backus Naur form) vagy BNFformalizmusban fejezzk ki. Egy BNF-nyelvtannak ngy komponense van:
A zrszimblumok vagy a terminlisok (terminal symbols) halmaza. Ezekbl a szimblumokbl,
mskppen szavakbl, llnak ssze a nyelv mondatai. Ezek lehetnek betk (A, B, C, ) vagy szavak (a,
aardvark, abacus, ...).
A nyelv rszkifejezseit kategorizl nemzr szimblumok vagy nemterminlisok (nonterminal
symbols) halmaza. Az angol nyelvben pldul a FnviKifejezs (NounPhrase) nemzr szimblum a you
s a the big slobbery dog mondatokat is tartalmaz vgtelen halmazt jelenti.
A kezd szimblum (start symbol) a nyelv teljes mondatait jelent nemzr szimblum. Az angol nyelv
esetn ez a Mondat (Sentence), az aritmetika esetn ilyen szimblum lehet a Kifejezs (Expr).
A kpzsi szablyok (rewrite rules) halmaza, ahol egy-egy szably LHS RHS formj. LHS egy nemzr
szimblum, az RHS pedig 0 vagy tbb (zr vagy nemzr) szimblumbl llhat.
A
Mondat FnviKifejezs IgeiKifejezs
alak kpzsi szably azt jelenti, hogy ha brmikor is van kt, egy FnviKifejezs-knt s egy IgeiKifejezsknt kategorizlt mondatunk, akkor azokat sszekapcsolhatjuk, s az eredmnyt Mondat-knt kategorizlhatjuk.
A | szimblum az alternatv jobb oldali kifejezseket vlasztja szt. Nzzk most az egyszer aritmetikai
kifejezsek BNF- nyelvtant:
Kifejezs
Opertor
Kifejezs
Kifejezs ) | Szm
Kifejezs
Szm
Szmjegy | Szm Szmjegy
Szmjegy
0|1|2|3|4|5|6|7|8|9
Opertor
+ | | |
A nyelvekkel s a nyelvtanokkal bvebben a 22. fejezetben foglalkoztunk. Elfordul, hogy ms forrsokban a

BNF-re kiss mdostott jellst hasznlnak. Nemzr szimblum esetn Szmjegy -gyel tallkozhatunk a
Szmjegy helyett, a zrszimblum esetn sz-val a sz helyett, illetve szablyokban a : : = jellssel a
helyett.
2. B2. Az algoritmusok lersa pszeudokddal
863
Megjegyzsek a nyelvekrl s az
algoritmusokrl
A knyvnkben tbb mint 80 algoritmust definiltunk rszletesen. Ahelyett hogy egy programozsi nyelvet
vlasztottuk volna (s ahelyett, hogy azt kockztattuk volna, hogy a nyelvet nem ismer olvas elveszti a
fonalat), gy dntttnk, hogy pszeudokddal rjuk le az algoritmusokat. Ezek legtbbje rthet lesz azoknak,
akik Javt, C++-t, Lispet vagy hasonl nyelveket hasznlnak. Helyenknt azonban matematikai formulkat,
illetve mindennapi nyelvet hasznlunk olyan rszek lershoz, amelyek msklnben nehezebben lennnek
olvashatk. Nhny egyni vonsrl is szt kell ejtennk.
Statikus vltozk. A static kulcsszt egy olyan vltoz megjellsre hasznljuk, amely kezdeti vagy a
rkvetkez rtkadsbl add rtkt a fggvny els hvsnl kapja meg, s megtartja a fggvny minden
azt kvet hvsnl. A statikus vltoz teht hasonlt egy globlis vltozra abban, hogy a fggvny egyedi
hvst tlli, rtke azonban csak a fggvnyen bell frhet hozz. A knyv gensprogramjai statikus
vltozkat memria ltestsre hasznlnak. A statikus vltozkat kezel programok objektumknt
implementlhatk olyan objektumorientlt nyelvekben, mint a Java vagy a Smalltalk. A funkcionlis
nyelvekben az implementlsuk knnyen oldhat meg a lambda-kifejezs vgrehajtsval egy olyan
krnyezeten bell, amelyben a szksges vltozt definiltuk.
Fggvnyek mint rtkek. A fggvnyek s eljrsok jellsre nagybets neveket, a vltozk jellsre pedig
kis-, dlt bets neveket hasznlunk. Egy fggvnyhvs legtbb esetben teht FN(x) kpet nyjt. Megengedjk
azonban, hogy egy vltoz fggvnyrtket is felvehessen. Ha az f rtke pldul a ngyzetgykfggvny, akkor
az f (9) ltal visszaadott rtk a 3.
A tmbk 1-tl kezddnek. Ha mskppen nincs specifiklva, egy tmb els indexe mindig 1, ahogy ez a
matematikban szoks, s nem 0, mint a Javban vagy a C-ben.
A beljebb szedett bekezds fontos. A beljebb szedett bekezdst a hurok vagy a feltteles kifejezs
hatskrnek megjellsre hasznljuk, mint pldul a Python nyelvben, ellenttben a Javval s a C++-szal
(ahol a zrjelezs hasznlatos), illetve a Pascallal s a Visual Basickel (ahol egy end hasznlatos).
3. B3. Online segdnyjts

Fontos
A knyvben tallhat algoritmusok tbbsgt online kdtrunkban implementltuk, amelynek cme:
aima.cs.berkeley.edu
Fontos
Ha nnek megjegyzsei lennnek a knyvnkkel kapcsolatban, hibkat vett szre, illetve ha tletei
vannak, amelyekkel a knyv javthat, keressen meg bennnket. Krjk, ltogassa meg a
weboldalunkon a vitafrumunkat, vagy kldjn e-mail zenetet a kvetkez cmre:
aima@cs.berkeley.edu
864
C. fggelk - Irodalomjegyzk
Aarup, M., Arentoft, M. M., Parrod, Y., Stadler, J., and Stokes, I. (1994). OPTIMUM-AIV: A knowledgebased planning and scheduling system for spacecraft AIV. In Fox, M. and Zweben, M. (Eds.), Knowledge Based
Scheduling. Morgan Kaufmann, San Mateo, California.
Abramson, B. and Yung, M. (1989). Divide and conquer under global constraints: A solution to the N-queens
problem. Journal of Parallel and Distributed Computing, 6(3), 649662.
Ackley, D. H. and Littman, M. L. (1991). Interactions between learning and evolution. In Langton, C., Taylor,
C. Farmer, J. D., and Ramussen, S. (Eds.) Artificial Life II, pp. 487509. Addison-Wesley, Redwood City,
California.
Adelson-Velsky, G. M., Arlazarov, V. L., Bitman, A. R., Zhivotovsky, A. A., and Uskov, A. V. (1970).
Programming a computer to play chess. Russian Mathematical Surveys, 25, 221262.
Adelson-Velsky, G. M., Arlazarov, V. L., and Donskoy, M. V. (1975). Some methods of controlling the tree
search in chess programs. Artificial Intelligence, 6(4), 361371.
Agmon, S. (1954.) The relaxation method for linear inequalities. Canadian J. Math., 6(3), 382392.
Agre, P. E. and Chapman, D. (1987). Pengi: an implementation of a theory of activity. In Proceedings of the
Tenth International Joint Conference on Artificial Intelligence (IJCAI-87), pp. 26872, Milan. Morgan
Kaufman.
Aho, A. V., Hopcroft, J., and Ullman, J. D. (1974). The Design and Analysis of Computer Algorithms. AddisonWesley, Reading, Massachusetts.
Aho, A. V. and Ullman, J. D. (1972). The Theory of Parsing, Translation and Compiling. Prentice-Hall, Upper
Saddle River, New Jersey.
Ait-Kaci, H. and Podelski, A. (1993). Towards a meaning of LIFE. Journal of Logic Programming, 16(34),
195234.
Aizerman, M., Braverman, E., and Rozonoer, L. (1964). Theoretical foundations of the potential functions
method in pattern recognition learning. Automation and Remote Control, 25, 821837.
Albus, J. S. (1975). A new approach to manipulator control: The cerebellar model articulation controller
(CMAC). Journal of Dynamic Systems, Measurement, and Control, 97, 270277.
Aldous, D. and Vazirani, U. (1994). Go with the winners algorithms. In Procceedings of the 35th Annual
Symposiumon Foundations of Computer Science, pp. 492501, Santa Fe, New Mexico. IEEE Computer Society
Press.
Allais, M. (1953). Le comportment de lhomme rationnel devant la risque: critique des postulats et axiomes de
lcole Amricaine. Econometrica, 21, 503546.
Allen, J. F. (1983). Maintaining knowledge about temporal intervals. Communications of the Association for
Computing Machinery, 26(11), 832843.
Allen, J. F. (1984). Towards a general theory of action and time. Artificial Intelligence, 23, 123154.
Allen, J. F. (1991). Time and time again: The many ways to represent time. International Journal of Intelligent
Systems, 6, 341355.
Allen, J. F. (1995). Natural Language Understanding. Benjamin/Cummings, Redwood City; California.
Allen, J. F., Hendler, J., and Tate, A. (Eds.). (1990). Readings in Planning. Morgan Kaufmann, San Mateo,
California.
865
Irodalomjegyzk
Almuallim, H. and Dietterich, T. (1991). Learning with many irrelevant features. In Proccedings of the Ninth
National Conference on Artificial Intelligence (AAAI-91), Vol. 2, pp. 547552, Anaheim, California. AAAI
Press.
ALPAC (1966). Language and machines: Computers in translation and linguistics. Tech. rep. 1416, The
Automatic Language Processing Advisory Committee of the National Academy of Sciences, Washington, DC.
Alshawi, H. (Ed.). (1992). The Core Language Engine. MIT Press, Cambridge, Massachusetts.
Alterman, R. (1988). Adaptive planning. Cognitive Science, 12, 393422.
Amarel, F. (1998). On representations of problems of reasoning about actions. In Michie, D. (Ed.), Machine
Intelligence 3, Vol. 3, pp. 131171. Elsevier/North-Holland, Amsterdam, London, New York.
Ambros-Ingerson, J. and Steel, S. (1988). Integrating planning, execution and monitoring. In Proceedings of
the Seventh National Conference on Artificial Intelligence (AAAI-88), pp. 735740, St. Paul, Minnesota.
Morgan Kaufmann.
Amit, D., Gutfreund, H., and Sompolinsky, H. (1985). Spin-glass models of neural networks. Physical Review,
A 32, 10071018.
Andersen, S. K., Olesen, K. G., Jensen, F. V., and Jensen F. (1989). HUGIN a shell for building Bayesian
belief universes for expert systems. In Proceedings of the Eleventh International Joint Conference on Artificial
Intelligence (IJCAI-89), Vol. 2, pp. 10801085. Detroit. Morgan Kaufmann.
Anderson, A. R. (Ed.) 1964). Minds and Machines. Prentice-Hall, Upper Saddle River, New Jersey.
Anderson, J. A. and Rosenfeld, E. (Eds.). (1988). Neurocomputing: Foundations of Research. MIT Press,
Cambridge, Massachusetts.
Anderson, J. R. (1980). Cognitive Psychology and Its Implications. W. H. Freeman, New York.
Anderson, J. R. (1993). The Architecture of Cognition. Harvard University Press, Cambridge, Massachusetts.
Andre, D. and Russell, S. J. (2002). State abstraction for programmable reinforcement learning agents. In
Proceedings of the Eighteenth National Conference on Artificial Intelligence (AAAI-02), pp. 119125,
Edmonton, Alberta. AAAI Press.
Anshelevich, V. A. (2000). The game of Hex: An automatic theorem proving approach to game programming.
In Proceedings of the Seventeenth National Conference on Artificial Intelligence (AAAI-00), pp. 189194.
Austin, Texas. AAAI Press.
Anthony, M. and Bartlett, P. (1999). Neural Network Learning: Theoretical Foundations. Cambridge
University Press, Cambridge, UK.
Appel, K. and Haken, W. (1977). Every planar map is four colorable: Part I: Discharging. Illinois J. Math., 21,
429490.
Apt, K. R. (1999). The essence of constraint propagation. Theoretical Computer Science, 221 (12), 179210.
Apt, C. Damerau, F., and Weiss, S. (1994). Automated learning of decision rules for text categorization. ACM
Transactions on Information Systems, 12, 233251.
Arkin, R. (1998). Behavior-Based Robotics. MIT Press, Boston, MA.
Armstrong, D. M. (1968). A Materialist Theory of the Mind. Routledge and Kegan Paul, London.
Arnauld, A. (1662). La logique, ou lart de penser. Chez Charles Savreux, au pied de la Tour de Nostre Dame,
Paris.
Arora, S. (1998). Polynomial time approximation schemes for Euclidean traveling salesman and other
geometric problems. Journal of the Association for Computing Machinery, 45(5), 753782.
866
Irodalomjegyzk
Ashby, W. R. (1940). Adaptiveness and equilibrium. Journal of Mental Science, 86, 478483.
Ashby, W. R. (1948). Design for a brain. Electronic Engineering, December, 379383.
Ashby, W. R. (1952). Design for a Brain. Wiley, New York.
Asimov, I. (1942). Runaround. Astounding Science Fiction, March.
Asimov, I. (1950). I. Robot. Doubleday, Garden City, New York.
Astrom, K. J. (1965). Optimal control of Markov decision processes with incomplete state estimation. J. Math.
Anal. Applic., 10, 174205.
Audi, R. (Ed.). (1999). The Cambridge Dictionary of Philosophy. Cambridge University Press, Cambridge, UK.
Austin, J. L. (1962). How To Do Things with Words. Harvard University Press, Cambridge, Massachusetts.
Axelrod, R. (1985). The Evolution of Cooperation. Basic Books, New York.
Bacchus, F. (1990). Representing and Reasoning with Probabilistic Knowledge. MIT Press, Cambridge,
Massachusetts.
Bacchus, F. and Grove, A. (1995). Graphical models for preference and utility. In Uncertainty in Artificial
Intelligence: Proceedings of the Eleventh Conference, pp. 310, Montreal, Canada, Morgan Kaufmann.
Bacchus, F. and Grove, A. (1996). Utility independence in a qualitative decision theory. In Proceedings of the
Fifth International Conference on the Principles of Knowledge Representation and Reasoning, pp. 542552,
San Mateo, California, Morgan Kaufmann.
Bacchus, F. Grove, A., Halpern, J. Y., and Koller, D. (1992). From statistics to beliefs. In Proceedings of the
Tenth National Conference on Artificial Intelligence (AAAI-92), pp. 602608, San Jose. AAAI Press.
Bacchus, F. and van Beek, P. (1998). On the conversion between non-binary and binary constraint satisfaction
problems. In Proceedings of the Fifteenth National Conference on Artificial Intelligence (AAAI-98), pp. 311
318, Madison, Wisconsin. AAAI Press.
Bacchus, F. and van Run, P. (1995). Dynamic variable ordering in CSPs. In Proceedings of the First
International Conference on Principles and Practice of Constraint Programming, pp. 258275, Cassis, France.
Springer-Verlag.
Bachmann, P. G. H. (1894). Die analytische Zahlentheorie. B. G. Teubner, Leipzig.
Backus, J. W. (1996). Transcript of question and answer session. In Wexelblat, R. L. (Ed.), History of
Programming Languages, p. 162. Academic Press, New York.
Baeza-Yates, R. and Ribeiro-Neto, B. (1999). Modern Information Retrieval. Addison Wesley Longman,
Reading, Massachusetts.
Bajcsy, R. and Lieberman, L. (1976). Texture gradient as a depth cue. Computer Graphics and Image
Processing, 5(1), 5267.
Baker, C. L. (1989). English Syntax. MIT Press, Cambridge, Massachusetts.
Baker, J. (1975). The Dragon system overview. IEEE Transactions on Acoustics, Speech, and Signal
processing, 23, 2429.
Baker, J. (1979). Trainable grammars for speech recognition. In Speech Communication Papers for the 97th
Meeting of the Acoustical Society of America, pp. 547550, Cambridge, Massachusetts. MIT Press.
Baldwin, J. M. (1896). A new factor in evolution. American Naturalist, 30, 441451. Continued on pages 536
553.
867
Irodalomjegyzk
Ballard, B. W. (1983). The *-minimax search procedure for trees containing chance nodes. Artificial
Intelligence, 21(3), 327350.
Baluja, S. (1997). Genetic algorithms and explicit search statistics. In Mozer, M. C. Jordan, M. I., and Petsche,
T. (Eds.), Advances in Neural Information Processing Systems, Vol. 9. pp. 319325. MIT Press, Cambridge,
Massachusetts.
Bancilhon, F. Maier, D., Sagiv, Y., and Ullman, J. D. (1986). Magic sets and other strange ways to implement
logic programs. In Proceedings of the Fifth ACM Symposium on Principles of Database Systems, pp. 116. New
York. ACM Press.
Bar-Hillel, Y. (1954). Indexical expressions. Mind, 63, 359379.
Bar-Hillel, Y. (1960). The present status of automatic translation of languages. In Alt, F. L. (Ed.), Advances in
Computers, Vol. 1, pp. 91163. Academic Press, New York.
Bar-Shalom, Y. (Ed.). (1972). Multitarget-multisensor tracking: Advanced applications. Artech House,
Norwood, Massachusetts.
Bar-Shalom, Y. and Fortmann, T. E. (1988). Tracking and Data Association. Academic Press, New York.
Barrett, A. and Weld, D. S. (1994). Task-decomposition via plan parsing. In Proceedings of the Twelfth
National Conference on Artificial Intelligence (AAAI-94), pp. 11171122, Seattle. AAAI Press.
Bartak, R. (2001). Theory and practice of constraint propagation. In Proceedings of the Third Workshop on
Constraint Programming for Decision and Control (CPDC-01), pp. 714, Gliwice, Poland.
Barto, A. G. Bradtke, S. J., and Singh, S. P. (1995). Learning to act using real-time dynamic programming.
Artificial Intelligence, 73(1), 81138.
Barto, A. G., Sutton, R. S., and Anderson, C. W. (1983). Neuronlike adaptive elements that can solve difficult
learning control problems. IEEE Transactions on Systems, Man and Cybernetics, 13, 834846.
Barto, A. G., Sutton, R. S., and Brouwer, P. S. (1981). Associative search network: A reinforcement learning
associative memory. Biological Cybernetics, 40(3), 201211.
Barton, G. E. Berwick, R. C., and Ristad, E. S. (1987). Computational Complexity and Natural Language. MIT
Press, Cambridge, Massachusetts.
Barwise, J. and Etchemendy, J. (1993). The Language of First-Order Logic: Including the Macintosh Program
Tarskis World 4.0 (Third Revised and Expanded edition). Center for the Study of Language and Information
(CSLI), Stanford, California.
Bateman, J. A. (1997). Enabling technology for multilingual natural language generation: The KPML
development environment. Natural Language Engineering, 3(1), 1555.
Bateman, J. A., Kasper, R. T., Moore, J. D., and Whitney, R. A. (1989). A general organization of knowledge
for natural language proecessing: The penman upper model. Tech. rep., Information Sciences Institute, Marina
del Rey, CA.
Baum, E., Boneh, D., and Garrett, C. (1995). On genetic algorithms. In Proceedings of the Eighth Annual
Conference on Computational Learning Theory (COLT-92), pp. 230239, Santa Cruz, California. ACM Press.
Baum, E. and Haussler, D. (1989). What size net gives valid generalization?. Neural Computation, 1(1), 151
160.
Baum, E. and Smith, W. D. (1997). A Bayesian approach to relevance in game playing. Artificial Intelligence,
97(12), 195242.
Baum, E. and Wilczek, F. (1988). Supervised learning of probability distributions by neural networks. In
Anderson, D. Z. (Ed.), Neural Information Processing Systems, pp. 5261. American Institute of Physics, New
York.
868
Irodalomjegyzk
Baum, L. E. and Petrie, T. (1966). Statistical inference for probabilistic functions of finite state Markov chains.
Annals of Mathematical Statistics, 41.
Baxter, J. and Bartlett, P. (2000). Reinforcement learning in POMDPs via direct gradient ascent. In
Proceedings of the Seventeenth International Conference on Machine Learning, pp. 4148, Standford,
California. Morgan Kaufmann.
Bayardo, R. J. and Schrag, R. C. (1997). Using CSP look-back techniques to solve real-world SAT instances. In
Proceedings of the Fourteenth National Conference on Artificial Intelligence (AAAI-97). pp. 203208.
Providence, Rhode Island. AAAI Press.
Bayes, T. (1763). An essay towards solving a problem in the doctrine of chances. Philosophical Transactions of
the Royal Society of London, 53, 370418.
Beal, D. F. (1980). An analysis of minimax. In Clarke, M. R. B. (Ed.). Advances in Computer Chess 2, pp. 103
109. Edinburgh University Press, Edinburgh, Scotland.
Beal, D. F. (1990). A generalised quiescence search algorithm. Artificial Intelligence, 43(1), 8598.
Beckert, B. and Posegga, J. (1995). Leantap: Lean, tableau-based deduction. Journal of Automated Reasoning,
15(3), 339358.
Beeri, C. Fagin, R., Maier, D., and Yannakakis, M. (1983). On the desirability of acyclic database schemes.
Journal of the Association for Computing Machinery, 30(3), 479513.
Bell, C. and Tate, A. (1985). Using temporal constraints to restrict search in a planner. In Proceedings of the
Third Alvey IKBS SIG Workshop, Sunningdale, Oxfordshire, UK. Institution of Electrical Engineers.
Bell, J. L. and Machover, M. (1977). A Course in Mathematical Logic. Elservier/North-Holland, Amsterdam,
London, New York.
Bellman, R. E. (1978). An Introduction to Artificial Intelligence: Can Computers Think? Boyd & Fraser
Publishing Company, San Francisco.
Bellman, R. E. and Dreyfus, S. E. (1962). Applied Dynamic Programming. Princeton University Press,
Princeton, New Jersey.
Bellman, R. E. (1957). Dynamic Programming. Princeton University Press, Princeton, New Jersey.
Belongie, S., Malik, J., and Puzicha, J. (2002). Shape matching and object recognition using shape contexts.
IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI), 24(4), 509522.
Bender, E. A. (1996). Mathematical methods in artificial intelligence. IEEE Computer Society Press, Los
Alamitos, California.
Bentham, J. (1823). Principles of Morals and Legislation. Oxford University Press, Oxford, UK. Original work
published in 1789.
Berger, J. O. (1985). Statistical Decision Theory and bayesian Analysis. Springer Verlag, Berlin.
Berlekamp, E. R. Conway, J. H., and Guy, R. K. (1982). Winning Ways, For Your Mathematical Plays.
Academic Press, New York.
Berleur, J. and Brunnstein, K. (2001). Ethics of Computing: Codes, Spaces for Discussion and Law. Chapman
and Hall, London.
Berliner, H. J. (1977), BKG a program that plays backgammon. Tech. rep., Computer Science Department,
Carnegie-Mellon University, Pittsburgh.
Berliner, H. J. (1979). The B* tree search algorithm: A best-first proof procedure. Artificial Intelligence, 12(1),
2340.
869
Irodalomjegyzk
Berliner, H. J. (1980a). Backgammon computer program beats world champion. Artificial Intelligence, 14,
205220.
Berliner, H. J. (1980b). Computer backgammon. Scientific American, 249(6), 6472.
Berliner, H. J. and Ebeling, C. (1989). Pattern knowledge and search: The SUPREM architecture. Artificial
Bernardo, J. M. and Smith, A. F. M. (1994). Bayesian Theory. Wiley, New York.
Berners-Lee, T. Hendler, J., and Lassila, O. (2001). The semantic web. Scientific American, 284(5), 3443.
Bernoulli, D. (1738). Specimen theoriae novae de mensura sortis. Proceedings of the St. Petersburg Imperial
Academy of Sciences, 5, 175192.
Bernstein, A. and Roberts, M. (1985). Computer vs. chess player. Scientific American, 198(6), 96105.
Bernstein, A., Roberts, M., Arbuckle, T., and Belsky, M. S. (1958). A chess playing program for the IBM 704.
In Proceedings of the 1958 Western Joint Computer Conference, pp. 157159, Los Angeles. American Institute
of Electrical Engineers.
Bernstein, P. L. (1996). Against the Odds: The Remarkable Story of Risk. Wiley, New York.
Berrou, C., Glavieux, A., and Thitimajshima, P. (1993). Near Shannon limit error control-correcting coding and
decoding: Turbo-codes. I. In Proc. IEEE International Conference on Communications, pp. 10641070,
Geneva, Switzerland. IEEE.
Berry, D. A. and Fristedt, B. (1985). Bandit Problems: Sequential Allocation of Experiments. Chapman and
Hall, London.
Bertele, U. and Brioschi, F. (1972). Nonserial dynamic programming. Academic Press, New York.
Bertoli, P. Cimatti, A., and Roveri, M. (2001a). Heuristic search + symbolic modell checking = efficient
conformant planning. In Proceedings of the Seventeenth International Joint Conference on Artificial
Intelligence (IJCAI-01), pp. 467472. Seattle, Morgan Kaufmann.
Bertoli, P. Cimatti, A., Roveri, M., and Traverso, P. (2001b). Planning in nondeterministic domains under
partial observability via symbolic model checking. In Proceedings of the Seventeenth International Joint
Conference on Artificial Intelligence (IJCAI-01), pp. 473478. Seattle. Morgan Kaufmann.
Bertsekas, D. (1987). Dynamic Programming: Deterministic and Stochastic Models. Prentice-Hall, Upper
Bertsekas, D. and Tsitsiklis, J. N. (1996). Neurodynamic programming. Athena Scientific, Belmont,
Massachusetts.
Bertsekas, D. and Tsitsiklis, J. N. (2002). Introduction to Probability. Athena Scientific, Belmont,
Massachusetts.
Bibel, W. (1981). On matrices with connections. Journal of the Association for Computing Machinery, 28(4),
633645.
Bibel, W. (1993). Deduction: Automated Logic. Academic Press, London.
Biggs, N. L., Lloyd, E. K., and Wilson, R. J. (1986). Graph Theory 17361936. Oxford University Press,
Oxford, UK.
Binder, J., Koller, D., Russelll, S. J., and Kanazawa, K. (1997a). Adaptive probabilistic networks with hidden
variables. Machine Learning, 29, 213244.
Binder, J. Murphy, K., and Russel, S. J. (1997b). Space-efficient inference in dynamic probabilistic networks.
In Proceedings of the Fifteenth International Joint Conference on Artificial Intelligence (IJCAI-97), pp. 1292
1296, Nagoya, Japan. Morgan Kaufmann.
870
Irodalomjegyzk
Binford, T. O. (1971). Visual perception by computer. Invited paper presented at the IEEE Systems Science and
Cybernetics Conference, Miami.
Binmore, K. (1982). Essays on Foundations of Game Theory. Pitman, London.
Birnbaum, L. and Selfridge, M. (1981). Conceptual analysis of natural language. In Schank, R. and Riesbeck,
C. (Eds.), Inside Computer Understanding. Lawrence Erlbaum, Potomac, Maryland.
Biro, J. I. and Shahan, R. W. (Eds.) (1982). Mind, Brain and Function: Essays in the Philosophy of Mind.
University of Oklahoma Press, Norman, Oklahoma.
Birtwistle, G. Dahl, O.-J., Myrhaug, B. and Nygaard, K. (1973). Simula Begin. Studentliteratur (Lund) and
Auerbach, New York.
Bishop, C. M. (1995). Neural Networks for Pattern Recognition. Oxford University Press, Oxford, UK.
Bistarelli, S. Montanari, U., and Rossi, F. (1997). Semiring-based constraint satisfaction and optimization.
Journal of the Association for Computing Machinery, 44(2), 201236.
Bitner, J. R. and Reingold, E. M. (1975). Backtrack programming techniques. Communications of the
Association for Computing Machinery, 18(11), 651656.
Blei, D. M., Ng, A. Y., and Jordan, M. I. (2001). Latent Dirichlet Allocation. In Neural Information Processing
Systems, Vol. 14, Cambridge, Massachusetts, MIT Press.
Blinder, A. S. (1983). Issues in the coordination of monetary and fiscal policies. In Monetary Policy Issues in
the 1980s. Federal Reserve Bank, Kansas City, Missouri.
Block, N. (ed.) (1980). Readings in Philosophy of Psychology, Vol. 1. Harvard University Press, Cambridge,
Massachusetts.
Blum, A. L. and Furst, M. (1995). Fast planning through planning graph analysis. In Proceedings of the
Fourteenth International Joint Conference on Artificial Intelligence (IJCAI-95), pp. 16361642, Montreal
Morgan Kaufmann.
Blum, A. L. and Furst, M. (1997). Fast planning through planning graph analysis. Artificial Intelligence, 90(1
2), 281300.
Blumer, A., Ehrenfeucht, A., Haussler, D., and Warmuth, M. (1989). Learnability and the VapnikChervonenkis dimension. Journal of the Association for Computing Machinery, 36(4), 929965.
Bobrow, D. G. (1967). Natural language input for a computer problem solving system. In Minsky, M. L. (Ed.),
Semantic Information Processing, pp. 133215. MIT Press, Cambridge, Massachusetts.
Bobrow, D. G., Kaplan, R., Kay, M., Norman, D. A., Thompson, H., and Winograd, T. (1977). GUS, a frame
driven dialog system. Artificial Intelligence, 8, 155173.
Bobrow, D. G. and Raphael, B. (1974). New programming languages for artificial intelligence research.
Computing Surveys, 6(3), 153174.
Boden, M. A. (1977). Artificial Intelligence and Natural Man. Basic Books, New York.
Boden, M. A. (Ed.) (1990). The Philosophy of Artificial Intelligence, Oxford University Press, Oxford, UK.
Bonet, B. and Geffner, H. (1999). Planning as heuristic search: New results. In Proceedings of the European
Conference on Planning, pp. 360372, Durham, UK. Springer-Verlag.
Bonet, B. and Geffner, H. (2000). Planning with incomplete information as heuristic search in belief space. In
Chien, S., Kambhampati, S., and Knoblock, C. A. (Eds.), International Conference on Artificial Intelligence
Planning and Scheduling, pp. 5261, Menlo Park, California. AAAI Press.
Boole, G. (1847). The Mathematical Analysis of Logic: Being an Essay towards a Calculus of Deductiva
Reasoning. Macmillan, Barclay, and Macmillan, Cambridge.
871
Irodalomjegyzk
Boolos, G. S. and Jeffrey, R. C. (1989). Computability and Logic (3rd edition). Cambridge University Press,
Cambridge, UK.
Booth, T. L. (1969). Probabilistic representation of formal languages. In IEEE Conference Record of the 1969
Tenth Annual Symposium on Switching and Automata Theory, pp. 7481, Waterloo, Ontario. IEEE.
Borel, E. (1921). La thorie du jeu et les quations intgrales noyau symtrique. Comptes Rendus
Hebdomadaires des Sances de lAcadmie des Sciences, 173, 13041308.
Borenstein, J., Everett, B., and Feng, L. (1996). Navigating Mobile Robots: Systems and Techniques. A. K.
Peters, Ltd., Wellesley, MA.
Borenstein, J. and Koren., Y. (1991). The vector field histogramfast obstacle avoidance for moile robots. IEEE
Transactions on Robotics and Automation, 7(3), 278288.
Borgida, A., Brachman, R. J., McGuinness, D. L., and Alperin Resnick, L. (1989). CLASSIC: A structural data
model for objects. SIGMOD Record, 18(2), 5867.
Boser, B. E. Guyon, I. M. and Vapnik, V. N. (1992). A training algorithm for optimal margin classifiers. In
Proceedings of the Fifth Annual ACM Workshop on Computational Learning Theory (COLT-92), Pittsburgh,
Pennsylvania. ACM Press.
Boutilier, C. and Brafman, R. I. (2001). Partial-order planning with concurrent interacting actions. Journal of
Artificial Intelligence Research, 14, 105136.
Boutilier, C., Dearden, R., and Goldszmidt, M. (2000). Stochastic dynamic programming with factored
representations. Artificial Intelligence, 121, 49107.
Boutilier, C. Reiter, R., and Price, B. (2001). Symbolic dynamic programming for first-order MDPs. In
Proceedings of the Seventeenth International Joint Conference on Artificial Intelligence (IJCAI-01), pp. 467
472, Seattle, Morgan Kaufmann.
Boutilier, C., Reiter, R., Soutchanski, M., and Thrun, S. (2000). Decision-theoretic, high-level agent
programming in the situation calculus. In Proceedings of the Seventeenth National Conference on Artificial
Intelligence (AAAI-00), pp. 355362, Austin, Texas. AAAI Press.
Box, G. E. P. (1957). Evolutionary operation: A method of increasing industrial productivity. Applied Statistics,
6, 81101.
Boyan, J. A. (2002). Technical update: Least-squares temporal difference learning. Machine Learning, 49(23),
233246.
Boyan, J. A. and Moore, A. W. (1998). Learning evaluation functions for global optimization and Boolean
satisfiability. In Proceedings of the Fifteenth National Conference on Artificial Intelligence (AAAI-98),
Madison, Wisconsin. AAAI Press.
Boyen, X., Friedman, N., and Koller, D. (1999). Discovering the hidden structure of complex dynamic systems.
In Uncertainty in Artificial Intelligence: Proceedings of the Fifteenth Conference, Stockholm. Morgan
Kaufmann.
Boyer, R. S. and Moore, J. S. (1979). A Computational Logic. Academic Press, New York.
Boyer, R. S. and Moore, J. S. (1984). Proof checking the RSA public key encryption algorithm. American
Mathematical Monthly, 91(3), 181189.
Brachman, R. J. (1979). On the epistemological status of semantic networks. In Findler, N. V. (Ed.),
Associative Networks: Representation and Use of Knowledge by Computers, pp. 350. Academic Press, New
York.
Brachman, R. J., Fikes, R. E., and Levesque, H. J. (1983). Krypton: A functional approach to knowledge
representation. Computer, 16(10), 6773.
872
Irodalomjegyzk
Brachman, R. J. and Levesque, H. J. (Eds.). (1985). Readings in Knowledge Representation. Morgan

Kaufmann, San Mateo, California.
Bradtke, S. J. and Barto, A. G. (1996). Linear least-squares algorithms for temporal difference learning.
Machine Learning, 22, 3357.
Brafman, R. I. and Tennenholtz, M. (2000). A near optimal polynomial time algorithm for learning in certain
classes of stochastic games. Artificial Intelligence, 121, 3147.
Braitenberg, V. (1984). Vehicles: Experiments in Synthetic Psychology. MIT Press.
Bransford, J. and Johnson, M. (1973). Consideration of some problems in comprehension. In Chase, W. G.
(Ed.), Visual Information Processing. Academic Press, New York.
Bratko, I. (1986). Prolog Programming for Artificial Intelligence (1st edition). AddisonWesley, Reading,
Massachusetts.
Bratko, I. (2001). Prolog Programming for Artificial Intelligence (Third edition). Addison-Wesley, Reading,
Massachusetts.
Bratman, M. E. (1987). Intention, Plans, and Practical Reason. Harvard University Press, Cambridge,
Massachusetts.
Bratman, M. E. (1992). Planning and the stability of intention. Minds and Machines, 2(1), 116.
Breese, J. S. and Heckerman, D. (1996). Decision-theoretic troubleshooting: A framework for repair and
experiment. In Uncertainty in Artificial Intelligence: Proceedings of the Twelfth Conference, pp. 124132,
Portland, Oregon, Morgan Kaufmann.
Breiman, L. (1996). Bagging predictors. Machine Learning, 26(2), 123140.
Breiman, L., Friedman, J., Olshen, R. A., and Stone, P. J. (1984). Classification and Regression Trees.
Wadsworth International Group, Belmont, California.
Brelaz, D. (1979). New methods to color the vertices of a graph. Communications of the Association for
Brent, R. P. (1973). Algorithms for minimization without derivatives. Prentice-Hall, Upper Saddle River, New
Jersey.
Bresnan, J. (1982). The Mental Representation of Grammatical Relations. MIT Press, Cambridge,
Massachusetts.
Brewka, G., Dix, J., and Konolige, K. (1997). Nononotonic Reasoning: An Overview. CSLI Publications,
Stanford, California.
Bridle, J. S. (1990). Probabilistic interpretation of feedforward classification network outputs, with relationships
to statistical pattern recognition. In Fogelman Souli, F. and Hrault, J. (Eds.), Neurocomputing: Algorithms,
Architectures and Applications. Springer-Verlag, Berlin.
Briggs, R. (1985). Knowledge representation in Sanskrit and artificial intelligence. Al Magazine, 6(1), 3239.
Brin, S. and Page, L. (1998). The anatomy of a largescale hypertextual web search engine. In Proceedings of
the Seventh World Wide Web Conference, Brisbane, Australia.
Broadbent, D. E. (1958). Perception and communication. Pergamon, Oxford, UK.
Brooks, R. A. (1986). A robust layered control system for a mobile robot. IEEE Journal of Robotics and
Automation, 2, 1423.
Brooks, R. A. (1989). Engineering approach to building complete, intelligent beings. Proceedings of the SPIE
the International Society for Optical Engineering, 1002, 618625.
873
Irodalomjegyzk
Brooks, R. A. (1990). Elephants dont play chess. Autonomous Robots, 6, 315.

Brooks, R. A. (1991). Intelligence without representation. Artificial Intelligence, 47(13), 139159.
Brooks, R. A. and Lozano-Perez, T. (1985). A subdivision algorithm in configuration space for findpath with
rotation. IEEE Transactions on Systems, Man and Cybernetics, 15(2), 224233.
Brown, M. Grundy, W., Lin, D., Cristianini, N., Sugnet, C., Furey, T., Ares, M., and Haussler, D. (2000).
Knowledge-based analysis of microarray gene expression data using support vector machines. In Proceedings of
the national Academy of Sciences, Vol. 97, pp. 262267.
Brown, P. F., Cocke, J., Della Pietra, S. A., Della Pietra, V. J., Jelinek, F., Mercer, R. L., and Rossin, P. (1988).
A statistical approach to language translation. In Proceedings of the 12th International Conference on
Computational Linguistics, pp. 7176, Budapest, John von Neumann Society for Computing Sciences.
Brown, P. F., Della Pietra, S. A., Della Pietra, V. J., and Mercer, R. L. (1993). The mathematics of statistical
machine translation: Parameter estimation. Computational Linguistics, 19(2), 263311.
Brownston, L., Farrell, R., Kant, E., and Martin, N. (1985). Programming expert systems in OPS5: An
introduction to rule-based programming. Addison-Wesley, Reading, Massachusetts.
Brudno, A. L. (1963). Bounds and valuations for shortening the scanning of variations. Problems of
Cybernetics, 10, 225241.
Bruner, J. S., Goodnow, J. J., and Austin, G. A. (1957). A Study of Thinking. Wiley, New York.
Bryant, R. E. (1992). Symbolic Boolean manipulation with ordered binary decision diagrams. ACM Computing
Surveys, 24(3), 293318.
Bryson, A. E. and Ho, Y.-C. (1969). Applied Optimal Control. Blaisdell, New York.
Buchanan, B. G. and Mitchell, T. M. (1978). Model-directed learning of production rules. In Waterman, D. A.
and Hays-Roth, F. (Eds.), Pattern-Directed Inference Systems, pp. 297312. Academic Press, New York.
Buchanan, B. G., Mitchell, T. M., Smith, R. G., and Johnson, C. R. (1978). Models of learning systems. In
Encyclopedia of Computer Science and Technology, Vol. 11. Dekker, New York.
Buchanan, B. G., and Shortliffe, E. H. (Eds.). (1984). Rule-Based Expert Systems: The MYCIN Experiments of
the Stanford Heuristic Programming Project. Addison-Wesley, Reading, Massachusetts.
Buchanan, B. G., Sutherland, G. L., and Feigenbaum, E. A. (1969). Heuristic DENDRAL: A program for
generating explanatory hypotheses in organic chemistry. In Meltzer, B., Michie, D., and Swann, M. (Eds.),
Machine Intelligence 4, pp. 209254. Edinburgh University Press, Edinburgh, Scotland.
Bundy, A. (1999). A survey of automated deduction. In Wooldridge, M. J. and Veloso, M. (Eds.), Artificial
intelligence today: Recent trends and developments, pp. 153174. Springer-Verlag, Berlin.
Bunt, H. C. (1985). The formal representation of (quasi-) continuous concepts. In Hobbs, J. R. and Moore, R. C.
(Eds.), Formal Theories of the Commonsense World, chap. 2, pp. 3770. Ablex, Norwood, New Jersey.
Burgard, W., Cremers, A. B., Fox, D., Hhnel, D., Lakemeyer, G., Schulz, D., Steiner, W., and Thrun, S.
(1999). Experiences with an interactive museum tourguide robot. Artificial Intelligence, 114(12), 355.
Buro, M. (2002). Improving heuristic mini-max search by supervised learning. Artificial Intelligence, 134(12),
8599.
Burstall, R. M. (1974). Program proving as hand simulation with a little induction. In Information Processing
74, pp. 308312. Elsevier/North-Holland, Amsterdam, London, New York.
Burstall, R. M. and Darlington, J. (1977). A transformation system for developing recursive programs. Journal
of the Association for Computing Machinery, 24(1), 4467.
874
Irodalomjegyzk
Burstein, J., Leacock, C., and Swartz, R. (2001). Automated evaluation of essays and short answers. In Fifth
International Computer Assisted Assessment (CAA) Conference, Loughborough, U.K. Loughborough
University.
Bylander, T. (1992). Complexity results for serial decomposability. In Proceedings of the Tenth National
Conference on Artificial Intelligence (AAAI-92), pp. 729734, San Jose. AAAI Press.
Bylander, T. (1994). The computational complexity of propositional strips planning. Artificial Intelligence, 69,
165204.
Calvanese, D., Lenzerini, M., and Nardi, D. (1999). Unifying class-based representation formalism. Journal of
Campbell, M. S., Hoane, A. J., and Hsu, F.-H. (2002). Deep Blue. Artificial Intelligence, 134(12), 5783.
Canny, J. and Reif, J. (1987). New lower bound techniques for robot motion planning problems. In IEEE
Symposium on Foundations of Computer Science, pp. 3948.
Canny, J. (1986). A computational approach to edge detection. IEEE Transactions on Pattern Analysis and
Machine Intelligence (PAMI), 8, 679698.
Canny, J. (1988). The Complexity of Robot Motion Planning. MIT Press. Cambridge, Massachusetts.
Carbonell, J. G. (1983). Derivational analogy and its role in problem solving. In Proceedings of the National
Conference on Artificial Intelligence (AAAI-83), pp. 6469, Washington, DC. Morgan Kaufmann.
Carbonell, J. G. Knoblock, C. A., and Minton, S. (1989). PRODIGY: An integrated architecture for planning
and learning. Technical report CMU-CS-89-189, Computer Science Department, Carnegie-Mellon University,
Pittsburgh.
Carbonell, J. R. and Collins, A. M. (1973). Natural semantics in artificial intelligence. In Proceedings of the
Third International Joint Conference on Artificial Intelligence (IJCAI-73), pp. 344351, Stanford, California.
IJCAII.
Carnap, R. (1928). Der logische Aufbau der Welt. Weltkreis-verlag, Berlin-Schlachtensee. Translated into
English as (Carnap, 1967).
Carnap, R. (1948). On the application of inductive logic. Philosophy and Phenomenological Research, 8, 133
148.
Carnap, R. (1950). Logical Foundations of Probability. University of Chicago Press, Chicago.
Carrasco, R. C., Oncina, J., and Calera, J. (1998). Stochastic Inference of Regular Tree Languages, Vol. 1433
of Lecture Notes in Computer Science. Springer-Verlag, Berlin.
Cassandra, A. R. Kaelbling, L., P., and Littman, M. L. (1994). Acting optimally in partially observable
stochastic domains. In Proceedings of the Twelfth National Conference on Artificial Intelligence (AAAI-94), pp.
10231028. Seattle. AAAI Press.
Ceri, S., Gottlob, G., and Tanca, L. (1990). Logic programming and databases. Springer-Verlag, Berlin.
Chakrabarti, P. P., Ghose, S., Acharya, A., and de Sarkar, S. C. (1989). Heuristic search in restricted memory.
Chan, W. P., Prete, F., and Dickinson, M. H. (1998). Visual input to the efferent control system of a flys
gyroscope. Science, 289, 289292.
Chandra, A. K. and Harel, D. (1980). Computable queries for relational data bases. Journal of Computer and
System Sciences, 21(2), 156178.
Chandra, A. K. and Merlin, P. M. (1977). Optimal implementation of conjunctive queries in relational
databases. In Proceedings of the 9th Annual ACM Symposium on Theory of Computing, pp. 7790, New York.
ACM Press.
875
Irodalomjegyzk
Chang, C.-L. and Lee, R. C.-T. (1973). Symbolic Logic and Mechanical Theorem Proving. Academic Press,
New York.
Chapman, D. (1987). Planning for conjunctive goals. Artificial Intelligence, 32(3), 333377.
Charniak, E. (1993). Statistical Language Learning. MIT Press, Cambridge, Massachusetts.
Charniak, E. (1996). Tree-bank grammars. In Proceedings of the Thirteenth National Conference on Artificial
Intelligence (AAAI-96), pp. 10311036, Portland, Oregon. AAAI Press.
Charniak, E. (1997). Statistical parsing with a context-free grammar and word statistics. In Proceedings of the
Fourteenth National Conference on Artificial Intelligence (AAAI-97), pp. 598603, Providence, Rhode Island.
AAAI Press.
Charniak, E. and Goldman, R. (1992). A Bayesian model of plan recognition. Artificial Intelligence, 64(1) 53
79.
Charniak, E. and McDermott, D. (1985). Introduction to Artificial Intelligence. Addison-Wesley, Reading,
Massachusetts.
Charniak, E., Riesbeck, C., McDermott, D., and Meehan, J. (1987). Artificial Intelligence Programming (2nd
edition). Lawrence Erlbaum Associates, Potomac, Maryland.
Chatfield, C. (1989). The Analysis of Time Series: An Introduction (4th edition). Chapman and Hall, London.
Cheeseman, P. (1985). In defense of probability. In Proceedings of the Ninth International Joint Conference on
Artificial Intelligence (IJCAI-85), pp. 10021009, Los Angeles, Morgan Kaufmann.
Cheeseman, P. (1988). An inquiry into computer understanding. Computational Intelligence, 4(1), 5866.
Cheeseman, P., Kanefsky, B., and Taylor, W. (1991). Where the really hard problems are. In Proceedings of the
Twelfth International Joint Conference on Artificial Intelligence (IJCAI-91), pp. 331337, Sydney. Morgan
Kaufmann.
Cheeseman, P., Self, M., Kelly, J., and Stutz, J. (1988). Bayesian classification. In Proceedings of the Seventh
National Conference on Artificial Intelligence (AAAI-88), Vol. 2, pp. 607611, St. Paul, Minnesota, Morgan
Kaufmann.
Cheeseman, P. and Stutz, J. (1996). Bayesian classification (AutoClass): Theory and results. In Fayyad, U.,
Piatesky-Shapiro, G., Smyth, P., and Uthurusamy, R. (Eds.), Advances in Knowledge Discovery and Data
Mining. AAAI Press/MIT Press, Menlo Park, California.
Cheng, J. and Druzdzel, M. J. (2000). AIS-BN: An adaptive importance sampling algorithm for evidential
reasoning in large Bayesian networks. Journal of Artificial Intelligence Research, 13, 155188.
Cheng, J. Greiner, R., Kelly, J., Bell, D. A., and Liu, W. (2002). Learning Bayesian networks from data: An
information-theory based approach. Artificial Intelligence, 137, 4390.
Chierchia, G. and McConnell-Ginet, S. (1990). Meaning and Grammar. MIT Press, Cambridge, Massachusetts.
Chomsky, N. (1956). Three models for the description of language. IRE Transactions on Information Theory,
2(3), 113124.
Chomsky, N. (1957). Syntactic Structures. Mouton, The Hague and Paris.
Chomsky, N. (1980). Rules and representations. The Behavioral and Brain Sciences, 3, 161.
Choset, H. (1996). Sensor Based Motion Planning: The Hierarchical Generalized Voronoi Graph. Ph.D. thesis,
California Institute of Technology.
Chung, K. L. (1979). Elementary Probability Theory with Stochastic Processes (3rd edition). Springer-Verlag,
Berlin.
876
Irodalomjegyzk
Church, A. (1936). A note on the Entscheidungsproblem. Journal of Symbolic Logic, 1, 4041 and 101102.
Church, K. and Patil, R. (1982). Coping with syntactic ambiguity or how to put the block in the box on the
table. American Journal of Computational Linguistics, 8(34), 139149.
Church, K. and Gale, W. A. (1991). A comparison of the enhanced Good-Turing and deleted estimation
methods for estimating probabilities of English bigrams. Computer Speech and Language, 5, 1954.
Churchland, P. M. (1979). Scientific Realism and the Plasticity of Mind. Cambridge University Press,
Cambridge, UK.
Churchland, P. M. and Churchland, P. S. (1982). Functionalism, qualia, and intentionality. In Biro, J. I. and
Shahan, R. W. (Eds.), Mind, Brain and Function: Essays in the Philosophy of Mind, pp. 121145. University of
Oklahoma Press, Norman, Oklahoma.
Churchland, P. S. (1986). Neurophilosophy: Toward a Unifed Science of the MindBrain. MIT Press,
Cimatti, A., Roveri, M., and Traverso, P. (1998). Automatic OBDD-based generation of universal plans in nondetermistic domains. In Proceedings of the Fifteenth National Conference on Artificial Intelligence (AAAI-98),
pp. 875881, Madison, Wisconsin. AAAI Press.
Clark, K. L. (1978). Negation as failure. In Gallaire, H. and Minker, J. (Eds.), Logic and Data Bases, pp. 293
322. Plenum, New York.a
Clark, P. and Niblett, T. (1989). The CN2 induction algorithm. Machine Learning, 3, 261283.
Clarke, A. C. (1968a). 2001: A Space Odyssey. Signet.
Clarke, A. C. (1968b). The world of 2001. Vogue.
Clarke, E. and Grumberg, O. (1987). Research on automtic verification of finite-state concurrent systems.
Annual Review of Computer Science, 2, 269290.
Clarke, E. Grumberg, O., and Peled, D. (1999). Model Checking. MIT Press, Cambridge, Massachusetts.
Clarke, M. R. B. (Ed.). (1977). Advances in Computer Chess 1. Edinburgh University Press, Scotland.
Clearwater, S. H. (Ed.). (1996). Market-Based Control. World Scientific, Singapore and Teneck, New Jersey.
Clocksin, W. F. and Mellish, C. S. (1994). Programming in Prolog (4th edition). Springer-Verlag, Berlin.
Clowes, M. B. (1971). On seeing things. Artificial Intelligence, 2(1), 79116.
Cobham, A. (1964). The intrinsic computational difficulty of functions. In Bar-Hillel, Y. (Ed.), Proceedings of
the 1964 International Congress for Logic, Methodology, and Philosophy of Science, pp. 2430, Jerusalem.
Elsevier/North-Holland.
Cobley, P. (1997). Introducting Semiotics. Totem Books, New York.
Cohen, J. (1988). A view of the origins and development of PROLOG. Communications of the Association for
Computing Machinery, 31, 2636.
Cohen, P. R. (1995). Empirical methods for artificial intelligence. MIT Press, Cambridge, Massachusetts.
Cohen, P. R. and Levesque, H. J. (1990). Intention is choice with commitment. Artificial Intelligence, 42(23),
213261.
Cohen, P. R., Morgan, J., and Pollack, M. E. (1990). Intentions in Communication. MIT Press, Cambridge,
Massachusetts.
Cohen, P. R. and Perrault, C. R. (1979). Elements of a plan-based theory of speech acts. Cognitive Science,
3(3), 177212.
877
Irodalomjegyzk
Cohen, W. W. and Page, C. D. (1995). Learnability in inductive logic programming: Methods and results. New
Generation Computing, 13(34), 369409.
Cohn, A. G. Bennett, B., Gooday, J. M., and Gotts, N. (1997). RCC: A calculus for region based qualitative
spatial reasoning. GeoInformatica, 1, 275316.
Collins, M. J. (1996). A new statistical parser based on bigram lexical dependencies. In Joshi, A. K. and Palmer,
M. (Eds.), Proceedings of the Thirty-Fourth Annual Meeting of the Association for Computational Linguistics,
pp. 184191, San Francisco, Morgan Kaufmann Publishers.
Collins, M. J. (1999). Head-driven Statistical Models for Natural Language Processing. Ph.D. thesis,
University of Pennsylvania.
Collins, M. and Duffy, K. (2002). New ranking algorithms for parsing and tagging: Kernels over discrete
structures, and the voted perceptron. In Proceedings of the ACL.
Colmerauer, A. (1975). Les grammaires de metamorphose. Tech. rep., Groupe dIntelligence Artificielle,
Universit de Marsaille-Luminy.
Colmerauer, A., Kanoui, H., Pasero, R., and Roussel, P. (1973). Un systme de communication homme
machine en Franais. Rapport, Groupe dIntelligence Artificielle, Universit dAix-Marseille II.
Condon, J. H. and Thompson, K. (1982). Belle chess harware. In Clarke, M. R. B. (Ed.), Advances in Computer
Chess 3, pp. 4554. Pergamon, Oxford, UK.
Congdon, C. B., Huber, M., Kortenkamp, D., Bidlack, C., Cohen, C., Huffman, S., Koss, F., Raschke, U., and
Weymouth, T. (1992). CARMEL versus Flakey: A comparison of two robots. Tech. rep. Papers from the AAAI
Robot Competition, RC-92-01, American Association for Artificial Intelligence, Menlo Park, CA.
Connell, J. (1989). A Colony Architecture for an Artificial Creature. Ph.D. thesis, Artificial Intelligence
Laboratory, MIT, Cambridge, MA. also available as AI Technical Report 1151.
Cook, S. A. (1971). The complexity of theorem-proving procedures. In Proceedings of the 3rd Annual ACM
Symposium on Theory of Computing, pp. 151158, New York. ACM Press.
Cook, S. A. and Mitchell, D. (1997). Finding hard instances of the satisfiability problem: A survey. In Du, D.,
Gu, J., and Pardalos, P. (Eds.), Satisfiability problems: Theory and applications. American Mathematical
Society, Providence, Rhode Island.
Cooper, G. (1990). The computational complexity of probabilistic inference using Bayesian belief networks.
Artificial Intelligence, 42, 393405.
Cooper, G. and Herskovits, E. (1992). A Bayesian method for the induction of probabilistic networks from data.
Copeland, J. (1993). Artificial Intelligence: A Philosophical Introduction. Blackwell, Oxford, UK.
Copernicus (1543). De Revolutionibus Orbium Coelestium. Apud Ioh. Petreium, Nuremberg.
Cormen, t. H., Leiserson, C. E., and Rivest, R. (1990). Introduction to Algorithms. MIT Press, Cambridge,
Massachusetts.
Cortes, C. and Vapnik, V. N. (1995). Support vector networks. Machine Learning, 20, 273297.
Cournot, A. (Ed.) (1838). Recherches sur les principes mathmatiques de la thorie des richesses. L. Hachette,
Paris.
Covington, M. A., (1994). Natural Language Processing for Prolog Programmers. Prentice-Hall, Upper Saddle
River, New Jersey.
Cowan, J. D. and Sharp, D. H. (1988a). Neural nets. Quarterly Reviews of Biophysics, 21, 365427.
Cowan, J. D. and Sharp, D. H. (1988b). Neural nets and artificial intelligence. Daedalus, 117, 85121.
878
Irodalomjegyzk
Cox, I. (1993). A review of statistical data association techniques for motion correspondence. International
Journal of Computer Vision, 10, 5366.
Cox, I. and Hingorani, S. L. (1994). An efficient implementation and evaluation of Reids multiple hypothesis
tracking algorithm for visual tracking. In Proceedings of the 12th International Conference on Pattern
Recognition, Vol. 1, pp. 437442, Jerusalem, Israel. International Association for Pattern Recognition (IAPR).
Cox, I. and Wilfong, G. T. (Eds.). (1990). Autonomous Robot Vehicles. Springer-Verlag, Berlin.
Cox, R. T. (1946). Probability, frequency, and reasonable expectation. American Journal of Physics, 14(1), 1
13.
Craig, J. (1989). Introduction to Robotics: Mechanics and Control (2nd Edition). Addison-Wesley Publishing,
Inc., Reading, MA.
Craik, K. J. (1943). The Nature of Explanation. Cambridge University Press, Cambridge, UK.
Crawford, J. M. and Auton, L. D. (1993). Experimental results on the crossover point in satisfiability problems.
In Proceedings of the Eleventh National Conference on Artificial Intelligence (AAAI-93), pp. 2127,
Washington, DC. AAAI Press.
Cristianini, N. and Schlkopf, B. (2002). Support vector machines and kernel methods: The new generation of
learning machines. AI Magazine, 23(3), 3141.
Cristianini, N. and Shawe-Taylor, J. (2000). An introduction to support vector machines and other kernelbased learning methods. Cambridge University Press, Cambridge, UK.
Crockett, L. (1994). The Turing Test and the Frame Problem: AIs Mistaken Understanding of Intelligence.
Ablex, Norwood, New Jersey.
Cross, S. E. and Walker, E. (1994). Dart: Applying knowledge based planning and scheduling to crisis action
planning. In Zweben, M. and Fox, M. S. (Eds.), Intelligent Scheduling, pp. 711729. Morgan Kaufmann, San
Mateo, California.
Cruse, D. A. (1986). Lexical Semantics. Cambridge University Press.
Culberson, J. and Schaeffer, J. (1998). Pattern databases. Computational Intelligence, 14(4), 318334.
Cullingford, R. E. (1981). Integrating knowledge sources for computer understanding tasks. IEEE
Transactions on Systems, Man and Cybernetics (SMC), 11.
Cussens, J. and Dzeroski, S. (2000). Learning Language in Logic, Vol. 1925 of Lecture Notes in Computer
Science. Springer-Verlag, Berlin.
Cybenko, G. (1988). Continuous valued neural networks with two hidden layers are sufficient. Technical report,
Department of Computer Science, Tufts University, Medford, Massachusetts.
Cybenko, G. (1989). Approximation by superpositions of a sigmoidal function. Mathematics of Controls,
Signals, and Systems, 2, 303314.
Daganzo, C. (1979). Multinomial probit: The theory and its application to demand forecasting. Academic
Press, New York.
Dagum, P. and Luby, M. (1993). Approximating probabilistic inference in Bayesian belief networks is NP-hard.
Dahl, O.-J., Myrhaug, B., and Nygaard, K. (1970). (Simula 67) common base language. Tech. rep. N. S-22,
Norsk Regnesentral (Norwegian Computing Center), Oslo.
Dale, R., Moisl, H., and Somers, H. (2000). Handbook of Natural Language Processing. Marcel Dekker, New
York.
879
Irodalomjegyzk
Dantzig, G. B. (1949). Programming of interdependent activities: II. mathematical model. Econometrica, 17,
200211.
Darwiche, A. (2001). Recursive conditioning. Artificial Intelligence, 126, 541.
Darwiche, A. and Ginsberg, M. L. (1992). A symbolic generalization of probability theory. In Proceedings of
the Tenth National Conference on Artificial Intelligence (AAAI-92), pp. 622627, San Jose. AAAI Press.
Darwin, C. (1859). On The Origin of Species by Means of Natural Selection. J. Murray, London.
Darwin, C. (1871). Descent of Man. J. Murray.
Dasgupta, P., Chakrabarti, P. P., and DeSarkar, S. C. (1994). Agent searching in a tree and the optimality of
iterative deepening. Artificial Intelligence, 71, 195208.
Davidson, D. (1980). Essays on Actions and Events. Oxford University Press, Oxford, UK.
Davies, T. R. (1985). Analogy. Informal note INCSLI-85-4, Center for the Study of Language and Information
(CSLI), Stanford, California.
Davies, T. R. and Russell, S. J. (1987). A logical approach to reasoning by analogy. In Proceedings of the Tenth
International Joint Conference on Artificial Intelligence (IJCAI-87), Vol. 1, pp. 264270. Milan. Morgan
Kaufmann.
Davis, E. (1986). Representing and Acquiring Geographic Knowledge. Pitman and Morgan Kaufmann, London
and San Mateo, California.
Davis, E. (1990). Representations of Commonsense Knowledge. Morgan Kaufmann, San Mateo, California.
Davis, K. H., Biddulph, R., and Balashek, S. (1952). Automatic recognition of spoken digits. Journal of the
Acoustical Society of America, 24(6), 637642.
Davis, M. (1957). A computer program for Presburgers algorithm. In Robinson, A. (Ed.), Proving Theorems
(as Done by Man, Logician, or Machine), pp. 215233, Cornell University, Ithaca, New York. Communications
Research Division, Institute for Defense Analysis. Proceedings of the Summer Institute for Symbolic Logic.
Second edition; publication date is 1960.
Davis, M., Logemann, G., and Loveland, D. (1962). A machine program for theorem-proving. Communications
of the Association for Computing Machinery, 5, 394397.
Davis, M. and Putnam, H. (1960). A computing procedure for quantification theory. Journal of the Association
for Computing Machinery, 7(3), 201 215.
Davis, R. and Lenat, D. B. (1982). Knowledge-Based Systems in Artificial Intelligence. McGraw-Hill, New
York.
Dayan, P. (1992). The convergence of TD() for general . Machine Learning, 8(34), 341362.
Dayan, P. and Abbott, L. F. (2001). Theoretical Neuroscience: Computational and Mathematical Modeling of
Neural Systems. MIT Press, Cambridge, Massachusetts.
de Dombal, F. T., Leaper, D. J., Horrocks, J. C., and Staniland, J. R. (1974). Human and computer-aided
diagnosis of abdominal pain: Further report with emphasis on performance of clinicians. British Medical
Journal, 1, 376380.
de Dombal, F. T., Staniland, J. R., and Clamp, S. E. (1981). Geographical variation in disease presentation.
Medical Decision Making, 1, 5969.
de Finetti, B. (1937). Le prvision: ses lois logiques, ses sources subjectives. Ann. Inst. Poincar, 7, 168.
de Freitas, J. F. G., Niranjan, M., and Gee, A. H. (200). Sequential Monte Carlo methods to train neural
network models. Neural Computation, 12(4), 933953.
880
Irodalomjegyzk
de Kleer, J. (1975). Qualitative and quantitative knowledge in classical mechanics. Tech. rep. AI-TR-352, MIT
Artificial Intelligence Laboratory.
de Kleer, J. (1986a). An assumption-based TMS. Artificial Intelligence, 28(2), 127162.
de Kleer, J. (1986b). Extending the ATMS. Artificial Intelligence, 28(2), 163196.
de Kleer, J. (1986c). Problem solving with the ATMS. Artificial Intelligence, 28(2), 197224.
de Kleer, J. (1989). A comparison of ATMS and CSP techniques. In Proceedings of the Eleventh International
Joint Conference on Artificial Intelligence (IJCAI-89), Vol. 1, pp. 290296, Detroit. Morgan Kaufmann.
de Kleer, J. and Brown, J. S. (1985). A qualitative physics based on confluences. In Hobbs, J. R. and Moore, R.
C. (Eds.), Formal Theories of the Commonsense World, chap. 4, pp. 109183. Ablex, Norwood, New Jersey.
de Marcken, C. (1996). Unsupervised Language Acquisition. Ph.D. thesis, MIT.
De Morgan, A. (1864). On the syllogism IV and on the logic of relations. Cambridge Philosophical
Transactions, x, 331358.
De Readt, L. (1992). Interactive Theory Revision: An Inductive Logic Programming Approach. Academic
Press, New York.
de Saussure, F. [1910 (republished 1993)]. Lectures on General Linguistics. Pergamon Press, Oxford, UK.
Deacon, T. W. (1997). The symbolic species: The coevolution of language and the brain. W. W. Norton, New
York.
Deale, M., Yvanovich, M., Schnitzius, D., Kautz, D., Carpenter, M., Zweben, M., Davis, G., and Daun, B.
(1994). The space shuttle ground processing scheduling system. In Zweben, M. and Fox, M. (Eds.), Intelligent
Scheduling, pp. 423449. Morgan Kaufmann, San Mateo, California.
Dean, T., Basye, K., Chekaluk, R., and Hyun, S. (1990). Coping with uncertainty in a control system for
navigation and exploration. In Preceedings of the Eighth National Conference on Artificial Intelligence (AAAI90), Vol. 2, pp. 10101015, Boston. MIT Press.
Dean, T. and Boddy, M. (1988). An analysis of time dependent planning. In Proceedings of the Seventh
National Conference on Artificial Intelligence (AAAI-88), pp. 4954, St. Paul, Minnesota. Morgan Kaufmann.
Dean, T., Firby, R. J., and Miller, D. (1990). Hierarchical planning involving deadlines, travel time, and
resources. Computational Intelligence, 6(1), 381398.
Dean, T., Kaelbling, L. P., Kirman, J., and Nicholson, A. (1993). Planning with deadlines in stochastic domains.
In Proceedings of the Eleventh National Conference on Artificial Intelligence (AAAI-93), pp. 574579,
Dean, T. and Kanazawa, K. (1989a). A model for projection and action. In Proceedings of the Eleventh
International Joint Conference on Artificial Intelligence (IJCAI-89), pp. 985990, Detroit. Morgan Kaufmann.
Dean, T. and Kanazawa, K. (1989b). A model for reasoning about persistence and causation. Computational
Dean, T., Kanazawa, K., and Shewchuk, J. (1990). Prediction, observation and estimation in planning and
control. In 5th IEEE International Symposium on Intelligent Control, Vol. 2, pp. 645650, Los Alamitos, CA.
IEEE Computer Society Press.
Dean, T. and Wellman, M. P. (1991). Planning and Control. Morgan Kaufmann, San Mateo, California.
Debevec, P., Taylor, C., and Malik, J. (1996). Modeling and rendering architecture from photographs: a hybrid
geometry- and image-based approach. In Proceedings. of the 23rd Annual Conference on Computer Graphics
(SIGGRAPH), pp. 1120.
881
Irodalomjegyzk
Debreu, G. (1960). Topological methods in cardinal utility theory. In Arrow, K. J., Karlin, S., and Suppes, P.
(Eds.), Mathematical Methods in the Social Sciences, 1959. Stanford University Press, Stanford, California.
Dechter, R. (1990a). Enhancement schemes for constraint processing: Backjumping, learning and cutset
decomposition. Artificial Intelligence, 41, 273312.
Dechter, R. (1990b). On the expressiveness of networks with hidden variables. In Proceedings of the Eighth
National Conference on Artificial Intelligence (AAAI-90), pp. 379385, Boston. MIT Press.
Dechter, R. (1992). Constraint networks. In Shapiro, S. (Ed.), Encyclopedia of Artificial Intelligence (2nd
edition), pp. 276285. Wiley and Sons, New York.
Dechter, R. (1999). Bucket elimination: A unifying framework for reasoning. Artificial Intelligence, 113, 41
85.
Dechter, R. and Frost, D. (1999). Backtracking algorithms for constraint satisfaction problems. Tech. rep.,
Department of Information and Computer Science, University of California, Irvine.
Dechter, R. and Pearl, J. (1985). Generalized best-first search strategies and the optimality of A*. Journal of the
Dechter, R. and Pearl, J. (1987). Network-based heuristics for constraint-satisfaction problems. Artificial
Dechter, R. and Pearl, J. (1989). Tree clustering for constraint networks. Artificial Intelligence, 38(3), 353366.
DeCoste, D. and Scholkopf, B. (2002). Training invariant support vector machines. Machine Learning, 46(1),
161190.
Dedekind, R. (1888). Was sind und was sollen die Zahlen. Braunschweig, Germany.
Deerwester, S. C., Dumais, S. T., Landauer, T. K., Furnas, G. W., and Harshman, r. A. (1990). Indexing by
latent semantic analysis. Journal of the American Society of Information Science, 41(6), 391407.
DeGroot, M. H. (1970). Optimal Statistical Decisions. McGraw-Hill, New York.
DeGroot, M. H. (1989). Probability and Statistics (2nd edition). Addison-Wesley, Reading, Massachusetts.
DeJong, G. (1981). Generalizations based on explanations. In Proceedings of the Seventh International Joint
Conference on Artificial Intelligence (IJCAI-81), pp. 6769, Vancouver, British Columbia. Morgan Kaufmann.
DeJong, G. (1982). An overview of the FRUMP system. In Lehnert, W. and Ringle, M. (Eds.), Strategies for
Natural Language Processing, pp. 149176. Lawrence Erlbaum, Potomac, Maryland.
DeJong, G. and Mooney, R. (1986). Explanation-based learning: An alternative view. Machine Learning, 1,
145176.
Dempster, A. P. (1968). A generalization of Bayesian inference. Journal of the Royal Statistical Society, 30
(Series B), 205247.
Dempster, A. P., Laird, N., and Rubin, D. (1977). Maximum likelihood from incomplete data via the EM
algorithm. Journal of the Royal Statistical Society, 39 (Series B), 138.
Denes, P. (1959). The design and operation of the mechanical speech recognizer at University College London.
Journal of the British Institution of Radio Engineers, 19(4), 219234.
Deng, X. and Papadimitriou, C. H. (1990). Exploring an unknown graph. In Proceedings 31st Annual
Symposium on Foundations of Computer Science, pp. 355361, St. Louis. IEEE Computer Society Press.
Denis, F. (2001). Learning regular languages from simple positive examples. Machine Learning, 44(1/2), 37
66.
Dennett, D. C. (1971). Intentional systems. The Journal of Philosophy, 68(4), 87106.
882
Irodalomjegyzk
Dennett, D. C. (1978). Why you cant make a computer that feels pain. Synthese, 38(3).
Dennett, D. C. (1984). Cognitive wheels: the frame problem of AI. In Hookway, C. (Ed.), Minds, Machines,
and Evolution: Philosophical Studies, pp. 129151. Cambridge University Press, Cambridge, UK.
Deo, N. and Pang, C.-Y. (1984). Shortest path algorithms: Taxonomy and annotation. Networks, 14(2), 275
323.
Descartes, R. (1637). Discourse on method. In Cottingham, J., Stoothoff, R., and Murdoch, D. (Eds.), The
Philosophical Writings of Descartes, Vol. I. Cambridge University Press, Cambridge, UK.
Descotte, Y. and Latombe, J.-C. (1985). Making compromises among antagonist constraints in a planner.
Devroye, L. (1987). A course in density estimation. Birkhauser, Boston.
Devroye, L., Gyorfi, L., and Lugosi, G. (1996). A probabilistic theory of pattern recognition. Springer-Verlag,
Berlin.
Dickmanns, E. D. and Zapp, A. (1987). Autonomous high speed road vehicle guidance by computer vision. In
Isermann, R. (Ed.), Automatic Control World Congress, 1987: Selected Papers from the 10th Triennial World
Congress of the International Federation of Automatic Control, pp. 221226, Munich. Pergamon.
Dietterich, T. (1990). Machine Learning. Annual Review of Computer Science, 4, 255306.
Dietterich, T. (2000). Hierarchical reinforcement learning with the MAXQ value function decomposition.
Journal of Artificial Intelligence Research, 13, 227303.
DiGioia, A. M., Kanade, T., and Wells, P. (1996). Final report of the second international workshop on robotics
and computer assisted medical interventions. Computer Aided Surgery, 2, 69101.
Dijkstra, E. W. (1959). A note on two problems in connexion with graphs. Numerische Mathematik, 1, 269
271.
Dissanayake, G., Newman, P., Clark, S., Durrant-Whyte, H., and Csorba, M. (2001). A solution to the
simultaneous localisation and map building (SLAM) problem. IEEE Transactions of Robotics and Automation,
17(3), 229241.
Do, M. B. and Kambhampati, S. (2001). Sapa: A domain-independent heuristic metric temporal planner. In
Proceedings of the European Conference on Planning, Toledo, Spain. Springer-Verlag.
Domingos, P. and Pazzani, M. (1997). On the optimality of the simple Bayesian classifier under zeroone loss.
Doran, C., Egedi, D., Hockey, B. A., Srinivas, B., and Zaidel, M. (1994). XTAG systema wide coverage
grammar of English. In Nagao, M. (Ed.), Proceedings of the 15th COLING, Kyoto, Japan.
Doran, J. and Michie, D. (1966). Experiments with the graph traverser program. Proceedings of the Royal
Society of London, 294, Series A, 235259.
Dorf, R. C. and Bishop, R. H. (1999). Modern Control Systems. Addison-Wesley, Reading, Massachusetts.
Doucet, A. (1997). Monte Carlo methods for Bayesian estimation of hidden Markov models: Application to
radiation signals. Ph.D. thesis, Universit de Paris-Sud, Orsay, France.
Dowling, W. F. and Gallier, J. H. (1984). Linear-time algorithms for testing the satisfiability of propositional
Horn formulas. Journal of Logic Programming, 1, 267284.
Dowty, D., Wall, R., and Peters, S. (1991). Introduction to Montague Semantics. D. Reidel, Dordrecht,
Netherlands.
Doyle, J. (1979). A truth maintenance system. Artificial Intelligence, 12(3), 231272.
883
Irodalomjegyzk
Doyle, J. (1983). What is rational psychology? Toward a modern mental philosophy. AI Magazine, 4(3), 5053.
Doyle, J. and Patil, R. (1991). Two theses of knowledge representation: Language restrictions, taxonomic
classification, and the utility of representation services. Artificial Intelligence, 48(3), 261297.
Drabble, B. (1990). Mission scheduling for spacecraft: Diaries of t-sched. In Expert Planning Systems, pp. 76
81, Brighton, UK. Institute of Electrical Engineers.
Draper, D., Hanks, S., and Weld, D. S. (1994). Probabilistic planning with information gathering and
contingent execution. In Proceedings of the Second International Conference on AI Planning Systems, pp. 31
36, Chicago. Morgan Kaufmann.
Dreyfus, H. L. (1972). What Computers Cant Do: A Critique of Artificial Reason. Harper and Row, New York.
Dreyfus, H. L. (1992). What Computers Still Cant Do: A Critique of Artificial Reason. MIT Press, Cambridge,
Massachusetts.
Dreyfus, H. L. and Dreyfus, S. E. (1986). Mind over Machine: The Power of Human Intuition and Expertise in
the Era of the Computer. Blackwell, Oxford, UK.
Dreyfus, S. E. (1969). An appraisal of some shortest-paths algorithms. Operations Research, 17, 395412.
Du, D., Gu, J., and Pardalos, P. M. (Eds.). (1999). Optimization methods for logical inference. American
Mathematical Society, Providence, Rhode Island.
Dubois, D. and Prade, H. (1994). A survey of belief revision and updating rules in various uncertainty models.
International Journal of Intelligent Systems, 9(1), 61100.
Duda, R. O., Gasching, J. and Hart, P. E. (1979). Model design in the Prospector consultant system for mineral
exploration. In Michie, D. (Ed.), Expert Systems in the Microelectronic Age, pp. 153167. Edinburgh University
Press, Edinburgh, Scotland.
Duda, R. O. and Hart, P. E. (1973). Pattern classification and scene analysis. Wiley, New York.
Duda, R. O., Hart, P. E., and Stork, D. g. (2001). Pattern Classification. Wiley, New York.
Dudek, G. and Jenkin, M. (2000). Computational Principles of Mobile Robotics. Cambridge University Press,
Cambridge CB2 2RU, UK.
Durfee, E. H. and Lesser, V. R. (1989). Negotiating task decomposition and allocation using partial global
planning. In Huhns, M. and Gasser, L. (Eds.), Distributed AI, Vol. 2. Morgan Kaufmann, San Mateo, California.
Dyer, M. (1983). In-Depth Understanding. MIT Press, Cambridge, Massachusetts.
Dzeroski, S., Muggleton, S. H., and Russell, S. J. (1992). PAC-learnability of determinate logic programs. In
Proceedings of the Fifth Annual ACM Workshop on Computational Learning Theory (COLT-92), pp. 128135,
Pittsburgh, Pennsylvania. ACM Press.
Earley, J. (1970). An efficient context-free parsing algorithm. Communications of the Association for
Ebeling, C. (1987). All the Right Moves. MIT Press, Cambridge, Massachusetts.
Eco, U. (1979). Theory of Semiotics. Indiana University Press, Bloomington, Indiana.
Edmonds, J. (1965). Paths, trees, and flowers. Canadian Journal of Mathematics, 17, 449467.
Edwards, P. (Ed.). (1967). The Encyclopedia of Philosophy. Macmillan, London.
Eiter, T., Leone, N., Mateis, C., Pfeifer, G., and Scarcello, F. (1998). The KR system dlv: Progress report,
comparisons and benchmarks. In Cohn, A., Schubert, L., and Shapiro, S. (Eds.), Proceedings of the Sixth
International Conference on Principles of Knowledge Representation and Reasoning, pp. 406417, Trento,
Italy.
884
Irodalomjegyzk
Elhadad, M. (1993). FUF: The universal unifieruser manual. Technical report, Ben Gurion University of the
Negev, Beer Sheva, Israel.
Elkan, C. (1993). The paradoxical success of fuzzy logic. In Proceedings of the Eleventh National Conference
on Artificial Intelligence (AAAI-93), pp. 698703, Washington, DC. AAAI Press.
Elkan, C. (1997). Boosting and naive Bayesian learning. Tech. rep., Department of Computer Science and
Engineering, University of California, San Diego.
Elman, J., Bates, E., Johnson, M., Karmiloff-Smith, A., Parisi, D., and Plunkett, K. (1997). Rethinking
Innateness. MIT Press, Cambridge, Massachusetts.
Empson, W. (1953). Seven Types of Ambiguity. New Directions, New York.
Enderton, H. B. (1972). A Mathematical Introduction to Logic. Academic Press, New York.
Erdmann, M. A. and Mason, M. (1988). An exploration of sensorless manipulation. IEEE Journal of Robotics
and Automation, 4(4), 369379.
Erman, L. D., Hayes-Roth, F., Lesser, V. R., and Reddy, R. (1980). The hearsay-ii speech-understanding
system: Integrating knowledge to resolve uncertainty. Computing Surveys, 12(2), 213253.
Ernst, H. A. (1961). MH-1, a Computer-Operated Mechanical Hand. Ph.D. thesis, Massachusetts Institute of
Technology, Cambridge, Massachusetts.
Ernst, M., Millstein, T., and Weld, D. S. (1997). Automatic SAT-compilation of planning problems. In
Proceedings of the Fifteenth International Joint Conference on Artificial Intelligence (IJCAI-97), pp. 1169
1176, Nagoya, Japan. Morgan Kaufmann.
Erol, K., Hendler, J., and Nau, D. S. (1994). HTN planning: Complexity and expressivity. In Proceedings of the
Twelfth National Conference on Artificial Intelligence (AAAI-94), pp. 11231128, Seattle. AAAI Press.
Erol, K., Hendler, J., and Nau, D. S. (1996). Complexity results for HTN planning. Annals of Mathematics and
Etzioni, O. (1989). Tractable decision-analytic control. In Proc. of 1st International Conference on Knowledge
Representation and Reasoning, pp. 114125, Toronto.
Etzioni, O., Hanks, S., Weld, D. S., Draper, D., Lesh, N., and Williamson, M. (1992). An approach to planning
with incomplete information. In Proceedings of the 3rd International Conference on Principles of Knowledge
Representation and Reasoning, Cambridge, Massachusetts.
Etzioni, O. and Weld, D. S. (1994). A softbot-based interface to the Internet. Communications of the
Evans, T. G. (1968). A program for the solution of a class of geometric-analogy intelligence-test questions. In
Minsky, M. L. (Ed.), Semantic Information Processing, pp. 271353. MIT Press, Cambridge, Massachusetts.
Fagin, R., Halpern, J. Y., Moses, Y., and Vardi, M. Y. (1995). Reasoning about Knowledge. MIT Press,
Fahlman, S. E. (1974). A planning system for robot construction tasks. Artificial Intelligence, 5(1), 149.
Fahlman, S. E. (1979). NETL: A System for Representing and Using Real-World Knowledge. MIT Press,
Faugeras, O. (1992). What can be seen in three dimensions with an uncalibrated stereo rig?. In Sandini, G.
(Ed.), Preceedings of the European Conference on Computer Vision, Vol. 588 of Lecture Notes in Computer
Science, pp. 563578. Springer-Verlag.
Faugeras, O. (1993). Three-Dimensional Computer Vision: A Geometric Viewpoint. MIT Press, Cambridge,
Massachusetts.
885
Irodalomjegyzk
Faugeras, O., Luong, Q.-T., and Papadopoulo, T. (2001). The Geometry of Multiple Images. MIT Press,
Fearing, R. S. and Hollerbach, J. M. (1985). Basic solid mechanics for tactile sensing. International Journal of
Robotics Research, 4(3), 4054.
Featherstone, R. (1987). Robot Dynamics Algorithms. Kluwer Academic Publishers, Boston, MA.
Feigenbaum, E. A. (1961). The simulation of verbal learning behavior. Proceedings of the Western Joint
Computer Conference, 19, 121131.
Feigenbaum, E. A., Buchanan, B. G., and Lederberg, J. (1971). On generality and problem solving: A case
study using the DENDRAL program. In Meltzer, B. and Michie, D. (Eds.), Machine Intelligence 6, pp. 165
190. Edinburgh University Press, Edinburgh, Scotland.
Feigenbaum, E. A. and Feldman, J. (Eds.). (1963). Computers and Thought. McGraw-Hill, New York.
Feldman, J. and Sproull, R. F. (1977). Decision theory and artificial intelligence II: The hungry monkey.
Technical report, Computer Science Department, University of Rochester.
Feldman, J. and Yakimovsky, Y. (1974). Decision theory and artificial intelligence I: Semantics-based region
analyzer. Artificial Intelligence, 5(4) 349371.
Fellbaum, C. (2001). Wordnet: An Electronic Lexical Database. MIT Press, Cambridge, Massachusetts.
Feller, W. (1971). An Introduction to Probability Theory and its Applications, Vol. 2. John Wiley.
Ferraris, P. and Giunchiglia, E. (2000). Planning as satisability in nondeterministic domains. In Proceedings of
Seventeenth National Conference on Artificial Intelligence, pp. 748753. AAAI Press.
Fikes, R. E., Hart, P. E., and Nilsson, N. J. (1972). Learning and executing generalized robot plans. Artificial
Fikes, R. E. and Nilsson, N. J. (1971). STRIPS: A new approach to the application of theorem proving to
problem solving. Artificial Intelligence, 2(34), 189208.
Fikes, R. E. and Nilsson, N. J. (1993). STRIPS, a retrospective. Artificial Intelligence, 59(12), 227232.
Findlay, J. N. (1941). Time: A treatment of some puzzles. Australasian Journal of Psychology and Philosophy,
19(3), 216235.
Finney, D. J. (1947). Probit analysis: A statistical treatment of the sigmoid response curve. Cambridge
Firby, J. (1994). Task networks for controlling continuous processes. In Hammond, K. (Ed.), Proceedings of
the Second International Conference on AI Planning Systems, pp. 4954, Menlo Park, CA. AAAI Press.
Firby, R. J. (1996). Modularity issues is reactive planning. In Proceedings of the 3rd International Conference
on Artificial Intelligence Planning Systems (AIPS-96), pp. 7885, Edinburgh, Scotland. AAAI Press.
Fischer, M. J. and Ladner, R. E. (1977). Propositional modal logic of programs. In Proceedings of the 9th ACM
Symposium on the Theory of Computing, pp. 286294, New York. ACM Press.
Fisher, R. A. (1922). On the mathematical foundations of theoretical statistics. Philosophical Transactions of
the Royal Society of London, Series A 222, 309368.
Fix, E. and Hodges, J. L. (1951). Discriminatory analysisnonparametric discrimination: Consistency
properties. Tech. rep. 21-49-004, USAF School of Aviation Medicine, Randolph Field, Texas.
Fogel, D. B. (2000). Evolutionary Computation: Toward a New Philosophy of Machine Intelligence. IEEE
Press, Piscataway, New Jersey.
886
Irodalomjegyzk
Fogel, L. J., Owens, A. J., and Walsh, M. J. (1966). Artificial Intelligence through Simulated Evolution. Wiley,
New York.
Forbes, J. (2002). Learning Optimal Control for Autonomous Vehicles. Ph.D. thesis, University of California,
Berkeley.
Forbus, K. D. (1985). The role of qualitative dynamics in naive physics. In Hobbs, J. R. and Moore, R. C.
(Eds.), Formal Theories of the Commonsense World, chap. 5, pp. 185226. Ablex Norwood, New Jersey.
Forbus, K. D. and de Kleer, J. (1993). Building Problem Solvers. MIT Press, Cambridge, Massachusetts.
Ford, K. M. and Hayes, P. J. (1995). Turing Test considered harmful. In Proceedings of the Fourteenth
International Joint Conference on Artificial Intelligence (IJCAI-95), pp. 972977, Montreal. Morgan
Kaufmann.
Forestier, J.-P. and Varaiya, P. (1978). Multilayer control of large Markov chains. IEEE Transactions on
Automatic Control, 23(2), 298304.
Forgy, C. (1981). OPS5 users manual. Technical report CMU-CS-81-135, Computer Science Department,
Carnegie-Mellon University, Pittsburgh.
Forgy, C. (1982). A fast algorithm for the many patterns/many objects match problem. Artificial Intelligence,
19(1), 1737.
Forsyth, D. and Zisserman, A. (1991). Reflections on shading. IEEE Transactions on Pattern Analysis and
Machine Intelligence (PAMI), 13(7), 671679.
Fortescue, M. D. (1984). West Greenlandic. Croom Helm, London.
Foster, D. W. (1989). Elegy by W. W.: A Study in Attribution. Associated University Presses, Cranbury, New
Jersey.
Fourier, J. (1827). Analyse des travaux de lAcadmie Royale des Sciences, pendant lanne 1824; partie
mathmatique. Histoire de lAcadmie Royale des Sciences de France, 7, xlviilv.
Fox, D., Burgard, W., Dellaert, F., and Thrun, S. (1999). Monte Carlo localization: Efficient position estimation
for mobile robots. In Proceedings of the National Conference on Artificial Intelligence (AAAI), Orlando, FL.
AAAI.
Fox, M. S. (1990). Constraint-guided scheduling: A short history of research at CMU. Computers in Industry,
14(13), 7988.
Fox, M. S., Allen, B., and Strohm, G. (1982). Job shop scheduling: An investigation in constraint-directed
reasoning. In Proceedings of the National Conference on Artificial Intelligence (AAAI-82), pp. 155158,
Pittsburgh, Pennsylvania. Morgan Kaufmann.
Fox, M. S. and Long, D. (1998). The automatic inference of state invariants in TIM. Journal of Artificial
Intelligence Research, 9, 367421.
Frakes, W. and Baeza-Yates, R. (Eds.). (1992). Information Retrieval: Data Structures and Algorithms.
Prentice-Hall, Upper Saddle River, New Jersey.
Francis, S. and Kucera, H. (1967). Computing Analysis of Present-day American English. Brown University
Press, Providence, Rhode Island.
Franco, J. and Paull, M. (1983). Probabilistic analysis of the Davis Putnam procedure for solving the
satisfiability problem. Discrete Applied Mathematics, 5, 7787.
Frank, R. H. and Cook, P. J. (1996). The Winner-Take-All Society. Penguin, New York.
Frege, G. (1879). Begriffsschrift, eine der arithmetischen nachgebildete Formelsprache des reinen Denkens.
Halle, Berlin. English translation appears in van Heijenoort (1967).
887
Irodalomjegyzk
Freuder, E. C. (1978). Synthesizing constraint expressions. Communications of the Association for Computing
Machinery, 21(11), 958966.
Freuder, E. C. (1982). A sufficient condition for backtrack-free search. Journal of the Association for
Freuder, E. C. (1985). A sufficient condition for backtrack-bounded search. Journal of the Association for
Freuder, E. C. and Mackworth, A. K. (Eds.). (1994). Constraint-based reasoning. MIT Press, Cambridge,
Massachusetts.
Freund, Y. and Schapire, R. E. (1996). Experiments with a new boosting algorithm. In Proceedings of the
Thirteenth International Conference on Machine Learning, Bari, Italy. Morgan Kaufmann.
Friedberg, R. M. (1958). A learning machine: Part I. IBM Journal, 2, 213.
Friedberg, R. M., Dunham, B., and North, T. (1959). A learning machine: Part II. IBM Journal of Research and
Development, 3(3), 282287.
Friedman, G. J. (1959). Digital simulation of an evolutionary process. General Systems Yearbook, 4, 171184.
Friedman, J., Hastie, T., and Tibshirani, R. (2000). Additive logistic regression: A statistical view of boosting.
Annals of Statistics, 28(2), 337374.
Friedman, N. (1998). The Bayesian structural EM algorithm. In Uncertainty in Artificial Intelligence:
Proceedings of the Fourteenth Conference, Madison, Wisconsin. Morgan Kaufmann.
Friedman, N. and Goldszmidt, M. (1996). Learning Bayesian networks with local structure. In Uncertainty in
Artificial Intelligence: Proceedings of the Twelfth Conference, pp. 252262, Portland, Oregon. Morgan
Kaufmann.
Fry, D. B. (1959). Theoretical aspects of mechanical speech recognition. Journal of the British Institution of
Radio Engineers, 19(4), 211218.
Fuchs, J. J., Gasquet, A., Olalainty, B., and Currie, K. W. (1990). PlanERS-1: An expert planning system for
generating spacecraft mission plans. In First International Conference on Expert Planning Systems, pp. 7075,
Brighton, UK. Institute of Electrical Engineers.
Fudenberg, D. and Tirole, J. (1991). Game theory. MIT Press, Cambridge, Massachusetts.
Fukunaga, A. S., Rabideau, G., Chien, S., and Yan, D. (1997). ASPEN: A framework for automated planning
and scheduling of spacecraft control and operations. In Proceedings of the International Symposium on AI,
Robotics and Automation in Space, pp. 181187, Tokyo.
Fung, R. and Chang, K. C. (1989). Weighting and integrating evidence for stochastic simulation in Bayesian
networks. In Proceedings of the Fifth Conference on Uncertainty in Artificial Intelligence (UAI-89), pp. 209
220, Windsor, Ontario. Morgan Kaufmann.
Gaifman, H. (1964). Concerning measures in first order calculi. Israel Journal of Mathematics, 2, 118.
Gallaire, H. and Minker, J. (Eds.). (1978). Logic and Databases. Plenum, New York.
Gallier, J. H. (1986. Logic for Computer Science: Foundations of Automatic Theorem Proving. Harper and
Row, New York.
Gallo, G. and Pallottino, S. (1988). Shortest path algorithms. Annals of Operations Research, 13, 379.
Gamba, A., Gamberini, L., Palmieri, G., and Sanna, R. (1961). Further Experiments with PAPA. Nuovo
Cimento Supplemento, 20(2), 221231.
Garding, J. (1992). Shape from texture for smooth curved surfaces in perspecitve projection. Journal of
Mathematical Imaging and Vision, 2(4), 327350.
888
Irodalomjegyzk
Gardner, M. (1968). Logic Machines, Diagrams and Boolean Algebra. Dover, New York.
Garey, M. R. and Johnson, D. S. (1979). Computers and Intractability. W. H. Freeman, New York.
Gaschnig, J. (1977). A general backtrack algorithm that eliminates most redundant tests. In Proceedings of the
Fifth International Joint Conference on Artificial Intelligence (IJCAI-77), p. 457, Cambridge, Massachusetts.
IJCAII.
Gaschnig, J. (1979.) Performance measurement and analysis of certain search algorithms. Technical report
CMU-CS-79-124, Computer Science Department, Carnegie-Mellon University.
Gasser, R., (1995). Efficiently harnessing computational resources for exhaustive search. Ph.D. thesis, ETH
Zrich, Switzerland.
Gasser, R. (1998). Solving nine mens morris. In Nowakowski, r. (Ed.), Games of No Chance. Cambridge
Gat, E. (1998). Three-layered architectures. In Kortenkamp, D., Bonasso, R. P., and Murphy, R. (Eds.), AIbased Mobile Robots: Case Studies of Successful Robot Systems, pp. 195210. MIT Press.
Gauss, K. F. (1809). Theoria Motus Corporum Coelestium in Sectionibus Conicis Solem Ambientium. Sumtibus
F. Perthes et I. H. Besser, Hamburg.
Gauss, K. F. (1829). Beitrge zur theorie der algebraischen gleichungen. Collected in Werke, Vol. 3, pages 71
102. K. Gesellschaft Wissenschaft, Gttingen, Germany, 1876.
Gawande, A. (2002). Complications: A Surgeons Notes on an Imperfect Science. Metropolitan Books, New
York.
Ge, N., Hale, J. and Charniak, E. (1998). A statistical approach to anaphora resolution. In Proceedings of the
Sixth Workshop on Very Large Corpora, pp. 161171, Montreal. COLING-ACL.
Geiger, D., Verma, T., and Pearl, J. (1990). Identifying independence in Bayesian networks. Networks, 20(5),
507534.
Gelb, A. (1974). Applied Optimal Estimation. MIT Press, Cambridge, Massachusetts.
Gelernter, H. (1959). Realization of a geometry-theorem proving machine. In Proceedings of an International
Conference on Information Processing, pp. 273282, Paris. UNESCO House.
Gelfond, M. and Lifschitz, v. (1988). Compiling circumscriptive theories into logic programs. In Reinfrank, M.,
de Kleer, J., Ginsberg, M. L., and Sandewall, E. (Eds.), Non-Monotonic Reasoning: 2nd International Workshop
Proceedings, pp. 7499, Grassau, Germany. Springer-Verlag.
Gelman, A., Carlin, J. B., Stern, H. S., and Rubin, D. (1995). Bayesian Data Analysis. Chapman & Hall,
London.
Geman, S. and Geman, D. (1984). Stochastic relaxation, Gibbs distributions, and Bayesian restoration of
images. IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI), 6(6), 721741.
Genesereth, M. R. (1984). The use of design descriptions in automated diagnosis. Artificial Intelligence, 24(1
3), 411436.
Genesereth, M. R. and Nilsson, N. J. (1987). Logical Foundations of Artificial Intelligence. Morgan Kaufmann,
San Mateo, California.
Genesereth, M. R. and Nourbakhsh, I. (1993). Time-saving tips for problem solving with incomplete
information. In Proceedings of the Eleventh National Conference on Artificial Intelligence (AAAI-93), pp. 724
730, Washington, DC. AAAI Press.
Genesereth, M. R. and Smith, D. E. (1981). Metalevel architecture. Memo HPP-81-6, Computer Science
Department, Stanford University, Stanford, California.
889
Irodalomjegyzk
Gentner, D. (1983). Structure mapping: A theoretical framework for analogy. Cognitive Science, 7, 155170.
Gentzen, G. (1934). Untersuchungen ber das logische Schliessen. Mathematische Zeitschrift, 39, 176210,
405431.
Georgeff, M. P. and Lansky, A. L. (1987). Reactive reasoning and planning. In Proceedings of the Sixth
National Conference on Artificial Intelligence (AAAI-87), pp. 677682, Seattle. Morgan Kaufmann.
Gerevini, A. and Schubert, L. K. (1996). Accelerating partial-order planners: Some techniques for effective
search control and pruning. Journal of Artificial Intelligence Research, 5, 95137.
Gerevini, A. and Serina, I. (2002). LPG: A planner based on planning graphs with action costs. In Proceedings
of the Sixth International Conference on AI Planning and Scheduling, pp. 281290, Menlo Park, California.
AAAI Press.
Germann, U., Jahr, M., Knight, K., Marcu, D., and Yamada, K. (2001). Fast decoding and optimal decoding for
machine translation. In Proceedings of the Conference of the Association for Computational Linguistics (ACL),
pp. 228235, Toulouse, France.
Gershwin, G. (1937). Lets call the whole thing off. song.
Ghahramani, Z. and Jordan, M. I. (1997). Factorial hidden Markov models. Machine Learning, 29, 245274.
Ghallab, M., Howe, A., Knoblock, C. A., and McDermott, D. (1998). PDDLthe planning dormain definition
language. Tech. rep. DCS TR-1165, Yale Center for Computational Vision and Control, New Haven,
Connecticut.
Ghallab, M. and Laruelle, H. (1994). Representation and control in IxTeT, a temporal planner. In Proceedings
of the 2nd International Conference on Artificial Intelligence Planning Systems (AIPS-94), pp. 6167, Chicago.
AAAI Press.
Giacomo, G. D., Lesprance, Y., and Levesque, H. J. (2000). ConGolog, a concurrent programming language
based on the situation calculus. Artificial Intelligence, 121, 109169.
Gibson, J. J. (1950). The Perception of the Visual World. Houghton Mifflin, Boston.
Gibson, J. J. (1979). The Ecological Approach to Visual Perception. Houghton Mifflin, Boston.
Gibson, J. J., Olum, P., and Rosenblatt, F. (1955). Parallax and perspective during aircraft landings. American
Journal of Psychology, 68, 372385.
Gilks, W. R., Richardson, S., and Spiegelhalter, D. J. (Eds.). (1996). Markov chain Monte Carlo in practice.
Chapman and Hall, London.
Gilks, W. R., Thomas, A., and Spiegelhalter, D. J. (1994). A language and program for complex Bayesian
modelling. The Statistician, 43, 169178.
Gilmore, P. C. (1960). A proof method for quantification theory: Its justification and realization. IBM Journal
of Research and Development, 4, 2835.
Ginsberg, M. L. (1989). Universal planning: An (almost) universally bad idea. AI Magazine, 10(4), 4044.
Ginsberg, M. L. (1993). Essentials of Artificial Intelligence. Morgan Kaufmann, San Mateo, California.
Ginsberg, M. L. (1999). GIB: Steps toward an expert-level bridge-playing program. In Proceedings of the
Sixteenth International Joint Conference on Artificial Intelligence (IJCAI-99), pp. 584589, Stockholm. Morgan
Kaufmann.
Ginsberg, M. L., Frank, M., Halpin, M. P., and Torrance, M. C. (1990). Search lessons learned from crossword
puzzles. In Proceedings of the Eighth National Conference on Artificial Intelligence (AAAI-90), Vol. 1, pp. 210
215, Boston. MIT Press.
Gittins, J. C. (1989). Multi-Armed Bandit Allocation Indices. Wiley, New York.
890
Irodalomjegyzk
Glanc, A. (1978). On the etymology of the word robot. SIGART Newsletter, 67, 12.
Glover, F. (1989). Tabu search: 1. ORSA Journal on Computing, 1(3), 190206.
Glover, F. and Laguna, M. (Eds.). (1997). Tabu search. Kluwer, Dordrecht, Netherlands.
Gdel, K. (1930). ber die Vollstndigkeit des Logikkalkls, Ph.D. thesis, University of Vienna.
Gdel, K. (1931). ber formal unentscheidbare Stze der Principia mathematica und verwandter Systeme I.
Monatshefte fr Mathematik und Physik, 38, 173198.
Goebel, J., Volk, K., Walker, H., and Gerbault, F. (1989). Automatic classification of spectra from the infrared
astronomical satellite (IRAS). Astronomy and Astrophysics, 222, L5L8.
Gold, B. and Morgan, N. (2000). Speech and Audio Signal Processing. Wiley, New York.
Gold, E. M. (1967). Language identification in the limit. Information and Control, 10, 447474.
Golden, K. (1998). Leap before you look: Information gathering in the PUCCINI planner. In Proceedings of the
4th International Conference on Artificial Intelligence Planning Systems (AIPS-98), pp. 7077, Pittsburgh,
Pennsylvania. AAAI Press.
Goldman, N. (1975). Conceptual generation. In Schank, R. (Ed.), Conceptual Information Processing, chap. 6.
North-Holland, Amsterdam.
Goldman, R. and Boddy, M. (1996). Expressive planning and explicit knowledge. In Proceedings of the 3rd
International Conference on Artificial Intelligence Planning Systems (AIPS-96), pp. 110117, Edinburgh,
Scotland. AAAI Press.
Gomes, C., Selman, B., and Kautz, H. (1998). Boosting combinatorial search through randomization. In
Proceedings of the Fifteenth National Conference on Artificial Intelligence (AAAI-98), pp. 431437, Madison,
Wisconsin. AAAI Press.
Good, I. J. (1950). Contribution to the discussion of Eliot Slaters Statistics for the chess computer and the
factor of mobility. In Symposium on Information Theory, p. 199, London. Ministry of Supply.
Good, I. J. (1961). A causal calculus. British Journal of the Philosophy of Science, 11, 305318.
Good, I. J. (1965). Speculations concerning the first ultraintelligent machine. In Alt, F. L. and Rubinoff, M.
(Eds.), Advances in Computers, Vol. 6, pp. 3188. Academic Press, New York.
Goodman, D. and Keene, R. (1997). Man versus Machine: Kasparov versus Deep Blue. H3 Publications,
Goodman, N. (1954). Fact, Fiction and Forecast. University of London Press, London.
Goodman, N. (1977). The Structure of Appearance (3rd edition). D. Reidel, Dordrecht, Netherlands.
Gordon, M. J., Milner, A. J., and Wadsworth, C. P. (1979). Edinburgh LCF. Springer-Verlag, Berlin.
Gordon, N. J. (1994). Bayesian methods for tracking. Ph.D. thesis, Imperial College, University of London.
Gordon, N. J., Salmond, D. J., and Smith, A. F. M. (1993). Novel approach to nonlinear/non-Gaussian
Bayesian state estimation. IEE Proceedings F (Radar and Signal Processing), 140(2), 107113.
Gorry, G. A. (1968). Strategies for computer-aided diagnosis. Mathematical Biosciences, 2(34, 293318.
Gorry, G. A., Kassirer, J. P., Essig, A., and Schwartz, W. B. (1973). Decision analysis as the basis for
computer-aided management of acute renal failure. American Journal of Medicine, 55, 473484.
Gottlob, G., Leone, N., and Scarcello, F. (1999a). A comparison of structural CSP decomposition methods. In
Proceedings of the Sixteenth International Joint Conference on Artificial Intelligence (IJCAI-99), pp. 394399,
Stockholm. Morgan Kaufmann.
891
Irodalomjegyzk
Gottlob, G., Leone, N., and Scarcello, F. (1999b). Hypertree decompositions and tractable queries. In
Proceedings of the 18th ACM International Symposium on Principles of Database Systems, pp. 2132,
Philadelphia. Association for Computing Machinery.
Graham, S. L., Harrison, M. A., and Ruzzo, W. L. (1980). An improved context-free recognizer. ACM
Transactions on Programming Languages and Systems, 2(3), 415462.
Grassmann, H. (1861). Lehrbuch der Arithmetik. Th. Chr. Fr. Enslin, Berlin.
Grayson, C. J. (1960). Decisions under uncertainty: Drilling decisions by oil and gas operators. Tech. rep.,
Division of Research, Harvard Business School, Boston.
Green, B., Wolf, A., Chomsky, C., and Laugherty, K. (1961). BASEBALL: An automatic question answerer. In
Proceedings of the Western Joint Computer Conference, pp. 219224.
Green, C. (1969a). Application of theorem proving to problem solving. In Proceedings of the First
International Joint Conference on Artificial Intelligence (ijcai-69), pp. 219239, Washington, DC. IJCAII.
Green, C. (1969b). Theorem-proving by resolution as a basis for question-answering systems. In Meltzer, B.,
Michie, D., and Swann, M. (Eds.), Machine Intelligence 4, pp. 183205. Edinburgh University Press,
Edinburgh, Scotland.
Green, C. and Raphael, B. (1968). The use of theorem-proving techniques in question-answering systems. In
Proceedings of the 23rd ACM National Conference, Washington, DC. ACM Press.
Greenblatt, R. D., Eastlake, D. E., and Crocker, S. D. (1967). The Greenblatt chess program. In Proceedings of
the Fall Joint Computer Conference, pp. 801810. American Federation of Information Processing Societies
(AFIPS).
Greiner, R. (1989). Towards a formal analysis of EBL. In Proceedings of the Sixth International Machine
Learning Workshop, pp. 450453, Ithaca, NY. Morgan Kaufmann.
Grice, H. P. (1957). Meaning. Philosophical Review, 66, 377388.
Grosz, B. J., Joshi, A. K., and Weinstein, S. (1995). Centering: A framework for modeling the local coherence
of discourse. Computational Linguistics, 21(2), 203225.
Grosz, B. J. and Sidner, C. L. (1986). Attention, intentions, and the structure of discourse. Computational
Linguistics, 12(3), 175204.
Grosz, B. J., Sparck Jones, K., and Webber, B. L. (Eds.). (1986). Readings in Natural Language Processing.
Morgan Kaufmann, San Mateo, California.
Grove, W. and Meehl, P. (1996). Comparative efficiency of informal (subjective, impressionistic) and formal
(mechanical, algorithmic) prediction procedures: The clinical statistical controversy. Psychology, Public Policy,
and Law, 2, 293323.
Gu, J. (1989). Parallel Algorithms and Architectures for Very Fast AI Search. Ph.D. thesis, University of Utah.
Guard, J., Oglesby, F., Bennett, J., and Settle, L. (1969). Semi-automated mathematics. Journal of the
Association for Computing Machinery, 16, 4962.
Guibas, L. J., Knuth, D. E., and Sharir, M. (1992). Randomized incremental construction of Delaunay and
Voronoi diagrams. Algorithmica, 7, 381413. See also 17th Int. Coll. on Automata, Languages and
Programming, 1990, pp. 414431.
Haas, A. (1986). A syntactic theory of belief and action. Artificial Intelligence, 28(3), 245292.
Hacking, I. (1975). The Emergence of Probability. Cambridge University Press, Cambridge, UK.
Hald, A. (1990). A History of Probability and Statistics and Their Applications before 1750. Wiley, New York.
Halpern, J. Y. (1990). An analysis of first-order logics of probability. Artificial Intelligence, 46(3), 311350.
892
Irodalomjegyzk
Hamming, R. W. (1991). The Art of Probability for Scientists and Engineers. Addison-Wesley, Reading,
Massachusetts.
Hammond, K. (1989). Case-Based Planning: Viewing Planning as a Memory Task. Academic Press, New
York.
Hamscher, W., Console, L., and Kleer, J. D. (1992). Readings in Model-based Diagnosis. Morgan Kaufmann,
Handschin, J. E. and Mayne, D. Q. (1969). Monte Carlo techniques to estimate the conditional expectation in
multi-stage nonlinear filtering. International Journal of Control, 9(5), 547559.
Hansen, E. (1998). Solving POMDPs by searching in policy space. In Uncertainty in Artificial Intelligence:
Proceedings of the Fourteenth Conference, pp. 211219, Madison, Wisconsin. Morgan Kaufmann.
Hansen, E. and Zilberstein, S. (2001). LAO*: a heuristic search algorithm that finds solutions with loops.
Hansen, P. and Jaumard, B. (1990). Algorithms for the maximum satisfiability problem. Computing, 44(4),
279303.
Hanski, I. and Cambefort, Y. (Eds.). (1991). Dung Beetle Ecology. Princeton University Press, Princeton, New
Jersey.
Hansson, O. and Mayer, A. (1989). Heuristic search as evidential reasoning. In Proceedings of the Fifth
Workshop on Uncertainty in Artificial Intelligence, Windsor, Ontario. Morgan Kaufmann.
Hansson, O., Mayer, A., and Yung, M. (1992). Criticizing solutions to relaxed models yields powerful
admissible heuristics. Information Sciences, 63(3), 207227.
Haralick, R. M. and Elliot, G. L. (1980). Increasing tree search efficiency for constraint satisfaction problems.
Hardin, G. (1968). The tragedy of the commons. Science, 162, 12431248.
Harel, D. (1984). Dynamic logic. In Gabbay, D. and Guenthner, F. (Eds.), Handbook of Philosophical Logic,
Vol. 2, pp. 497604. D. Reidel, Dordrecht, Netherlands.
Harman, G. H. (1983). Change in View: Principles of Reasoning. MIT Press, Cambridge, Massachusetts.
Harsanyi, J. (1967). Games with incomplete information played by Bayesian players. Management Science, 14,
159182.
Hart, P. E., Nilsson, N. J. and Raphael, B. (1968). A formal basis for the heuristic determination of minimum
cost paths. IEEE Transactions on Systems Science and Cybernetics, SSC-4(2), 100107.
Hart, P. E., Nilsson, N. J., and Raphael, B. (1972). Correction to A formal basis for the heuristic determination
of minimum cost paths. SIGART Newsletter, 37, 2829.
Hart, T. P. and Edwards, D. J. (1961). The tree prune (TP) algorithm. Artificial intelligence project memo 30,
Massachusetts Institute of Technology, Cambridge, Massachusetts.
Hartley, R. and Zisserman, A. (2000). Multiple view geometry in computer vision. Cambridge University Press,
Cambridge, UK.
Haslum, P. and Geffner, H. (2001). Heuristic planning with time and resources. In Proceedings of the IJCAI-01
Workshop on Planning with Resources, Seattle.
Hastie, T. and Tibshirani, R. (1996). Discriminant adaptive nearest neighbor classification and regression. In
Touretzky, D. S., Mozer, M. C., and Hasselmo, M. E. (Eds.), Advances in Neural Information Processing
Systems, Vol. 8, pp. 40915. MIT Press, Cambridge, Massachusetts.
893
Irodalomjegyzk
Hastie, T., Tibshirani, R. and Friedman, J. (2001). The Elements of Statistical Learning: Data Mining, Inference
and Prediction. Springer-Verlag, Berlin.
Haugeland, J. (Ed.). (1981). Mind Design. MIT Press, Cambridge, Massachusetts.
Haugeland, J. (Ed.). (1985). Artificial Intelligence: The Very Idea. MIT Press, Cambridge, Massachusetts.
Haussler, D. (1989). Learning conjunctive concepts in structural domains. Machine Learning, 4(1), 740.
Havelund, K., Lowry, M., Park, S., Pecheur, C., Penix, J., Visser, W., and White, J. L. (2000). Formal analysis
of the remote agent before and after flight. In Proceedings of the 5th NASA Langley Formal Methods Workshop,
Williamsburg, VA.
Hayes, P. J. (1978). The naive physics manifesto. In Michie, D. (Ed.), Expert Systems in the Microelectronic
Age. Edinburgh University Press, Edinburgh, Scotland.
Hayes, P. J. (1979). The logic of frames. In Metzing, D. (Ed.), Frame Conceptions and Text Understanding, pp.
4661. de Gruyter, Berlin.
Hayes, P. J. (1985a). Naive physics I: Ontology for liquids. In Hobbs, J. R. and Moore, R. C. (eds.), Formal
Theories of the Commonsense World, chap. 3, pp. 71107. Ablex, Norwood, New Jersey.
Hayes, P. J. (1985b). The second naive physics manifesto. In Hobbs, J. R. and Moore, R. C. (Eds.), Formal
Theories of the Commonsense World, chap. 1, pp. 136. Ablex, Norwood, New Jersey.
Hebb, D. O. (1949). The Organization of Behavior. Wiley, New York.
Heckerman, D. (1986). Probabilistic interpretation for MYCINs certainty factors. In Kanal, L. N. and
Lemmer, J. F. (Eds.), Uncertainty in Artificial Intelligence, pp. 167196. Elsevier/North-Holland, Amsterdam,
London, New York.
Heckerman, D. (1991). Probabilistic Similarity Networks. MIT Press, Cambridge, Massachusetts.
Heckerman, D. (1998). A tutorial on learning with Bayesian networks. In Jordan, M. I. (Ed.), Learning in
graphical models. Kluwer, Dordrecht, Netherlands.
Heckerman, D., Geiger, D., and Chickering, D. M. (1994). Learning Bayesian networks: The combination of
knowledge and statistical data. Technical report MSR-TR-94-09, Microsoft Research, Redmond, Washington.
Heim, I. and Kratzer, A. (1998). Semantics in a Generative Grammar. Blackwell, Oxford, UK.
Heinz, E. A. (2000). Scalable search in computer chess. Vieweg, Braunschweig, Germany.
Held, M. and Karp, R. M. (1970). The traveling salesman problem and minimum spanning trees. Operations
Research, 18, 11381162.
Helmert, M. (2001). On the complexity of planning in transportation domains. In Cesta, A. and Barrajo, D.
(Eds.), Sixth European Conference on Planning (ECP-01), Toledo, Spain. Springer-Verlag.
Hendrix, G. G. (1975). Expanding the utility of semantic networks through partitioning. In Proceedings of the
Fourth International Joint Conference on Artificial Intelligence (IJCAI-75), pp. 115121, Tbilisi, Georgia.
IJCAII.
Henrion, M. (1988). Propagation of uncertainty in Bayesian networks by probabilistic logic sampling. In
Lemmer, J. F. and Kanal, L. N. (Eds.), Uncertainty in Artificial Intelligence 2, pp. 149163. Elsevier/NorthHolland, Amsterdam, London, New York.
Henzinger, T. A. and Sastry, S. (Eds.). (1998). Hybrid systems: Computation and control. Springer-Verlag,
Berlin.
Herbrand, J. (1930). Recherches sur la Thorie de la Dmonstration. Ph.D. thesis, University of Paris.
894
Irodalomjegyzk
Hewitt, C. (1969). PLANNER: a language for proving theorems in robots. In Proceedings of the First
International Joint Conference on Artificial Intelligence (IJCAI-69), pp. 295301, Washington, DC. IJCAII.
Hierholzer, C. (1873). ber die Mglichkeit, einen Linienzug ohne Wiederholung und ohne Unterbrechung zu
umfahren. Mathematische Annalen, 6, 3032.
Hilgard, E. R. and Bower, G. H. (1975). Theories of Learning (4th edition). Prentice-Hall, Upper Saddle River,
New Jersey.
Hintikka, J. (1962). Knowledge and Belierf. Cornell University Press, Ithaca, New York.
Hinton, G. E. and Anderson, J. A. (1981). Parallel Models of Associative Memory. Lawrence Erlbaum
Associates, Potomac, Maryland.
Hinton, G. E. and Nowlan, S. J. (1987). How learning can guide evolution. Complex Systems, 1(3), 495502.
Hinton, G. E. and Sejnowski, T. (1983). Optimal perceptual inference. In Proceedings of the IEEE Computer
Society Conference on Computer Vision and Pattern Recognition, pp. 448453, Washington, DC. IEEE
Computer Society Press.
Hinton, G. E. and Sejnowski, T. (1986). Learning and relearning in Boltzmann machines. In Rumelhart, D. E.
and McClelland, J. L. (Eds.), Parallel Distributed Processing, chap. 7, pp. 282317. MIT Press, Cambridge,
Massachusetts.
Hirsh, H. (1987). Explanation-based generalization in a logic programming environment. In Proceedings of the
Tenth International Joint Conference on Artificial Intelligence (IJCAI-87), Milan. Morgan Kaufmann.
Hirst, G. (1981). Anaphora in Natural Language Understanding: A Survey, Vol. 119 of Lecture Notes in
Computer Science. Springer-Verlag, Berlin.
Hirst, G. (1987). Semantic Interpretation against Ambiguity. Cambridge University Press, Cambridge, UK.
Hobbs, J. R. (1978). Resolving pronoun references. Lingua, 44, 339352.
Hobbs, J. R. (1990). Literature and Cognition. CSLI Press, Stanford, California.
Hobbs, J. R., Appelt, D., Bear, J., Israel, D., Kameyama, M., Stickel, M. E., and Tyson, M. (1997). FASTUS: A
cascaded finite-state transducer for extracting information from natural-language text. In Roche, E. and Schabes,
Y. (Eds.) Finite-State Devices for Natural Language Processing, pp. 383406. MIT Press, Cambridge,
Massachusetts.
Hobbs, J. R. and Moore, R. C. (Eds.). (1985). Formal Theories of the Commonsense World. Ablex, Norwood,
New Jersey.
Hobbs, J. R., Stickel, M. E., Appelt, D., and Martin, P. (1993). Interpretation as abduction. Artificial
Hoffmann, J. (2000). A heuristic for domain independent planning and its use in a n enforced hillclimbing
algorithm. In Proceedings of the 12th International Symposium on Methodologies for Intelligent Systems, pp.
216227, Charlotte, North Carolina. Springer-Verlag.
Hogan, N. (1985). Impedance control: An approach to manipulation. parts i, ii, and iii. Transactions ASME
Journal of Dynamics, Systems, Measurement, and Control, 107(3), 124.
Holland, J. H. (1975). Adaption in Natural and Artificial Systems. University of Michigan Press, Ann Arbor,
Michigan.
Holland, J. H. (1995). Hidden order: How adaptation builds complexity. Addison-Wesley, Reading,
Massachusetts.
Holldobler, S. and Schneeberger, J. (1990). A new deductive approach to planning. New Generation
Computing, 8(3), 225244.
895
Irodalomjegyzk
Holzmann, G. J. (1997). The Spin model checker. ISSS Transactions on Software Engineering, 23(5), 279295.
Hood, A. (1824). Case 4th28 July 1824 (Mr. Hoods cases of injuries of the brain). The Phrenological Journal
and Miscellany, 2, 8294.
Hopfield, J. J. (1982). Neurons with graded response have collective computational properties like those of twostate neurons. Proceedings of the National Academy of Sciences of the United States of America, 79, 2554
2558.
Horn, A. (1951). On sentences which are true of direct unions of algebras. Journal of Symbolic Logic, 16, 14
21.
Horn, B. K. P. (1970). Shape from shading: A method for obtaining the shape of a smooth opeque object from
one view. Technical report 232, MIT Artificial Intelligence Laboratory, Cambridge, Massachusetts.
Horn, B. K. P. (1986). Robot Vision. MIT Press, Cambridge, Massachusetts.
Horn, B. K. P. and Brooks, M. J. (1989). Shape from Shading. MIT Press, Cambridge, Massachusetts.
Horning, J. J. (1969). A study of grammatical inference. Ph.D. thesis, Stanford University.
Horowitz, E. and Sahni, s. (1978). Fundamentals of computer algorithms. Computer Science Press, Rockwille,
Maryland.
Horswill, I. (2000. Functional programming of behavior-based systems. Autonomous Robots, 9, 8393.
Horvitz, E. J. (1987). Problem-solving design: Reasoning about computational value, trade-offs, and resources.
In Proceedings of the Second Annual NASA Research Forum, pp. 2643, Moffett Field, California. NASA
Ames Research Center.
Horvitz, E. J. (1989). Rational metareasoning and compilation for optimizing decisions under bounded
resources. In Proceedings of Computational Intelligence 89, Milan. Association for Computing Machinery.
Horvitz, E. J. and Barry, M. (1995). Display of information for time-critical decision making. In Uncertainty in
Artificial Intelligence: Proceedings of the Eleventh Conference, pp. 296305, Montreal Canada. Morgan
Kaufmann.
Horvitz, E. J., Breese, J. S., Heckerman, D., and Hovel, D. (1998). The Lumiere project: Bayesian user
modeling for inferring the goals and needs of software users. In Uncertainty in Artificial Intelligence:
Proceedings of the Fourteenth Conference, pp. 256265, Madison, Wisconsin. Morgan Kaufmann.
Horvitz, E. J., Breese, J. S., and Henrion, M. (1988). Decision theory in expert systems and artificial
intelligence. International Journal of Approximate Reasoning, 2, 247302.
Horvitz, E. J. and Breese, J. S. (1996). Ideal partition of resources for metareasoning. In Proceedings of the
Thirteenth National Conference on Artificial Intelligence (AAAI-96), pp. 12291234, Portland, Oregon. AAAI
Press.
Horvitz, E. J. and Heckerman, D. (1986). The inconsistent use of measures of certainty in artificial intelligence
research. In Kanal, L. N. and Lemmer, J. F. (Eds.), Uncertainty in Artificial Intelligence, pp. 137151.
Elsevier/North-Holland, Amsterdam, London, New York.
Horvitz, E. J., Heckerman, D., and Langlotz, C. P. (1986). A framework for comparing alternative formalisms
for plausible reasoning. In Proceedings of the Fifth National Conference on Artificial Intelligence (AAAI-86),
Vol. 1, pp. 210214, Philadelphia. Morgan Kaufmann.
Hovy, E. (1988). Generating Natural Language under Progmatic Constraints. Lawrence Erlbaum, Potomac,
Maryland.
Howard, R. A. (1960). Dynamic Programming and Markov Processes. MIT Press, Cambridge, Massachusetts.
Howard, R. A. (1966). Information value theory. IEEE Transactions on Systems Science and Cybernetics, SSC2, 2226.
896
Irodalomjegyzk
Howard, R. A. (1977). Risk preference. In Howard, R. A. and Matheson, J. E. (Eds.), Readings in Decision
Analysis, pp. 429465. Decision Analysis Group, SRI International, Menlo Park, California.
Howard, R. A. (1989). Microrisks for medical decision analysis. International Journal of Technology
Assessment in Health Care, 5, 357370.
Howard, R. A. and Matheson, J. e. (1984). Influence diagrams. In Howard, R. A. and Matheson, J. E. (Eds.),
Readings on the Principles and Applications of Decision Analysis, pp. 721762. Strategic Decisions Group,
Menlo Park, California.
Hsu, F.-H. (1999). IBMs Deep Blue chess grandmaster chips. IEEE Micro, 19(2), 7080.
Hsu, F.-H., Anantharaman, T. S., Campbell, M. S., and Nowatzyk, A. (1990). A grandmaster chess machine.
Scientific American, 263(4), 4450.
Huang, T., Koller, D., Malik, J., Ogasawara, G., Rao, B., Russell, S. J., and Weber, J. (1994). Automatic
symbolic traffic scene analysis using belief networks. In Proceedings of the Twelfth National Conference on
Artificial Intelligence (AAAI-94), pp. 966972, Seattle. AAAI Press.
Huang, X. D., Acero, A., and Hon, H. (2001). Spoken Language Processing. Prentice Hall, Upper Saddle River,
New Jersey.
Hubel, D. H. (1988). Eye, Brain, and Vision. W. H. Freeman, New York.
Huddleston, R. D. and Pullum, G. K. (2002). The Cambridge Grammar of the English Language. Cambridge
Huffman, D. A. (1971). Impossible objects as nonsense sentences. In Meltzer, B. and Michie, D. (Eds.),
Machine Intelligence 6, pp. 295324. Edinburgh University Press, Edinburgh, Scotland.
Hughes, B. D. (1995). Random Walks and Random Environments, Vol. 1: Random Walks. Oxford University
Press, Oxford, UK.
Huhns, M. N. and Singh, M. P. (Eds.). (1998). Readings in agents. Morgan Kaufmann, San Mateo, California.
Hume, D. (1739). A Treatise of Human Nature (2nd edition). Republished by Oxford University Press, 1978,
Oxford, UK.
Hunsberger, L. and Grosz, B. J. (2000). A combinatorial auction for collaborative planning. In International
Conference on Multi-Agent Systems (ICMAS-2000).
Hunt, E. B., Marin, J., and Stone, P. T. (1966). Experiments in Induction. Academic Press, New York.
Hunter, L. and States, D. J. (1992). Bayesian classification of protein structure. IEEE Expert, 7(4), 6775.
Hurwicz, L. (1973). The design of mechanisms for resource allocation. American Economic Review Papers and
Proceedings, 63(1), 130.
Hutchins, W. J. and Somers, H. (1992). An Introduction to Machine Translation. Academic Press, New York.
Huttenlocher, D. P. and Ullman, S. (1990). Recognizing solid objects by alignment with an image.
International Journal of Computer Vision, 5(2), 195212.
Huygens, C. (1657). Ratiociniis in ludo aleae. In van Schooten, F. (Ed.), Exercitionum Mathematicorum.
Elsevirii, Amsterdam.
Hwa, R. (1998). An empirical evaluation of probabilistic lexicalized tree insertion grammars. In Proceedings of
COLING-ACL 98, pp. 557563, Montreal. International Committee on Computational Linguistics and
Association for Computational Linguistics.
Hwang, C. H. and Schubert, L. K. (1993). EL: A formal, yet natural, comprehensive knowledge representation.
In Proceedings of the Eleventh National Conference on Artificial Intelligence (AAAI-93), pp. 676-682,
897
Irodalomjegyzk
Indyk, P. (2000). Dimensionality reduction techniques for proximity problems. In Proceedings of the Eleventh
Annual ACMSIAM Symposium on Discrete Algorithms, pp. 371378, San Francisco. Asociation for Computing
Machinery.
Ingerman, P. Z. (1967). PaniniBackus form suggested. Communications of the Association for Computing
Machinery, 10(3), 137.
Inoue, K. (2001). Inverse entailment for full clausal theories. In LICS-2001 Workshop on Logic and Learning,
Boston, IEEE.
Intille, S. and Bobick, A. (1999). A framework for recognizing multi-agent action from visual evidence. In
Proceedings of the Sixteenth National Conference on Artificial Intelligence (AAAI-99), pp. 518525, Orlando,
Florida. AAAI Press.
Isard, M. and Blake, A. (1996). Contour tracking by stochastic propagation of conditional density. In
Proceedings of Fourth European conference on Computer Vision, pp. 343356, Cambridge, UK. SpringerVerlag.
Jaakkola, T. and Jordan, M. I. (1996). Computing upper and lower bounds on likelihoods in intractable
networks. In Uncertainty in Artificial Intelligence: Proceedings of the Twelfth Conference, pp. 340348.
Morgan Kaufmann, Portland, Oregon.
Jaakkola, T., Singh, S. P., and Jordan, M. I. (1995). Reinforcement learning algorithm for partially observable
Markov decision problems. In Tesauro, G., Touretzky, D., and Leen, T. (Eds.), Advances in Neural Information
Processing Systems 7, pp. 345352, Cambridge, Massachusets. MIT Press.
Jaffar, J. and Lassez, J.-L. (1987). Constraint logic programming. In Proceedings of the Fourteenth ACM
Conference on Principles of Programming Languages, pp. 111119, Munich. Association for Computing
Machinery.
Jaffar, J., Michaylov, S., Stuckey, P. J., and Yap, R. H. C. (1992a). The CLP(R) language and system. ACM
Transactions on Programming Languages and Systems, 14(3), 339395.
Jaffar, J., Stuckey, P. J., Michaylov, S., and Yap, R. H. C. (1992b). An abstract machine for CLP(R).
SIGPLAN Notices, 27(7), 128139.
Jskowski, S. (1934). On the rules of suppositions in formal logic. Studia Logica, 1.
Jefferson, G. (1949). The mind of mechanical man: The Lister Oration delivered at the Royal College of
Surgeons in England. British Medical Journal, 1(25), 11051121.
Jeffrey, R. C. (1983). The Logic of Decision (2nd edition). University of Chicago Press, Chicago.
Jeffreys, H. (1948). Theory of Probability. Oxford, Oxford, UK.
Jelinek, F. (1969). Fast sequential decoding algorithm using a stack. IBM Journal of Research and
Development, 64, 532556.
Jelinek, F. (1976). Continuous speech recognition by statistical methods. Proceedings of the IEEE, 64(4), 532
556.
Jelinek, F. (1997). Statistical methods for speech recognition. MIT Press, Cambridge, Massachusetts.
Jelinek, F. and Mercer, R. L. (1980). Interpolated estimation of Markov source parameters from sparse data. In
Proceedings of the Workshop on Pattern Recognition in Practice, pp. 381397, Amsterdam, London, New
York. North Holland.
Jennings, H. S. (1906). Behavior of the lower organisms. Columbia University Press, New York.
Jensen, F. V. (2001). Bayesian Networks and Decision Graphs. Springer-Verlag, Berlin.
Jespersen, O. (1965). Essentials of English Grammar. University of Alabama Press, Tuscaloosa, Alabama.
898
Irodalomjegyzk
Jevons, W. S. (1874). The Principles of Science. Routledge/Thoemmes Press, London.

Jimenez, P. and Torras, C. (2000). An efficient algorithm for searching implicit AND/OR graphs with cycles.
Joachims, T. (2001). A statistical learning model of text classification with support vector machines. In
Proceedings of the 24th Conference on Research and Development in Information Retrieval (SIGIR), pp. 128
136, New Orleans. Association for Computing Machinery.
Johnson, W. W. and Story, W. E. (1879). Notes On the 15 puzzle. American Journal of Mathematics, 2, 397
404.
Johnson-Laird, P. N. (1988). The Computer and the Mind: An Introduction to Cognitive Science. Harvard
University Press, Cambridge, Massachusetts.
Johnston, M. D. and Adorf, H.-M. (1992). Scheduling with neural networks: The case of the Hubble space
telescope. Computers & Operations Research, 19(34), 209240.
Jones, N. D., Gomard, C. K., and Sestoft, P. (1993). Partial Evaluation and Automatic Program Generation.
Jones, R., Laird, J. E., and Nielsen, P. E. (1998). Automated intelligent pilots for combat flight simulation. In
Preceedings of the Fifteenth National Conference on Artificial Intelligence (AAAI-98), pp. 104754, Madison,
Wisconsin. AAAI Press.
Jonsson, A., Morris, P., Muscettola, N., Rajan, K., and Smith, B. (2000). Planning in interplanetary space:
Theory and practice. In Proceedings of the 5th International Conference on Artificial Intelligence Planning
Systems (AIPS-00), pp. 177186, Breckenridge, Colorado. AAAI Press.
Jordan, M. I. (1995). Why the logistic funciton? a tutorial discussion on probabilities and neural networks.
Computational cognitive science technical report 9503, Massachusetts Institute of Technology.
Jordan, M. I. (2003). An Introduction to Graphical Models. In press.
Jordan, M. I., Ghahramani, Z., Jaakkola, T., and Saul, L. K. (1998). An introduction to variational methods for
graphical models. In Jordan, M. I. (Ed.), Learning in Graphical Models. Kluwer, Dordrecht, Netherlands.
Jordan, M. I., Ghahramani, Z., Jaakkola, T., and Saul, L. K. (1999). An introduction to variational methods for
graphical models. Machine Learning, 37(23), 183233.
Joshi, A. K. (1985). Tree-adjoining grammars: How much context sensitivity is required to provide reasonable
structural descriptions. In Dowty, D., Karttunen, L., and Zwicky, A. (Eds.), Natural Language Parsing.
Cambridge University Press, Cambridge, UK.
Joshi, A. K., Webber, B. L., and Sag, I. (1981). Elements of Discourse Understanding. Cambridge University
Press, Cambridge, UK.
Joslin, D. and Pollack, M. E. (1994). Least-cost flaw repair: A plan refinement strategy for partial-order
planning. In Proceedings of the Twelfth National Conference on Artificial Intelligence (AAAI-94), p. 1506,
Seattle. AAAI Press.
Jouannaud, J.-P. and Kirchner, C. (1991). Solving equations in abstract algebras: A rule-based survey of
unification. In Lassez, J.-L. and Plotkin, G. (Eds.), Computational Logic, pp. 257321. MIT Press, Cambridge,
Massachusetts.
Judd, J. S. (1990). Neural Network Design and the Complexity of Learning. MIT Press, Cambridge,
Massachusetts.
Juels, A. and Wattenberg, M. (1996). Stochastic hill-climbing as a baseline method for evaluating genetic
algorithms. In Touretzky, D. S., Mozer, M. C., and Hasselmo, M. E. (Eds.), Advances in Neural Information
Processing Systems, Vol. 8, pp. 4306. MIT Press, Cambridge, Massachusetts.
Julesz, B. (1971). Foundations of Cyclopean Perception. University of Chicago Press, Chicago.
899
Irodalomjegyzk
Jurafsky, D. and Martin, J. H. (2000). Speech and Language Processing: An Introduction to Natural Language
Processing, Computational Linguistics, and Speech Recognition. Prentice-Hall, Upper Saddle River, New
Jersey.
Kadane, J. B. and Larkey, P. D. (1982). Subjective probability and the theory of games. Management Science,
28(2), 113120.
Kaelbling, L. P., Littman, M. L., and Cassandra, A. R. (1998). Planning and acting in partially observable
stochastic domains. Artificial Intelligence, 101, 99134.
Kaelbling, L. P., Littman, M. L., and Moore, A. W. (1996). Reinforcement learning: A survey. Journal of
Kaelbling, L. P. and Rosenschein, S. J. (1990). Action and planning in embedded agents. Robotics and
Autonomous Systems, 6(12), 3548.
Kager, R. (1999). Optimality Theory. Cambridge University Press, Cambridge, UK.
Kahneman, D., Slovic, P., and Tversky, A. (Eds.). (1982). Judgment under Uncertainty: Heuristics and Biases.
Kaindl, H. and Khorsand, A. (1994). Memory-bounded bidirectional search. In Proceedings of the Twelfth
Kalman, R. (1960). A new approach to linear filtering and prediction problems. Journal of Basic Engineering,
82, 3546.
Kambhampati, S. (1994). Exploiting causal structure to control retrieval and refitting during plan reuse.
Computational Intelligence, 10, 213244.
Kambhampati, S., Mali, A. D., and Srivastava, B. (1998). Hybrid planning for partially hierarchical domains.
In Proceedings of the Fifteenth National Conference on Artificial Intelligence (AAAI-98), pp. 882888,
Kanal, L. N. and Kumar, V. (1988). Search in Artificial Intelligence. Springer-Verlag, Berlin.
Kanal, L. N. and Lemmer, J. f. (Eds.) (1986). Uncertainty in Artificial Intelligence. Elsevier/North-Holland,
Amsterdam, London, New York.
Kanazawa, K., Koller, D., and Russell, S. J. (1995). Stochastic simulation algorithms for dynamic probabilistic
networks. In Uncertainty in Artificial Intelligence: proceedings of the Eleventh Conference, pp. 346351,
Montreal, Canada. Morgan Kaufmann.
Kaplan, D. and Montague, R. (1960). A paradox regained. Notre Dame Journal of Formal Logic, 1(3), 7990.
Karmarkar, N. (1984). A new polynomial-time algorithm for linear programming. Combinatorica, 4, 373395.
Karp, R. M. (1972). Reducibility among combinatorial problems. In Miller, R. E. and Thatcher, J. W. (Eds.),
Complexity of Computer Computations, pp. 85103. Plenum, New York.
Kasami, T. (1965). An efficient recognition and syntax analysis algorithm for context-free languages. Tech. rep.
AFCRL-65758, Air Force Cambridge Research Laboratory, Bedford, Massachusetts.
Kasparov, G. (1997). IBM owes me a rematch. Time, 149(21), 6667.
Kasper, R. T. (1988). Systemic grammar and functional unification grammar. In Benson, J. and Greaves, W.
(Eds.), Systemic Functional Approaches to Discourse. Ablex, Norwood, New Jersey.
Kaufmann, M., Manolios, P., and Moore, J. S. (2000). Computer-Aided Reasoning: An Approach. Kluwer,
Dordrecht, Netherlands.
900
Irodalomjegyzk
Kautz, H. McAllester, D. A., and Selman, B. (1996). Encoding plans in propositional logic. In Proceedings of
the Fifth International Conference on Principles of Knowledge Representation and Reasoning, pp. 374384,
Cambridge, Massachusetts. Morgan Kaufmann.
Kautz, H. and Selman, b. (1992). Planning as satisfiability. In ECAI 92: 10th European Conference on Artificial
Intelligence Proceedings, pp. 359363, Vienna. Wiley.
Kautz, H. and Selman, B. (1998). BLACKBOX: A new aproach to the application of theorem proving to
problem solving. Working Notes of the AIPS-98 Workshop on Planning as Combinatorial Search.
Kavraki, L., Svestka, P., Latombe, J.-C., and Overmars, M. (1996). Probabilistic roadmaps for path planning in
high-dimensional configuration spaces. IEEE Transactions on Robotics and Automation, 12(4), 566580.
Kay, M., Gawron, J. M., and Norvig, P. (1994). Verbmobil: A Translation System for Face-ToFace Dialog.
CSLI Press, Stanford, California.
Kaye, r. (2000). Minesweeper is NP-complete!. Mathematical Intelligencer, 5(22), 915.
Kearns, M. (1990). The Computational Complexity of Machine Learning. MIT Press, Cambridge,
Massachusetts.
Kearns, M., Mansour, Y., and Ng, A. Y. (2000). Approximate planning in large POMDPs via reusable
trajectories. In Solla, S. A., Leen, T. K., and Mller, K.-R. (Eds.), Advances in Neural Information Processing
Systems 12. MIT Press, Cambridge, Massachusetts.
Kearns, M. and Singh, S. P. (1998). Near-optimal reinforcement learning in polynomial time. In Proceedings of
the Fifteenth International Conference on Machine Learning, pp. 260268, Madison, Wisconsin. Morgan
Kaufmann.
Kearns, M. and Vazirani, U. (1994). An Introduction to Computational Learning Theory. MIT Press,
Keeney, R. L. (1974). Multiplicative utility functions. Operations Research, 22, 2234.
Keeney, R. L. and Raiffa, H. (1976). Decisions with Multiple Objectives: preferences and Value Tradeoffs.
Wiley, New York.
Kehler, A. (1997). Probabilistic coreference in information extraction. In Cardie, C. and Weischedel, R. (Eds.),
Proceedings of the Second Conference on Empirical Methods in Natural Language Processing, pp. 163173.
Association for Computational Linguistics, Somerset, New Jersey.
Kemp, M. (Ed.). (1989). Leonardo on Painting: An Anthology of Writings. Yale University Press, New Haven,
Connecticut.
Kern, C. and Greenstreet, M. R. (1999). Formal verification in hardware design: A survey. ACM Transactions
on Design Automation of Electronic Systems, 4(2), 123193.
Keynes, J. M. (1921). A Treatise on Probability. Macmillan, London.
Khatib, O. (1986). Real-time obstacle avoidance for robot manipulator and mobile robots. The International
Journal of Robotics Research, 5(1), 9098.
Kietz, J.-U. and Dzeroski, S. (1994). Inductive logic programming and learnability. SIGART Bulletin, 5(1), 22
32.
Kim, J. H. (1983). CONVINCE: A Conversational Inference Consolidation Engine. Ph.D. thesis, Department of
Computer Science, University of California at Los Angeles.
Kim, J. H. and Pearl, J. (1983). A computational model for combined causal and diagnostic reasoning in
inference systems. In Proceedings of the Eighth International Joint Conference on Artificial Intelligence
(IJCAI-83), pp. 190193, Karlsruhe, Germany. Morgan Kaufmann.
901
Irodalomjegyzk
Kim, J. H. and Pearl, J. (1987). CONVINCE: A conversational inference consolidation engine. IEEE
Transactions on Systems, Man, and Cybernetics, 17(2), 120132.
King, R. D., Muggleton, S. H., Lewis, R. A., and Sternberg, M. J. E. (1992). Drug design by machine learning:
The use of inductive logic programming to model the structure activity relationships of trimethoprim analogues
binding to dihydrofolate reductase. Proceedings of the National Academy of Sciences of the United States of
America, 89(23), 1132211326.
Kirkpatrick, S., Gelatt, C. D., and Vecchi, M. P. (1983). Optimization by simulated annealing. Sience, 220,
671680.
Kirkpatrick, S. and Selman, b. (1994). Critical behavior in the satisfiability of random Boolean expressions.
Science, 264(5163), 12971301.
Kirousis, L. M. and Papadimitriou, C. H. (1988). The complexity of recognizing polyhedral scenes. Journal of
Computer and System Sciences, 37(1), 1438.
Kitano, H., Asada, M., Kuniyoshi, Y., Noda, I., and Osawa, E. (1997). RoboCup: The robot world cup
initiative. In Johnson, W. L. and Hayes-Roth, B. (Eds.), Proceedings of the First International Conference on
Autonomous Agents, pp. 340347, New York. ACM Press.
Kjaerulff, U. (1992). A computational scheme for reasoning in dynamic probabilistic networks. In Uncertainty
in Artificial Intelligence: Proceedings of the Eighth Conference, pp. 121129, Stanford, California. Morgan
Kaufmann.
Klein, D. and Manning, C. D. (2001). Parsing with treebank grammars: Empirical bounds, theoretical models,
and the structure of the Penn treebank. In Proceedings of the 39th Annual Meeting of the ACL.
Kleinberg, J. M. (1999). Authoritative sources in a hyperlinked environment. Journal of the ACM, 46(5), 604
632.
Knight, K. (1999). A statistical mt tutorial workbook. prepared in connection with the Johns Hopkins
University summer workshop.
Knoblock, c. A. (1990). Learning abstraction hierarchies for problem solving. In Proceedings of the Eighth
National Conference on Artificial Intelligence (AAAI-90), Vol. 2, pp. 923928, Boston. MIT Press.
Knuth, D. E. (1968). Semantics for context-free languages. Mathematical Systems Theory, 2(2), 127145.
Knuth, D. E. (1973). The Art of Computer Programming (second edition)., Vol. 2: Fundamental Algorithms.
Addison-Wesley, Reading, Massachusetts.
Knuth, D. E. (1975). An analysis of alphabeta pruning. Artificial Intelligence, 6(4), 293326.
Knuth, D. E. and Bendix, P. B. (1970). Simple word problems in universal algebras. In Leech, J. (Ed.),
Computational Problems in Abstract Algebra, pp. 263267. Pergamon, Oxford, UK.
Koditschek, D. (1987). Exact robot navigation by means of potential functions: some topological
considerations. In Proceedings of the 1987 IEEE International Conference on Robotics and Automation, Vol. 1,
pp. 16, Raleigh, North Carolina. IEEE Computer Society Press.
Koehler, J., Nebel, B., Hoffman, J., and Dimopoulos, y. (1997). Extending planning graphs to an ADL subset.
In Proceedings of the Fourth European Conference on Planning, pp. 273285, Toulouse, France. SpringerVerlag.
Koenderink, J. J. (1990). Solid Shape. MIT Press, Cambridge, Massachusetts.
Koenderink, J. J. and van Doorn, A. J. (1975). Invariant properties of the motion parallax field due to the
movement of rigid bodies relative to an boserver. Optica Acta, 22(9), 773791.
Koenderink, J. J. and van Doorn, A. J. (1991). Affine structure from motion. Journal of the Optical Society of
America A, 8, 377385.
902
Irodalomjegyzk
Koenig, s. (1991). Optimal probabilistic and decision-theoretic planning using Markovian decision theory.
Masters report, Computer Science Division, University of California, Berkeley.
Koenig, S. (2000). Exploring unknown environments with real-time search or reinforcement learning. In solla,
S. A., Leen, T. K., and Mller, K.-R. (Eds.), Advances in Neural Information Processing Systems 12. MIT
Koenig, s. and Simmons, R. (1998). Solving robot navigation problems with initial pose uncertainty using realtime heuristic search. In aips98. AAAI Press, Menlo Park, California.
Kohn, W. (1991). Declarative control architecture. Communications of the Association for Computing
Machinery, 34(8), 6579.
Koller, D., Meggido, N., and von Stengel, B. (1996). Efficient computation of equilibria for extensive twoperson games. Games and Economic Behaviour, 14(2), 247259.
Koller, D. and Pfeffer, A. (1997). Representations and solutions for game-theoretic problems. Artificial
Koller, d. and Pfeffer, a. (1998). Probabilistic frame-based systems. In Proceedings of the Fifteenth National
Conference on Artificial Intelligence (AAAI-98), pp. 580587, Madison, Wisconsin. AAAI Press.
Koler, d. and Sahami, M. (1997). Hierarchically classifying documents using very few words. In Proceedings of
the Fourteenth International Conference on Machine Learning, pp. 170-178. Morgan Kaufmann.
Kolmogorov, A. N. (1941). Interpolation und extrapolation von stationaren zufalligen folgen. Bulletin of the
Academy of Sciences of the USSR, Ser. Math. 5, 314.
Kolmogorov, A. N. (1950). Foundations of the Theory of Probability. Chelsea, New York.
Kolmogorov, A. N. (1963). On tables of random numbers. Sankhya, the Indian Journal of Statistics, Series A
25.
Kolmogorov, A. N. (1965). Three approaches to the quantitative definition of information. Problems in
Information Transmission, 1(1), 17.
Kolodner, J. (1983). Reconstructive memory: A computer model. Cognitive Science, 7, 281328.
Kolodner, J. (1993). Case-Based Reasoning. Morgan Kaufmann, San Mateo, California.
Kondrak, G. and van Beek, P. (1997). A theoretical evaluation of selected backtracking algorithms. Artificial
Intelligence, 89, 365387.
Konolige, K. (1997). COLBERT: A language for reactive control in Saphira. In KI-97: Advances in Artificial
Intelligence, LNAI, p. 3152. Springer-Verlag.
Konolige, K. (1982). A first order formalization of knowledge and action for a multi-agent planning system. In
Hayes, J. E., Michie, D., and Pao, Y.-H. (Eds.), Machine Intelligence 10. Ellis Horwood, Chichester, England.
Koopmans, T. C. (1972). Representation of preference orderings over time. In McGuire, C. B. and Radner, R.
(Eds.), Decision and Organization. Elsevier/North-Holland, Amsterdam, London, New York.
Korf, R. E. (1985a). Depth-first iterative-deepening: an optimal admissible tree search. Artificial Intelligence,
27(1), 97109.
Korf, R. E. (1985b). Iterative-deepening A*: An optimal admissible tree search. In Proceedings of the Ninth
International Joint Conference on Artificial Intelligence (IJCAI-85), pp. 10341036, Los Angeles. Morgan
Kaufmann.
Korf, R. E. (1987). Planning as search: A quantitative approach. Artificial Intelligence, 33(1), 6588.
Korf, R. E. (1988). Optimal path finding algorithms. In Kanal, L. N. and Kumar, V. (Eds.), Search in Artificial
Intelligence, chap. 7, pp. 223267. Springer-Verlag, Berlin.
903
Irodalomjegyzk
Korf, R. E. (1990). Real-time heuristic search. Artificial Intelligence, 42(3), 189212.

Korf, R. E. (1991). Best-first search with limited memory. UCLA Computer Science Annual.
Korf, R. E. (1993). Linear-space best-first search. Artificial Intelligence, 62(1), 4178.
Korf, R. E. (1995). Space-efficient search algorithms. ACM Computing Surveys, 27(3), 337339.
Korf, R. E. and Chickering, D. M. (1996). Best-first minimax search. Artificial Intelligence, 84(12), 299337.
Korf, R. E. and Felner, a. (2002). Disjoint pattern database heuristics. Artificial Intelligence, 134(12), 922.
Korf, R. E. and Zhang, W. (2000). Divide-and-conquer frontier search applied to optimal sequence alignment.
In Proceedings of the 17th National Conference on Artificial Intelligence, pp. 910916, Cambridge,
Massachusetts. MIT Press.
Kortenkamp, D., Bonasso, R. P., and Murphy, R. (Eds.). (1998). AI-based Mobile Robots: Case studies of
successful robot systems, Cambridge, MA. MIT Press.
Kotok, a. (1962). A chess playing program for the IBM 7090. Ai project memo 41, MIT Computation Center,
Koutsoupias, E. and Papadimitriou, C. H. (1992). On the greedy algorithm for satisfiability. Information
Processing Letters, 43(1), 5355.
Kowalski, R. (1974). Predicate logic as a programming language. In Proceedings of the IFIP-74 Congress, pp.
569574. Elsevier/North-Holland.
Kowalski, R. (1979a). Algorithm = logic + control. Communications of the Association for Computing
Machinery, 22, 424436.
Kowalski, R. (1979b). Logic for Problem Solving. Elsevier/North-Holland, Amsterdam, London, New York.
Kowalski, R. (1988). The early years of logic programming. Communications of the Association for Computing
Kowalski, R. and Kuehner, D. (1971). Linear resolution with selection function. Artificial Intelligence, 2(34),
227260.
Kowalski, R. and Sergot, M. (1986). A logic-based calculus of events. New Generation Computing, 4(1), 67
95.
Koza, J. R. (1992). Genetic Programming: On the Programming of Computers by Means of Natural Selection.
MIT Press, Cambridge, Massachusetts.
Koza, J. R. (1994). Genetic Programming II: Automatic discovery of reusable programs. MIT Press,
Koza, J. R., Bennett, F. H., Andre, D., and Keane, M. A. (1999). Genetic Programming III: Darwinian
invention and problem solving. Morgan Kaufmann, San Mateo, California.
Kraus, S., Ephrati, E., and Lehmann, D. (1991). Negotiation in a non-cooperative environment. Journal of
Experimental and Theoretical Artificial Intelligence, 3(4), 255281.
Kripke, S. A. (1963). Semantical considerations on modal logic. Acta Philosophica Fennica, 16, 8394.
Krovetz, R. (1993). Viewing morphology as an inference process. In Proceedings of the Sixteenth Annual
International ACM-SIGIR Conference on Research and Development in Information Retrieval, pp. 191202,
New York. ACM Press.
Kruppa, E. (1913). Zur Ermittlkung eines Objecktes aus zwei Perspektiven mit innerer Orientierung. Sitz.-Ber.
Akad. Wiss., Wien, Math. Naturw., Kl. Abt. Ila, 122, 19391948.
904
Irodalomjegyzk
Kuhn, H. W. (1953). Extensive games and the problem of information. In Kuhn, H. W. and Tucker, A. W.
(Eds.), Contributions to the Theory of Games II. Princeton University Press, Princeton, New Jersey.
Kuipers, B. J. and Levitt, T. S. (1988). Navigation and mapping in large-scale space. AI Magazine, 9(2), 2543.
Kukich, K. (1992). Techniques for automatically correcting words in text. ACM Computing Surveys, 24(4),
377439.
Kumar, P. R. and Varaiya, P. (1986). Stochastic systems: Estimation, identification, and adaptive control.
Kumar, V. (1992). Algortihms for constraint satisfaction problems: A survey. AI Magazine, 13(1), 3244.
Kumar, V. and Kanal, L. N. (1983). A general branch and bound formulation for understanding and
synthesizing and/or tree search procedures. Artificial Intelligence, 21, 179198.
Kumar, V. and Kanal, L. N. (1988). The CDP: A unifying formulation for heuristic search, dynamic
programming, and branch-and-bound. In Kanal, L. N. and Kumar, V. (Eds.), Search in Artificial Intelligence,
chap. 1, pp. 127. Springer-Verlag, Berlin.
Kumar, V., Nau, D. S., and Kanal, L. N. (1988). A general branch-and bound formulation for AND/OR grap
and game tree search. In Kanal, L. N. and Kumar, V. (Eds.), Search in Artificial Intelligence, chap. 3, pp. 91
130. Springer-Verlag, Berlin.
Kuper, g. M. and Vardi, M. Y. (1993). On the complexity of queries in the logical data model. Theoretical
Computer Science, 116(1), 3357.
Kurzweil, R. (1990). The Age of Intelligent Machines. MIT Press, Cambridge, Massachusetts.
Kurzweil, r. (2000). The Age of Spiritual Machines. Penguin.
Kyburg, H. E. (1977). Randomness and the right reference class. The Journal of Philosophy, 74(9), 501521.
Kyburg, H. E. (1983). The reference class. Philosophy of Science, 50, 374397.
La Mettrie, J. O. (1748). Lhomme machine. E. Luzac, Leyde, France.
La Mura, P. and Shoham, Y. (1999). Expected utility networks. In Uncertainty in Artificial Intelligence:
Proceedings of the Fifteenth Conference, pp. 366373, Stockholm. Morgan Kaufmann.
Ladkin, P. (1986a). Primitives and units for time specification. In Proceedings of the Fifth National Conference
on Artificial Intelligence (AAAI-86), Vol. 1, pp. 354359, Philadelphia. Morgan Kaufmann.
Ladkin, P. (1986b). Time representation: a taxonomy of interval relations. In Proceedings of the Fifth National
Conference on Artificial Intelligence (AAAI-86), Vol. 1, pp. 360366, Philadelphia. Morgan Kaufmann.
Lafferty, J. and Zhai, C. (2001). Probabilistic relevance models based on document and query generation. In
Proceedings of the Workshop on Language Modelling and Information retrieval.
Laird, J. E., Newell, A., and Rosenbloom, P. S. (1987). SOAR: An architecture for general intelligence.
Laird, J. E., Rosenbloom, P. S., and Newell, A. (1986). Chunking in Soar: The anatomy of a general learning
mechanism. Machine Learning, 1, 1146.
Lakoff, G. (1987). Women, Fire, and Dangerous Things: What Categories Reveal about the Mind. University
of Chicago Press, Chicago.
Lakoff, G. and Johnson, M. (1980). Metaphors We Live By. University of Chicago Press, Chicago.
Lamarck, J. B. (1809). Philosophie zoologique. Chez Dentu et LAuteur, Paris.
905
Irodalomjegyzk
Langley, P., Simon, H. A., Bradshaw, G. L., and Zytkow, J. M. (1987). Scientific Discovery: Computational
Explorations of the Creative Processes. MIT Press, Cambridge, Massachusetts.
Langton, C. (Ed.). (1995). Artificial life. MIT Press, Cambridge, Massachusetts.
Laplace, P. (1816). Essai philosophique sur les probabilits (3rd edition). Courcier Imprimeur, Paris.
Lappin, S. and Leass, H. J. (1994). An algorithm for pronominal anaphora resolution. Computational
Lari, K. and Young, S. J. (1990). The estimation of stochastic context-free grammars using the inside-outside
algorithm. Computer, Speech and Language, 4, 3556.
Larraaga, P., Kuijpers, C., Murga, R., Inza, I., and Dizdarevic, S. (1999). Genetic algorithms for the travelling
salesman problem: A review of representations and operators. Artificial Intelligence Review, 13, 129170.
Latombe, J.-C. (1991). Robot Motion Planning. Kluwer, Dordrecht, Netherlands.
Lauritzen, S. (1995). The EM algorithm for graphical association models with missing data. Computational
Statistics and Data Analysis, 19, 191201.
Lauritzen, S. (1996). Graphical models. Oxford University Press, Oxford, UK.
Lauritzen, S., Dawid, A., Larsen, B., and Leimer, H. (1990). Independence properties of directed Markov
fields. Networks, 20(5), 491505.
Lauritzen, S. and Spiegelhalter, D. J. (1988). Local computations with probabilities on graphical structures and
their application to expert systems. Journal of the Royal Statistical Society, B 50(2), 157224.
Lauritzen, S. and Wermuth, N. (1989). Graphical models for associations between variables, some of which are
qualitative and some quantitative. Annals of Statistics, 17, 3157.
Lavrac, N. and Dzeroski, S. (1994). Inductive Logic Programming: Techniques and Applications. Ellies
Horwood, Chichester, England.
Lawler, E. L. (1985). The travelling salesman problem: A guided tour of combinatorial optimization. Wiley,
New York.
Lawler, E. L., Lenstra, J. K., Kan, A., and Shmoys, D. B. (1992). The Travelling Salesman Problem. Wiley
Interscience.
Lawler, E. L., Lenstra, J. K., Kan, A., and Shmoys, D. B. (1993). Sequencing and scheduling: algorithms and
complexity. In Graves, S. c., Zipkin, P. H., and Kan, A. h. g. r. (Eds.), Logistics of Production and Inventory:
Handbooks in Operations Research and Management Science, Volume 4, pp. 445522. North-Holland,
Amsterdam.
Lawler, E. L. and Wood, D. E. (1966). Branch-and-bound methods: A survey. Operations Research, 14(4),
699719.
Lazanas, A. and Latombe, J.-C. (1992). Landmark-based robot navigaton. In Preceedings of the Tenth National
Conference on Artificial Intelligence (AAAI-92), pp. 816822, San Jose. AAAI Press.
Le Cun, Y., Jackel, L., Boser, B., and Denker, J. (1989). Handwritten digit recognition: Applications of neural
network chips and automatic learning. IEEE Communications Magazine, 27(11), 4146.
LeCun, Y., Jackel, L., Bottou, L., Brunot, A., Cortes, C., Denker, J., Drucker, H., Guyon, I., Muller, U.,
Sackinger, E., Simard, P., and Vapnik, V. N. (1995). Comparison of learning algorithms for handwritten digit
recognition. In Fogelman, F. and Gallinari, P. (Eds.), International Conference on Artificial Neural Networks,
pp. 5360, Berlin. Springer-Verlag.
Leech, G., Rayson, P., and Wilson, A. (2001). Word Frequencies in Written and Spoken English: Based on the
British National Corpus. Longman, New York.
906
Irodalomjegyzk
Lefkovitz, D. (1960). A strategic pattern recognition program for the game Go. Technical note 60243, Wright
Air Development Division, University of Pennsylvania, Moore School of Electrical Engineering.
Lenat, D. B. (1983). EURISKO: A program that learns new heuristics and domain concepts: The nature of
heuristics, III: Program design and results. Artificial Intelligence, 21(12), 6198.
Lenat, D. B. (1995). Cyc: A large-scale investment in knowledge infrastructure. Communications of the ACM,
38(11).
Leant, D. B. and Brown, J. S. (1984). Why AM and EURISKO appear to work. Artificial Intelligence, 23(3),
269294.
Leant, D. B. and Guha, R. V. (1990). Building Large Knowledge-Based Systems: Representation and Inference
in the CYC project. Addison-Wesley, Reading, Massachusetts.
Leonard, H. S. and Goodman, N. (1940). The calculus of individuals and its uses. Journal of Symbolic Logic,
5(2), 4555.
Leonard, J. J. and Durrant-Whyte, H. (1992). Directed sonar sensing for mobile robot navigation. Kluwer,
Dordrecht, Netherlands.
Lesniewski, S. (1916). Podstawy oglnej teorii mnogosci. Moscow.
Lettvin, J. Y., Maturana, H. R., McCulloch, W. S., and Pitts, W. H. (1959). What the frogs eye tells the frogs
brain. Proceedings of the IRE, 47(11), 19401951.
Letz, r., Schumann, J., Bayerl, S., and Bibel, W. (1992). SETHEO: A high-performance theorem prover.
Journal of Automated Reasoning, 8(2), 183212.
Levesque, H. J. and Brachman, R. J. (1987). Expressiveness and tractability in knowledge representation and
reasoning. Computational Intelligence, 3(2), 7893.
Levesque, H. J., Reiter, R., Lesprance, Y., Lin, F., and Scherl, R. (1997a). GOLOG: A logic programming
language for dynamic domains. Journal of Logic Programming, 31, 5984.
Levesque, H. J., Reiter, R., Lesprance, y., Lin, F., and Scherl, R. (1997b). GOLOG: A logic programming
language for dynamic domains. Journal of Logic Programming, 31, 5984.
Levitt, G. M. (2000). The Turk, Chess Automation. McFarland and Company.
Levy, D. N. L. (Ed.). (1988a). Computer Chess Compendium. Springer-Verlag, Berlin.
Levy, d. N. L. (Ed.). (1988b). Computer Games. Springer-Verlag, Berlin.
Lewis, D. D. (1998). Naive Bayes at forty: The independence assumption in information retrieval. In Machine
Learning: ECML-98. 10th European Conference on Machine Learning. Proceedings, pp. 415, Chemnitz,
Germany. Springer-Verlag.
Lewis, D. K. (1966). An argument for the identity theory. the Journal of Philosophy, 63(1), 1725.
Lewis, D. K. (1972). General semantics. In Davidson, d. and Harman, G. (Eds.), Semantics of Natural
Language, pp. 169218. Reidel, Dordrecht, Netherlands.
Lewis, D. K. (1980). Mad pain and Martian pain. In Block, N. (Ed.), Readings in Philosophy of Psychology,
Vol. 1, pp. 216222. Harvard University Press, Cambridge, Massachusetts.
Li, C. M. and Anbulagan (1997). Heuristics based on unit propagation for satisfiability problems. In
Proceedings of the Fifteenth International Joint Conference on Artificial Intelligence (IJCAI-97), pp. 366371,
Nagoya, Japan. Morgan Kaufmann.
Li, M. and Vitanyi, P. M. B. (1993). An Introduction to Kolmogorov Complexity and Its Applications. SpringerVerlag, Berlin.
907
Irodalomjegyzk
Lifschitz, V. (1986). On the semantics of STRIPS. In Georgeff, M. P. and Lansky, a. L. (Eds.), Reasoning about
Actions and Plans: Proceedings of the 1986 Workshop, pp. 19, timberline, Oregon. Morgan Kaufmann.
Lifschitz, V. (2001). Answer set programming and plan generation. Artificial Intelligence, 138(12), 3954.
Lighthill, J. (1973). Artificial intelligence: A general survey. In Lighthill, J., Sutherland, N. s., Needham, r. M.,
Longuet-Higgins, H. c., and Michie, D. (Eds.), Artificial Intelligence: A Paper Symposium. Science Research
Council of Great Britain, London.
Lin, F. and Reiter, R. (1997). How to progress a database. Artificial Intelligence, 92(12), 131167.
Lin, S. (1965). Computer solutions of the travelling salesman problem. Bell Systems Technical Journal, 44(10),
22452269.
Lin, S. and Kernighan, b. W. (1973). An effective heuristic algorithm for the travelling-salesman problem.
Operations Research, 21(2), 498516.
Linden, T. A. (1991). Representing software design as partially developed plans. In Lowry, M. R. and
McCartney, R. D. (Eds.), Automating Software Design, pp. 603625. MIT Press, Cambridge, Massachusetts.
Lindsay, r. K. (1963). Inferential memory as the basis of machines which understand natural language. In
Feigenbaum, E. A. and Feldman, J. (Eds.), Computers and Thought, pp. 217236. McGraw-Hill, New Jork.
Lindsay, R. K., Buchanan, B. G., Feigenbaum, E. A., and Lederberg, J. (1980). Applications of Artificial
Intelligence for Organic Chemistry: The DENDRAL Project. McGraw-Hill, New York.
Littman, M. L. (1994). Markov games as a framework for multi-agent reinforcement learning. In Proceedings
of the 11th International Conference on Machine Learning (ML-94), pp. 157163, Mew Brunswick, NJ.
Morgan Kaufmann.
Littman, M. L., Keim, g. A., and Shazeer, N. M. (1999). Solving crosswords with PROVERB. In Proceedings
of the Sixteenth National Conference on Artificial Intelligence (AAAI-99), pp. 914915, Orlando, Florida. AAAI
Press.
Liu, J. S. and Chen, R. (1998). Sequential Monte Carlo methods for dynamic systems. Journal of the American
Statistical Association, 93, 10221031.
Lloyd, J. W. (1987). Foundations of Logic Programming. Springer-Verlag, Berlin.
Locke, J. (1690). An Essay Concerning Human Understanding. William Tegg.
Locke, W. N. and Booth, A. D. (1955). Machine Translation of Languages: Fourteen Essays. MIT Press,
Lodge, D. (1984). Small World. Penguin Books, New York.
Lohn, J. D., Kraus, W. F., and Colombano, S. P. (2001). Evolutionary optimization of yagi-uda antennas. In
Proceedings of the Fourth International Conference on Evolvable Systems, pp. 236243.
Longuet-Higgins, H. C. (1981). A computer algorithm for reconstructing a scene from two projections. Nature,
293, 133135.
Lovejoy, W. S. (1991). A survey of algorithmic methods for partially observed Markov decision processes.
Annals of Operations Research, 28(14), 4766.
Loveland, D. (1968). Mechanical theorem proving by model elimination. Journal of the Association for
Loveland, d. (1970). A linear format for resolution. In Proceedings of the IRIA Symposium on Automatic
Demonstration, pp. 147162, Berlin. Springer-Verlag.
Loveland, D. (1984). Automated theorem-proving: A quarter-century review. Contemporary Mathematics, 29,
145.
908
Irodalomjegyzk
Lowe, D. g. (1987), Three-dimensional object recognition from single two-dimensional images. Artificial
Lwenheim, L. (1915). ber mglichkeiten im Relativkalkl. Mathematische Annalen, 76, 447 470.
Lowerre, b. T. (1976). The Harpy Speech Recognition System. Ph.D. thesis, Computer Science Department,
Carnegie-Mellon University, Pittsburgh, Pennsylvania.
Lowerre, B. T. and Reddy, R. (1980). The harpy speech recognition system. In Lea, W. A. (Ed.), Trends in
Speech Recognition, chap. 15. Prentice-Hall, Upper Saddle River, New Jersey.
Lowry, M. R. and McCartney, R. D. (1991). Automating Software Design. MIT Press, Cambridge,
Massachusetts.
Loyd, D. (1959). Mathematical Puzzles of Sam Loyd: Selected and Edited by Martin Gardner. Dover, New
York.
Lozano-Perez, T. (1983). Spatial planning: A configuration space approach. IEEE Transactions on Computers,
C-32(2), 108120.
Lozano-Perez, T., Mason, M., and Tylor, R. (1984). Automatic synthesis of fine-motion strategies for robots.
International Journal of Robotics Research, 3(1), 324.
Luby, M., Sinclair, A., and Zuckerman, D. (1993). Optimal speedup of Las Vegas algorithms. Information
Processing Letters, 47, 173180.
Luby, M. and Vigoda, E. (1999). Fast convergence of the glauber dynamics for sampling independent sets.
Random Structures and Algorithms, 15(34), 229241.
Lucas, J. R. (1961). Minds, machines, and Gdel. Philosophy, 36.
Lucas, J. R. (1976). This Gdel is killing me: A rejoinder. Philosophia, 6(1), 145148.
Lucas, P. (1996). Knowledge acquisition for decision-theoretic expert systems. AISB Quarterly, 94, 2333.
Luce, D. R. and Raiffa, H. (1957). Games and Decisions. Wiley, New York.
Luger, G. F. (Ed.). (1995). Computation and intelligence: Collected readings. AAAI Press, Menlo Park,
California.
MacKay, D. J. C. (1992). a practical Bayesian framework for back-propagation networks. Neural Computation,
4(3), 448472.
Mackworth, A. K. (1973). Interpreting pictures of polyhedral scenes. Artificial Intelligence, 4, 121137.
Mackworth, A. K. (1977). Consistency in networks of relations. Artificial Intelligence, 8(1), 99118.
Mackworth, A. K. (1992). Constraint satisfaction. In Shapiro, S. (Ed.), Encyclopedia of Artificial Intelligence
(second edition)., Vol. 1, pp. 285293. Wiley, New York.
Mahanti, A. and Daniels, C. J. (1993). A SIMD approach to parallel heuristic search. Artificial Intelligence,
60(2), 243282.
Majercik, S. M. and Littman, M. L. (1999). Planning under uncertainty via stochastic satisfiability. In
Proceedings of the Sixteenth National Conference on Artificial Intelligence, pp. 549556.
Malik, J, (1987). Interpreting line drawings of curved objects. International Journal of Computer Vision, 1(1),
73103.
Malik, J. and Rosenholtz, r. (1994). Recovering surface curvature and orientation from texture distortion: A
least squares algorithm and sensitivity analysis. In Eklundh, J.-O. (Ed.), Proceedings of the Third European
Conf. on Computer Vision, pp. 353364, Stockholm. Springer-Verlag.
909
Irodalomjegyzk
Malik, J. and Rosenholtz, R. (1997). Computing local surface orientation and shape from texture for curved
surfaces. International Journal of Computer Vision, 23(2), 149168.
Mann, W. C. and Thompson, S. A. (1983). Relational propositions in discourse. Tech. rep. RR-83-115,
Information Sciences Institute.
Mann, W. C. and Thompson, S. A. (1988). Rhetorical structure theory: Toward a functional theory of text
organization. Text, 8(3), 243281.
Manna, Z. and Waldinger, R. (1971). Toward automatic program synthesis. Communications of the Association
for Computing Machinery, 14(3), 151165.
Manna, Z. and Waldinger, R. (1985). The Logical Basis for Computer Programming: Volume 1: Deductive
Reasoning. Addison-Wesley, Reading, Massachusets.
Manna, Z. and Waldinger, R. (1986). Special relations in automated deduction. Journal of the Association for
Manna, Z. and Waldinger, R. (1992). Fundamentals of deductive program synthesis. IEEE Transactions on
Software Engineering, 18(8), 674 704.
Manning, C. D. and Schtze, H. (1999). Foundations of Statistical Natural Language Processing. MIT Press.
Marbach, P. and Tsitsiklis, J. N. (1998). Simulation-based optimization of Markov reward processes. Technical
report LIDS-P-2411, Laboratory for Information and Decision Systems, Massachusetts Institute of Technology.
Marcus, M. P., Santorini, B., and Marcinkiewicz, M. A. (1993). Building a large annotated corpus of english:
The penn treebank. Computational Linguistics, 19(2), 313330.
Markov, A. A. (1913). An example of statistical investigation in the text of Eugene Onegin illustrating
coupling of tests in chains. Proceedings of the Academy of Sciences of St. Petersburg, 7.
Maron, M. E. (1961). Automatic indexing: An experimental inquiry. Journal of the Association for Computing
Machinery, 8(3), 404417.
Maron, M. E. and Kuhns, J.-L. (1960). On relevance, probabilistic indexing and information retrieval.
Communications of the ACM, 7, 219244.
Marr, D. (1982). Vision: A Computational Investigation into the Human Representation and Processing of
Visual Information. W. H. Freeman, New York.
Marriott, K. and Stuckey, P. J. (1998). Programming with Constraints: An Introduction. MIT Press,
Marsland, a. T. and Schaeffer, J. (Eds.). (1990). Computers, Chess, and Cognition. Springer-Verlag, Berlin.
Martelli, A. and Montanari, U. (1976). Unification in linear time and space: A structured presentation. Internal
report B 76-16, Istituto di Elaborazione della Informazione, Pisa, Italy.
Martelli, A. and Montanari, U. (1978). Optimizing decision trees through heuristically guided search.
Communications of the Association for Computing Machinery, 21, 10251039.
Marthi, B., Pasula, H., Russell, S. J., and Peres, Y. (2002). Decayed MCMC filtering. In Uncertainty in
Artificial Intelligence: Proceedings of the Eighteenth Conference, pp. 319326, Edmonton, Alberta. Morgan
Kaufmann.
Martin, J. H. (1990). A Computational Model of Metaphor Interpretation. Academic Press, New York.
Martin, P. and Shmoys, D. B. (1996). A new approach to computing optimal schedules for the jobshop
scheduling problem. In Proceedings of the 5th International IPCO Conference, pp. 389403. Springer-Verlag.
Maslov, S. Y. (1964). An inverse method for establishing deducibility in classical predicate calculus. Doklady
Akademii nauk SSSR, 159, 1720.
910
Irodalomjegyzk
Maslov, S. Y. (1967). An inverse method for establishing deducibility of nonprenex formulas of the predicate
calculus. Doklady Akademii nauk SSSR, 172, 2225.
Mason, M. (1993). Kicking the sensing habit. AI Magazine, 14(1), 5859.
Mason, M. (2001). Mechanics of Robotic Manipulation. MIT Press.
Mason, M. and Salisbury, J. (1985). Robot hands and the mechanics of manipulation. MIT Press.
Mataric, M. J. (1997). Reinforcement learning in the multi-robot domain. Autonomous Robots, 4(1), 7383.
Mates, B. (1953). Stoic Logic. University of California Press, Berkeley and Los Angeles.
Maxwell, J. and Kaplan, r. (1993). The interface between phrasal and functional constraints. Computational
Maxwell, J. and Kaplan, R. (1995). A method for disjunctive constraint satisfaction. In Dalrymple, M., Kaplan,
r., Maxwell, J., and Zaenen, A. (Eds.), Formal Issues in Lexical-Functional Grammar, No. 47 in CSLI Lecture
Note Series, chap. 14, pp. 381481. CSLI Publications.
McAllester, D. A. (1980). An outlook on truth maintenance. Ai memo 551, MIT AI Laboratory, Cambridge,
Massachusetts.
McAllester, D. A. (1988). Conspiracy numbers for min-max search. Artificial Intelligence, 35(3), 287310.
McAllester, D. A. (1989). Ontic: A Knowledge Representation System for Mathematics. MIT Press, Cambridge,
Massachusetts.
McAllester, D. A. (1998). What is the most pressing issue facing ai and the aaai today?. Candidate statement,
election for Councilor of the American Association for Artificial Intelligence.
McAllester, D. A. and Givan, R. (1992). Natural language syntax and first-order inference. Artificial
McAllester, D. A. and Rosenblitt, D. (1991). Systematic nonlinear planning. In Proceedings of the Ninth
National Conference on Artificial Intelligence (AAAI-91), Vol. 2, pp. 634639, Anaheim, California. AAAI
Press.
McCarthy, J. (1958). Programs with common sense. In Proceedings of the Symposium on Mechanisation of
Thought Processes, Vol. 1, pp. 7784, London. Her Majestys Stationery Office.
McCarthy, J. (1963). Situations, actions, and causal laws. Memo 2, Stanford University Artificial Intelligence
Project, Stanford, California.
McCarthy, J. (1968). Programs with common sense. In Minsky, M. L. (Ed.), Semantic Information Processing,
pp. 403418. MIT Press, Cambridge, Massachusetts.
McCarthy, J. (1980). Circumscription: A form of non-monotonic reasoning. Artificial Intelligence, 13(12),
2739.
McCarthy, J. and Hayes, P. J. (1969). Some philosophical problems from the standpoint of artificial
intelligence. In Meltzer, B., Michie, D., and Swann, M. (Eds.), Machine Intelligence 4, pp. 463502. Edinburgh
University Press, Edinburgh, Scotland.
McCarthy, J., Minsky, M. L., Rochester, N., and Shannon, c. E. (1955). Proposal for the Dartmouth summer
research project on artificial intelligence. Tech. rep., Dartmouth College.
McCawley, J. D. (1988). The Syntactic Phenomena of English, Vol. 2 volumes. University of Chicago Press.
McCawley, J. D. (1993). Everything That Linguists Have Always Wanted to Know about Logic but Were
Ashamed to Ask (Second edition). University of Chicago Press, Chicago.
911
Irodalomjegyzk
McCulloch, W. S. and Pitts, W. (1943). A logical calculus of the ideas immanent in nervous activity. Bulletin of
Mathematical Biophysics, 5, 115137.
McCune, W. (1992). Automated discovery of new axiomatizations of the left group and right group calculi.
Journal of Automated Reasoning, 9(1), 124.
McCune, W. (1997). Solution of the robbins problem. Journal of Automated Reasoning, 19(3), 263276.
McDermott, D. (1976). Artificial intelligence meets natural stupidity. SIGART Newsletter, 57, 49.
McDermott, D. (1978a). Planning and acting. Cognitive Science, 2(2), 71109.
McDermott, D. (1978b). Tarskian semantics, or, no notation without denotation!. Cognitive Science, 2(3).
McDermott, D. (1987). A critique of pure reason. Computational Intelligence, 3(3), 151237.
McDermott, D. (1996). A heuristic estimator for means-ends analysis in planning. In Proceedings of the Third
International Conference on AI Planning Systems, pp. 142149, Edinburgh, Scotland. AAAI Press.
McDermott, D. and Doyle, J. (1980). Non-monotonic logic: i. Artificial Intelligence, 13(12), 4172.
McDermott, J. (1982). R1: A rule-based configurer of computer systems. Artificial Intelligence, 19(1), 3988.
McEliece, R. J., MacKay, D. J. C., and Cheng, J.-F. (1998). Turbo decoding as an instance of Pearls belief
propagation algorithm. IEEE Journal on Selected Areas in Communications, 16(2), 140 152.
McGregor, J. J. (1979). Relational consistency algorithms and their application in finding subgraph and graph
isomorphisms. Information Sciences, 19(3), 229250.
McKeown, K. (1985). Text Generation: Using Discourse Strategies and Focus Constraints to Generate Natural
Language Text. Cambridge University Press, Cambridge, UK.
McLachlan, g. J. and Krishnan, t. (1997). The EM Algorithm and Extensions. Wiley, New York.
McMillan, K. L. (1993). Symbolic Model Checking. Kluwer, Dordrecht, Netherlands.
Meehl, P. (1955). Clinical vs. Statistical Prediction. University of Minnesota Press, Minneapolis.
Melcuk, I. A. and Polguere, A. (1988). A formal lexicon in the meaning-text theory (or how to do lexica with
words). Computational Linguistics, 13(34), 261275.
Mendel, G. (1866). Versuche ber pflanzen-hybriden. Verhandlungen des Naturforschenden Vereins,
Abhandlungen, Brnn, 4, 347. Translated into English by C. T. Druery, published by Bateson (1902).
Mercer, J. (1909). Functions of positive and negative type and their connection with the theory of integral
equations. Philos. Trans. Roy. Soc. London, A, 209, 415446.
Metropolis, N., Rosenbluth, A., Rosenbluth, M., Teller, A., and Teller, E. (1953). Equations of state
calculations by fast computing machines. Journal of Chemical Physics, 21, 10871091.
Mzard, M. and Nadal, J.-P. (1989). Learning in feed-forward layered networks: The tiling algorithm. Journal
of Physics, 22, 21912204.
Michalski, R. S. (1969). On the quasi-minimal solution of the general covering problem. In Proceedings of the
First International Symposium on Information Processing, pp. 125128.
Michalski, R. S., Carbonell, J. G., and Mitchell, T. M. (Eds.). (1983). Machine Learning: An Artificial
Intelligence Approach, Vol. 1. Morgan Kaufmann, San Mateo, California.
Michalski, r. S., Carbonell, J. G., and Mitchell, T. M. (Eds.). (1986a). Machine Learning: An Artificial
Intelligence Approach, Vol. 2. Morgan Kaufmann, San Mateo, California.
912
Irodalomjegyzk
Michalski, r. S., Mozetic, I., Hong, J., and Lavrac, N. (1986b). The multi-purpose incremental learning system
aq15 and its testing application to three medical domains. In Proceedings of the Fifth National Conference on
Artificial Intelligence (AAAI-86), pp. 10411045, Philadelphia. Morgan Kaufmann.
Michel, S. and Plamondon, P. (1996). Bilingual sentence alignment: Balancing robustnes and accuracy. In
Proceedings of the Conference of the Association for Machine Translation in the Americas (AMTA).
Michie, d. (1966). Game-playing and game-learning automata. In Fox, L. (Ed.), Advances in Programming and
Non-Numerical Computation, pp. 183 200. Pergamon, Oxford, UK.
Michie, D. (1972). Machine intelligence at Edinburgh. Management Informatics, 2(1), 712.
Michie, D. (1974). Machine intelligence at Edinburgh. In On Intelligence, pp. 143155. Edinburgh University
Press.
Michie, d. and Chambers, r. A. (1968). BOXES: An experiment in adaptive control. In Dale, E. and Michie, D.
(Eds.), Machine Intelligence 2, pp. 125133. Elsevier/North-Holland, Amsterdam, London, New York.
Michie, d., Spiegelhalter, D. J., and Taylor, C. (Eds.). (1994). Machine Learning, Neural and Statistical
Classification. Ellis Horwood, Chichester, England.
Milgrom, P. (1997). Putting auction theory to work: The simultaneous ascending auction. Tech. rep. Technical
Report 980002, Stanford University Department of Economics.
Mill, J. S. (1843). A System of Logic, Ratiocinative and Inductive: Being a Connected View of the Principles of
Evidence, and Methods of Scientific Investigation. J. W. Parker, London.
Mill, J. S. (1863). Utilitarianism. Parker, Son and Bourn, London.
Miller, A. C., Merkhofer, M. M., Howard, R. A., Matheson, J. E., and Rice, T. R. (1976). Development of
automated aids for decision analysis. Technical report, SRI International, Menlo Park, California.
Minsky, M. L. (Ed.). (1968). Semantic Information Processing. MIT Press, Cambridge, Massachusetts.
Minsky, M. L. (1975). A framework for representing knowledge. In Winston, P. H. (Ed.), The Psychology of
Computer Vision, pp. 211277. McGraw-Hill, New York. Originally an MIT AI Laboratory memo; the 1975
version is abridged, but is the most widely cited.
Minsky, M. L. and Papert, S. (1969). Perceptrons: An Introduction to Computational Geometry (first edition).
Minsky, M. L. and Papert, S. (1988). Perceptrons: An Introduction to Computational Geometry (Expanded
edition). MIT Press, Cambridge, Massachusetts.
Minton, S. (1984). Constraint-based generalization: Learning game-playing plans from single expamples. In
Proceedings of the National Conference on Artificial Intelligence (AAAI-84), pp. 251254, Austin, Texas.
Morgan Kaufmann.
Minton, S. (1988). Quantitative results concerning the utility of explanation-based learning. In Proceedings of
the Seventh National Conference on Artificial Intelligence (AAAI-88), pp. 564569, St. Paul, Minnesota.
Morgan Kaufmann.
Minton, S., Johnston, M. D., Philips, A. B., and Laird, P. (1992). Minimizing conflicts: A heuristic repair
method for constraint satisfaction and scheduling problems. Artificial Intelligence, 58(13), 161205.
Mitchell, M. (1996). An Introduction to Genetic Algorithms. MIT Press, Cambridge, Massachusetts.
Mitchell, M., Holland, J. H., and Forrest, S. (1996). When will a genetic algorithm outperform hill climbing?. In
Cowan, J., Tesauro, G., and Alspector, J. (Eds.), Advances in Neural Information Processing Systems, Vol. 6.
913
Irodalomjegyzk
Mitchell, T. M. (1977). Version spaces: A candidate elimination approach to rule learning. In Proceedings of
the Fifth Intgernational Joint Conference on Artificial Intelligence (IJCAI-77), pp. 305310, Cambridge,
Massachusetts. IJCAII.
Mitchell, T. M. (1982). Generalization as search. Artificial Intelligence, 18(2), 203226.
Mitchell, t. M. (1990). Becoming increasingly reactive (mobile robots). In Proceedings of the Eighth National
Conference on Artificial Intelligence (AAAI-90), Vol. 2, pp. 10511058, Boston. MIT Press.
Mitchell, T. M. (1997). Machine Learning. McGraw-Hill, New York.
Mitchell, t. M., Keller, R., and Kedar-Cabelli, S. (1986). Explanation-based generalization: A unifying view.
Mitchell, T. M., Utgoff, P. E., and Banerji, r. (1983). Learning by experimentation: Acquiring and refining
problem-solving heuristics. In Michalski, r. s., Carbonell, J. G., and Mitchell, T. M. (Eds.), Machine Learning:
An Artificial Intelligence Approach, pp. 163190. Morgan Kaufmann, San Mateo, California.
Mitkov, R. (2002). Anaphora Resolution. Longman, New York.
Mohr, R. and Henderson, T. C. (1986). Arc and path consistency revisited. Artificial Intelligence, 28(2), 225
233.
Mohri, M., Pereira, F., and Riley, M. (2002). Weighted finite-state transducers in speech recognition. Computer
Speech and Language, 16(1), 6988.
Montague, P. r., Dayan, P., Person, C., and Sejnowsky, T. (1995). Bee foraging in uncertain environments
using predictive Hebbian learning. Nature, 377, 725728.
Montague, R. (1970). English as a formal language. In Linguaggi nella Societ e nella Tecnica, pp. 189224.
Edizioni di Comunit, Milan.
Montague, r. (1973). The proper treatment of quantification in ordinary English. In Hintikka, K. J. J.,
Moravcsik, J. M. E., and Suppes, P. (Eds.), Approaches to Natural Language. D. Reidel, Dordrecht,
Netherlands.
Montanari, U. (1974). Networks of constraints: Fundamental properties and applications to picture processing.
Information Sciences, 7(2), 95132.
Montemerlo, M. Thrun, S., Koller, D., and Wegbreit, B. (2002). FastSLAM: A factored solution to the
simultaneous localization and mapping problem. In Preceedings of the Eighteenth National Conference on
Artificial Intelligence (AAAI-02), Edmonton, Alberta. AAAI Press.
Mooney, R. (1999). Learning for semantic interpretation: Scaling up without dumbing down. In Cussens, J.
(Ed.), Proceedings of the 1st Workshop on Learning Language in Logic, pp. 715. Springer-Verlag.
Mooney, R. J. and Califf, M. E. (1995). Induction of first-order decision lists: Results on learning the past tense
of English verbs. Journal of AI Research, 3, 124.
Moore, A. W. and Atkeson, C. G. (1993). Prioritized sweepingreinforcement learning with less data and less
time. Machine Learning, 13, 103130.
Moore, E. F. (1959). The shortest path through a maze. In Proceedings of an International Symposium on the
Theory orf Switching, Part II, pp. 285292. Harvard University Press, Cambridge, Massachusetts.
Moore, J. S. and Newell, A. (1973). How can Merlin understand?. In Gregg, L. (Ed.), Knowledge and
Cognition. Lawrence Erlbaum Associates, Potomac, Maryland.
Moore, R. C. (1980). Reasoning about knowledge and action. Artificial intelligence center technical note 191,
SRI Inernational, Menlo Park, California.
Moore, R. C. (1985). A formal theory of knowledge and action. In Hobbs, J. R. and Moore, R. C. (Eds.),
Formal Theories of the Commonsense World, pp. 319358. Ablex, Norwood, New Jersey.
914
Irodalomjegyzk
Moravec, H. P. (1983). The stanford cart and the cmu rover. Proceedings of the IEEE, 71(7), 872884.
Moravec, H., P. and Elfes, A. (1985). High resolution maps from wide angle sonar. In 1985 IEEE International
Conference on Robotics and Automation, pp. 116121, St. Louis, Missouri. IEEE Computer Society Press.
Moravec, H. P. (1988). Mind Children: The Future of Robot and Human Intelligence. Harvard Unviersity
Moravec, H. P. (2000). Robot: Mere Machine to Transcendent Mind. Oxford University Press.
Morgenstern, L. (1987). Knowledge preconditions for actions and plans. In Proceedings of the Tenth
International Joint Conference on Artificial Intelligence (IJCAI-87), pp. 867874, Milan. Morgan Kaufmann.
Morgenstern, L. (1998). Inheritance comes of age: Applying nonmonotonic techniques to problems in industry.
Morjaria, M. A., Rink, F. J., Smith, W. D., Klempner, G., Burns, C., and Stein, J. (1995). Elicitation of
probabilities for belief networks: Combining qualitative and quantitative information. In Proceedings of the
Conference on Uncertainty in Artificial Intelligence, pp. 141148. Morgan Kaufmann.
Morrison, P. and Morrison, E. (Eds.). (1961). Charles Babbage and His Calculating Engines: Selected
Writings by Charles Babbage and Others. Dover, New York.
Moskewicz, M. W., Madigan, C. F., Zhao, Y., Zhang, L., and Malik, S. (2001). Chaff: Engineering an efficient
SAT solver. In Proceedings of the 38th Design Automation Conference (DAC 2001), pp. 530535. ACM Press.
Mosteller, F. and Wallace, D. L. (1964). Inference and Disputed Authorship: The Federalist. Addison-Wesley.
Mostow, J. and Prieditis, A. E. (1989). Discovering admissible heuristics by abstracting and optimizing: A
transformational approach. In Proceedings of the Eleventh International Joint Conference on Artificial
Intelligence (IJCAI-89), Vol. 1, pp. 701707, Detroit. Morgan Kaufmann.
Motzkin, T. S. and Schoenberg, I. J. (1954). The relaxation method for linear inequalities. Canadian Journal of
Mathematics, 6(3), 393404.
Moussouris, J., Holloway, J., and Greenblatt, R. D. (1979). CHEOPS: A chess-oriented processing system. In
Hayes, J. E., Michie, D., and Mikulich, L. I. (Eds.), Machine Intelligence 9, pp. 351360. Ellis Horwood,
Chichester, England.
Moutarlier, P. and Chatila, R. (1989). Stochastic multisensory data fusion for mobile robot location and
environment modeling. In 5th Int. Symposium on Robotics Research, Tokyo.
Muggleton, S. H. (1991). Inductive logic programming. New Generation Computing, 8, 295318.
Muggleton, s. H. (1992). Inductive Logic Programming. Academic Press, New York.
Muggleton, S. H. (1995). Inverse entailment and Progol. New Generation Computing, Special issue on
Inductive Logic Programming, 13(34), 245286.
Muggleton, S. H. (2000). Learning stochastic logic programs. Proceedings of the AAAI 2000 Workshop on
Learning Statistical Models from Relational Data.
Muggleton, S. H. and Buntine, W. (1988). Machine invention of first-order predicates by inverting resolution.
In Proceedings of the Fifth International Conference on Machine Learning, pp. 339352. Morgan Kaufmann.
Muggleton, S. H. and De Raedt, L. (1994). Inductive logic programming: Theory and methods. Journal of
Logic Programming, 19/20, 629679.
Muggleton, s. H. and Feng, C. (1990). Efficient induction of logic programs. In Proceedings of the Workshop
on Algorithmic Learning Theory, pp. 368381, Tokyo. Ohmsha.
Mller, M. (2002). Computer Go. Artificial Intelligence, 134(12), 145179.
915
Irodalomjegyzk
Mundy, J. and Zisserman, A. (Eds.). (1992). Geometric Invariance in Computer Vision. MIT Press, Cambridge,
Massachusetts.
Murphy, K., Weiss, Y., and Jordan, M. I. (1999). Loopy belief propagation for approximate inference: An
empirical study. In Uncertainty in Artificial Intelligence: Proceedings of the Fifteenth Conference, pp. 467475,
Stockholm. Morgan Kaufmann.
Murphy, K. and Russell, S. J. (2001). Raoblackwellised particle filtering for dynamic bayesian networks. In
Doucet, A., de Freitas, N., and Gordon, N. J. (Eds.), Sequential Monte Carlo Methods in Practice. SpringerVerlag, Berlin.
Murphy, R. (2000). Introduction to AI Robotics. MIT Press, Cambridge, Massachusetts.
Muscettola, N., Nayak, P., Pell, B., and Williams, B. (1998). Remote agent: To boldly go where no ai system
has gone before. Artificial Intelligence, 103, 548.
Myerson, r. B. (1991). Game Theory: Analysis of Conflict. Harvard University Press, Cambridge.
Nagel, t. (1974). What is it like to be a bat?. Philosophical Review, 83, 435450.
Nalwa, V. S. (1993). A Guided Tour of Computer Vision. Addison-Wesley, Reading, Massachusetts.
Nash, J. (1950). Equilibrium points in N-person games. Proceedings of the National Academy of Sciences of the
United States of America, 36, 4849.
Nau, D. S. (1980). Pathology on game trees: A summary of results. In Proceedings of the First Annual National
Conference on Artificial Intelligence (AAAI-80), pp. 102104, Stanford, California. AAAI.
Nau, d. S. (1983). Pathology on game trees revisited, and an alternative to minimaxing. Artificial Intelligence,
21(12), 221244.
Nau, D. S., Kumar, V., and Kanal, L. N. (1984). General branch and bound, and its relation to A* and AO*.
Naur, P. (1963). Revised report on the algorithmic language Algol 60. Communications of the Association for
Computing Machinery, 6 (1), 117.
Nayak, P. and Williams, B. (1997). Fast context switching in real-time propositional reasoning. In Proceedings
of the Fourteenth National Conference on Artificial Intelligence (AAAI-97), pp. 5056, Providence, Rhode
Island. AAAI Press.
Neal, R. (1996). Bayesian Learning for Neural Networks. Springer-Verlag, Berlin.
Nebel, B. (2000). On the compilability and expressive power of propositional planning formalisms. Journal of
AI Research, 12, 271315.
Nelson, G. and Oppen, D. C. (1979). Simplification by cooperating decision procedures. ACM Transactions on
Programming Languages and Systems, 1(2), 245257.
Netto, E. (1901). Lehrbuch der Combinatorik. b. G. Teubner, Leipzig.
Nevill-Manning, C. G. and Witten, I. H. (1997). Identifying hierarchical structures in sequences: A linear-time
algorithm. Journal of AI Research, 7, 6782.
Nevins, A. J. (1975). Plane geometry theorem proving using forward chaining. Artificial Intelligence, 6(1), 1
23.
Newell, a. (1982). The knowledge level. Artificial Intelligence, 18(1), 82127.
Newell, A. (1990). Unified Theories of Cognition. Harvard University Press, Cambridge, Massachusetts.
Newell, A. and Ernst, G. (1965). The search for generality. In Kalenich, W. A. (Ed.), Information Processing
1965: Proceedings of IFIP Congress 1965, Vol. 1, pp. 1724, Chicago. Spartan.
916
Irodalomjegyzk
Newell, A., Shaw, J. C., and Simon, H. A. (1957). Empirical explorations with the logic theory machine.
Proceedings of the Western Joint Computer Conference, 15, 218239. Reprinted in Feigenbaum and Feldman
(1963).
Newell, A., Shaw, J. C., and Simon, H. A. (1958). Chess playing programs and the problem of complexity. IBM
Journal of Research and Development, 4(2), 320335.
Newell, A. and Simon, H. a. (1961). GPS, a program that simulates human thought. In Billing, H. (Ed.),
Lernende Automaten, pp. 109124. R. Oldenbourg, Munich.
Newell, A. and Simon, H. A. (1972). Human Problem Solving. Prentice-Hall, Upper Saddle River, New Jersey.
Newell, A. and Simon, H. A. (1976). Computer science as empirical inquiry: Symbols and search.
Communications of the Association for Computing Machinery, 19, 113126.
Newton, I. (16641671). Methodus fluxionum et serierum infinitarum. Unpublished notes.
Ng, A. Y., Harada, D., and Russell, S. J. (1999). Policy invariance under reward transformations: Theory and
application to reward shaping. In Proceedings of the Sixteenth International Conference on Machine Learning,
Bled, Slovenia. Morgan Kaufmann.
Ng, A. Y. and Jordan, M. I. (2000). PEGASUS: A policy search method for large MDPs and POMDPs. In
Uncertainty in Artificial Intelligence: proceedings of the Sixteenth Conference, pp. 406415, Stanford,
California. Morgan Kaufmann.
Nguyen, X. and Kambhampati, S. (2001). Reviving partial order planning. In Proceedings of the Seventeenth
International Joint Conference on Artificial Intelligence (IJCAI-01), pp. 459466, Seattle. Morgan Kaufmann.
Nguyen, X. Kambhampati, S., and Nigenda, R. S. (2001). Planning graph as the basis for deriving heuristics for
plan synthesis by state space and CSP search. Tech. rep., Computer Science and Engineering Department,
Arizona State University.
Nicholson, A. and Brady, J. M. (1992). The data association problem when monitoring robot vehicles using
dynamic belief networks. In ECAI 92: 10th European Conference on Artificial Intelligence Proceedings, pp.
689693, Vienna, Austria. Wiley.
Niemel, I., Simons, P., and Syrjnen, T. (2000). Smodels: A system for answer set programming. In
Proceedings of the 8th International Workshop on Non-Monotonic Reasoning.
Nilsson, D. and Lauritzen, S. (2000). Evaluating influence diagrams using LIMIDs. In Uncertainty in Artificial
Intelligence: Proceedings of the Sixteenth Conference, pp. 436445, Stanford, California. Morgan Kaufmann.
Nilsson, N. J. (1965). Learning Machines: Foundations of Trainable Pattern-Classifying Systems. McGrawHill, New York. republished in 1990.
Nilsson, N. J. (1971). Problem-Solving Methods in Artificial Intelligence. McGraw-Hill, New York.
Nilsson, N. J. (1980). Principles of Artificial Intelligence. Morgan Kaufmann, San Mateo, California.
Nilsson, N. J. (1984). Shakey the robot. Technical note 323, SRI International, Menlo Park, California.
Nilsson, N. J. (1986). Probabilistic logic. Artificial Intelligence, 28(1), 7187.
Nilsson, N. J. (1991). Logic and artificial intelligence. Artificial Intelligence, 47(13), 3156.
Nilsson, N. J. (1998). Artificial Intelligence: A New Synthesis. Morgan Kaufmann, San Mateo, California.
Norvig, P. (1988). Multiple simultaneous interpretations of ambiguous sentences. In Proceedings of the 10th
Annual Conference of the Cognitive Science Society.
Norvig, P. (1992). Paradigms of Artificial Intelligence Programming: Case Studies in Common Lisp. Morgan
917
Irodalomjegyzk
Nowick, S. M., Dean, M. E., Dill, D. L., and Horowitz, M. (1993). The design of a high-performance cache
controller: A case study in asynchronous synthesis. Integration: The VLSI Journal, 15(3), 241262.
Nunberg, g. (1979). The non-uniqueness of semantic solutions: Polysemy. Language and Philosophy, 3(2)
143184.
Nussbaum, M. C. (1978). Aristotles De Motu Animalium. Princeton University Press, Princeton, New Jersey.
Ogawa, S., Lee, t.-M., Kay, A. R., and Tank, D. W. (1990). Brain magnetic resonance imaging with contrast
dependent on blood oxygenation. Proceedings of the National Academy of Sciences of the United States of
America, 87, 98689872.
Olawsky, D. and Gini, M. (1990). Deferred planning and sensor use. In Sycara, K. P. (Ed.), Proceedings,
DARPA Workshop on Innovative Approaches to Planning, Scheduling, and Control, San Diego, California.
Defense Advanced Research Projects Agency (DARPA), Morgan Kaufmann.
Olesen, K. G. (1993). Causal probabilistic networks with both discrete and continuous variables. IEEE
Transactions on Pattern Analysis and Machine Intelligence (PAMI), 15(3), 275279.
Oliver, r. M. and Smith, J. Q. (Eds.). (1990). Influence Diagrams, Belief Nets and Decision Analysis. Wiley,
New York.
Olson, C. F. (1994). Time and space efficient pose clustering. In Proceedings of the IEEE Conference on
Computer Vision and Pattern Recognition, pp. 251258, Washington, DC. IEEE Computer Society Press.
Oncina, J. and Garcia, P. (1992). Inferring regular languages in polynomial update time. In Perez, Sanfeliu, and
Vidal (Eds.), Pattern Recognition and Image Analysis, pp. 4961. World Scientific.
OReilly, U.-M. and Oppacher, f. (1994). Program search with a hierarchical variable length representation:
Genetic programming, simulated annealing and hill climbing. In Davidor, Y., Schwefel, H.-P., and Manner, R.
(Eds.), Proceedings of the Third Conference on Parallel Problem Solving from Nature, pp. 397406, Jerusalem,
Israel. Springer-Verlag.
Ormoneit, D. and Sen, S. (2002). Kernel-based reinforcement learning. Machine Learning, 49(23), 161178.
Ortony, A. (Ed.). (1979). Metaphor and Thought. Cambridge University Press, Cambridge, UK.
Osborne, M. J. and Rubinstein, A. (1994). A Course in Game Theory. MIT Press, Cambridge, Massachusetts.
Osherson, D. N., Stob, M., and Weinstein, S. (1986). Systems That Learn: An Introduction to Learning Theory
for Cognitive and Computer Scientists. MIT Press, Cambridge, Massachusetts.
Page, C. D. and Srinivasan, A. (2002). ILP: A short look back and a longer look forward. Submitted to Journal
of Machine Learning Research.
Pak, I. (2001). On mixing of certain random walks, cutoff phenomenon and sharp threshold of random matroid
processes. DAMATH: Discrete Applied Mathematics and Combinatorial Operations Research and Computer
Science, 110, 251272.
Palay, A. J. (1985). Searching with Probabilities. Pitman, London.
Palmer, D. A. and Hearst, M. A. (1994). Adaptive sentence boundary disambiguation. In Proceedings of the
Conference on Applied Natural Language Processing, pp. 7883. Morgan Kaufmann.
Palmer, S. (1999). Vision Science: Photons to Phenomenology. MIT Press, Cambridge, Massachusetts.
Papadimitriou, c. H. (1994). Computational Complexity. Addison-Wesley.
Papadimitriou, C. H., Tamaki, H., Raghavan, P., and Vempala, s. (1998). Latent semantic indexing: A
probabilistic analysis. In Proceedings of the ACM Conference on Principles of Database Systems (PODS), pp.
159168, New York. ACM Press.
918
Irodalomjegyzk
Papadimitriou, C. H. and Tsitsiklis, J. N. (1987). The complexity of markov decision processes. Mathematics
of Operations Research, 12(3), 441 450.
Papadimitriou, C. H. and Yannakakis, M. (1991). Shortest paths without a map. Theoretical Computer Science,
84(1), 127150.
Papavassiliou, V. and Russell, S. J. (1999). Convergence of reinforcement learning with general function
approximators. In Proceedings of the Sixteenth International Joint Conference on Artificial Intelligence (IJCAI99), pp. 748757, Stockholm. Morgan Kaufmann.
Parekh, R. and Honavar, V. (2001). Dfa learning from simple examples. Machine Learning, 44, 935.
Parisi, g. (1988). Statistical field theory. Addison-Wesley, Reading, Massachusetts.
Parker, D. B. (1985). Learning logic. Technical report TR-47, Center for Computational Research in
Economics and Management Science, Massachusetts Institute of Technology, Cambridge, Masachusetts.
Parker, L. E. (1996). On the design of behavior-based multi-robot teams. Journal of Advanced Robotics, 10(6).
Parr, R. and Russell, S. J. (1998). Reinforcement learning with hierarchies of machines. In Jordan, M. I.,
Kearns, M., and Solla, S. A. (Eds.), Advances in Neural Information Processing Systems 10. MIT Press,
Parzen, E. (1962). On estimation of a probability density function and mode. Annals of Mathematical Statistics,
33, 10651076.
Pasula, H. and Russell, S. J. (2001). Approximate inference for first-order probabilistic languages. In
Proceedings of the Seventeenth International Joint Conference on Artificial Intelligence (IJCAI-01), Seattle.
Morgan Kaufmann.
Pasula, H., Russell, S. J., Ostland, M., and Ritov, Y. (1999). Tracking many objects with many sensors. In
Proceedings of the Sixteenth International Joint Conference on Artificial Intelligence (IJCAI-99), Stockholm.
Morgan Kaufmann.
Paterson, M. S. and Wegman, M. N. (1978). Linear unification. Journal of Computer and System Sciences, 16,
158167.
Patrick, B. G., Almulla, M., and Newborn, M. M. (1992). An upper bound on the time complexity of iterativedeepening-A*. Annals of Mathematics and Artificial Intelligence, 5(24), 265278.
Patten, T. (1988). Systemic Text Generation as Problem Solving. Studies in Natural Language Processing.
Paul, R. P. (1981). Robot Manipulators: Mathematics, Programming, and Control. MIT Press, Cambridge,
Massachusetts.
Peano, G. (1889). Arithmetices principia, nova methodo exposita. Fratres Bocca, Turin.
Pearl, J. (1982a). Reverend Bayes on inference engines: A distributed hierarchical approach. In Proceedings of
the National Conference on Artificial Intelligence (AAAI-82), pp. 133136, Pittsburgh, Pennsylvania. Morgan
Kaufmann.
Pearl, J. (1982b). The solution for the branching factor of the alphabeta pruning algorithm and its optimality.
Communications of the Association for Computing Machinery, 258), 559564.
Pearl, J. (1984). Heuristics: Intelligent Search Strategies for Computer Problem Solving. Addison-Wesley,
Reading, Massachusetts.
Pearl, J. (1986). Fusion, propagation, and structuring in belief networks. Artificial Intelligence, 29, 241288.
Pearl, J. (1987). Evidential reasoning using stochastic simulation of causal models. Artificial Intelligence, 32,
247257.
919
Irodalomjegyzk
Pearl, J. (1988). Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference. Morgan
Pearl, J. (2000). Causality: Models, Reasoning, and Inference. Cambridge University Press, Cambridge, UK.
Pearl, J. and Verma, T. (1991). A theory of inferred causation. In Allen, J. A., Fikes, R., and Sandewall, E.
(Eds.), Proceedings of the 2nd International Conference on Principles of Knowledge Representation and
Reasoning, pp. 441452, San Mateo, California. Morgan Kaufmann.
Pearson, J. and Jeavons, P. (1997). A survey of tractable constraint satisfaction problems. Technical report
CSD-TR-97-15, Royal Holloway College, U. of London.
Pednault, E. P. D. (1986). Formulating multiagent, dynamic-world problems in the classical planning
framework. In Georgeff, M. P. and Lansky, A. L. (Eds.), Reasoning about Actions and Plans: Proceedings of
the 1986 Workshop, pp. 4782, Timberline, Oregon. Morgan Kaufmann.
Peirce, C. S. (1870). Description of a notation for the logic of relatives, resulting from an amplification of the
conceptions of Booles calculus of logic. Memoirs of the American Academy of Arts and Sciences, 9, 317378.
Peirce, C. S. (1883). A theory of probable inference. Note B. The logic of relatives. In Studies in Logic by
Members of the Johns Hopkins University, pp. 187203, Boston.
Peirce, C. S. (1902). Logic as semiotic: The theory of signs. Unpublished manuscript; reprinted in (Buchler
1955).
Peirce, C. S. (1909). Existential graphs. Unpublished manuscript; reprinted in (Bucler 1955).
Pelikan, M., Goldberg, D. E., and Cantu-Paz, E. (1999). BOA: The Bayesian optimization algorithm. In
GECCO-99: Proceedings of the Genetic and Evolutionary Computation Conference, pp. 525532, Orlando,
Florida. Morgan Kaufmann.
Pemberton, J. C. and Korf, R. E. (1992). Incremental planning on graphs with cycles. In Hendler, J. (Ed.),
Artificial Intelligence Planning Systems: Proceedings of the First International Conference, pp. 525 532,
College Park, Maryland. Morgan Kaufmann.
Penberthy, J. S. and Weld, D. S. (1922). UCPOP: A sound, complete, partial order planner for ADL. In
Proceedings of KR-92, pp. 103114. Morgan Kaufmann.
Peng, J. and Williams, R. J. (1993). Efficient learning and planning within the Dyna framework. Adaptive
Behavior, 2, 437454.
Penrose, R. (1989). The Emperors New Mind. Oxford University Press, Oxford, UK.
Penrose, R. (1994). Shadows of the Mind. Oxford University Press, Oxford, UK.
Peot, M. and Smith, D. E. (1992). Conditional nonlinear planning. In Hendler, J. (Ed.), Proceedings of the First
International Conference on AI Planning Systems, pp. 189197, College Park, Maryland. Morgan Kaufmann.
Pereira, F. and Shieber, S. M. (1987). Prolog and Natural-Language Analysis. Center for the Study of
Language and Information (CSLI), Stanford, California.
Pereira, f. and Warren, D. H. D. (1980). Definite clause grammars for language analysis: A survey of the
formalism and a comparison with augmented transition networks. Artificial Intelligence, 13, 231278.
Peterson, C. and Anderson, J. R. (1987). A mean field theory learning algorithm for neural networks. Complex
Systems, 1(5) 9951019.
Pfeffer, A. (2000). Probabilistic Reasoning for Complex Systems. Ph.D. thesis, Stanford University, Stanford,
California.
Pinker, S. (1989). Learnability and Cognition. MIT Press, Cambridge, MA.
920
Irodalomjegyzk
Pinker, s. (1995). Language acquisition. In Gleitman, L. R., Liberman, M., and Osherson, D. N. (Eds.), An
Invitation to Cognitive Science (second edition)., Vol. 1. MIT Press, Cambridge Massachusetts.
Pinker, S. (2000). The Language Instinct: How the Mind Creates Language. MIT Press, Cambridge,
Massachusetts.
Plaat, A., Schaeffer, J., Pijls, W., and de Bruin, A. (1996). Best-first fixed-depth minimax algorithms. Artificial
Intelligence Journal, 87 (12), 255293.
Place, U. T. (1956). Is consciousness a brain process?. British Journal of Psychology, 47, 4450.
Plotkin, g. (1971). Automatic Methods of Inductive Inference. Ph.D. thesis, Edinburgh University.
Plotkin, G. (1972). Building-in equational theories. In Meltzer, B. and Michie, D. (Eds.), Machine Intelligence
7, pp. 7390. Edinburgh University Press, Edinburgh, Scotland.
Pnueli, A. (1977). The temporal logic of programs. In Proceedings of the 18th IEEE Symposium on the
Foundations of Computer Science (FOCS-77), pp. 4657, Providence, Rhode Island. IEEE, IEEE Computer
Society Press.
Pohl, I. (1969). Bi-directional and heuristic search in path problems. Tech. rep. 104, SLAC (Stanford Linear
Accelerator Center), Stanford, California.
Pohl, I. (1970). First results on the effect of error in heuristic search. In Meltzer, B. and Michie, D. (Eds.),
Machine Intelligence 5, pp. 219236. Elsevier/North-Holland, Amsterdam, London, New York.
Pohl, I. (1971). Bi-directional search. In Meltzer, B. and Michie, D. (Eds.), Machine Intelligence 6, p. 127140.
Edinburgh University Press, Edinburgh, Scotland.
Pohl, I. (1973). The avoidance of (relative) catastrophe, heuristic competence, genuine dynamic weighting and
computational issues in heuristic problem solving. In Proceedings of the Third International Joint Conference
on Artificial Intelligence (IJCAI-73), pp. 2023, Stanford, California. IJCAII.
Pohl, I. (1977). Practical and theoretical considerations in heuristic search algorithms. In Elcock, E. W. and
Michie, D. (Eds.), Machine Intelligence 8, pp. 5572. Ellis Horwood, Chichester, England.
Pomerleau, d. A. (1993). Neural Network Perception for Mobile Robot Guidance. Kluwer, Dordrecht,
Netherlands.
Ponte, J. M. and Croft, W. B. (1998). A language modeling approach to information retrieval. In Research and
Development in Information Retrieval, pp. 275281.
Poole, D. (1993). Probabilistic Horn abduction and Bayesian networks. Artificial Intelligence, 64, 81129.
Poole, D., Mackworth, A. K., and Goebel, R. (1998). Computational intelligence: A logical approach. Oxyford
University Press, Oxford, UK.
Popper, K. R. (1959). The Logic of Scientific Discovery. Basic Books, New York.
Popper, K. R. (1962). Conjectures and Refutations: The Growth of Scientific Knowledge. Basic Books, New
York.
Porter, M. F. (1980). An algorithm for suffix stripping. Program, 13(3), 130137.
Post, E. L. (1921). Introduction to a general theory of elementary propositions. American Journal of
Mathematics, 43, 163185.
Pradhan, M., Provan, G. M., Middleton, B., and Henrion, M. (1994). Knowledge engineering for large belief
networks. In Uncertainty in Artificial Intelligence: Proceedings of the Tenth Conference, pp. 484490, Seattle,
Washington, Morgan Kaufmann.
Pratt, V. R. (1976). Semantical considerations on Floyd-Hoare logic. In Proceedings of the 17th IEEE
Symposium on the Foundations of Computer Science, pp. 109121. IEEE Computer Society Press.
921
Irodalomjegyzk
Prawitz, d. (1960). An improved proof procedure. Theoria, 26, 102139.

Prawitz, D. (1965). Natural Deduction: A Proof Theoretical Study. Almquist and Wiksell, Stockholm.
Press, W. H., Teukolsky, S. A., Vetterling, W. T., and Flannery, B. P. (2002). Numerical Recipes in C++: The
Art of Scientific Computing (Second edition). Cambridge University Press, Cambridge, UK.
Prieditis, A. E. (1993). Machine discovery of effective admissible heuristics. Machine Learning, 12(13), 117
141.
Prinz, D. G. (1952). Robot chess. Research, 5, 261266.
Prior, A. N. (1967). Past, Present, and Future. Oxford University Press, Oxford, UK.
Prosser, P. (1993). Hybrid algorithms for constraint satisfaction problems. Computational Intelligence, 9, 268
299.
Pryor, L. and Collins, G. (1996). Planning for contingencies: A decision-based approach. Journal of Artificial
Intelligence Research, 4, 287339.
Pullum, g. K. (1991). The Great Eskimo Vocabulary Hoax (and Other Irreverent Essays on the Study of
Language). University of Chicago Press, Chicago.
Pullum, G. K. (1996). Learnability, hyperlearning, and the poverty of the stimulus. In 22nd Annual Meeting of
the Berkeley Linguistics Society.
Puterman, M. L. (1994). Markov Decision Processes: Discrete Stochastic Dynamic Programming. Wiley, New
York.
Puterman, M. L. and Shin, M. C. (1978). Modified policy iteration algorithms for discounted Markov decision
problems. Management Science, 24(11), 11271137.
Putnam, H. (1960). Minds and machines. In Hook, S. (Ed.), Dimensions of Mind, pp. 138164. Macmillan,
London.
Putnam, H. (1963). Degree of confirmation and inductive logic. In Schilpp, P. A. (Ed.), The Philosophy of
Rudolf Carnap, pp. 270292. Open Court, La Salle, Illinois.
Putnam, H. (1967). The nature of mental states. In Capitan, W. H. and Merrill, D. D. (Eds.), Art, Mind, and
Religion, pp. 3748. University of Pittsburgh Press, Pittsburgh.
Pylyshyn, Z. W. (1974). Minds, machines and phenomenology: Some reflections on Dreyfus What
Computers Cant Do. International Journal of Cognitive Psychology, 3(1), 5777.
Pylyshyn, Z. W. (1984). Computation and Cognition: Toward a Foundation for Cognitive Science. MIT Press,
Quillian, R. (1961). A design for an understanding machine. Paper presented at a colloquium: Semantic
Problems in Natural Language, Kings College, Cambridge, England.
Quine, W. V. (1953). Two dogmas of empiricism. In From a Logical Point of View, pp. 2046. Harper and
Row, New York.
Quine, W. V. (1960). Word and Object. MIT Press, Cambridge, Massachusetts.
Quine, W. V. (1982). Methods of Logic (Fourth edition). Harvard University Press, Cambridge, Massachusetts.
Quinlan, e. and OBrien, S. (1992). Sublanguage: Characteristics and selection guidelines for MT. In AI and
Cognitive Science 92: Proceedings of Annual Irish Conference on Artificial Intelligence and Cognitive Science
92, pp. 342345, Limerick, Ireland. Springer-Verlag.
Quinlan, J. R. (1979). Discovering rules from large collections of examples: A case study. In Michie, D. (Ed.),
Expert Systems in the Microelectronic Age. Edinburgh University Press, Edinburgh, Scotland.
922
Irodalomjegyzk
Quinlan, J. R. (1986). Induction of decision trees. Machine Learning, 1, 81106.

Quinlan, J. R. (1990). Learning logical definitions from relations. Machine Learning, 5(3), 239266.
Quinlan, J. R. (1993). C4.5: Programs for machine learning. Morgan Kaufmann, San Mateo, California.
Quinlan, J. R. and Cameron-Jones, R. M. (1993). FOIL: a midterm report. In Brazil, P. B. (Ed.), European
Conference on Machine Learning Proceedings (ECML-93), pp. 320, Vienna. Springer-Verlag.
Quirk, R., Greenbaum, S., Leech, G., and Svartvik, J. (1985). A Comprehensive Grammar of the English
Language. Longman, New York.
Rabani, Y. Rabinovich, Y., and Sinclair, A. (1998). A computational view of population genetics. Random
Structures and Algorithms, 12(4), 313334.
Rabiner, L. R. and Juang, B.-H. (1993). Fundamental os Speech Recognition. Prentice-Hall, Upper Saddle
River, New Jersey.
Ramakrishnan, R. and Ullman, J. D. (1995). A survey of research in deductive database systems. Journal of
Logic Programming, 23(2), 125149.
Ramsey, F. P. (1931). Truth and probability. In Braithwaite, R. B. (Ed.), The Foundations of Mathematics and
Other Logical Essays. Harcourt Brace Jovanovich, New York.
Raphson, J. (1690). Analysis aequationum universalis. Apud Abelem Swalle, London.
Rassenti, S., Smith, V., and Bulfin, R. (1982). A combinatorial auction mechanism for airport time slot
allocation. Bell Journal of Economics, 13, 402417.
Ratner, D. and Warmuth, M. (1986). Finding a shortest solution for th n n extension of the 15-puzzle is
intractable. In Proceedings of the Fifth National Conference on Artificial Intelligence (AAAI-86), Vol. 1, pp.
168172, Philadelphia. Morgan Kaufmann.
Rauch, H. E., Tung, F., and Striebel, C. T. (1965). Maximum likelihood estimates of linear dynamic systems.
AIAA Journal, 3(8), 14451450.
Rechenberg, I. (1965). Cybernetic solution path of an experimental problem. Library translation 1122, Royal
Aircraft Establishment.
Rechenberg, I. (1973). Evolutionsstrategie: Optimierung technischer Systeme nach Prinzipien der biologischen
Evolution. Frommann-Holzboog, Stuttgart, Germany.
Regin, J. (1994). A filtering algorithm for constraints of difference in CSPs. In Proceedings of the Twelfth
Reichenbach, H. (1949). The Theory of Probability: An Inquiry into the Logical and Mathematical
Foundations of the Calculus of Probability (Second edition). University of California Press, Berkeley and Los
Angeles.
Reif, J. (1979). Complexity of the movers problem and generalizations. In Proceedings of the 20th IEEE
Symposium on Foundations of Computer Science, pp. 421427, San Juan, Puero Rico. IEEE, IEEE Computer
Society Press.
Reiter, E. and Dale, R. (2000). Building Natural Language Generation Systems. Studies in Natural Language
Processing. Cambridge University Press, Cambridge, UK.
Reiter, R. (1980). A logic for default reasoning. Artificial Intelligence, 13(12), 81132.
Reiter, R. (1991). The frame problem in the situation calculus: A simple solution (sometimes) and a
completeness result for goal regression. In Lifschitz, V. (Ed.), Artificial Intelligence and Mathematical Theory
of Computation: Papers in Honor of John McCarthy, pp. 359380. Academic Press, New York.
923
Irodalomjegyzk
Reiter, R. (2001a). On knowledge-based programming with sensing in the situation calculus. ACM
Transactions on Computational Logic, 2(4), 433 457.
Reiter, R. (2001b). Knowledge in Action: Logical Foundations for Specifying Implementing Dynamical
Systems. MIT Press, Cambridge, Massachusetts.
Reitman, W. and Wilcox, B. (1979). The structure and performance of the INTERIM.2 Go program. In
Proceedings of the Sixth International Joint Conference on Artificial Intelligence (IJCAI-79), pp. 711719,
Tokyo. IJCAII.
Remus, H. (1962). Simulation of a learning machine for playing Go. In Proceedings IFIP Congress, pp. 428
432, Amsterdam, London, New York. Elsevier/North-Holland.
Rnyi, A. )1970). Probability Theory. Elsevier/North-Holland, Amsterdam, London, New York.
Rescher, N. and Urquhart, A. (1971). Temporal Logic. Springer-Verlag, Berlin.
Reynolds, C. W. (1987). Flocks, herds, and schools: A distributed behavioral model. Computer Graphics, 21,
2534. SIGGRAPH 87 Conference Proceedings.
Rich, E. and Knight, K. (1991). Artificial Intelligence (second edition). McGraw-Hill, New York.
Richardson, M., Bilmes, J., and Diorio, C. (2000). Hidden-articulator Markov models: Performance
improvements and robustness to noise. In ICASSP-2000: 2000 International Conference on Acoustics, Speech,
and Signal Processing, Los Alamitos, CA. IEEE Computer Society Press.
Rieger, C. (1976). An organization of knowledge for problem solving and language comprehension. Artificial
Ringle, M. (1979). Philosophical Perspectives in Artificial Intelligence. Humanities Press, Atlantic Highlands,
New Jersey.
Rintanen, J. (1999). Improvements to the evaluation of quantified boolean formulae. In Proceedings of the
Sixteenth International Joint Conference on Artificial Intelligence (IJCAI-99), pp. 11921197, Stockholm.
Morgan Kaufmann.
Ripley, B. D. (1996). Pattern Recognition and Neural Networks. Cambridge University Press, Cambridge, UK.
Rissanen, J. (1984). Universal coding, information, prediction, and estimation. IEEE Transactions on
Information Theory, IT-30(4), 629636.
Ritchie, G. D. and Hanna, F. K. (1984). AM: A case study in AI methodology. Artificial Intelligence, 23(3),
249268.
Rivest, R. (1987). Learning decision lists. Machine Learning, 2(3), 229246.
Roberts, L. G. (1963). Machine perception of three-dimensional solids. Technical report 315, MIT Lincoln
Laboratory.
Robertson, N. and Seymour, P. D. (1986). Graph minors. ii. Algorithmic aspects of tree-width. Journal of
Algorithms, 7(3), 309322.
Robertson, S. E. (1977). The probability ranking principle in ir. Journal of Documentation, 33, 294304.
Robertson, S. E. and Sparck Jones, K. (1976). Relevance weighting of search terms. Journal of the American
Society for Information Science, 27, 129146.
Robinson, J. A. (1965). A machine-oriented logic based on the resolution principle. Journal of the Association
for Computing Machinery, 12, 2341.
Roche, E. and Schabes, Y. (1977). Finite-State Language Processing (Language, Speech and Communication).
Bradford Books, Cambridge.
924
Irodalomjegyzk
Rock, I. (1984). Perception. W. H. Freeman, New York.

Rorty, R. (1965). Mind-body identity, privacy, and categories. Review of Metaphysics, 19(1), 2454.
Rosenblatt, F. (1957). The perception: A perceiving and recognizing automaton. Report 85-460-1, Project Para,
Cornell Aeronautical Laboratory, Ithaca, New York.
Rosenblatt, F. (1960). On the convergence of reinforcement procedures in simple perceptrons. Report VG1196-G-4, Cornell Aeronautical Laboratory, Ithaca, New York.
Rosenblatt, F. (1962). Principles of Neurodynamics: Perceptrons and the Theory of Brain Mechanisms.
Spartan, Chicago.
Rosenblatt, M. (1956). Remarks on some nonparametric estimates of a density function. Annals of
Mathematical Statistics, 27, 832837.
Rosenblueth, A., Wiener, N., and Bigelow, J. (1943). Behavior, purpose, and teleology. Philosophy of Science,
10, 1824.
Rosenschein, J. S. and Zlotkin, G. (1994). Rules of Encounter. MIT Press, Cambridge, Massachusetts.
Rosenschein, S. J. (1985). Formal theories of knowledge in AI and robotics. New Generation Computing, 3(4),
345357.
Rosenthal, D. M. (Ed.) (1971). Materialism and the Mind-Body Problem. Prentice-Hall, Upper Saddle River,
New Jersey.
Ross, S. M. (1988). A First Course in Probability (third edition). Macmillan, London.
Roussel, P. (1975). Prolog: Manual de reference et dutilization. Tech. ren. Groupe dIntelligence Artificielle,
Universit dAix-Marseille.
Rouveirol, C. and Puget, J.-F. (1989). A simple and general solution for inverting resolution. In Proceedings of
the European Working Session on Learning, pp. 201210, Porto, Portugal Pitman.
Rowat, P. F. (1979). Representing the Spatial Experience and Solving Spatial problems in a Simulated Robot
Environment. Ph.D. thesis, University of British Columbia, Vancouver, BC, Canada.
Roweis, S. T. and Ghahramani, U. (1999). A unifying review of Linear Gaussian Models. Neural Computation,
11(2), 305345.
Rubin, D. (1988). Using the SIR algorithm to simulate posterior distributions. In Bernardo, J. M., de Groot, M.
H., Lindley, D. V., and Smith, A. F. M. (Eds.), Bayesian Statistics 3, pp. 395402. Oxford University Press,
Oxford, UK.
Rumelhart, D. E., Hinton, G. E., and Williams, R. J. (1986a). Learning internal representations by error
propagation. In Rumelhart, D. E. and McClelland, J. L. (Eds.), Parallel Distributed Processing. Vol. 1, chap. 8,
pp. 318362. MIT Press, Cambridge, Massachusetts.
Rumelhart, D. E., Hinton, G. E., and Williams, R. J. (1986b). Learning representations by backpropagating
errors. Nature, 323, 533536.
Rumelhart, D. E. and McClelland, J. L. (Eds.). (1986). Parallel Distributed Processing. MIT Press,
Ruspini, E. H. Lowrance, J. D., and Strat, T. M. (1992). Understanding evidential reasoning. Intgernational
Journal of Approximate Reasoning, 6(3), 401424.
Russell, J. G. B. (1990). Is screening for abdominal aortic aneurysm worthwhile?. Clinical Radiology, 41, 182
184.
Russell, S. J. (1985). The compleat guide to MRS. Report STAN-CS-85-1080, Computer Science Department,
Stanford University.
925
Irodalomjegyzk
Russell, S. J. (1986). A quantitative analysis of analogy by similarity. In Proceedings of the Fifth National
Conference on Artificial Intelligence (AAAI-86), pp. 284288, Philadelphia. Morgan Kaufmann.
Russell, S. J. (1988). Tree-structured bias. In Proceedings of the Seventh National Conference on Artificial
Intelligence (AAAI-88), Vol. 2. pp. 641645, St. Paul, Minnesota. Morgan Kaufmann.
Russell, S. J. (1992). Efficient memory-bounded search methods. In ECAI 92: 10th European Conference on
Artificial Intelligence Proceedings, pp. 15, Vienna. Wiley.
Russell, S. J. (1998). Learning agents for uncertain environments (extended abstract). In Proceedings of the
Eleventh Annual ACM Workshop on Computational Learning Theory (COLT-98), pp. 101103, Madison,
Wisconsin. ACM Press.
Russell, S. J., Binder, J., Koller, D., and Kanazawa, K. (1995). Local learning in probabilistic networks with
hidden variables. In Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence
(IJCAI-95), pp. 114652, Montreal. Morgan Kaufmann.
Russell, S. J. and Grosof, B. (1987). A declarative approach to bias in concept learning. In Proceedings of the
Sixth National Conference on Artificial Intelligence (AAAI-87), Seattle. Morgan Kaufmann.
Russell, S. J. and Norvig, P. (1995). Artificial Intelligence: A Modern Approach. Prentice-Hall, Upper Saddle
River, New Jersey.
Russell, S. J. and Subramanian, D. (1995). Provably bounded-optimal agents. Journal of Artificial Intelligence
Research, 3, 575609.
Russell, S. J., Subramanian, D., and Parr, R. (1993). Provably bounded optimal agents. In Proceedings of the
Thirteenth International Joint Conference on Artificial Intelligence (IJCAI-93), pp. 338345, Chambery,
France. Morgan Kaufmann.
Russell, S. J. and Wefald, E. H. (1989). On optimal game-tree search using rational meta-reasoning. In
Proceedings of the Eleventh International Joint Conference on Artificial Intelligence (IJCAI-89), pp. 334340,
Detroit. Morgan Kaufmann.
Russell, S. J. and Wefald, E. H. (1991). Do the Right Thing: Studies in Limited Rationality. MIT Press,
Rustagi, J. S. (1976). Variational Methods in Statistics. Academic Press, New York.
Ryder, J. L. (1971). Heuristic analysis of large trees as generated in the game of Go. Memo AIM-155, Stanford
Artificial Intelligence Project, Computer Science Department, Stanford University, Stanford, California.
Sabin, D. and Freuder, E. C. (1994). Contradicting conventional wisdom in constraint satisfaction. In ECAI 94:
11th European Conference on Artificial Intelligence. Proceedings, pp. 125129, Amsterdam. Wiley.
Sacerdoti, E. D. (1974). Planning in a hieararchy of abstraction spaces. Artificial Intelligence, 5(2), 115135.
Sacerdoti, E. D. (1975). The nonlinear nature of plans. In Proceedings of the Fourth International Joint
Conference on Artificial Intelligence (IJCAI-75), pp. 206214, Tbilisi, Georgia. IJCAII.
Sacerdoti, E. D. (1977). A Structure for Plans and Behavior. Elsevier/North-Holland, Amsterdam, London,
New York.
Sacerdoti, E. D., Fikes, R. E., Reboh, R., Sagalowicz, D., Waldinger, R., and Wilber, B. M. (1976). QLISP a
language for the interactive development of complex systems. In Proceedings of the AFIPS National Computer
Conference, pp. 349356.
Sacks, E. and Joskowicz, L. (1993). Automated modeling and kinematic simulation of mechanisms. Computer
Aided Design, 25(2), 106118.
Sadri, F. and Kowalski, R. (1995). Variants of the event calculus. In International Conference on Logic
Programming, pp. 6781.
926
Irodalomjegyzk
Sag, I. and Wasow, T. (1999). Syntactic Theory: An Introduction. CSLI Publications, Stanford, California.
Sager, N. (1981). Natural Language Information Processing: A Computer Grammar of English and 1st
Applications. Addison-Wesley, Reading, Massachusetts.
Sahami, M., Dumais, S. T., Heckerman, D., and Horvitz, E. J. (1998). A Bayesian approach to filtering junk Email. In Learning for Text Categorization: Papers from the 1998 Workshop, Madison, Wisconsin. AAAI
Technical Report WS-98-05.
Sahami, M., Hearst, M. A., and Saund, E. (1996). Applying the multiple cause mixture model to text
categorization. In Saitta, L. (Ed.), Proceedings of ICML-96, 13th International Conference on Machine
Learning, pp. 435443, Bari, Italy. Morgan Kaufmann Publishers.
Salomaa, A. (1969). Probabilistic and weighted grammars. Information and Control, 15, 529 544.
Salton, G. and McGill, M. J. (1983). Introduction to Modern Information Retrieval. McGraw-Hill, New York,
NY.
Salton, G., Wong, A., and Yang, C. S. (1975). A vector space model for automatic indexing. Communications
of the ACM, 18(11), 613620.
Samuel, A. L. (1959). Some studies in machine learning using the game of checkers. IBM Journal of Research
and Development, 3(3), 210229.
Samuel, A. L. (1967). Some studies in machine learning using the game of checkers II Recent progress. IBM
Journal of Research and Development, 11(6), 601617.
Samuelsson, C. and Rayner, M. (1991). Quantitative evaluation of explanation-based learning as an
optimization tool for a large-scale natural language system. In Proceedings of the Twelfth International Joint
Conference on Artificial Intelligence (IJCAI-91), pp. 609615, Sydney. Morgan Kaufmann.
Sato, T. and Kameya, Y. (1997). PRISM: A symbolic-statistical modeling language. In Proceedings of the
Fifteenth International Joint Conference on Artificial Intelligence (IJCAI-97), pp. 13301335, Nagoya, Japan.
Morgan Kaufmann.
Saul, L. K., Jaakkola, T., and Jordan, M. I. (1996). Mean field theory for sigmoid belief networks. Journal of
Savage, L. J. (1954). The Foundations of Statistics. Wiley, New York.
Sayere, K. (1993). Three more flaws in the computation model. Paper presented at the APA (Central Division)
Annual Conference, Chicago, Illinois.
Schabes, Y., Abeille, A., and Joshi, A. K. (1988). Parsing strategies with lexicalized grammars: Application to
tree adjoining grammars. In Vargha, D. (Ed.), Proceedings of the 12th International Conference on
Computational Linguistics (COLING), Vol. 2, pp. 578583, Budapest, John von Neumann Society for
Computer Science.
Schaeffer, J. (1997). One Jump Ahead: Challenging Human Supremacy in Checkers. Springer-Verlag, Berlin.
Schank, R. C. and Abelson, R. P. (1977). Scripts, Plans, Goals, and Understanding. Lawrence Erlbaum
Associates, Potomac, Maryland.
Schank, R. C. and Riesbeck, C. (1981). Inside Computer Understanding: Five Programs Plus Miniatures.
Lawrence Erlbaum Associates, Potomac, Maryland.
Schapire, R. E. (1999). Theoretical views of boosting and applications. In Algorithmic Learning Theory:
Proceedings of the 10th International Conference (ALT99), pp. 1325. Springer-Verlag, Berlin.
Schapire, R. E. (1990). The strength of weak learnability. Machine Learning, 5(2), 197227.
927
Irodalomjegyzk
Schmolze, J. G. and Lipkis, T. A. (1983). Classification in the KL-ONE representation system. In Proceedings
of the Eighth International Joint Conference on Artificial Intelligence (IJCAI-83), pp. 330332, Karlsruhe,
Germany. Morgan Kaufmann.
Schofield, P. D. A. (1967). Complete solution of the eight puzzle. In Dale, E. and Michie, D. (Eds.), Machine
Intelligence 2, pp. 125133. Elsevier/North-Holland, Amsterdam, London, New York.
Schlkopf, B. and Smola, A. J. (2002). Learning with Kernels. MIT Press, Cambridge, Massachusetts.
Schning, T. (1999). A probabilistic algorithm for k-SAT and constraint satisfaction problems. In 40th Annual
Symposium on Foundations of Computer Science, pp. 410414, New York. IEEE Computer Society Press.
Schoppers, M. J. (1987). Universal plans for reactive robots in unpredictable environments. In Proceedings of
the Tenth International Joint Conference on Artificial Intelligence (IJCAI-87), pp. 1039 1046, Milan. Morgan
Kaufmann.
Schoppers, M. J. (1989). In defense of reaction plans as caches. AI Magazine, 10(4), 5160.
Schrder, E. (1877). Der Operationskreis des Logikkalkls. B. G. Teubner, Leipzig.
Schultz, W., Dayan, P., and Montague, P. R. (1997). A neural substrate of prediction and reward. Science, 275,
1593.
Schtze, H. (1995). Ambiguity in Language Learning: Computational and Cognitive Models. Ph.D. thesis,
Stanford University. Also published by CSLI Press, 1997.
Schwartz, J. T. Scharir, M., and Hopcroft, J. (1987). Planning, Geometry and Complexity of Robot Motion.
Ablex Publishing Corporation, Norwood, NJ.
Schwartz, S. P. (Ed.). (1977). Naming, Necessity, and Natural Kinds. Cornell University Press, Ithaca, New
York.
Scott, D. and Krauss, P. (1966). Assigning probabilities to logical formulas. In Hintikka, J. and Suppes, P.
(Eds.), Aspects of Inductive Logic: North-Holland, Amsterdam.
Scriven, M. (1953). The mechanical concept of mind. Mind, 62, 230240.
Searle, J. R. (1969). Speech Acts: An Essay in the Philosophy of Language. Cambridge University Press,
Cambridge, UK.
Searle, J. R. (1980). Minds, brains, and programs. Behavior and Brain Sciences, 3, 417457.
Searle, J. R. (1984). Minds, Brains and Science. Harvard University Press, Cambridge, Massachusetts.
Searle, J. R. (1990). Is the brains mind a computer program?. Scientific American, 262, 2631.
Searle, J. R. (1992). The Rediscovery of the Mind. MIT Press, Cambridge, Massachusetts.
Selman, B., Kautz, H., and Cohen, B. (1996). Local search strategies for satisfiability testing. In DIMACS
Series in Discrete Mathematics and Theoretical Computer Science, Volume 26, pp. 521532. American
Mathematical Society, Providence, Rhode Island.
Selman, B. and Levesque, H. J. (1993). The complexity of path-based defeasible inheritance. Artificial
Selman, B. Levesque, H. J., and Mitchell, D. (1992). A new method for solving hard satisfiability problems. In
Proceedings of the Tenth National Conference on Artificial Intelligence (AAAI-92), pp. 440446, San Jose.
AAAI Press.
Shachter, R. D. (1986). Evaluating influence diagrams. Operations Research, 34, 871882.
928
Irodalomjegyzk
Shachter, R. D. (1998). Bayes-ball: The rational pastime (for determining irrelevance and requisite information
in belief networks and influence diagrams). In Uncertainty in Artificial Intelligence: Proceedings of the
Fourtheenth Conference, pp. 480487, Madison, Wisconsin. Morgan Kaufmann.
Shachter, R. D., DAmbrosio, B., and Del Favero, B. A. (1990). Symbolic probabilistic inference in belief
networks. In Proceedings of the Eighth National Conference on Artificial Intelligence (AAAI-90), pp. 126131,
Boston, MIT Press.
Shachter, R. D. and Kenley, C. R. (1989). Gaussian influence diagrams. Management Science, 35(5), 527550.
Shachter, R. D. and Peot, M. (1989). Simulation approaches to general probabilistic inference on belief
networks. In Proceedings of the Fifth Conference on Uncertainty in Artificial Intelligence (UAI-89), Windsor,
Ontario, Morgan Kaufmann.
Shafer, G. (1976). A Mathematical Theory of Evidence. Princeton University Press, Princeton, New Jersey.
Shafer, G. and Pearl, J. (Eds.). (1990). Readings in Uncertain Reasoning. Morgan Kaufmann, San Mateo,
California.
Shahookar, K. and Mazumder, P. (1991). VLSI cell placement techniques. Computing Surveys, 23(2), 143
220.
Shanahan, M. (1997). Solving the Frame Pproblem. MIT Press, Cambridge, Massachusetts.
Shanahan, M. (1999). The event calculus explained. In Wooldridge, M. J. and Veloso, M. (Eds.), Artificial
Intelligence Today, pp. 409430. Springer-Verlag, Berlin.
Shankar, N. (1986). Proof-Checking Metamathematics. Ph.D. thesis, Computer Science Department,
University of Texas at Austin.
Shannon, C. E. and Weaver, W. (1949). The Mathematical Theory of Communication. University of Illinois
Press, Urbana, Illinois.
Shannon, C. E. (1950). Programming a computer for playing chess. Philosophical Magazine, 41(4), 256275.
Shapiro, E. (1981). An algorithm that infers theories from facts. In Proceedings of the Seventh International
Joint Conference on Artificial Intelligence (IJCAI-81), p. 1064, Vancouver, British Columbia. Morgan
Kaufmann.
Shapiro, S. C. (Ed.). (1992). Encyclopedia of Artificial Intelligence (second edition). Wiley, New York.
Shapley, S. (1953). Stochastic games. In Proceedings of the National Academy of Sciences, Vol. 39, pp. 1095
1100.
Shavlik, J. and Dietterich, T. (Eds.). (1990). Readings in Machine Learning. Morgan Kaufmann, San Mateo,
California.
Shelley, M. (1818). Frankenstein: or, the Modern Prometheus. Pickering and Chatto.
Shenoy, P. P. (1989). A valuation-based language for expert systems. International Journal of Approximate
Reasoning, 3(5), 383411.
Shi, J. and Malik, J. (2000). Normalized cuts and image segmentation. IEEE Transactions on Pattern Analysis
and Machine Intelligence (PAMI), 22(8), 888905.
Shoham, Y. (1987). Temporal logics in AI: Semantical and ontological considerations. Artificial Intelligence,
33(1), 89104.
Shoham, Y. (1993). Agent-oriented programming. Artificial Intelligence, 60(1), 5192.
Shoham, Y. (1994). Artificial Intelligence Techniques in Prolog. Morgan Kaufmann, San Mateo, California.
929
Irodalomjegyzk
Shortliffe, E. H. (1976). Computer-Based Medical Consultations: MYCIN. Elsevier/North-Holland,

Amsterdam, London, New York.
Shwe, M. and Cooper, G. (1991). An empirical analysis of likelihood-weighting simulation on a large, multiply
connected medical belief networks. Computers and Biomedical Research, 1991(5), 453475.
Siekmann, J. and Wrightson, G. (Eds.), (1983). Automation of Reasoning. Springer-Verlag, Berlin.
Sietsma, J. and Dow, R. J. F. (1988). Neural net pruning why and how. In IEEE International Conference on
Neural Networks, pp. 325333, San Diego. IEEE.
Siklossy, L. and Dreussi, J. (1973). An efficient robot planner which generates its own procedures. In
Proceedings of the Third International Joint Conference on Artificial Intelligence (IJCAI-73), pp. 423430,
Stanford, California. IJCAII.
Silverstein, C., Henzinger, M., Marais. H., and Moricz, M. (1998). Analysis of a very large altavista query log.
Tech. rep. 1998014, Digital Systems Research Center.
Simmons, R. and Koenig, S. (1995). Probabilistic robot navigation in partially observable environments. In
Proceedings of IJCAI-95. pp. 1080 1087, Montreal, Canada. IJCAI Inc.
Simmons, R. and Slocum, J. (1972). Generating english discourse from semantic networks. Communications of
the ACM, 15(10), 891905.
Simon, H. A. (1947). Administrative behavior. Macmillan, New York.
Simon, H. A. (1957). Models of Man: Social and Rational. John Wiley, New York.
Simon, H. A. (1963). Experiments with a heuristic compiler. Journal of the Association for Computing
Simon, H. A. (1981). The Sciences of the Artificial (second edition). MIT Press, Cambridge, Massachusetts.
Simon, H. A. (1982). Models of Bounded Rationality, Volume 1. The MIT Press, Cambridge, Massachusetts.
Simon, H. A. and Newell, A. (1958). Heuristic problem solving: The next advance in operations research.
Operations Research, 6, 110.
Simon, H. A. and Newell, A. (1961). Computer simulation of human thinking and problem solving.
Datamation, June/July, 3537.
Simon, J. C. and Dubois, O. (1989). Number of solutions to satisfiability instances applications to knowledge
bases. Int. J. Pattern Recognition and Artificial Intelligence, 3, 5365.
Sirovitch, L. and Kirby, M. (1987). Low-dimensional procedure for characterization of human faces. Journal of
the Optical Society of America A, 2, 586591.
Skinner, B. F. (1953). Science and Human Behavior. Macmillan, London.
Skolem, T. (1920). Logisch-kombinatorische Untersuchungen ber die Erfllbarkeit oder Beweisbarkeit
mathematischer Stze nebst einem Theoreme ber die dichte Mengen. Videnskapsselskapetes skrifter, I.
Matematisk-naturvidenskabelig klasse, 4.
Skolem, T. (1928). ber die mathematische Logik. Norsk matematisk tidsskrift, 10, 125142.
Slagle, J. R. (1963a). A heuristic program that solves symbolic integration problems in freshman calculus.
Journal of the Association for Computing Machinery, 10(4).
Slagle, J. R. (1963b). Game trees, m & n minimaxing, and the m & n alpha-beta procedure. Artificial
intelligence group report 3, University of California, Lawrence Radiation Laboratory, Livermore, California.
Slagle, J. R. and Dixon, J. K. (1969). Experiments with some programs that search game trees. Journal of the
930
Irodalomjegyzk
Slate, D. J. and Atkin, L. R. (1977). CHESS 4.5 Northwestern University chess program. In Frey, P. W. (Ed.),
Chess Skill in Man and Machine, pp. 82118. Springer-Verlag, Berlin.
Slater, E. (1950). Statistics for the chess computer and the factor of mobility. In Symposiumon Information
Theory, pp. 150152, London,. Ministry of Supply.
Sleator, D. and Temperley, D. (1993). Parsing English with a link grammar. In Third Annual Workshop on
Parsing technologies.
Sloman, A. (1978). The Computer Revolution in Philosophy. Harvester Press, Hassocks, Sussex, UK.
Smallwood, R. D. and Sondik, E. J. (1973). The optimal control of partially observable Markov processes over
a finite horizon. Operations Research, 21, 10711088.
Smith, D. E., Genesereth, M. R., and Ginsberg, M. L. (1986). Controlling recursive inference. Artificial
Smith, D. R. (1990). KIDS: a semiautomatic program development system. IEEE Transactions on Software
Engineering, 16(9), 10241043.
Smith, D. R. (1996). Machine suppurt for software development. In Proceedings of the 18th International
Conference on Software Engineering, pp. 167168, Berlin. IEEE Computer Society Press.
Smith, D. E. and Weld, D. S. (1998). Conformant Graphplan. In Proceedings of the Fifteenth National
Conference on Artificial Intelligence (AAAI-98), pp. 889896, Madison, Wisconsin. AAAI Press.
Smith, J. Q. (1988). Decision Analysis. Chapman and Hall, London.
Smith, J. M. and Szathmry, E. (1999). The Origins of Life: From the Birth of Life to the Origin of Language.
Oxford University Press, Oxford, UK.
Smith, R. C. and Cheeseman, P.(1986). On the representation and estimation of spatial uncertainty.
International Journal of Robotics Research, 5(4), 5668.
Smith, S. J. J., Nau, D. S., and Throop, T. A. (1998). Success in spades: Using ai planning techniques to win the
world championship of computer bridge. In Proceedings of the Fifteenth National Conference on Artificial
Intelligence (AAAI-98), pp. 10791086, Madison, Wisconsin. AAAI Press.
Smolensky, P. (1988). On the proper treatment of connectionism. Behavioral and Brain Sciences, 2, 174.
Smyth, P. Heckerman, D., and Jordan, M. I. (1997). Probabilistic independence networks for hidden Markov
probability models. Neural Computation, 9(2), 227269.
Soderland, S. and Weld, D. S. (1991). Evaluating nonlinear planning. Technical report TR-91-02-03,
University of Washington Department of Computer Science and Engineering, Seattle, Washington.
Solomonoff, R. J. (1964). A formal theory of inductive inference. Information and Control, 7, 122, 224254.
Sondik, E. J. (1971). The Optimal Control of Partially Observable Markov Decision Processes. Ph.D. thesis,
Stanford University, Stanford, California.
Sosic, r. and Gu, J. (1994). Efficient local search with conflict minimalization: A case study of the n-queens
problem. IEEE Transactions on Knowledge and Data Engineering, 6(5), 661668.
Sowa, J. (1999). Knowledge Representation: Logical, Philosophical and Computational Foundations.
Blackwell, Oxford, UK.
Spiegelhalter, D. J. (1986). Probabilistic reasoning in predictive expert systems. In Kanal, L. N. and Lemmer, J.
F. (Eds.), Uncertainty in Artificial Intelligence, pp. 4767. Elsevier/North-Holland, Amsterdam, London, New
York.
Spiegelhalter, D. J. Dawid, P., Lauritzen, S., and Cowell, R. (1993). Bayesian analysis in expert systems.
Statistical Science, 8, 219282.
931
Irodalomjegyzk
Spielberg, S. (2001). AI. movie.

Spirtes, P., Glymour, C., and Scheines, R. (1993). Causation, prediction, and search. Springer-Verlag, Berlin.
Springsteen, B. (1992). 57 channels (and nothin on). In Human Touch. Sony.
Srinivasan, A., Muggleton, S. H., King, R. D., and Sternberg, M. J. E. (1994). Mutagenesis: ILP experiments in
a non-determinate biological domain. In Wrobel, S. (Ed.), Proceedings of the 4th International Workshop on
Inductive Logic Programming, Vol. 237, pp. 217232. Gesellschaft fr Mathematik und Datenverarbeitung
MBH.
Srivas, M. and Bickford, M. (1990). Formal verification of a pipelined microprocessor. IEEE Software, 7(5),
5264.
Stallman, R. M. and Sussman, G. J. (1977). Forward reasoning and dependency-directed backtracking in a
system for computer-aided circuit analysis. Artificial Intelligence, 9(2), 135196.
Stanfill, C. and Waltz, D. (1986). Toward memory-based reasoning. Communications of the Association for
Stefik, M. (1995). Introduction to Knowledge Systems. Morgan Kaufmann, San Mateo, California.
Stein, L. A. (2002). Interactive Programming in Java (pre-publication draft). Morgan Kaufmann, San Mateo,
California.
Steinbach, M., Karypis, G., and Kumar, V. (2000). A comparison of document clustering techniques. In KDD
Workshop on Text Mining, pp. 109110. ACM Press.
Stevens, K. A. (1981). The information content of texture gradients. Biological Cybernetics, 42, 95105.
Stickel, M. E. (1985). Automated deduction by theory resolution. Journal of Automated Reasoning, 1(4), 333
355.
Stickel, M. E. (1988). A Prolog Technology Theorem Prover: implementation by an extended Prolog compiler.
Journal of Automated Reasoning, 4, 353380.
Stiller, L. B. (1992). KQNKRR. ICCA Journal, 15(1), 1618.
Stillings, N. A. Weisler, S., Feinstein, M. H. Garfield, J. L., and Rissland, E. L. (1995). Cognitive Science: An
Introduction (second edition). MIT Press, Cambridge, Massachusetts.
Stockman, G. (1979). A minimax algorithm better than alphabeta?. Artificial Intelligence, 12(2), 179196.
Stolcke, A. and Omohundro, S. (1994). Inducing probabilistic grammars by Bayesian model merging. In
Proceedings of the Second International Colloquium on Grammatical Inference and Applications (ICGI-94), pp.
106118, Alicante, Spain. Springer-Verlag.
Stone, P. (2000). Layered Learning in Multi-Agent Systems: A Winning Approach to Robotic Soccer. MIT
Strachey, C. (1952). Logical or non-mathematical programmes. In Proceedings of the Association for
Computing Machinery (ACM), pp. 4649, Toronto, Canada.
Subramanian, D. (1993). Artificial intelligence and conceptual design. In Proceedings of the Thirteenth
International Joint Conference on Artificial Intelligence (IJCAI-93), pp. 800809, Chambery, France. Morgan
Kaufmann.
Subramanian, D. and Feldman, R. (1990). The utility of EBL in recursive domain theories. In Proceedings of
the Eighth National Conference an Artificial Intelligence (AAAI-90), Vol. 2, pp. 942949, Boston, MIT Press.
Subramanian, D. and Wang, E. (1994). Constraint-based kinematic synthesis. In Proceedings of the
International Conference on Qualitative Reasoning, pp. 228239. AAAI Press.
932
Irodalomjegyzk
Sugihara, K. (1984). A necessary and sufficient condition for a picture to represent a polyhedral scene. IEEE
Transactions on Pattern Analysis and Machine Intelligence (PAMI), 6(5), 578586.
Sussman, G. J. (1975). A Computer Model of Skill Acquisition. Elsevier/North-Holland, Amsterdam, London,
New York.
Sussman, G. J. and Winograd, T. (1970). MICROPLANNER Reference Manual. Ai memo 203, MIT AI Lab,
Sutherland, I. (1963). Sketchpad: A man-machine graphical communication system. In Proceedings of the
Spring Joint Computer Conference, pp. 329346. IFIPS.
Sutton, R. S. (1988). Learning to predict by the methods of temporal differences. Machine Learning, 3, 944.
Sutton, R. S., McAllester, D. A., Singh, S. P., and Mansour, Y. (2000). Policy gradient methods for
reinforcement learning with function approximation. In Solla, S. A., Leen, T. K., and Mller, K.-R. (Eds.),
Advances in Neural Information Processing Systems 12, pp. 10571063. MIT Press, Cambridge, Massachusetts.
Sutton, R. S. (1990). Integrated architectures for learning, planning, and reacting based on approximating
dynamic programming. In Machine Learning: Proceedings of the Seventh International Conference, pp. 216
224, Austin, Texas. Morgan Kaufmann.
Sutton, R. S. and Barto, A. G. (1998). Reinforcement Learning: An Introduction. MIT Press, Cambridge,
Massachusetts.
Swade, D. D. (1993). Redeeming Charles Babbages mechanical computer. Scientific American, 268(2), 8691.
Swerling, P. (1959). First order error propagation in a stagewise smoothing procedure for satellite observations.
Journal of Astronautical Sciences, 6, 4652.
Swift, T. and Warren, D. S. (1994). Analysis of SLG-WAM evaluation of definite programs. In Logic
Programming. Proceedings of the 1994 International Symposium, pp. 219235, Ithaca NY. MIT Press.
Syrjnen, T. (2000). Lparse 1.0 users manual http://saturn.tcs.hut.fi/Software/smodels.
Tadepalli, P. (1993). Learning from queries and examples with tree-structured bias. In Proceedings of the Tenth
International Conference on Machine Learning, pp. 322329, Amherst, Massachusetts. Morgan Kaufmann.
Tait, P. G. (1880). Note on the theory of the 15 puzle. Proceedings of the Royal Society of Edinburgh, 10,
664665.
Tamaki, H. and Sato, T. (1986). OLD resolution with tabulation. In Third International Conference on Logic
Programming, pp. 8498, London, Springer-Verlag.
Tambe, M., Newell, A., and Rosenbloom, P. S. (1990). The problem of expensive chunks and its solution by
restricting expressiveness. Machine Learning, 5, 299348.
Tarjan, R. E. (1983). Data Structures and Network Algorithms. CBMS-NSF Regional Conference Series im
Applied Mathematics. SIAM (Society for Industrial and Applied Mathematics, Philadelphia.
Tarski, A. (1935). Die Wahrheitsbegriff in den formalisierten Sprachen. Studia Philosophica, 1, 261405.
Tarski, A. (1956). Logic, Semantics, Metamathematics: Papers from 1923 to 1938. Oxford University Press,
Oxford, UK.
Tash, J. K. and Russell, S. J. (1994). Control strategies for a stochastic planner. In Proceedings of the Twelfth
Tate, A. (1975a). Interacting goals and their use. In Proceedings of the Fourth International Joint Conference
on Artificial Intelligence (IJCAI-75), pp. 215218, Tbilisi, Georgia. IJCAII.
Tate, A. (1975b). Using Goal Structure to Direct Search in a Problem Solver, Ph.D. thesis, University of
Edinburgh, Edinburgh, Scotland.
933
Irodalomjegyzk
Tate, A. (1977). Generating project networks. In Proceedings of the Fifth International Joint Conference on
Artificial Intelligence (IJCAI-77), pp. 888893, Cambridge, Massachusetts. IJCAII.
Tate, A. and Whiter, A. M. (1984). Planning with multiple resource constraints and an application to a naval
planning problem. In Proceedings of the First Conference on AI Applications, pp. 410416, Denver, Colorado.
Tatman, J. A. and Shachter, R. D. (1990). Dynamic programming and influence diagrams. IEEE Transactions
on Systems, Man and Cybernetics, 20(2), 365379.
Tesauro, G. (1989). Neurogammon wins computer olympiad. Neural Computation, 1(3), 321323.
Tesauro, G. (1992). Practical issues in temporal difference learning. Machine Learning, 8(34), 257277.
Tesauro, G. (1995). Temporal difference learning and TD-Gammon. Communications of the Association for
Tesauro, G. and Sejnowski, T. (1989). A parallel network that learns to play backgammon. Artificial
Intelligence, 39(3) 357390.
Thagard, P. (1996). Mind: Introduction to Cognitive Science. MIT Press, Cambridge, Massachusetts.
Thaler, R. (1992). The Winners Curse: Paradoxes and Anomalies of Economic Life. Princeton University
Press, Princeton, New Jersey.
Thielscher, M. (1999). From situation calculus to fluent calculus: State update axioms as a solution to the
inferential frame problem. Artificial Intelligence, 111(12), 277299.
Thomason, R. H. (Ed.). (1974). Formal Philosophy: Selected Papers of Richard Montague. Yale University
Press, New Haven, Connecticut.
Thompson, D. W. (1917). On Growth and Form. Cambridge University Press, Cambridge, UK.
Thrun, S. (2000). Towards programming tools for robots that integrate probabilistic computation and learning.
In Proceedings of the IEEE International Conference on Robotics and Automation (ICRA), San Francisco, CA.
IEEE.
Thrun, S. (2002). Robotic mapping: A survey. In Lakemeyer, G. and Nebel, B. (Eds.), Exploring Artificial
Intelligence in the New Millenium. Morgan Kaufmann. to appear.
Titterington, D. M., Smith, A. F. M., and Makov, U. E. (1985). Statistical analysis of finite mixture
dictributions. Wiley, New York.
Toffler, A. (1970). Future Shock. Bantam.
Tomasi, C. and Kanade, T. (1992). Shape and motion from image streams under orthography: A factorization
method. International Journal of Computer Vision, 9, 137154.
Touretzky, D. S. (1986). The Mathematics of Inheritance Systems. Pitman and Morgan Kaufmann, London and
Trucco, E. and Verri, A. (1998). Introductory Techniques for 3-D Computer Vision. Prentice Hall, Upper
Tsang, E. (1993). Foundations of Constraint Satisfaction. Academic Press, New York.
Tsitsiklis, J. N. and Van Roy, B. (1997). An analysis of temporal-difference learning with function
approximation. IEEE Transactions on Automatic Control, 42(5), 674690.
Tumer, K. and Wolpert, D. (2000). Collective intelligence and braess paradox. In Proceedings of the
AAAI/IAAI, pp. 104109.
Turcotte, M., Muggleton, S. H., and Sternberg, M. J. E. (2001). Automated discovery of structural signatures of
protein fold and function. Journal of Molecular Biology, 306, 591605.
934
Irodalomjegyzk
Turing, A. (1936). On computable numbers, with an application to the Entscheidungsproblem. Proceedings of

the London Mathematical Society, 2nd series, 42, 230265.
Turing, A. (1948). Intelligent machinery. Tech. rep., National Physical Laboratory. reprinted in (Ince, 1992).
Turing, A. (1950). Computing machinery and intelligence. Mind, 59, 433460.
Turing, A., Strachey, C., Bates, M. A. and Bowden, B. V. (1953). Digital computers applied to games. In
Bowden, B. V. (Ed.), Faster than Thought, pp. 286310. Pitman, London.
Turtle, H. R. and Croft, W. B. (1992). A comparison of text retrieval models. The Computer Journal, 35(1),
279289.
Tversky, A. and Kahneman, D. (1982). Causal schemata in judgements under uncrtainty. In Kahneman, D.,
Slovic, P., and Tversky, A. (Eds.), Judgement Under Uncertainty. Heuristics and Biases. Cambridge University
Press, Cambridge, UK.
Ullman, J. D. (1985). Implementation of logical query languages for databases. ACM Transactions on Database
Systems, 10(3), 289321.
Ulmann, J. D. (1989). Principles of Database and Knowledge-Base Bystems. Computer Science Press,
Rockville, Maryland.
Ullman, S. (1979). The Interpretation of Visual Motion. MIT Press, Cambridge, Massachusetts.
Vaessens, R. J. M., Aarts, E. H. I., and Lenstra, J. K. (1996). Job shop scheduling by local search. INFORMS J.
on Computing, 8, 302117.
Valiant, L. (1984). A theory of the learnable. Communications of the Association for Computing Machinery, 27,
11341142.
van Benthem, J. (1983). The Logic of Time. D. Reidel, Dordrecht, Netherlands.
Van Emden, M. H. and Kowalski, R. (1976). The semantics of predicate logic as a programming language.
Journal of the Association for Computing Machiney, 23(4) 733742.
van Harmelen, F. and Bundy, A. (1988). Explanation-based generalisation = partial evaluation. Artificial
Intelligence, 36(3) 401412.
van Heijenoort, J. (Ed.), (1967). From Frege to Gdel: A Source Book in Mathematical Logic, 18791931.
Harvard University Press, Cambridge, Massachusetts.
Van Hentenryck, P., Saraswat, V., and Deville, Y. (1998). Design, implementation, and evaluation of the
constraint language cc(fd). Journal of Logic Programming, 37(13), 139164.
van Nunen, J. A. E. E. (1976). A set of successive approximation methods for discounted Markovian decision
problems. Zeitschrift fur Operations Research, Serie A, 20(5), 203208.
van Roy, B. (1998). Learning and value function approximation in complex decision processes. Ph.D. thesis,
Laboratory for Information and Decision Systems, MIT, Cambridge, Massachusetts.
Van Roy, P. L. (1990). Can logic programming executes, as fast as imperative programming?. Report
UCB/CSD 90/600, Computer Science Division, University of California, Berkeley, California.
Vapnik, V. N. (1998). Statistical Learning Theory. Wiley, New York.
Vapnik, V. N. and Chervonenkis, A. Y. (1971). On the uniform convergence of relative frequencies of relative
frequencies of events to their probabilities. Theory of Probability and Its Applications, 16, 264280.
Varian, H. R. (1995). Economic mechanism design for computerized agents. In USENIX Workshop on
Electronic Commerce, pp. 1321.
935
Irodalomjegyzk
Veloso, M. and Carbonell, J. G. (1993). Derivational analogy in prodigy: Automating case acquisition, storage,
and utilization. Machine Learning, 10, 249278.
Vere, S. A. (1983). Planning in time: Windows and durations for activities and goals. IEEE Transactions on
Pattern Analysis and Machine Intelligence (PAMI), 5, 246267.
Vinge, V. (1993). The coming technological singularity: How to survive in the post-human era. In VISION-21
Symposium. NASA Lewis Research Center and the Ohio Aerospace Institute.
Viola, P. and Jones, M. (2002). Robust real-time object detection. International Journal of Computer Vision, in
press.
von Mises, R. (1928). Wahrscheinlichkeit, Statistik und Wahrheit. J. Springer, Berlin.
von Neumann, J. (1928). Zur Theorie der Gesellschaftsspiele. Mathematische Annalen, 100(295 320).
von Neumann, J. and Morgenstern, O. (1944). Theory of Games and Economic Behavior (first edition).
Princeton University Press, Princeton, New Jersey.
von Winterfeldt, D. and Edwards, W. (1986). Desicion Analysis and Behavioral Research. Chambridge
Voorhees, E. M. (1993). Using WordNet to disambiguate word sens for text retrieval. In Sixteenth Annual
International ACM SIGIR Conference on Research and Development in Information Retrieval, pp. 17180,
Pittsburgh. Association for Computing Machinery.
Vossen, T., Ball, M., Lotem, A., and Nau, D. S. (2001). Applying integer programming to ai planning.
Knowledge Engieneering Review, 16, 85100.
Waibel, A. and Lee, K.-F., (1990). Readings in Speech Recognition. Morgan Kaufmann, San Mateo, California.
Waldinger, R. (1975). Achieving several goals simultaneously. In Elcock, E. W. and Michie, D. (Eds.),
Machine Intelligence 8, pp. 94138. Ellis Horwood, Chichester, England.
Waltz, D. (1975). Understanding line drawings of scenes with shadows. In Winston, P. H. (Ed.), the Psychology
of Computer Vision. McGraw-Hill, New York.
Wanner, E. (1974). On remembering, forgetting and understanding sentences. Mouton, The Hague and Paris.
Warren, D. H. D. (1974). WARPLAN: A System for Generating Plans. Department of Computational Logic
Memo 76, University of Edinburgh, Edinburgh, Scotland.
Warren, D. H. D. (1976). Generating conditional plans and programs. In Proceedings of the AISB Summer
Conference, pp. 344354.
Warren, D. H. D. (1983). An abstract Prolog instruction set. Technical note 309, SRI International, Menlo Park,
California.
Warren, D. H. D., Pereira, L. M., and Pereira, F. (1977). PROLOG: The language and its implementation
compared with LISP. SIGPLAN Notices, 12(8), 109115.
Watkins, C. J. (1989). Models of Delayed Reinforcement Learning. Ph.D. thesis, Psychology Department,
Cambridge University, Cambridge, UK.
Watson, J. D. and Crick, F. H. C. (1953). A structure for deoxyribose nucleic acid. Nature, 171, 737.
Webber, B. L. (1983). So what can we talk about now? In Brady, M. and Berwick, R. (Eds.), Computational
Models of Discourse. MIT Press, Cambridge, Massachusetts.
Webber, B. L. (1988). Tense as discourse anaphora. Computational Linguistics, 14(2), 6173.
Webber, B. L. and Nilsson, N. J. (Eds.). (1981). Readings in Artificial Intelligence. Morgan Kaufmann, San
Mateo, California.
936
Irodalomjegyzk
Weidenbach, C. (2001). SPASS: Combining superposition, sorts and splitting. In Robinson, A. and Voronkov,
A. (Eds.), Handbook of Automated Reasoning. mit, mit-ad.
Weiss, G. (1999). Multiagent systems. MIT Press, Cambridge, Massachusetts.
Weiss, S. and Kulikowski, C. A. (1991). Computer Systems That Learn: Classification and Prediction Methods
from Statistics, Neural Nets, Machine Learning, and Expert Systems. Morgan Kaufmann, San Mateo, California.
Weizenbaum, J. (1976). Computer Power and Human Reason. W. H. Freeman, New York.
Weld, D. S. (1994). An introduction to least commitment planning. AI Magazine, 15(4), 2761.
Weld, D. S. (1999). Recent advances in ai planning. AI Magazine, 20(2) 93122.
Weld, D. S. Anderson, C. R., and Smith, D. E. (1998). Extending graphplan to handle uncertainty and sensing
actions. In Proceedings of the Fifteenth National Conference on Artificial Intelligence (AAAI-98), pp. 897904,
Weld, D. S. and de Kleer, J. (1990). Readings in Qualitative Reasoning about Physical Systems. Morgan
Weld, D. S. and Etzioni, O. 1994). The first law of robotics: A call to arms. In Proceedings of the Twelfth
National Conference on Artificial Intelligence (AAAI-94), Seattle. AAAI Press.
Wellman, M. P. (1985). Reasoning about preference models. Technical report MIT/LCS/TR-340, Laboratory
for Computer Science, MIT, Cambridge, Massachusetts.
Wellman, M. P. (1988). Formulation of Tradeoffs in Planning under Uncertainty. Ph.D. thesis, Massachusetts
Institute of Technology, Cambridge, Massachusetts.
Wellman, M. P. (1990a). Fundamental concepts of qualitative probabilistic networks. Artificial Intelligence,
44(3), 257303.
Wellman, M. P. (1990b). The STRIPS assumption for planning under uncertainty. In Proceedings of the Eighth
National Conference on Artificial Intelligence (AAAI-90), pp. 198203, Boston. MIT Press.
Wellman, M. P. (1995). The economic approach to artificial intelligence. ACM Computing Surveys, 27(3), 360
362.
Wellman, M. P., Breese, J. S., and Goldman, R. (1992). From knowledge bases to decision models. Knowledge
Engieneering Review, 7(1), 3553.
Wellman, M. P. and Doyle, J. (1992). Modular utility representation for decision-theoretic planning. In
Proceedings, First International Conference on AI Planning Systems, pp. 236242, College Park, Maryland.
Morgan Kaufmann.
Werbos, P. (1974). Beyond Regression: New Tools for Prediction and Analysis in the Behavioral Sciences.
Ph.D. thesis, Harvard University, Cambridge, Massachusetts.
Werbos, P. (1977). Advanced forecasting methods for global crisis warning and models of intelligence. General
Systems Yearbook, 22, 2538.
Wesley, M. A. and Lozano-Perez, T. (1979). An algorithm for planning collision-free paths among polyhedral
objects. Communications of the ACM, 22(10), 560570.
Wheatstone, C. (1838). On some remarkable, and hitherto unresolved, phenomena of binocular vision.
Philosophical Transactions of the Royal Society of London, 2, 371394.
Whitehead, A. N. (1911). An Introduction to Mathematics. Williams and Northgate, London.
Whitehead, A. N. and Russell, B. (1910). Principia Mathematica. Cambridge University Press, Cambridge,
UK.
937
Irodalomjegyzk
Whorf, B. (1956). Language, Thought, and Reality. MIT Press. Cambridge, Massachusetts.
Widrow, B. (1962). Generalization and information storage in networks of adaline neurons. In Yovits, M. C.
Jacobi, G. T., and Goldstein, G. D. (Eds.), Self-Organizing Systems 1962, pp. 435461, Chicago, Illionis.
Spartan.
Widrow, B. and Hoff, M. E. (1960). Adaptive switching circuits. In 1960 IRE WESCON Convention Record,
pp. 96104, New York.
Wiener, N. (1942). The extrapolation, interpolation, and smoothing of stationary time series. Osrd 370, Report
to the Services 19, Research Project DIC-6037, MIT, Cambridge, Massachusetts.
Wiener, N. (1948). Cybernetics. Wiley, New York.
Wilensky, R. (1978). Understanding goal-based stories. Ph.D. thesis, Yale University, New Haven, Conecticut.
Wilensky, R. (1983). Planning and Understanding. Addison-Wesley, Reading, Massachusetts.
Wilkins, D. E. (1980). Using patterns and plans in chess. Artificial Intelligence, 14(2), 165203.
Wilkins, D. E. (1988). Practical Planning: Extending the AI Planning Paradigm. Morgan Kaufmann, San
Mateo, California.
Wilkins, D. E. (1990). Can AI planners solve practical problems?. Computational Intelligence, 6(4), 232246.
Wilkins, D. E., Myers, K. L., Lowrance, J. D., and Wesley, L. P. (1995). Planning and reacting in uncertain and
dynamic environments. Journal of Exprimental and Theoretical AI, 7(1), 197227.
Wilks, Y. (1975). An intelligent analyzer and understanding of English. Communications of the ACM, 18(5),
264274.
Williams, R. J.(1992). Simple statistical gradient-following algorithms for connectionist reinforcement learning.
Williams, R. J. and Baird, L. C. I. (1993). Tight performance bounds on greedy policies based on imperfect
value functions. Tech. rep. NU-CCS-93-14, College of Computer Science, Northeastern University, Boston.
Wilson, R. A. and Keil, F. C. (Eds.). (1999). The MIT Encyclopedia of the Cognitive Sciences. MIT Press,
Winograd, S. and Cowan, J. D. (1963). Reliable Computation in the Presence of Noise. MIT Press, Cambridge,
Massachusetts.
Winograd, T. (1972). Understanding natural language. Cognitive Psychology, 3(1), 1191.
Winston, P. H. (1970). Learning structural descriptions from examples. Technical report MAC-TR-76,
Department of Electrical Engineering and Computer Science, Massachusetts Institute of Technology,
Winston, P. H. (1992). Artificial Intelligence (Third edition). Addison-Wesley, Reading, Massachusetts.
Wirth, R. and ORorke, P. (1991). Constraints on predicate invention. In Machine Learning: Proceedings of the
Eighth International Workshop (ML-91), pp. 457461, Evanston, Illionis. Morgan Kaufmann.
Witten, I. H. and Bell, T. C. (1991). The zero frequency problem: Estimating the probabilistic of novel events in
adaptive text compression. IEEE Transactions on Information Theory, 37(4), 10851094.
Witten, I. H., Moffat, A., and Bell, T. C. (1999). Managing Gigabytes: Compressing and Indexing Documents
and Images (second edition). Morgan Kaufmann, San Mateo, California.
Wittgenstein, L. (1922). Tractatus Logico-Philosophicus (second edition). Routledge and Kegan Paul, London.
Reprinted 1971, edited by D. F. Pears and B. F. McGuinness. This edition of the English translation also
938
Irodalomjegyzk
contains Wittgensteins original German text on facing pages, as well as Bertrand Russells introduction to the
1922 edition.
Wittgenstein, L. (1953). Philosophical Investigations. Macmillan, London.
Wojciechowski, W. S. and Wojcik, A. S. (1983). Automated design of multiple-valued logic circuits by
automated theorem proving techniques. IEEE Transactions on Computers, C-32(9), 785 798.
Wojcik, A. S. (1983). Formal design verification of digital systems. In ACM IEEE 20th Design Automation
Conference Proceedings, pp. 228 234, Miami Beach, Florida. IEEE.
Wood, M. K. and Dantzig, G. B. (1949). Programming of interdependent activities. i. general discussion.
Econometrica, 17, 193199.
Woods, W. A. (1973). Progress in natural language understanding: An application to lunar geology. In AFIPS
Conference Proceedings, Vol. 42, pp. 441450.
Woods, W. A. (1975). Whats in a link? Foundations for semantic networks. In Bobrow, D. G. and Collins, A.
M. (Eds.), Representation and Understanding: Studies in Cognitive Science, pp. 3582. Academic Press, New
York.
Woods, W. A. (1978). Semantics and quantification in natural language question answering. In Advances in
Computers. Academic Press.
Wooldridge, M. and Rao, A. (Eds.). (1999). Foundations of national agency. Kluwer, Dordrecht, Netherlands.
Wos, L., Carson, D., and Robinson, G. (1964). The unit preference strategy in theorem proving. In Proceedings
of the Fall Joint Computer Conference, pp. 615621.
Wos, L., Carson, D., and Robinson, G. (1965). Efficiency and completeness of the set-of-support strategy in
theorem proving. Journal of the Association for Computing Machinery, 12, 536541.
Wos, L., Overbeek, R., Lusk, E., and Boyle, J. (1992). Automated Reasoning: Introduction and Applications
(second edition). McGraw-Hill, New York.
Wos, L. and Robinson, G. (1968). Paramodulation and set of support. In Proceedings of the IRIA Symposium on
Automatic Demonstration, pp. 276310. Springer-Verlag.
Wos, L., Robinson, G., Carson, D., and Shalla, L. (1967). The concept of demodulation in theorem proving.
Journal of the Association for Computing Machinery, 14, 698704.
Wos, L. and Winker, S. (1983). Open questions solved with the assistance of AURA. In Bledsoe, W. W. and
Loveland, D. (Eds.), Automated Theorem Proving: After 25 Years: Proceedings of the Special Session of the
89th Annual Meeting of the American Mathematical Society, pp. 7188, Denver, Colorado. American
Mathematical Society.
Wright, S. (1921). Correlation and causation. Journal of Agricultural Research, 20, 557585.
Wright, S. (1931). Evolution in Mendelian populations. Genetics, 16, 97159.
Wright, S. (1934). The method of path coefficients. Annals of Mathematical Statistics, 5, 161215.
Wu, D. (1993). Estimating probability distributions over hypotheses with variable unification. In Proceedings of
the Thirteenth International Joint Conference on Artificial Intelligence (IJCAI-93), pp. 790795, Chambery,
France. Morgan Kaufmann.
Wygant, R. M. (1989). CLIPS a powerful development and delivery expert system tool. Computers and
Industrial Engieneering, 17, 546549.
Yamada, K. and Knight, K. (2001). A syntax-based statistical transaction model. In Proceedings of the Thirty
Ninth Annual Conference of the Association for Computational Linguistics, pp. 228235.
939
Irodalomjegyzk
Yang, Q. (1990). Formalizing planning knowledge for hierarchical planning. Computational Intelligence, 6, 12
24.
Yang, Q. (1997). Intelligent planning: A decomposition and abstraction based approach. Springer-Verlag,
Berlin.
Yedidia, J., Freeman, W., and Weiss, Y. (2001). Generalized belief propagation. In Leen, T. K. Dietterich, T.,
and Tresp, V. (Eds.), Advances in Neural Information Processing Systems 13. MIT Press, Cambridge,
Massachusetts.
Yip, K. M.-K. (1991). KAM: A System for Intelligently Guiding Numerical Experimentation by Computer. MIT
Yngve, V. (1955). A model and an hypothesis for language structure. In Locke, W. N. and Booth, A. D. (Eds.),
Machine Translation of Languages, pp. 208226. MIT Press, Cambridge, Massachusetts.
Yob, G. (1975). Hunt the wumpus!. Creative Computing, Sep/Oct.
Yoshikawa, T. (1990). Foundations of Robotics: Analysis and Control. MIT Press, Cambridge, Massachusetts.
Young, R. M. Pollack, M. E., and Moore, J. D. (1994). Decomposition and causality in partial order planning.
In Proceedings of the 2nd International Conference on Artificial Intelligence Planning Systems (AIPS-94), pp.
188193, Chicago.
Younger, D. H. (1967). Recognition and parsing of context-free languages in time n3. Information and Control,
10(2), 189208.
Zadeh, L. A. (1965). Fuzzy sets. Information and Control, 8, 338353.
Zadeh, L. A. (1978). Fuzzy sets as a basis for a theory of possibility. Fuzzy Sets and Systems, 1, 328.
Zaritskii, V. S., Svetnik, V. B. and Shimelevich, L. I. (1975). Monte-Carlo technique in problems of optimal
information processing. Automation and Remote Control, 36, 201522.
Zelle, J. and Mooney, R. J. (1996). Learning to parse database queries using inductive logic programming. In
Proceedings of the Thirteenth National Conference on Artificial Intelligence, pp. 1050 1055.
Zermelo, E. (1913). Uber Eine Anwendung der Mengenlehre auf die Theorie des Schachspiels. In Proceedings
of the Fifth International Congress of Mathematicians, Vol. 2, pp. 501504.
Zermelo, E. (1976). An application of set theory to the theory of chess-playing. Firbush News, 6, 3742.
English translation of (Zermelo 1913).
Zhang, N. L. and Poole, D. (1994). A simple approach to bayesian network computations. In Proceedings of the
10th Canadian Conference on Artificial Intelligence, pp. 171178, Banff, Alberta, Morgan Kaufmann.
Zhang, N. L. and Poole, D. (1996). Exploiting causal independence in Bayesian network inference. Journal of
Zhou, R. and Hansen, E. (2002). Memory-bounded A* graph search. In Proceedings of the 15th International
Flairs Conference.
Zhu, D. J. and Latombe, J.-C. (1991). New heuristic algorithms for efficient hierarchical path planning. IEEE
Transaction on Robotics and Automation, 7(1), 920.
Zilberstein, S. and Russell, S. J. (1996). Optimal composition of real-time systems. Artificial Intelligence, 83,
181213.
Zimmermann, H.-J. (Ed.). (1999). Practical application of fuzzy technologies. Kluwer, Dordrecht, Netherlands.
Zimmermann, H.-J. (2001). Fuzzy Set Theory And Its Applications (Fourth edition). Kluwer, Dordrecht,
Netherlands.
940
Irodalomjegyzk
Zobrist, A. L. (1970). Feature Extraction and Representation for Pattern Recognition and the Game of Go.
Ph.D. thesis, University of Wisconsin.
Zuse, K. (1945). The Plankalkl. Report 175, Gesellschaft fr Mathematik und Datenverarbeitung, Bonn,
Germany.
Zweig, G. and Russell, S. J. (1998). Speech recognition with dynamic Bayesian networks. In Proceedings of the
Fifteenth National Conference on Artificial Intelligence (AAAI-98), pp. 173180, Madison, Wisconsin. AAAI
Press.
941
D. fggelk - Magyar nyelv

szakirodalom
Mint korbban, ehhez a kiadshoz is mellkeljk a kapcsold magyar nyelv irodalom egy rvid vlogatst.
Az lvonalbeli magyar kutatk tbbsge angolul publikl, gy ez a vlogats semmikppen sem tekinthet
reprezentatvnak a hazai mhelyek, a mvelt terletek s a kutats intenzitsa szempontjbl. A magyar nyelv
irodalom egyttal kevsb kapcsoldik egy szkebb szakterlethez szmos ltalnos, interdiszciplinris,
illetve sszefoglal mvet vonultatunk fel. A magyar nyelv szakirodalom megadsnl az a szndk vezrelt
minket, hogy az angol nyelvben kevsb jrtas, m az MI-tmk irnt rdekld olvas kzvetlen segtsget
kapjon olvasmnyai folytatsban, ezrt nem is trekedtnk arra, hogy a vlogatsban helyet kapjanak
klnbz bels, nehezen vagy hossz tvon nem garantltan hozzfrhet oktatsi, illetve egyb anyagok. A
magyar nyelv irodalmi vlogatsban megrdemelten hangslyozott helyet kaptak a magyar nyelvszeti
forrsok. A magyar nyelv feldolgozsrl hitelesen csakis magyar szerzktl magyarul olvashatunk. A
vlogatshoz vgl csatoltuk nhny hazai konferencia cikkeit is.
1. Mestersges intelligencia ltalnossgban

Borgulya, I.: Neurlis hlk s fuzzy-rendszerek. Dialg Campus Kiad, Budapest, 1998.
Calvin, W. H.: A gondolkod agy. Az intelligencia fejldstrtnete. Vilg Egyetem, Kulturtrade Kiad, 1997.
Clark, A.: A megismers ptkvei. Osiris Kiad, Budapest, 1996.
Darab T.: A gpestett rtelem. Vzlatok a mestersges intelligencia filozfijhoz. ron, Budapest, 1991.
Dennett, D. C.: Micsoda elmk. A tudatossg megismerse fel. Vilg Egyetem, Kulturtrade Kiad, 1996.
Fekete I.Gregorics T.Nagy S.: Bevezets a mestersges intelligenciba. Heurisztikus grfkeress,
ktszemlyes jtkok, automatikus ttelbizonyts. LSI Oktatkzpont, 1990, 1999.
Fut I. (szerk.): Mestersges intelligencia. Aula Kiad, Budapest, 1999.
Horvth G. (szerk.): Neurlis hlzatok s mszaki alkalmazsaik. Egyetemi tanknyv. Megyetemi Kiad,
Budapest, 1998.
Kczy T. L.Tick D.: Fuzzy rendszerek. Typotex, Budapest, 2000.
Mr L.: szjrsok. Tercum, Budapest. 1997.
Penrose, R.: A csszr j elmje. Akadmiai Kiad, Budapest, 1993.
Ruzsa I.: Klasszikus, intenzionlis s modlis logika. Akadmiai Kiad, Budapest, 1984.
Sntn-Tth E.: Tudsalap technolgia, szakrt rendszerek. Dunajvrosi Fiskola Kiad Hivatala,
Dunajvros, 1995, 1997, 1998, 2000.
Yoshiaki Shirai, Jun-ichi Tsujii: Mestersges intelligencia. Alapelvek, alkalmazsok. Novotrade Rt. Budapest,
1987.
Az jALAPLAP tematikus MI-sorozatban megjelent npszerst dolgozatok, 1992. februr-1996.
augusztus kztti szmokban
ll G.: Ltni s lttatni I-VI. 1993(2), 2527., 1993(3), 2122. 25., 1993(4), 22, 2526.,1993(5), 2122, 25.,
1993(6), 2122, 2526.,1993(7), 2022.
Aszals L.: A fuzzy vezreljen titeket Az igen s a nem kztti vilg. 1996(3), 3840.
Aszals L.: Sejtek, automatizlt sejtek, sejtautomatk Mestersges let? 1996(7), 4244.
942
Magyar nyelv szakirodalom
Aszals L.: A sakk hatsa a kutatsra A jtkfk az gig nnek. 1996(5), 5152.
Aszals L.: Nyelviskola A Prolog mint kvetkeztet rendszer. 1995(8), 4547.
Aszals L.: Mestersges tancsadk Szupergrf a hzibulhoz. 1996(4), 3840.
Aszals L.: Izgalmas gondolkodsutnzatok Logika s tmrts. 1996(8), 3640.
Bessenyei Z., Tomcsnyi T.: Turbgenertor-rezgsdiagnosztika. 1992(9), 42.
Borsodi G.Lois L.: Elkszletek a beszdfelismershez I-II. 1995(2), 3940., 1995(3), 3436.
Farkas E.: A vilgmodellek korltos vilga I-II. 1993(10), 2526., 1993(11), 4546.
Farkas Z.: A rendszer mint diagnoszta. Nvny- s tudsnvekmny-vdelem. 1994(1), 37.
Farkas Zs.: MProlog-alapon. 1992(9), 3839.
Fekete I.: Tudsreprezentci I-II. 1992(6), 23.25., 1992(7), 1921.
Fut I.: Az EXPO kockzata. 1992(9), 4041.
Galntai Z.: Egyszer szablyok bonyolult kvetkezmnyekkel Az letjtk is lehet szenvedly. 1996(7), 4547.
Horvth I.: Intelligens CAD rendszerek I-II. 1994(9), 2728., 1995(12), 2729.
Horvth I.: Tervezi stratgik s eljrsok. Vannak mg problmk. 1995(2), 3437.
Horvth I.: A tervezs szakrtrendszerei I-II. 1995(4), 5051., 1995(5), 5152.
Horvth I.: Az alaksajtossg paradigma Nem elg tervezni, kivitelezni is kell! 1995(6), 5051.
Horvth I.: A lnyeg burkoltan Sajtos alakfelismers. 1995(7), 5051.
Horvth I.: Tanulni nehz de valahogy kell. A rendszer intelligencija. 1995(8), 4850.
Istenes P.: Karakterolgia a mtrixrcson. A kzrs felismerse. 1993(9), 3537.
Jakab .: A CNN univerzlis szmtgp s szuperszmtgp-chip. sszefogva a neuro-biolgusokkal. 1994(7),
1416.
Jakab .: Ember tervez 1994(8), 27.
Jakab .: Mert utlunk robotolni 1994(2), 37.
Jakab .: Videre necesse est. 1993(2), 25.
Koch P.: A titkos tuds. Forrsok s ktfk. 1992(10), 2021.
K A.Lovrics L.: j csillag a kzgazdasgi modellezsben: Backpropagation. 1993.
Lindner L.: Genius 2 a sakk-kirly. Gpek lesznek a sakkvilgbajnokok? 1994(12), 1315.
Pirk J.: 3 D(imenzi) biolgiai s optikai szemszgbl. A szemez szmtgp. 1993(8), 3235.
Sntn-Tth E.: Mestersges intelligencia. Agyszer s nagyszer. 1992(2), 1314.
Sntn-Tth E.: A tuds minden eltt! 1992(8), 1720.
Sntn-Tth E.: Szakrtrendszer-projektek s -alkalmazsok. 1992(9), 3738.
Seregy L.: Lektorlva 15 ezertl 15 millirdig? A magyar szkincs. 1993(11), 3940.
Strausz Gy.: Mestersges neurlis hlzatok I-II. 1992(12), 1820.,1993(1), 2527.
943
Strausz Gy.: gynkk s stratgik; genetikus algoritmusok s kromoszmk - Elosztott intelligens rendszerek.
1995(12), 5152.
Szeredi P.: VAGY- s S- fggetlen s fgg Prhuzamos logikai programozs. 1996(1), 3840.
Szts M.: Automatikus ttelbizonyts. 1992(5), 2022.
Tar J.: Mestersges mesterek I-V. 1994(2), 3739., 1994(3), 3537., 1994(5), 4546., 1994(6), 37., 1994(7), 37
38.
Vmos T.: Ember s ember kztt. 1992(4), 4445.
Vncza J.: Mit tanulhatunk mi a gp tanulsbl? Tud(hat)-e a gp tanulni? 1992(11), 3134.
Alkalmazsok s hatrterletek
ll G.Hegeds Gy. s trsai: A Digitlis kpfeldolgozs alapproblmi. Akadmiai Kiad, Budapest, 1989.
ll G., Fglein J. s trsai: Bevezets a szmtgpes kpfeldolgozsba javtott kiads. BME
Mrnktovbbkpz Intzet, Egyetemi jegyzet, Budapest, 1993.
Bach I.: Szmtstechnikai nyelvszet. BME, Budapest, 1991.
Bach I., Farkas E., Naszdi M.: A magyar nyelv elemzse szmtgppel. SZTAKI Tanulmnyok, 199/1987.
Bacz E.Takcs E.: Kis magyar nyelvtan. Gondolat Talentum, Budapest, 1996.
Benk T.Lukcsy G.Szeredi P.: A Szemantikus Vilghl elmlete s gyakorlata. Typotex, Budapest, 2005.
Berke J.Hegeds Gy. s trsai: Digitlis kpfeldolgozs s alkalmazsai. Keszthelyi Akadmia Alaptvny,
Keszthely, 1996.
Copi XX.Irving M.Gould, J. A.: Kortrstanulmnyok a logikaelmlet krdseirl. Gondolat, Budapest, 1985
Csibi S. (szerk.): Informci kzlse s feldolgozsa. Tanknyvkiad, Budapest, 1986.
Kasztkin, V. N.Valdkina, L. I.: Algoritmusok s jtkok. Tanknyvkiad, Budapest, 1988.
Kenesei I. (szerk.): A nyelv s a nyelvek, Akadmiai Kiad, Budapest, 1995, 2004.
Kovcs P. A.: Sakkprogramozsrl mindenkinek, Novotrade Rt., 1987.
Kovcs M.Olaszy G.Niklczy P.Gsy M.: Magyar nyelvi beszdtechnolgiai alapismeretek. (600 oldal CDROM-on). Szerk.: Olaszy G., Nikol Kiad, Budapest, 2002.
Lipi G.Nemes .Novk I.: A knai hadseregtl az utaz gynkig. Grfok gpkzelben. Novotrade Kiad,
1990.
Lukcs O.: Matematikai Statisztika. Mszaki Knyvkiad, Budapest, 1996
Olaszy G.Kovcs M.Niklczy P.Gsy M.: Magyar nyelvi beszdtechnolgiai alapismeretek. (600 oldal CDROM-on). Szerk.: Olaszy G., Nikol Kiad, Budapest, 2002.
Psztorn Varga K.: Logikai alapozs alkalmazsokhoz. Matematikai logika szmtstudomny. ELTE
Budapest, Egyetemi jegyzet, 1997
Psztorn Varga K.Vrtersz M.: Matematikai logika alkalmazsszemllet trgyalsa. Panem, Budapest,
2003.
Pinker S.: A nyelvi sztn. Hogyan hozza ltre az elme a nyelvet? Typotex, 1999, Budapest
Plh Cs.: A mondatmegrts a magyar nyelvben. Osiris, Budapest, 1998.
Prkopa A.: Valsznsgelmlet mszaki alkalmazsokkal, Mszaki Knyvkiad, Budapest, 1980.
944
Prszky G.: Szmtgpes nyelvszet. SZMALK, Budapest, 1989.

Prszky G.Kis B.: Szmtgppel emberi nyelven (Intelligens szvegkezels szmtgppel). SZAK Kiad,
Bicske, 1999.
Rathmann J.: Idegen szavak a filozfiban. Nemzeti Tanknyvkiad, Budapest, 1996.
Rnyi A.: Valsznsgszmts. Tanknyvkiad, Budapest, 1973.
Szeghegyi .Velencei J.: zleti dntshozsra alkalmas tudsalap dntstmogat rendszer. Fiskolai
jegyzet, Budapesti Mszaki Fiskola. 2003.
Vetier A.: Szemlletes mrtk- s valsznsgelmlet. Tanknyvkiad, Budapest, 1991.
Williams, J. D.: Jtkelmlet, Mszaki Knyvkiad, Budapest, 1972.
Folyiratokban s konferenciakiadvnyokban megjelent dolgozatok
Benk T.Krauth P.: IQ*SILK: Modell-vezrelt adatintegrls logikai alapokon. Alma Mater sorozat, Vllalat,
informci, tudomny. BME GTK ITM s KFKI, 2002. aug., 223244. o.
Bir M.Mayer, J.Rapcsk T.Vermes M.: Matematikai programozsi szakrti rendszerek. Alkalmazott
Matematikai Lapok 16, 1992, 217278. o.
Bognr K.: Klasszifikci az esetalap kvetkeztetrendszerekben. Alkalmazott Matematikai Lapok 21, 2004,
317328. o.
Bognr K.: Ler logikk az ismeretbrzolsban. Alkalmazott Matematikai Lapok 20(2), 2000, 183193. o.
Csendes, D.Hatvani, Cs.Alexin, Z. s trsai: Kzzel annotlt magyar nyelvi korpusz. Els Magyar
Szmtgpes Nyelvszeti Konferencia (MSZNY) kiadvnya, Szeged, 2003. 238247. o.
Dezsnyi Cs.Varga P.Mszros T.Strausz Gy. Dobrowiecki T.: Tudsalap informcikinyers: Az IKF
projekt. Tudomnyos s Mszaki Tjkoztats, Knyvtr- s informcitudomnyi szakfolyirat, Vol. 51, No.
5, 2004.
Fk M.Nmeth G.Olaszy G.Gordos G.: Megrtst segt rszletez gpi nvfelolvass Magyar nyelvre. II.
Magyar Szmtgpes Nyelvszeti Konferencia (MSZNY) kiadvnya, Szeged, 2004. 301306. o.
Gregorics T.: Megjegyzsek a heurisztikus grfkeres algoritmusokhoz. Alkalmazott Matematikai Lapok, 1992,
16., 6171. o.
Hcza A.: Teljes mondatszintaxis tanulsa s felismerse. II. Magyar Szmtgpes Nyelvszeti Konferencia
(MSZNY 2004) kiadvnya, Szeged, 2004. dec. 910., 127136. o.
Lukcsy G.Benk T.Szeredi P.Krauth P.: Ontolgiakezels logikai mdszerekkel. Networkshop 2003
kiadvnya. Nemzeti Informcis Infrastruktra Fejlesztsi Program, 2003.
Lukcsy G.Szeredi P.: Ontolgik s alkalmazsuk orvosi terleten. IME Informatika s Menedzsment az
Egszsggyben, III(1), 2004, 2630. o.
Mik B.Szntai M.: Kltsgbecsls a szerszmgyrtsban. Gpgyrts 2003/3., 1418. o.
Nmeth I.Pspki J.: Szerszmgpek felptsi vltozatainak tervezse mechatronikai tervez rendszer
keretbe. Gp, LIV(1011), 2003. 112117. o.
Olaszy G.Kiss G.Nmeth G.Olaszi P.: Profivox: a legkorszerbb hazai beszdszintetiztor. In Gsy M.
(szerk.): Beszdkutats 2000, MTA Nyelvtudomnyi Intzete, 167179. o.
Olaszy G.Gordos G.Nmeth G.: A gpi beszdkelts korszer mdszerei. Alkalmazott Nyelvtudomny, III(1)
2003, 1327. o.
945
Molnr A.: Elektromos hajts robotreplgpek. Haditechnika 2002 Nemzetkzi Szimpzium, 2002.
szeptember 1617, Zrnyi Mikls Nemzetvdelmi Egyetem Bolyai Jnos Katonai Mszaki Fiskolai Kar,
Budapest, Bolyai Szemle klnsz. II. 2133. o.
Paczolay, D.Kocsor, A.Sejtes, Gy.Hgely, G.: A Beszdmester csomag bemutatsa, informatikai s nyelvi
aspektusok. Alkalmazott Nyelvtudomny, IV(1), 2004, 5779. o.
Roska T.: Egyszer s bonyolult fogalmak s mrtkek mestersges s l rendszerekben. Bevezet. Magyar
Tudomny, 48(3), 2003, 290291. o.
Roska T.: Bonyolultsg s egyszersg analogikai hullm-szmtgpekben s nhny idegi jelensg
modelljben. Magyar Tudomny, 48(3), 2003, 328331. o.
Roska T.Blya D.Csapodi M.Zarndy .: Analogikai cellulris szmtgpek. Egy j szmtgpelv.
Termszet Vilga, 2000, II. klnsz., 7174. o.
Sntn-Tth E.: Szakrt rendszerek fejlesztsnek mdszertani s oktatsi krdsei. Informatika az
oktatsban 2002 Konferencia CD-kiadvnya, Debrecen, 2002. aug. 2830, 6. o.
Starkn Werner .: Szakrti rendszer lehetsgek a kmiaoktatsban. A kmia tantsa mdszertani folyirat,
VI. vf. 1998, 34.
Starkn Werner .: Mestersges intelligenciabeli lehetsgek az internetes s multimdis fldrajz oktatsban.
A fldrajz tantsa mdszertani folyirat, XII. vf. 2004(1), 37. o.
Starkn Werner ., Vgh K.: Dntst tmogat szakrti rendszer az aromaterpiban. XXI. Neumann
Kollokvium, Veszprm 1998. nov. 1214., 200204. o.
Szeredi P.Gyimthy T.: Logikai programozs s alkalmazsai. IX. Neumann centenriumi Kongresszus
kiadvnya, NJSZT, 2003. 181198. o.
Tatai G.Laufer L.: Nyelvi elemek rzelmi tltetnek vizsglata s felhasznlsa termszetes nyelvi
dialgusrendszerben. Magyar Szmtgpes Nyelvszet Konferencia (MSZNY), 2003. Szeged, 102107. o.
Tatai G.Laufer L.Csords A.Fegy T.: Interaktv, szintetikus tanrok az e-oktatsban. Multimdia az
oktatsban Fkuszban az e-learning gyakorlata Konf. kiadvnya, 2004. Szeged, 2729. o.
Tth L.Kocsor A.: Az MTBA magyar telefonbeszd-adatbzis kzi feldolgozsnak tapasztalatai. In Gsy M.
(szerk.): Beszdkutats 2003. 134146. o.
Vmos T.: Fizika fszisz informcis trsadalom. Fizikai Szemle, 2005/1. Fizika ve sz., 8. o.
Velencei J.: Lerhat-e a tuds? CEO magazin. 2000. 3. sz.
Viharos Zs. J.: Megmunklt felletek minstse neurlis hl alkalmazsval. Fiatal Mszakiak Tudomnyos
lsszaka, Kolozsvr, 1996. 713. o.
Elektronikus forrsok
Kis B.: Mi van a szavakon tl? Nyelvtani szerkezetek felismerse szmtgppel.
http://www.mek.iif.hu/porta/szint/tarsad/nyelvtud/mivana/mivana.htm
Naszdi M.: Nyelvhelyessg-ellenrzs szmtgppel.
http://www.mek.iif.hu/porta/szint/tarsad/nyelvtud/nylvhely/nyelvhely.htm
Sntn-Tth E. (szerk.): Magyar Mestersges Intelligencia Bibliogrfia Vlogats az 1988 1996 kztt
megjelent
publikcikbl.
NJSZT
OMIKK,
Budapest,
1996.
aug.
(400
referencia)
http://www.mek.iif.hu/porta/szint/egyeb/katalog/mi-bibl
946

0026 Mi 4 4 PDF

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

0026 Mi 4 4 PDF

Diunggah oleh

Hak Cipta:

Format Tersedia

Mestersges Intelligencia

Created by XMLmind XSL-FO Converter.

Mestersges Intelligencia: Modern megkzeltsben: Msodik,

Created by XMLmind XSL-FO Converter.

3. Megoldsok keresse .......................................................................................................... 58

2.3. Optimlis dntsek tbbszemlyes jtkokban ....................................................

2.11. Egyenlsg .........................................................................................................

1.1. temezs erforrskorltokkal .............................................................................

7.3. A meghatrozatlansg reprezentlsa: fuzzy halmazok s logikk ......................

2.2. Az rtkiterci algoritmus ...................................................................................

3.1. Nem ellenrztt osztlyozs: Gauss-eloszlsok keverknek tanulsa ................

9.1. Irodalmi s trtneti megjegyzsek ......................................................................

6.1. Dinamika s vezrls ............................................................................................

3.7. Az ltalnos fakeressi algoritmus informlis lersa ................................................................ 60

4.8. A keressi kltsg s az effektv elgazsi tnyez sszehasonltsa ITERATVAN-MLYL-KERESS

TARTOMNY-RTKEK-SORRENDEZSE fggvnyek hasznlhatk a szvegben bemutatott ltalnos cl

heurisztikk megvalstsra. ......................................................................................................... 126

7.10. Egy igazsgtbla felsorol algoritmus tletkalkulus llts vonzatnak eldntsre. Az IT az

9.2. (a) A bennfoglalsi hl, amelynek a legalacsonyabb csompontja ez a mondat: Alkalmaz(AIMA.org,

cselekvs vgrehajthat, felttelezve, hogy a sorrendezsi megktseket betartjuk. A szrke tglalapok

15.13. (a) Az rzkel llapotvltozjt bemutat DBH-rszlet. Ez a vltoz szksges az

az egyttesben tallhat hipotzisek szmnak a fggvnyben. Figyeljk meg, hogy a teszthalmazon

20.15. A neuron egyszer matematikai modellje. Az egysg kimeneti aktivcija

1.1. bra - Az MI nhny meghatrozsa ngy kategriba szervezve

1.1. Emberi mdon cselekedni: Turing-teszt megkzelts

1.2. Emberi mdon gondolkodni: a kognitv modellezs

1.3. Racionlisan gondolkodni: a gondolkods trvnye

1.4. Racionlisan cselekedni: a racionlis gens

Ha nincs megolds, a program a keresst esetleg soha nem fejezi be.

2. A mestersges intelligencia alapjai

2.1. Filozfia (i. e. 428-tl napjainkig)

2.2. Matematika (kb. 800-tl napjainkig)

2.3. Gazdasgtan (1776-tl napjainkig)

2.4. Neurlis tudomnyok (1861-tl napjainkig)

1.3. bra - A szmtgpek szmtsi erforrsainak (2003 krl) s az agy

2.5. Pszicholgia (1879-tl napjainkig)

alkalmazott az emberi lts tanulmnyozsnl, s a Handbook of Physiological Optics c. mvt mg ma is gy

2.6. Szmtgpes tudomnyok (1940-tl napjainkig)

A mestersges intelligencia sikerhez kt dolog szksges: intelligencia s valamilyen mestersgesen ltrehozott

2.7. Irnytselmlet s kibernetika (1948-tl napjainkig)

2.8. Nyelvszet (1957-tl napjainkig)

3. A mestersges intelligencia trtnete

3.1. A mestersges intelligencia rleldse (19431955)

neuronok valamilyen hlzatval minden kiszmthat fggvny elllthat, s hogy egyszer

3.2. A mestersges intelligencia megszletse (1956)

Most Carnegie Mellon Egyetem (Carnegie Mellon University, CMU).

3.3. Korai lelkeseds, nagy elvrsok (19521969)

3.4. Egy adag realits (19661973)

3.5. Tudsalap rendszerek: a hatalom kulcsa? (19691979)

megadta a molekula bizonyos rszeinek a tmegt, amikor a molekult elektronsugrral bombztk. A

a. x + x = M + 28 (M a teljes molekula tmege);

b. x 28 egy magas cscs;

c. x 28 egy magas cscs;

d. x s x kzl legalbb egy cscs magas,

akkor ketoncsoport van jelen.

3.6. Az MI iparr vlik (1980-tl napjainkig)

3.7. A neurlis hlk visszatrse (1986-tl napjainkig)

3.8. Az MI tudomnny vlik (1987-tl napjainkig)

3.9. Az intelligens gensek kialakulsa (1995-tl napjainkig)

4. A mestersges intelligencia jelenlegi helyzete

A gp rmutatott a dntst befolysol f tnyezkre, s megmagyarzta az adott esetben jelentkez tnetek

Az MI trtnetben voltak sikeres idszakok, de megtallhatk a tves optimizmus s a lelkeseds, valamint a

5.1. Irodalmi s trtneti megjegyzsek